<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

新型威脅：探索LLM攻擊對網絡安全的沖擊

來自卡內基梅隆大學（CMU）的研究人員發布了 LLM Attacks，這是一種可以針對各種大型語言模型（LLM）構建對抗性攻擊的算法，包括 ChatGPT、Claude 和 Bard。這些自動生成的攻擊，在 GPT-3.5 和 GPT-4 上的成功率為 84%，在 PaLM-2 上的成功率為 66%。

與大多數“越獄”攻擊通過試錯手工構建不同，CMU 的團隊設計了一個三步流程來自動生成提示后綴，它們可以繞過 LLM 的安全機制，導致有害的響應。而且，這些提示還是可轉移（transferrable）的，也就是說，一個給定的后綴通?？梢杂糜谠S多不同的 LLM，甚至是閉源模型。為了衡量算法的有效性，研究人員創建了一個名為 AdvBench 的基準測試；在此基準測試上進行評估時，LLM 攻擊對 Vicuna 的成功率為 88%，而基線對抗算法的成功率為 25%。根據 CMU 團隊的說法：

最令人擔憂的也許是，目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里，在計算機視覺領域，類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此，我們認為，在增加對此類人工智能模型的使用和依賴時，應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發布，出現了許多破解這些模型的技術，其中就包括可能導致模型繞過其保護措施并輸出潛在有害響應的提示。雖然這些提示通常是通過實驗發現的，但 LLM Attacks 算法提供了一種自動創建它們的方法。第一步是創建一個目標令牌序列：“Sure, here is (content of query)”，其中“content of query”是用戶實際輸入的提示，要求進行有害的響應。

接下來，該算法會查找可能導致 LLM 輸出目標序列的令牌序列，基于貪婪坐標梯度（GCG）算法為提示生成一個對抗性后綴。雖然這確實需要訪問 LLM 的神經網絡，但研究團隊發現，在許多開源模型上運行 GCG 所獲得的結果甚至可以轉移到封閉模型中。

在 CMU 發布的一條介紹其研究成果的新聞中，論文合著者 Matt Fredrikson 表示：

令人擔憂的是，這些模型將在沒有人類監督的自主系統中發揮更大的作用。隨著自主系統越來越真實，我們要確保有一種可靠的方法來阻止它們被這類攻擊所劫持，這將非常重要……現在，我們根本沒有一個令人信服的方法來防止這種事情的發生，所以下一步，我們要找出如何修復這些模型……了解如何發動這些攻擊通常是建立強大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項研究。他寫道：

盡管存在風險，但我們認為還是應該把它們全部披露出來。這里介紹的攻擊很容易實現，以前也出現過形式類似的攻擊，并且最終也會被致力于濫用 LLM 的團隊所發現。

劍橋大學助理教授 David Krueger 回復了 Zou 的帖子，他說：

在圖像模型中，10 年的研究和成千上萬的出版物都未能找出解決對抗樣本的方法，考慮到這一點，我們有充分的理由相信，LLM 同樣會如此。

在 Hacker News 上關于這項工作的討論中，有一位用戶指出：

別忘了，本研究的重點是，這些攻擊不需要使用目標系統來開發。作者談到，攻擊是“通用的”，他們的意思是說，他們可以在自己的計算機上完全使用本地模型來生成這些攻擊，然后將它們復制并粘貼到 GPT-3.5 中，并看到了有意義的成功率。速率限制并不能幫你避免這種情況，因為攻擊是在本地生成的，而不是用你的服務器生成的。你的服務器收到的第一個提示已經包含了生成好的攻擊字符串——研究人員發現，在某些情況下，即使是對 GPT-4，成功率也在 50% 左右。

GitHub 上提供了代碼，你可以在 AdvBench 數據上重現 LLM Attacks 實驗。項目網站上還提供了幾個對抗性攻擊的演示。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

網絡安全

網絡安全

+關注

關注
10

文章
2983

瀏覽量
58788
GitHub

GitHub

+關注

關注
3

文章
458

瀏覽量
16029
LLM

LLM

+關注

關注
0

文章
218

瀏覽量
249

原文標題：新型威脅：探索 LLM 攻擊對網絡安全的沖擊

文章出處：【微信號：AI前線，微信公眾號：AI前線】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

艾體寶觀察 | 2024，如何開展網絡安全風險分析

2024年的網絡安全風險分析是一系列系統性的步驟，旨在識別、評估并減輕可能對企業產生負面影響的現有或潛在的網絡安全風險。對所有系統和資源進行清點、識別潛在的弱點和威脅、確定風險影響、制定和實施

的頭像

發表于 04-22 14:15 ?154次閱讀

勒索病毒的崛起與企業網絡安全的挑戰

在數字化時代，網絡安全已成為企業維護信息完整性、保障業務連續性的關鍵。然而，勒索病毒以其不斷進化的攻擊手段和商業化模式，成為全球網絡安全領域最嚴峻的威脅之一。本文將概述勒索病毒帶來的危

的頭像

發表于 03-16 09:41 ?150次閱讀

云網端安全托管方案 —— 企業網絡安全的守護盾

在數字化浪潮席卷全球的今天，企業面臨的網絡安全威脅愈發復雜多變。從業務中斷到數據丟失，這些外部威脅不僅影響公司的運營效率，還可能嚴重損害企業的聲譽。加之安全運維的困難、風險識別的挑戰以

的頭像

發表于 03-07 13:55 ?264次閱讀

知語云全景監測技術：現代安全防護的全面解決方案

可以幫助實現政務數據的安全保護，防止敏感信息泄露；對于個人用戶而言，知語云全景監測技術可以提供更加全面的網絡安全保護，防范網絡釣魚、惡意軟件等安全威

發表于 02-23 16:40

BlackBerry《季度全球威脅情報報告》顯示新型惡意軟件攻擊活動激增 70%

：BB）于今日發布了其最新的《季度全球威脅情報報告》，展示了 BlackBerry 人工智能賦能的網絡安全解決方案遇到的新型惡意軟件激增了 70%。每分鐘的網絡

發表于 11-29 07:19 ?357次閱讀

夯實網絡安全基石，多網口國產網絡安全主板助力強固防線

在當今信息化時代，網絡安全對企業來說是至關重要且不可忽視的。隨著網絡攻擊手段的不斷演進和網絡威脅的不斷增加，構建強大的

發表于 11-06 14:45 ?218次閱讀

借助圖技術增強網絡安全威脅檢測方法

數據安全研究中心Ponemon Institute 發現 66% 的中小企業在過去一年內遭遇過網絡攻擊。網絡安全的目標就是阻止盡可能多的攻擊

發表于 10-10 16:36 ?184次閱讀

新唐對應四大物聯網安全攻擊的保護措施

物聯網安全包含裝置安全和網絡安全，在此定義下涵蓋了保護聯網設備和網絡所需的流程、技術和防護措施。在現今社會上，各類型聯網裝置愈來愈普及，從工業設備、智能電網、智能家居、娛樂及穿戴設備等

發表于 08-21 08:14

網絡安全系統的主要要求有哪些常見的網絡安全問題有哪些

網絡安全設備是用于保護計算機網絡系統免受網絡攻擊和惡意行為的硬件或軟件設備。以下列舉了一些常見的網絡安全設備。

發表于 08-11 15:15 ?1782次閱讀

汽車網絡安全攻擊實例解析（二）

本文則選取典型的智能網聯汽車網絡安全攻擊實例展開詳細介紹。

發表于 08-08 15:17 ?1042次閱讀

威脅情報在安全分析中的作用和未來位置如何

威脅情報，也稱為網絡威脅情報，是網絡安全的一個分支，專注于收集和分析有關組織可能面臨的潛在威脅和漏洞的信息。這些信息有多種形式，從原始的、未

發表于 07-31 22:16 ?1272次閱讀

虹科分享丨網絡安全知識專欄：關于“威脅狩獵”你需要知道的一些事

什么是威脅狩獵網絡威脅狩獵是指一種主動尋找和識別網絡中潛在威脅的活動。它是一種針對已知和未知威脅

發表于 07-21 11:45 ?1999次閱讀

網絡安全常見漏洞有哪些網絡漏洞的成因有哪些

網絡安全的威脅和攻擊手法也在不斷演變。為了維護網絡安全，建議及時更新和修復系統漏洞，實施安全措施和防護機制，并加強用戶教育和意識，以有效應對

發表于 07-19 15:34 ?2784次閱讀

人工智能網絡攻擊案例人工智能的網絡攻擊檢測研究

　　摘要：隨著網絡攻擊技術的快速發展，網絡安全已逐漸深入工作和生活的各個方面，在網絡提供信息溝通便利的同時也暴露出篡改消息、偽造、拒絕服務、流量分析、竊聽等惡意

發表于 07-19 14:42 ?1次下載

lansweeper創建網絡安全資產管理基線

獲取適用于網絡安全的資產清單 ? ? 全可見性發現您甚至不知道的資產并消除盲點。 ? 風險緩解通過審計預防措施預測潛在的網絡安全攻擊。 ? 威脅檢測通過有價值的報告對整個網絡進行

發表于 06-29 09:29 ?705次閱讀

精選推薦
更多

文章

資料

帖子

使用理想二極管控制器的汽車應用冗余電源拓撲

德州儀器
3小時前

232 閱讀

電力電子中的電大、電小尺寸？

英飛凌工業半導體
2天前

165 閱讀

PSpice學習筆記 - TI器件模型導入

工程師看海
2分鐘前

11 閱讀

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

710 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

802 閱讀

高速PCB設計HyperLynx使用指南

劉潤生
492

10積分

174下載

MATLAB編程-新手入門

1107322551
5.24 MB

免費

0下載

Gitinspector git倉庫統計分析工具

母豬會上樹
0.38 MB

2積分

1下載

Ghidra軟件逆向工程框架

俞舟群
76.37 MB

免費

0下載

GoWallet比特幣錢包

學電超人
0.91 MB

2積分

3下載

為什么我的電源會出現振鈴和過熱？

久醉不醒
14小時前

84 閱讀

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

329 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

160 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

161 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

474 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看