<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型威脅:探索LLM攻擊對網絡安全的沖擊

jf_WZTOguxH ? 來源:AI前線 ? 2023-10-11 16:28 ? 次閱讀

來自卡內基梅隆大學(CMU)的研究人員發布了 LLM Attacks,這是一種可以針對各種大型語言模型(LLM)構建對抗性攻擊的算法,包括 ChatGPT、Claude 和 Bard。這些自動生成的攻擊,在 GPT-3.5 和 GPT-4 上的成功率為 84%,在 PaLM-2 上的成功率為 66%。

與大多數“越獄”攻擊通過試錯手工構建不同,CMU 的團隊設計了一個三步流程來自動生成提示后綴,它們可以繞過 LLM 的安全機制,導致有害的響應。而且,這些提示還是可轉移(transferrable)的,也就是說,一個給定的后綴通??梢杂糜谠S多不同的 LLM,甚至是閉源模型。為了衡量算法的有效性,研究人員創建了一個名為 AdvBench 的基準測試;在此基準測試上進行評估時,LLM 攻擊對 Vicuna 的成功率為 88%,而基線對抗算法的成功率為 25%。根據 CMU 團隊的說法:

最令人擔憂的也許是,目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里,在計算機視覺領域,類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此,我們認為,在增加對此類人工智能模型的使用和依賴時,應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發布,出現了許多破解這些模型的技術,其中就包括可能導致模型繞過其保護措施并輸出潛在有害響應的提示。雖然這些提示通常是通過實驗發現的,但 LLM Attacks 算法提供了一種自動創建它們的方法。第一步是創建一個目標令牌序列:“Sure, here is (content of query)”,其中“content of query”是用戶實際輸入的提示,要求進行有害的響應。

接下來,該算法會查找可能導致 LLM 輸出目標序列的令牌序列,基于貪婪坐標梯度(GCG)算法為提示生成一個對抗性后綴。雖然這確實需要訪問 LLM 的神經網絡,但研究團隊發現,在許多開源模型上運行 GCG 所獲得的結果甚至可以轉移到封閉模型中。

在 CMU 發布的一條介紹其研究成果的新聞中,論文合著者 Matt Fredrikson 表示:

令人擔憂的是,這些模型將在沒有人類監督的自主系統中發揮更大的作用。隨著自主系統越來越真實,我們要確保有一種可靠的方法來阻止它們被這類攻擊所劫持,這將非常重要……現在,我們根本沒有一個令人信服的方法來防止這種事情的發生,所以下一步,我們要找出如何修復這些模型……了解如何發動這些攻擊通常是建立強大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項研究。他寫道:

盡管存在風險,但我們認為還是應該把它們全部披露出來。這里介紹的攻擊很容易實現,以前也出現過形式類似的攻擊,并且最終也會被致力于濫用 LLM 的團隊所發現。

劍橋大學助理教授 David Krueger 回復了 Zou 的帖子,他說:

在圖像模型中,10 年的研究和成千上萬的出版物都未能找出解決對抗樣本的方法,考慮到這一點,我們有充分的理由相信,LLM 同樣會如此。

在 Hacker News 上關于這項工作的討論中,有一位用戶指出:

別忘了,本研究的重點是,這些攻擊不需要使用目標系統來開發。作者談到,攻擊是“通用的”,他們的意思是說,他們可以在自己的計算機上完全使用本地模型來生成這些攻擊,然后將它們復制并粘貼到 GPT-3.5 中,并看到了有意義的成功率。速率限制并不能幫你避免這種情況,因為攻擊是在本地生成的,而不是用你的服務器生成的。你的服務器收到的第一個提示已經包含了生成好的攻擊字符串——研究人員發現,在某些情況下,即使是對 GPT-4,成功率也在 50% 左右。

GitHub 上提供了代碼,你可以在 AdvBench 數據上重現 LLM Attacks 實驗。項目網站上還提供了幾個對抗性攻擊的演示。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡安全
    +關注

    關注

    10

    文章

    2983

    瀏覽量

    58788
  • GitHub
    +關注

    關注

    3

    文章

    458

    瀏覽量

    16029
  • LLM
    LLM
    +關注

    關注

    0

    文章

    218

    瀏覽量

    249

原文標題:新型威脅:探索 LLM 攻擊對網絡安全的沖擊

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    艾體寶觀察 | 2024,如何開展網絡安全風險分析

    2024年的網絡安全風險分析是一系列系統性的步驟,旨在識別、評估并減輕可能對企業產生負面影響的現有或潛在的網絡安全風險。對所有系統和資源進行清點、識別潛在的弱點和威脅、確定風險影響、制定和實施
    的頭像 發表于 04-22 14:15 ?154次閱讀

    勒索病毒的崛起與企業網絡安全的挑戰

    在數字化時代,網絡安全已成為企業維護信息完整性、保障業務連續性的關鍵。然而,勒索病毒以其不斷進化的攻擊手段和商業化模式,成為全球網絡安全領域最嚴峻的威脅之一。本文將概述勒索病毒帶來的危
    的頭像 發表于 03-16 09:41 ?150次閱讀

    云網端安全托管方案 —— 企業網絡安全的守護盾

    在數字化浪潮席卷全球的今天,企業面臨的網絡安全威脅愈發復雜多變。從業務中斷到數據丟失,這些外部威脅不僅影響公司的運營效率,還可能嚴重損害企業的聲譽。加之安全運維的困難、風險識別的挑戰以
    的頭像 發表于 03-07 13:55 ?264次閱讀

    知語云全景監測技術:現代安全防護的全面解決方案

    可以幫助實現政務數據的安全保護,防止敏感信息泄露;對于個人用戶而言,知語云全景監測技術可以提供更加全面的網絡安全保護,防范網絡釣魚、惡意軟件等安全
    發表于 02-23 16:40

    BlackBerry《季度全球威脅情報報告》顯示新型惡意軟件攻擊活動激增 70%

    :BB)于今日發布了其最新的《季度全球威脅情報報告》,展示了 BlackBerry 人工智能賦能的網絡安全解決方案遇到的新型惡意軟件激增了 70%。每分鐘的網絡
    的頭像 發表于 11-29 07:19 ?357次閱讀

    夯實網絡安全基石,多網口國產網絡安全主板助力強固防線

    在當今信息化時代,網絡安全對企業來說是至關重要且不可忽視的。隨著網絡攻擊手段的不斷演進和網絡威脅的不斷增加,構建強大的
    的頭像 發表于 11-06 14:45 ?218次閱讀

    借助圖技術增強網絡安全威脅檢測方法

    數據安全研究中心Ponemon Institute 發現 66% 的中小企業在過去一年內遭遇過網絡攻擊。網絡安全的目標就是阻止盡可能多的攻擊
    發表于 10-10 16:36 ?184次閱讀
    借助圖技術增強<b class='flag-5'>網絡安全</b><b class='flag-5'>威脅</b>檢測方法

    新唐對應四大物聯網安全攻擊的保護措施

    物聯網安全包含裝置安全網絡安全,在此定義下涵蓋了保護聯網設備和網絡所需的流程、技術和防護措施。在現今社會上,各類型聯網裝置愈來愈普及,從工業設備、智能電網、智能家居、娛樂及穿戴設備等
    發表于 08-21 08:14

    網絡安全系統的主要要求有哪些 常見的網絡安全問題有哪些

    網絡安全設備是用于保護計算機網絡系統免受網絡攻擊和惡意行為的硬件或軟件設備。以下列舉了一些常見的網絡安全設備。
    的頭像 發表于 08-11 15:15 ?1782次閱讀

    汽車網絡安全攻擊實例解析(二)

    本文則選取典型的智能網聯汽車網絡安全攻擊實例展開詳細介紹。
    的頭像 發表于 08-08 15:17 ?1042次閱讀
    汽車<b class='flag-5'>網絡安全攻擊</b>實例解析(二)

    威脅情報在安全分析中的作用和未來位置如何

    威脅情報,也稱為網絡威脅情報,是網絡安全的一個分支,專注于收集和分析有關組織可能面臨的潛在威脅和漏洞的信息。這些信息有多種形式,從原始的、未
    的頭像 發表于 07-31 22:16 ?1272次閱讀
    <b class='flag-5'>威脅</b>情報在<b class='flag-5'>安全</b>分析中的作用和未來位置如何

    虹科分享丨網絡安全知識專欄:關于“威脅狩獵”你需要知道的一些事

    什么是威脅狩獵網絡威脅狩獵是指一種主動尋找和識別網絡中潛在威脅的活動。它是一種針對已知和未知威脅
    的頭像 發表于 07-21 11:45 ?1999次閱讀
    虹科分享丨<b class='flag-5'>網絡安全</b>知識專欄:關于“<b class='flag-5'>威脅</b>狩獵”你需要知道的一些事

    網絡安全常見漏洞有哪些 網絡漏洞的成因有哪些

    網絡安全威脅攻擊手法也在不斷演變。為了維護網絡安全,建議及時更新和修復系統漏洞,實施安全措施和防護機制,并加強用戶教育和意識,以有效應對
    發表于 07-19 15:34 ?2784次閱讀

    人工智能網絡攻擊案例 人工智能的網絡攻擊檢測研究

      摘 要:隨著網絡攻擊技術的快速發展,網絡安全已逐漸深入工作和生活的各個方面,在網絡提供信息溝通便利的 同時也暴露出篡改消息、偽造、拒絕服務、流量分析、竊聽等惡意
    發表于 07-19 14:42 ?1次下載

    lansweeper創建網絡安全資產管理基線

    獲取適用于網絡安全的資產清單 ? ? 全可見性 發現您甚至不知道的資產并消除盲點。 ? 風險緩解 通過審計預防措施預測潛在的網絡安全攻擊。 ? 威脅檢測 通過有價值的報告對整個網絡進行
    的頭像 發表于 06-29 09:29 ?705次閱讀
    lansweeper創建<b class='flag-5'>網絡安全</b>資產管理基線
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>