<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT重磅升級!新語音和圖像輸入功能,讓ChatGPT能看、能聽、能說

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-09-28 00:14 ? 次閱讀

電子發燒友網報道(文/李彎彎)近日消息,OpenAI在一篇博客中表示,ChatGPT 將推出新的語音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過語音或圖像與ChatGPT交流。OpenAI稱,新功能在未來兩周內向付費用戶推出,不久后會推廣到其他用戶。

ChatGPT 是OpenAI推出的一種人工智能技術驅動的自然語言處理工具,它能夠基于在預訓練階段所見的模式和統計規律,來生成回答,還能根據聊天的上下文進行互動,能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務。自2022年11月30日發布以來,ChatGPT 已經進行了多次功能升級。

ChatGPT現在能看、能聽、能說了

ChatGPT使用了Transformer神經網絡架構,也是GPT-3.5架構,這是一種用于處理序列數據的模型,擁有語言理解和文本生成能力,尤其是它會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT具備上知天文下知地理,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。

2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊用戶數超過100萬。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費者應用。

2023年2月2日,OpenAI發布ChatGPT試點訂閱計劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價格提供,訂閱者可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。同日,微軟發布公告稱,旗下所有產品將全線整合ChatGPT。

2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態大模型,即支持圖像和文本輸入以及文本輸出,擁有強大的識圖能力。GPT-4的特點在于:第一,它的訓練數量更大;第二,支持多元的輸出輸入形式;第三,在專業領域的學習能力更強。

2023年5月18日,OpenAI官網宣布推出iOS版ChatGPT應用,該應用可免費使用,并在不同設備間同步用戶的歷史記錄。該應用還集成了OpenAI開源語音識別系統Whisper,支持語音輸入。ChatGPT Plus付費訂閱用戶可以獨家使用GPT-4功能。

2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應方式。此外,OpenAI還發布公告稱,給ChatGPT加了一個名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。

2023年9月25日,OpenAI發布《ChatGPT 現在能看、能聽、能說了》的公告,宣布ChatGPT 增加語音輸入和圖像輸入兩項新功能。這可以說是ChatGPT 發布以來極其重大的更新。

據介紹,語音輸入功能類似于手機上的語音助手,用戶只需要輕輕點擊一個按鈕,說出自己的問題,ChatGPT能將這些口述的問題轉換成文本,將其輸入至大語言模型中,生成答案,接著將答案轉化成語音,播放給用戶。

語音轉文本的任務由OpenAI 的 Whisper 模型提供支持。同時,該公司正在引入一款全新的文本轉語音的模型,據稱可以通過幾秒鐘的語音樣本生成與人類相似的音頻。

圖像輸入功能類似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會嘗試識別用戶想要詢問的內容,并給出相應的回答。用戶還可以用應用中的繪圖工具來幫助表達自己的問題,或者配合語音或文本輸入來進行交流。

用戶可以向ChatGPT展示一張或多張圖片,提問相關的問題。比如,發送一張壞掉的燒烤爐圖片,然后詢問無法啟動原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。

OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問ChatGPT:這里是扳手嗎?是調整這里嗎?甚至還把說明書拍照發給ChatGPT求解釋。

這正是ChatGPT獨特的特性所帶來的幫助,用戶可以與機器人進行互動,逐步完善答案,而無需首先進行搜索并在得到錯誤答案后再次搜索。

ChatGPT新增語音和圖像功能帶來的風險

OpenAI在博客中表示,其目標是構建安全有益的通用人工智能(AGI)。新增的語音和圖像功能可能會帶來一些風險,但是OpenAI正在采取措施緩解這些風險。

新的語音技術能夠在短短幾秒鐘的真實語音片段中生成逼真的合成語音,這一技術存在潛在風險,比如,惡意行為者可能會濫用這項技術,冒充公眾人物或實施欺詐。為了避免這些問題的發生,OpenAI決定將這項技術應用于特定的場景中,會受到嚴格的限制。

新的圖像功能也帶來一定風險,在進行更廣泛的部署之前,OpenAI測試了該模型在極端主義和科學領域等方面潛在的風險,并對一些關鍵細節進行了調整,來確保負責任地應用這項技術。比如,在處理人物圖片時,OpenAI限制了ChatGPT 對人物進行分析和直接評價的能力,這意味著上傳一個人的照片就能知道那是誰無法實現,這是為了隱私安全。

ChatGPT自發布以來,在受到廣大用戶追捧的同時,其伴隨的風險也讓各界人士表示擔憂。一是它可能在被使用的過程中造成數據信息的丟失;二是它也可能會被一些不法分子用來實施欺詐行為。在過去這大半年時間里,不少機構也在反對ChatGPT的使用和進一步研究。

2023年2月3日,IT行業的領導們擔心,ChatGPT已經被黑客們用于策劃網絡攻擊時使用。黑莓(Black Berry)的一份報告調查了英國500名IT行業決策者對ChatGPT這項革命性技術的看法,發現超過四分之三(76%)的人認為,外國已經在針對其他國家的網絡戰爭中使用ChatGPT。近一半的人認為,2023年,將會出現有人惡意使用ChatGPT成功進行網絡攻擊。

2023年4月,中國支付清算協會倡議支付行業從業人員謹慎使用ChatGPT。4月13日,西班牙國家數據保護局和法國國家信息自由委員會分別宣布對ChatGPT展開調查。

在各界人士對ChatGPT存在風險的質疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時而不會帶來新的問題。從這次的功能升級來看,OpenAI試圖通過有意限制新模型的功能,來達到更進一步提升功能和同時帶來新問題的平衡。OpenAI表示,將不斷改進和完善風險緩解措施,未來為大家提供更強大的系統。

總結

ChatGPT自出世以來就引起了廣泛關注,過去近一年時間,OpenAI對其底層模型和界面也進行了多次升級。如今,ChatGPT更是進行了一次重磅升級,新增語音輸入和圖像輸入功能,讓ChatGPT實現了能看、能聽、能說的能力。

與此同時,ChatGPT在使用中存在的風險一直以來也是各界擔心的問題,此次增加的新功能更是可能帶來新的風險。不過在過去這段時間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級中,OpenAI通過一些限制來在實現新功能的同時也避免可能帶來新風險。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ChatGPT
    +關注

    關注

    27

    文章

    1443

    瀏覽量

    5037
收藏 人收藏

    評論

    相關推薦

    【Longan Pi 3H 開發板試用連載體驗】給ChatGPT裝上眼睛,還可以語音對話

    結果整合,整合后再輸入ChatGPT或其他大語言模型。最后再將大語言模型的輸出結果利用TTS轉化為語音進行播放。實現Chatgpt多模態輸入
    發表于 04-12 12:41

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    OpenAI推出ChatGPT“朗讀”功能

    OpenAI今日宣布,為其廣受歡迎的ChatGPT平臺新增了“朗讀”功能,該功能允許用戶將對話文本內容轉化為語音,從而進行聽讀。無論是iOS還是安卓系統的用戶,現在都可以輕松享受到這一
    的頭像 發表于 03-06 18:17 ?855次閱讀

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    (output_text) ); // 用于存儲用戶輸入的文本 reg [255:0] input_text; // 用于存儲ChatGPT4的響應 wire [255:0
    發表于 02-14 21:58

    不到1分鐘開發一個GPT應用!各路大神瘋狂整活,網友:ChatGPT就是新iPhone

    這個說法并不準確。盡管ChatGPT等語言模型已經在一定程度上改變了我們獲取信息、學習知識的方式,但它們并不能替代人類進行創造性思考和創造性活動。 雖然一些人可能會利用ChatGPT等語言模型快速
    發表于 11-19 12:06

    怎么和ChatGPT語音聊天?

    ChatGPT語音聊天免打字輸入、訓練外語口說能力的好幫手。 ChatGPT手機App的語音聊天功能
    的頭像 發表于 11-14 17:36 ?2202次閱讀
    怎么和<b class='flag-5'>ChatGPT</b><b class='flag-5'>語音</b>聊天?

    ChatGPT Plus怎么支付 開通ChatGPT plus有什么功能?

    。在這里,你可以找到關于ChatGPT 4.0的詳細信息,包括其功能、優勢和使用案例。 2?? 注冊OpenAI賬戶 如果你還沒有OpenA
    的頭像 發表于 10-10 16:01 ?3406次閱讀
    <b class='flag-5'>ChatGPT</b> Plus怎么支付 開通<b class='flag-5'>ChatGPT</b> plus有什么<b class='flag-5'>功能</b>?

    ChatGPT重磅升級 算力需求噴發可期

    在OpenAI給出的示例視頻中可以看到,當用戶向ChatGPT發送一張自行車照片、詢問如何調低車墊時,ChatGPT不僅會自發觀察自行車型號、辨認零部件、給出詳細步驟,還會看說明書,并分辨用戶現有工具能否完成這項工作。
    的頭像 發表于 09-27 17:11 ?631次閱讀

    重磅!OpenAI在ChatGPT內推出語言和圖像功能

    語音圖像為用戶在生活中使用 ChatGPT 提供了更多方式。旅行時,拍下地標性建筑的照片,然后就它的有趣之處進行實時對話。當您在家時,拍下冰箱和儲藏室的照片,找出晚餐的菜譜(并提出后續問題,一步步了解菜譜)。晚飯后,幫孩子做一
    的頭像 發表于 09-26 17:05 ?429次閱讀
    <b class='flag-5'>重磅</b>!OpenAI在<b class='flag-5'>ChatGPT</b>內推出語言和<b class='flag-5'>圖像</b><b class='flag-5'>功能</b>

    chatGPT有什么強大的功能?

    chatGPT有什么作用?chatGPT有什么強大的功能?為什么chatGPT可以火爆全球? 作為一款全球領先的在線聊天機器人平臺,chatGPT
    的頭像 發表于 08-09 15:48 ?877次閱讀

    chatgpt是什么意思 chatgpt有什么用

    有不少教程,搜索觀看即可?! ?b class='flag-5'>ChatGPT 是一款由 OpenAI 開發的大型語言模型,主要功能是回答用戶的問題和完成各種語言任務,如對話生成、文本摘要、翻譯、生成文本 等。它使用了先進的深度學習技術和海量的語言數據進行訓練,可以在 各種語言領域提供高質量的語言處理服務
    發表于 07-19 14:21 ?3次下載

    chatgpt是什么原理

    ChatGPT 是 OpenAI 發布的最新語言模型,比其前身 GPT-3 有顯著提升。與許多大型語言模型類似,ChatGPT 能以不同樣式、不同目的生成文本,并且在準確度、敘述細節和上下文連貫性
    發表于 06-27 13:57 ?229次閱讀

    ChatGPT應用實戰

    ChatGPT自發布之后一直大火至今,引起行業震動,我們也持續在跟進ChatGPT,體驗其功能,了解其技術原理,并基于爬蟲技術封裝了ChatGPT API,在實際NLP應用場景下對比了
    發表于 06-06 17:47 ?4次下載

    ChatGPT對話語音識別

    ChatGPT
    YS YYDS
    發布于 :2023年05月30日 22:13:10

    語音編程的要點

    清晰明了的指令是語音輸入的關鍵,即使是人類也是如此。 例如, 把x裝到123位置。 從456取出y。 剪去abcd的連接器廢料z,按efgh點切斷。 注意后方阻擋。 繞過a位置是xyz。 等待i機
    發表于 05-22 18:06
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>