<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

賈揚清的500行代碼,掀翻了Perplexity5.2億的桌子?

合宙LuatOS ? 2024-04-17 08:05 ? 次閱讀

500行代碼VS估值5億

1月25日,自從宣布創業后就備受社區矚目的賈揚清,在推特上展示了一個對話式搜索引擎的demo。

這個demo基于他創辦的LeptonAI提供的框架,“只用500行python 代碼”就開發完成。在邀請大家體驗同時,賈揚清也表示后續計劃把代碼開源。在介紹Lepton Search的一系列推特里,他還艾特了Perplexity——估值已經達到5.2億的當紅對話式搜索公司,并表示受到他們優秀產品的啟發。

而這也很快吸引來Perplexiyt的注意,但引來的并不是什么好話。

其創始人Aravind Srinivas在推特上很快轉發賈揚清的推特并表示:“太棒了,看到 Perplexity 成為一些融資動作的參照物,包括前 Meta 和阿里巴巴高管都這樣做。這說明 Perplexity 的影響力不局限于產品本身,而是輻射到了整個科技生態和行業發展,令人振奮!”

翻譯過來就一句話:Lepton為了融資而抄了我Perplexity尊貴的前端代碼。

而這條推特下面不乏煽風點火的評論,有人說Aravind你說的真委婉,這不就是抄襲了。但也有人指出,Aravind是反應過度,Lepton根本不是個做搜索的公司,人干嘛要盯著你借鑒。

賈揚清也迅速回應,感謝了對方“友好的評論”,然后立刻表示咱們開源見。

之后加速寫代碼,居然一個周末不到真就把代碼開源了。

然后這500行代碼在周日上線Github,一天后拿到Githhub熱榜第一,第二天繼續熱榜。星星數不斷增長,目前三天已經有了4500顆星星。

而從人們的討論看,有人已經基于它拿到了一些黑客松冠軍,它還被一款聚焦開發者版的Perplexity產品集成,其CEO夸贊這給自己帶來速度大幅提升。許多體驗和對比了Lepton和Perplexity的用戶也夸贊了Lepton的體驗。而且它還在不停迭代功能,兩天不到,賈揚清和團隊成員就給它增加了包括中文在內的多語言支持,把對話結果分享到推特和Facebook的功能,以及更多的API合作。

簡單體驗它后,我發現它確實用戶界面更加簡潔,速度也快很多。當然,它的功能整體也更簡單,比如在每一次回答后,它就結束,再次輸入開啟的是新一輪回答,而非持續的對話。包括提問的長度識別,中文的識別等一些小bug也依然存在。

但他顯然打破了我對Perplexity的一部分濾鏡。

Perplexity的護城河被捅破了?

在開源代碼后,賈揚清不忘再次艾特Aravind,表示期待合作,可以讓對方體驗一下真正“快速,云原生和用戶體驗友好的平臺”。但這一次Aravind沒再說什么奇怪的話。

事實上這500行代碼以一種最粗暴的方式把所謂十幾年來第一次能挑戰谷歌的創新——對話式搜索的真實技術含量展示了出來。

從代碼入手看一看,它一共就是幾個步驟:1.獲取查詢,說白了就是得到用戶輸入的文字、2.抓取用戶輸入關鍵字相關的搜索頁面、3.解析網頁文本、4.基于文本構建提示詞、5.把提示詞遞交給大語言模型、6.把大語言模型生成的結果返回給用戶。

當然它還有些具體區別,比如搜索的來源——是使用Bing或Google的API,還是使用一個自己的數據庫;背后大模型上的選擇,是Mistral 還是Llama這些開源的,還是直接使用OpenAI的API,或像Perplexity還有自己的幾款模型供選擇;以及大模型在其中起作用的方式,是直接讓它根據需求生成回答,還是經過一定的Prompt優化。

不過這樣看起來你很快會明白,它本質上是關于更好使用別人API的技術。

也就是說,這一切還是建立在傳統搜索引擎提供的檢索能力之上——想要替代Google的Perplexity是建立在Google的API之上的。它們本質上屬于RAG技術的應用,只不過,R更多來自對其他人API的系統性掌握,而G似乎可以更多歸功于自己的能力。賈揚清則表示,他在開發過程里發現在RAG里,R(檢索)比G(生成)的重要性更大。這樣看來,目前Lepton Search的demo之所以一開始沒有做多輪對話的能力,也似乎因為這個思路。展示R的能力更加重要。

Perplexity同樣沿著相似的技術思路,而在一些技術人士看來,他們的根源可能來自一篇Google和OpenAI合作的論文——是的,今天看起來可能不再可能一起寫論文的兩家公司,最后一次合作是對話式搜索的技術原理。

在這篇《FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation》的論文里,他們提出了一種FreshPrompt的技術思路,也就是為了解決預訓練模型對正在發生的事情的無知,要把它與實時搜索能力結合,而結合的方法是通過提供一種Prompt,這種Prompt本身是在按照發布日期,關鍵信源等各種要素來為大模型提供上下文信息,并通過一組優化的Prompt來引導和改善大模型生成更實時更好的回答。

這種技術思路其實也在指向R的重要性可能大過G。

Perplexity的網頁版事實上誕生于這個論文之前,但據一些研究它產品邏輯的人表示,這個論文提出的方法也被用到后來Perplexity迭代后的產品中。

而只要看看這張論文里給出的prompt示意圖,這種技術方案之下,前端長成什么樣最終似乎就是一個大概率的雷同。

37b31740-fc4e-11ee-9118-92fbcf53809c.jpg

說了這么多,其實你會發現,如果換成一個其他的基于“別人”的API和大模型能力,以及公開的論文給出的技術路線而開發的應用,可能這“抄襲”的指責只會讓人一笑而過。Perplexity的指責似乎也是一樣的事情,賈揚清的500行代碼成了破解獨角獸身份帶來的技術幻覺最好的解藥。

醉翁之意

但沒人否認的是,Perplexity依然是一款好產品。

然而一款充滿新設計的產品的好,在于功能體驗的量級上的領先,它來自對一整個系統的好品味與一個個細節積攢起來的優化。對Perplexity來說,對大模型和召回技術的理解,以及它們與應用的結合才是它快速成功的關鍵。而不在于一個單點的而且事實上也并不新鮮的概念。

在把理念通過簡潔的前端實現后,perplexity真正抓住用戶的是對產品的打磨進而將對話能力與強大搜索引擎的準確性相結合。這背后是各種細節,品味,經驗積累的最終結果。因此,它的護城河必然和時間成正比,從今天人們對它的好評也能看出——速度快,體驗絲滑,都是最樸素的感知,也是最容易替代的感知,因此在面對一個速度甚至更快的Lepton開源產品demo時,弦自然繃緊了。

而這也帶來整件事里真正有意思的地方:Perplexity暗示Lepton是抄襲其實在揣著明白裝糊涂。這種做法的一個表面上的作用,自然是“掩蓋”上面講的技術門檻并不高這件事。而除此之外,裝糊涂其實還有更重要的理由。

賈揚清在去年離開阿里后,創業初期其實十分低調。但這名開發了Caffe,核心參與了Tensorflow和Pytorch的框架大神,身經百戰的原阿里副總裁,顯然對自己和團隊的技術能力并不低調。在9月時我在硅谷聽他創業后的第一次公開分享,他已經在展示自己的Lepton服務是大模型基礎框架服務里速度第一的存在。只不過,現在看起來當時Lepton仍處早期,對更多模型的適配,對算力的建設等都在解決當中。

而進入2024年,賈揚清和Lepton開始逐漸高調。這一次Lepton Search的發布像是一個轉折點。這家創業公司正式開始進入戰場。

在這條Lepton Search的發布推特引發討論的同一天,AI創業公司Martian的一份開源大模型API推理榜單發布,對多款推理產品在主要的開源模型上的推理成本、速率和吞吐量等指標做了測試,而Lepton拿下多項關鍵指標第一。在另一個由ArtificialAnalysis.ai發布的API推理榜單中,Lepton也拿下了Mixtral 8x7B這個模型的每秒處理Token數的第一,并且是唯一一個支持Mixtral 32k上下文窗口的服務?!八膬r格也極具競爭力”,這個榜單這樣說。

而在賈揚清轉發的榜單圖中,Lepton高高的圓圈旁邊,被它超過的一個小圓圈正是Perplexity。

37cba2b0-fc4e-11ee-9118-92fbcf53809c.jpg

是的,Perplexity才不只是一個應用公司。

在Perplexity的對話搜索產品之外,Perplexity Lab其實和Lepton一樣,也是一個API推理服務商,比如最近剛發布的CodeLlama-70B-Instruct,就可以購買Perplexity Lab的API來直接使用,這也是最近Perplexity真正在發力的重點,它的社交媒體等賬號在大力推廣的是這個服務。

相比Perplexity這個搜索應用,Lepton無疑直接沖擊的是后面這部分的付費用戶。

這對Perplexity有多重要呢?

事實上今天的Perplexity有點掛羊頭賣狗肉的意味:

用一個極具話題度(VC可以參與共謀)的toC產品吸引融資彈藥,然后補貼到API 燒錢競賽中去。因為前者面對的是今天商業世界里最成熟的全家桶+廣告的搜索商業模式,而后者則是在新周期里重演一遍被驗證多次的規模效益的機會——先燒錢拿到市場份額,再提高收費。

也就是說都是關乎API,一個是成本,一個是收益。一個是被數據方控制生死的應用,一個是掘金潮里賣鏟子的生意。你說拿個真正更重要呢?

而且,如果去看一看Perplexity創業初期的故事,它最早做了一款口碑不錯的推特內容的搜索,后來正因為馬斯克收購推特后大幅提高API價格而被迫放棄。這些經驗Perplexity顯然是吸取了,不想再犯一次。

所以裝糊涂的第二層目的就是借著先占據的領先和C端產品的存在感發起一下進攻,騷擾一下在基礎設施端未來肉眼可見必有一戰的強敵。

看來所有人都意識到,在AI基礎設施層面,在所謂的API框架層面,一場更持久的戰爭要來了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26909

    瀏覽量

    264697
  • 代碼
    +關注

    關注

    30

    文章

    4569

    瀏覽量

    67062
收藏 人收藏

    評論

    相關推薦

    國產藍牙模組 | BLE5.2為藍牙帶來了哪些變化?

    經過多年的發展,藍牙已經從最初的1.0版本演變到了最新的5.3版本,目前最常用的是BLE5.2版本。在歷代的版本更迭中,藍牙技術有了非常大的進步。本期文章將帶大家一起了解BLE5.2的主要特點
    的頭像 發表于 05-31 08:25 ?50次閱讀
    國產藍牙模組 | BLE<b class='flag-5'>5.2</b>為藍牙帶來了哪些變化?

    SmartBond? DA14592 低功耗藍牙? 5.2 子板數據手冊

    電子發燒友網站提供《SmartBond? DA14592 低功耗藍牙? 5.2 子板數據手冊.rar》資料免費下載
    發表于 05-22 17:06 ?0次下載
    SmartBond? DA14592 低功耗藍牙? <b class='flag-5'>5.2</b> 子板數據手冊

    YXC興科技,邀您一起觀展 #科技 #半導體 #電子行業 #晶振 #興科技

    興科技
    揚興科技
    發布于 :2024年05月14日 18:32:26

    在使用STM32電機庫5.2的時候,生成的工程在Application/User中沒有代碼是為什么?

    在使用STM32電機庫5.2的時候,生成的工程在Application/User中除了主函數外其他的文件里邊只有注釋,沒有代碼。我當時生成工程的時候,更換了一次庫函數的路徑,然后重新改回去就出現這個問題了。
    發表于 04-24 07:28

    在uCGUI的回調函數里加了代碼,stm32無法啟動怎么解決?

    我是一個初學者。最近在寫一個uCGUI上的小應用的時候遇到了這樣的問題,我在MULTIEDIT控件的回調函數里加了一代碼,運行我自己寫的一個用于計算的函數,在沒有加這一代碼的時候運
    發表于 04-24 07:06

    STM32F103C8使用CUBEMX5.2,生成的USB HID工程編譯出錯怎么解決?

    STM32F103C8使用CUBEMX5.2,選擇Custom Human Interface Device Class(HID),生成工程后直接編譯盡然有錯誤在usbd_conf.c里有這么一個
    發表于 04-22 06:45

    Perplexity將Yelp數據引入其聊天機器人

    Perplexity首席執行官Aravind Srinivas告訴The Verge,許多人正在使用像常規搜索引擎一樣的聊天機器人 —— 直接從源頭提供他們想要的東西的信息是有意義的,比如選擇餐館。
    的頭像 發表于 03-19 17:36 ?441次閱讀
    <b class='flag-5'>Perplexity</b>將Yelp數據引入其聊天機器人

    黃仁勛使用Perplexity AI聊天機器人,日常用于研究

    值得關注的是,作為 “全球首個對話式答案引擎”,Perplexity 的便捷查詢能力和話題深度挖掘能力或許深受黃仁勛青睞。同時,它還附帶實用的歷史查詢線程庫和新聞時事瀏覽功能。
    的頭像 發表于 02-25 11:36 ?270次閱讀

    BLE5.2為藍牙帶來了哪些變化?

    經過多年的發展,藍牙已經從最初的1.0版本演變到了最新的5.3版本,目前最常用的是BLE5.2版本。在歷代的版本更迭中,藍牙技術有了非常大的進步。本期文章將帶大家一起了解BLE5.2的主要特點
    的頭像 發表于 10-26 08:25 ?631次閱讀
    BLE<b class='flag-5'>5.2</b>為藍牙帶來了哪些變化?

    光,高速光耦的分類

    光高速光耦的介紹 舉例
    發表于 10-12 09:50

    寄存器是寫10還是寫00?

    寄存器是寫10還是寫00
    發表于 09-26 06:45

    FIFO讀后一定要嗎?

    FIFO讀后一定要
    發表于 09-22 06:31

    R2A25110KSP 數據表 Rev.5.2

    R2A25110KSP 數據表 Rev.5.2
    發表于 07-05 18:38 ?0次下載
    R2A25110KSP 數據表 Rev.<b class='flag-5'>5.2</b>

    PyTorch教程5.2之多層感知器的實現

    電子發燒友網站提供《PyTorch教程5.2之多層感知器的實現.pdf》資料免費下載
    發表于 06-05 15:32 ?0次下載
    PyTorch教程<b class='flag-5'>5.2</b>之多層感知器的實現
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>