日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網(wǎng)絡

李彥宏內(nèi)部講話流出!談大模型三個認知誤區(qū)、稱不允許打榜

來源: 責編: 時間:2024-09-11 16:26:28 99觀看
導讀 快科技9月11日消息,據(jù)媒體報道,百度創(chuàng)始人李彥宏的一則內(nèi)部講話曝光,稱外界對大模型有相當多的誤解。在此次講話中,李彥宏提到了外界對大模型的三個認知誤區(qū),包括大模型競爭、開源模型效率、智能體趨勢等熱點話

快科技9月11日消息,據(jù)媒體報道,百度創(chuàng)始人李彥宏的一則內(nèi)部講話曝光,稱外界對大模型有相當多的誤解。5ii28資訊網(wǎng)——每日最新資訊28at.com

在此次講話中,李彥宏提到了外界對大模型的三個認知誤區(qū),包括大模型競爭、開源模型效率、智能體趨勢等熱點話題。5ii28資訊網(wǎng)——每日最新資訊28at.com

對于大模型之間的壁壘,李彥宏表示,部分自媒體的炒作,再加上每個新模型發(fā)布的時候都有宣傳的動力,使得大家有一種印象,認為模型之間的能力差別已經(jīng)比較小了,其實真不是這樣。5ii28資訊網(wǎng)——每日最新資訊28at.com

“真正衡量文心大模型能力的是,你在具體應用場景當中到底有沒有能夠滿足用戶的需求,有沒有能夠產(chǎn)生價值的增益,這是我們真正在乎的”,李彥宏表示,“我不允許我們的技術人員去打榜”。5ii28資訊網(wǎng)——每日最新資訊28at.com

不僅模型之間還有著明顯的差距,大模型的天花板也很高,跟理想狀態(tài)還差得非常遠,所以模型還需要不斷快速地去迭代、去更新、去升級,幾年、十幾年如一日地投入。5ii28資訊網(wǎng)——每日最新資訊28at.com

李彥宏內(nèi)部講話流出!談大模型三個認知誤區(qū)、稱不允許打榜5ii28資訊網(wǎng)——每日最新資訊28at.com

以下為內(nèi)部講話內(nèi)容5ii28資訊網(wǎng)——每日最新資訊28at.com

問:有觀點認為,大模型之間的能力已經(jīng)沒有壁壘了?5ii28資訊網(wǎng)——每日最新資訊28at.com

李彥宏:這個說法我不同意。我認為外界對大模型有相當多的誤解,每一個新模型發(fā)布時,肯定都想說自己有多好,每次都去跟GPT-4o做比較,拿測試集或者弄一些榜單,說我的得分已經(jīng)跟它差不多了,甚至某些單項上得分已經(jīng)超過它了,但這并不能證明這些新發(fā)的模型跟OpenAl先進的模型相比已經(jīng)沒有那么大的差距了。5ii28資訊網(wǎng)——每日最新資訊28at.com

模型之間的差距是多維度的,一個維度是能力方面,不管是理解能力、生成能力、邏輯推理能力還是記憶能力等這些基本能力上的差距;另一個維度是成本方面,你想具備這個能力或者想回答這些問題,你付出的成本是多少?5ii28資訊網(wǎng)——每日最新資訊28at.com

有些模型可能推理速度很慢,雖然也達到同樣的效果了,但實際上它的體驗還是不如先進的模型。還有就是對于測試集的over-fitting,每一個想證明自己能力的模型都會去打榜,打榜時他就要猜別人到底在測什么、哪些題我用什么樣的技巧就能做對,所以從榜單或者測試集上看,你覺得能力已經(jīng)很接近了,但到實際應用中還是有明顯差距的。5ii28資訊網(wǎng)——每日最新資訊28at.com

部分自媒體的炒作,再加上每個新模型發(fā)布的時候都有宣傳的動力,使得大家有一種印象,認為模型之間的能力差別已經(jīng)比較小了,其實真不是這樣。在實際使用過程當中,我不允許我們的技術人員去打榜,真正衡量文心大模型能力的是,你在具體應用場景當中到底有沒有能夠滿足用戶的需求,有沒有能夠產(chǎn)生價值的增益,這是我們真正在乎的。5ii28資訊網(wǎng)——每日最新資訊28at.com

我們需要看到,一方面模型能力之間還有比較明顯的差距,另外一方面天花板很高,你今天做到的跟你實際想要做到的、跟理想狀態(tài)還差得非常遠,所以模型還需要不斷快速地去迭代、去更新、去升級。5ii28資訊網(wǎng)——每日最新資訊28at.com

即使今天你看到差距也許沒有那么大了,再過一年你看看差距有沒有拉大? 有誰能夠持續(xù)不斷地幾年甚至十幾年如一日往這個方向上去投入,讓它越來越能夠滿足用戶的需求、滿足場景、滿足提升效率或者說降低成本等需求?不同的模型之間差距不是越來越小,是會越來越大的,只是他們不知道真實需求的時候,只去做測試集的題可能覺得差不多了。5ii28資訊網(wǎng)——每日最新資訊28at.com

所謂的領先12個月或者落后18個月,我認為沒有那么重要。我們每個公司都處在完全競爭的市場環(huán)境中,你不管做什么方向都有很多競爭對手,如果你能永遠保證領先對手12~18個月,那是天下無敵的,不要覺得12—18個月是很短的時間,哪怕你能保證永遠領先競爭對手6個月,那就贏了,你的市場份額可能是70%,而對手可能僅為20%甚至10%的份額。5ii28資訊網(wǎng)——每日最新資訊28at.com

問:有人說開源模型正在縮小與閉源模型的差距,這會摧毀閉源大模型公司的商業(yè)模式嗎?5ii28資訊網(wǎng)——每日最新資訊28at.com

李彥宏:這個問題跟上一個問題是高度關聯(lián)的,我剛才講一個模型除了能力或效果之外還要看效率,效率上開源模型是不行的。閉源模型準確地講應該叫商業(yè)模型,商業(yè)化的模型是無數(shù)個用戶或者說客戶在共享同樣的資源,在分攤研發(fā)成本、分攤推理用的機器資源和GPU,而開源模型需要你自己去部署一套東西,部署之后GPU的使用率是多少呢?5ii28資訊網(wǎng)——每日最新資訊28at.com

我們的文心大模型3.5、4.0也好,使用率都是90%多,你部署一個開源模型有多少人在用?我們對外講文心大模型每天調用量超過6億,每天生成的token數(shù)超過萬億,哪個開源模型可以說自己一天調用量是多少、生成了多少token?沒有人用的話成本怎么分擔?推理成本怎么能夠跟商業(yè)化模型相比呢?5ii28資訊網(wǎng)——每日最新資訊28at.com

在大模型時代之前,大家習慣了開源意味著免費、意味著成本低。那時市面上那種商業(yè)化的產(chǎn)品,每一個版本都要為之付錢,比如買一個電腦裝Windows,可能微軟要從中收多少錢,而你如果跑一個Linux就不用花這個錢了。由于Linux是開源的,所有程序員都可以看到代碼,哪兒做的不好我可以去更新,更新了再check in,大家眾人拾柴火焰高,你在巨人的肩膀上可以不斷地進步。5ii28資訊網(wǎng)——每日最新資訊28at.com

但是這些東西在大模型時代都不成立,大模型時代大家經(jīng)常講的是GPU有多貴,算力是決定大模型成敗的一個關鍵因素,開源的模型給你送算力嗎?它不給你送算力,怎么能夠讓算力高效地被利用?開源模型解決不了這個問題。5ii28資訊網(wǎng)——每日最新資訊28at.com

以前你買電腦的時候就已經(jīng)為算力付費了,但大模型的推理不是這樣,這個推理其實很貴。所以說開源大模型的價值在教學科研這些領域,要想搞清楚大模型的工作原理是啥,如果不知道源代碼什么的肯定是有劣勢的,但是真正在商業(yè)領域,當你追求的是效率、效果,追求的是低的成本時,開源模型是沒有優(yōu)勢的。5ii28資訊網(wǎng)——每日最新資訊28at.com

問:AI應用的演進方式是什么?為什么強調智能體?5ii28資訊網(wǎng)——每日最新資訊28at.com

李彥宏:大模型發(fā)展的過程必然要經(jīng)歷這幾個階段,一開始是對人進行輔助,后出來什么東西需要人把后一道關,我們確定它的效果是OK的,各方面都不錯才會讓它出去,這是Copilot階段;再往下走就是Agent智能體,外界對于Agent有各種各樣不同的定義,主要還是說它有了一定的自主性,具備自主使用工具、反思、自我進化等能力;這種自動化程度再往下走就變成一個所謂的Al Worker,能夠像人一樣做各種各樣的腦力和體力勞動,各方面的工作都可以獨立完成。肯定要有這么一個過程。5ii28資訊網(wǎng)——每日最新資訊28at.com

“智能體是大模型重要的發(fā)展方向”這個判斷,其實是一個非共識。百度Create大會上我們發(fā)了三個產(chǎn)品,AgentBuilder、AppBuilder、ModelBuilder,其中AgentBuilder和AppBuilder都是講智能體的,一個門檻更低一些,另一個功能更強大一些。5ii28資訊網(wǎng)——每日最新資訊28at.com

當我們解釋完了之后,有些人終于開始明白這東西確實有意思,能夠產(chǎn)生價值,而且已經(jīng)可以相對比較低門檻地做出來大家感覺可用的東西。從那時候開始智能體的熱度才慢慢上來,也開始有很多人看好智能體這個發(fā)展方向,但是到今天為止智能體還不是共識,像百度這樣把智能體作為大模型重要的戰(zhàn)略、重要的發(fā)展方向的公司并不多。5ii28資訊網(wǎng)——每日最新資訊28at.com

為什么我們這么強調智能體?因為智能體的門檻確實很低,我們?nèi)ツ暾f要卷應用、大家都去做應用,其實很多人還是說不知道該怎么做,不知道這個方向能不能做出來,我到底要用到什么能力才能夠在這個場景下產(chǎn)生價值,這里面有無數(shù)不確定性,大家不知道怎么從模型變成應用。5ii28資訊網(wǎng)——每日最新資訊28at.com

但是智能體提供了一個非常直接、非常高效、非常簡單的方式,在模型之上構建智能體是相當方便的,這也是為什么今天每周都有上萬個新的智能體在文心平臺上被創(chuàng)造出來。5ii28資訊網(wǎng)——每日最新資訊28at.com

智能體方面我們已經(jīng)看到了趨勢,也有比較好的先決條件,除了模型本身的能力比較強大之外,我們也有很好的分發(fā)通路。5ii28資訊網(wǎng)——每日最新資訊28at.com

百度的APP,尤其是百度搜索一天有數(shù)以億計的人在用,用戶的需求主動向我們表達了,哪一個智能體能更好地去回答他這些問題,去滿足他這些需求,這是一個自然匹配的過程,所以我們是能夠幫助這些開發(fā)者分發(fā)他們智能體的。5ii28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-17-113095-0.html李彥宏內(nèi)部講話流出!談大模型三個認知誤區(qū)、稱不允許打榜

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 賈躍亭稱蘋果正變得平庸:離開喬布斯越來越像失去靈魂的巨人

下一篇: 男生開學發(fā)現(xiàn)同桌是奧運冠軍袁心玥:當時以為自己看錯了

標簽:
  • 熱門焦點
  • 7月安卓手機性能榜:紅魔8S Pro再奪榜首

    7月份的手機市場風平浪靜,除了紅魔和努比亞帶來了兩款搭載驍龍8Gen2領先版處理器的新機之外,別的也想不到有什么新品了,這也正常,通常6月7月都是手機廠商修整的時間,進入8月份之
  • SpringBoot中使用Cache提升接口性能詳解

    環(huán)境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架從 3.1 開始,對 Spring 應用程序提供了透明式添加緩存的支持。和事務支持一樣,抽象緩存允許一致地使用各
  • 從 Pulsar Client 的原理到它的監(jiān)控面板

    背景前段時間業(yè)務團隊偶爾會碰到一些 Pulsar 使用的問題,比如消息阻塞不消費了、生產(chǎn)者消息發(fā)送緩慢等各種問題。雖然我們有個監(jiān)控頁面可以根據(jù) topic 維度查看他的發(fā)送狀態(tài),
  • 企業(yè)采用CRM系統(tǒng)的11個好處

    客戶關系管理(CRM)軟件可以為企業(yè)提供很多的好處,從客戶保留到提高生產(chǎn)力。  CRM軟件用于企業(yè)收集客戶互動,以改善客戶體驗和滿意度。  CRM軟件市場規(guī)模如今超過580
  • 微軟邀請 Microsoft 365 商業(yè)用戶,測試視頻編輯器 Clipchamp

    8 月 1 日消息,微軟近日宣布即將面向 Microsoft 365 商業(yè)用戶,開放 Clipchamp 應用,邀請用戶通過該應用來編輯視頻。微軟于 2021 年收購 Clipchamp,隨后開始逐步整合到 Microsof
  • 騰訊蓋樓,字節(jié)拆墻

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎?一起上晶核,即刻暴打!”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
  • ESG的面子與里子

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之三伏大幕拉起,各地高溫預警不絕,但處于厄爾尼諾大“烤”之下的除了眾生,還有各大企業(yè)發(fā)布的ESG報告。ESG是“環(huán)境保
  • 機構稱Q2國內(nèi)智能手機銷量同比下滑4% vivo份額重回第1

    7月29日消息,根據(jù)市場調查機構Counterpoint Research公布的最新報告,2023年第2季度中國智能手機銷量同比下降4%,創(chuàng)新自2014年以來第2季度銷量新低。報
  • 支持aptX Lossless無損傳輸 iQOO TWS 1賽道版發(fā)布限時優(yōu)惠價369元

    2023年7月4日,“無損音質,聲動人心”iQOO TWS 1正式發(fā)布,支持aptX Lossless無損傳輸,限時優(yōu)惠價369元。iQOO TWS 1耳機率先支持端到端aptX Lossless無
Top 主站蜘蛛池模板: 资溪县| 德化县| 呈贡县| 铁岭市| 绥滨县| 娄烦县| 大埔区| 靖宇县| 井陉县| 九寨沟县| 奉贤区| 博罗县| 五原县| 自治县| 伊金霍洛旗| 南康市| 泰安市| 巴青县| 博爱县| 南充市| 清新县| 左云县| 江阴市| 新兴县| 农安县| 彭阳县| 东宁县| 郓城县| 新密市| 濮阳市| 茂名市| 吴川市| 南召县| 淅川县| 茂名市| 三穗县| 和平县| 建宁县| 庄浪县| 阿巴嘎旗| 武夷山市|