快科技10月31日消息,在今天上午舉辦的2023云棲大會上,百川智能創始人兼CEO王小川發表演講稱,今年年底之前,國內會有幾家公司能夠做到GPT3.5的水平,明年國內會有若干款超級應用。
王小川表示,百川智能做大模型的理念是“理想上慢一步,落地上快三步”。4月下場之后,百川在兩個月時間就完成了第一個70億參數的模型的發布,行業一般需要半年,比預期時間節省了三倍。
他直言,在大模型領域,確實得承認跟美國存在差距。他預計今年年底之前國內會有幾家公司能達到GPT 3.5的水平,到明年也有信心能夠達到GPT4.0的水平,但是達到之后,可能很難去超越他們。
他在發言中還談到在美國與OpenAI交流時了解到的情況。
“他們在正在設計一個把1000萬顆GPU連在一起做模型的技術。咱們做GPT3.5的時候用了4000顆GPU,做GPT4的時候是25000顆,英偉達一年生產能力才100萬顆,而OpenAI在設計把1000萬個GPU連接起來,這樣一種想法像登月一樣。“
“我對他們充滿了敬畏。我更自豪的地方是,我們在做應用方面可能比美國走得更快。”王小川表示。
王小川認為,在做應用方面,中國企業會走得很快?;诂F在已有的技術,相信中國明年有若干款超級應用。
公開資料顯示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川創立。其核心團隊來自搜狗、Google、騰訊、百度、華為、微軟、字節等知名科技公司,目前團隊規模170余人,研發人員占比超80%。
成立半年,百川智能便接連發布baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B兩款閉源大模型,平均每28天就會發布一款新的大模型。
10月30日,百川智能發布Baichuan2-192K大模型,其上下文窗口長度達192K,是目前全球長的上下文窗口,能夠處理約35萬個漢字,是目前支持長上下文窗口優秀大模型Claude2(支持100K上下文窗口,實測約8萬字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,實測約 2.5萬字)的14倍。
據悉,Baichuan2-192K現已正式開啟內測,以API(應用程序接口)調用的方式開放給核心合作方,目前已經與財經類媒體及律師事務所等機構達成了合作,將全球領先的長上下文能力應用到了傳媒、金融、法律等具體場景當中,不久后將全面開放。
本文鏈接:http://www.www897cc.com/showinfo-17-16113-0.html百川智能王小川:美國OpenAI要把1000萬個GPU連接起來做大模型 這種想法像登月一樣
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 阿里云宣布大模型家族全面升級 :通義千問2.0發布 通義千問App正式上線
下一篇: 半導體持續虧損!三星Q3利潤暴降78%