6月7日消息,商湯科技與上海AI實(shí)驗(yàn)室近日聯(lián)合香港中文大學(xué)、復(fù)旦大學(xué)和上海交通大學(xué)發(fā)布了一款名為"書生·浦語"的大型語言模型。該模型參數(shù)量達(dá)到1040億,是當(dāng)前千億級(jí)參數(shù)的大語言模型之一。它基于一個(gè)包含1.6萬億token的多語種高質(zhì)量數(shù)據(jù)集進(jìn)行訓(xùn)練。
據(jù)報(bào)道,"書生·浦語"在全面評(píng)測(cè)中表現(xiàn)出色,在知識(shí)掌握、閱讀理解、數(shù)學(xué)推理、多語翻譯等多項(xiàng)測(cè)試任務(wù)上都表現(xiàn)優(yōu)秀,并展現(xiàn)出強(qiáng)大的綜合能力。尤其在綜合性考試中,該模型在多項(xiàng)中文考試中的成績超過了ChatGPT,甚至包括中國高考各科目的數(shù)據(jù)集。
據(jù)ITBEAR科技資訊了解,早在今年3月,商湯科技就發(fā)布了另一款名為"書生(INTERN)2.5"的多模態(tài)多任務(wù)通用大模型。據(jù)官方介紹,"書生2.5"具備通用場(chǎng)景下的高級(jí)感知和復(fù)雜問題處理能力,可以通過文本定義任務(wù),并根據(jù)給定的視覺圖像和任務(wù)提示語句提供相應(yīng)的指令或作答。此外,它還能根據(jù)用戶的文本創(chuàng)作需求利用擴(kuò)散模型生成算法生成寫實(shí)圖像。
據(jù)悉,"書生2.5"在圖文跨模態(tài)領(lǐng)域的性能表現(xiàn)得益于視覺、語言和多任務(wù)建模三種能力的有效融合。而這次最新發(fā)布的"書生·浦語"大語言模型與"書生2.5"大模型之間可能存在一定聯(lián)系。
商湯科技與上海AI實(shí)驗(yàn)室的這一發(fā)布顯示了大型模型在各行業(yè)中的普遍應(yīng)用趨勢(shì)。這些模型的出色表現(xiàn)為人工智能技術(shù)的發(fā)展帶來了新的可能性,也為各領(lǐng)域的應(yīng)用帶來了更多機(jī)會(huì)和挑戰(zhàn)。隨著大模型的不斷涌現(xiàn),我們可以期待在語言理解、圖像識(shí)別等領(lǐng)域取得更多突破。
本文鏈接:http://www.www897cc.com/showinfo-45-1242-0.html"書生·浦語":商湯科技推出1040億參數(shù)的創(chuàng)新大型語言模型
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com