今年3月ChatGPT-4上線以來,國內科技龍頭企業密集推出人工智能大模型,百度“文心一言”、阿里云“通義千問”、華為“盤古”、360“智腦”、昆侖萬維“天工”、京東“靈犀”、科大訊飛“星火”、騰訊“混元”、商湯“日日新”等大模型先后登場,呈現百花齊放、迅猛發展的態勢。截至2023年10月初,國內公開的AI大模型已經超過200個。
當前,大模型正在成為推動新一輪科技創新、產業升級、生產力躍遷的重要力量。隨著前沿技術推動產業全鏈條升級,未來從田間到產線,從實驗室到便利店,大模型可能無處不在。
“與早期的人工智能模型相比,今年我國大模型在參數量上實現了質的飛躍,復雜任務建模能力整體提升,學習能力、泛化性更強,具備了更高層次的認知互動能力?!北编]國家大學科技園元宇宙產業協同創新中心執行主任陳曉華表示。
然而,在大模型迅猛發展的背后,也存在一系列問題亟待解決。
首先是對大模型套殼的質疑。近期,從谷歌新發布的AI模型Gemini演示視頻的造假,到字節跳動被曝出部分工程師使用OpenAI技術開發自己的大語言模型,違反了OpenAI服務條款,因此被暫停了賬戶……“百模大戰”的激烈競爭以及引發的亂象,也讓業界對大模型評測標準以及統一規范提出了新的課題。
由于大模型的復雜性和應用場景的多樣性,如何評價其性能和效果成為下一階段的一個極具挑戰性的問題。因此,建立一套科學、合理、完善的評價體系對于大模型的應用至關重要,它能夠推動技術進步、促進產業發展,同時確保技術應用的合規性和社會效益。
其次,隨著互聯網和科技企業不斷調整大模型參數,傳統企業對于數智化轉型需求的增加,算力需求增長。但是,由于高端芯片獲取難度大,大模型的研發成本進一步增加。北京大學智能學院副院長林宙辰教授提出通過合作共享資源和數據,以及創新訓練方法和獎勵機制,來更高效地開發和利用大模型的必要性。他提出通過股份和特別的獎勵機制來鼓勵公司共享數據和算力,其中股份可以基于資金貢獻或者模型準確率的貢獻來分配,個人也可以提供數據,或者參與到訓練過程中,通過數據質量和微調效果擁有股份。這或許能幫助中小企業移開面前的“成本”“技術”兩座大山。
在算法方面,國產大模型與國際先進水平相比沒有根本性差異,基本都是圍繞深度神經網絡、注意力機制、人工調優等基礎算法進行模型結構或局部算法優化,而在算力、數據等方面則與國際先進水平存在一定差距。艾瑞咨詢產業數字化研究院負責人徐樊磊介紹,為提升整體算力效率和滿足差異化需求,應建立支撐大模型萬億量級參數計算的“智算中心”?!爸撬阒行摹笨衫矛F有高質量數據中心,通過提升組網能力、協同能力、軟硬件適配能力等實現部署。當前,“萬卡”級別的智算中心正在主要節點城市發展起來。
面向未來,企業不能盲目跟風,需要滿足自身已有的基礎產品和用戶群體在AI領域的訴求。從政產學研用通盤視角來看,政策端需要做好統籌調度,支持孵化大模型產業生態,提供相應的創新要素供給,促進科技成果轉化和產業大模型落地成熟、成規?;患夹g端需要進一步推動軟硬件技術一體化,為大模型的產業端應用提供更牢固的技術基礎;產業端則需要促進產業對大模型和數智化應用升級的知識認知、能力建設和人才培養,并結合當前產業大模型訓練需求,協助和支持科研界將大模型成果落實落地。
本文鏈接:http://www.www897cc.com/showinfo-16-54786-0.htmlAI大模型走出“泡沫期”未來何如
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 回顧2023,感知中國科技行業新變化