AI 手機(jī)的 iPhone 時(shí)刻
前不久, 聯(lián)發(fā)科正式推出新一代旗艦 5G 智慧體 AI 芯片天璣 9400。發(fā)布沒(méi)多久, 它就成為了 2024 年旗艦手機(jī)芯片的標(biāo)桿, 并且會(huì)應(yīng)用在即將上市的 vivo 手機(jī)上。
在這塊芯片強(qiáng)大性能的支持下, 手機(jī)的 AI 算力顯著提升,AI 功能豐富多樣, 帶來(lái)用戶體驗(yàn)的更多可能性。
將大模型裝進(jìn)手機(jī)并且流暢運(yùn)行,AI 離我們?cè)絹?lái)越近了。但無(wú)法忽視的一件事是, 受限于大模型對(duì)算力資源的需求, 目前各家手機(jī)廠商的手機(jī) AI 進(jìn)化之路, 幾乎都是建立在芯片的能力突破這一前提下。也就是說(shuō), 脫離高算力的芯片, 手機(jī)無(wú)法達(dá)到同等程度的 AI 升級(jí)。
我們不禁要問(wèn), 米 OV 們?cè)谑謾C(jī)的 AI 突破上展現(xiàn)出真本事, 是否只能依賴高算力芯片? 在手機(jī)上運(yùn)行更復(fù)雜的大模型, 搭載天璣 9400 這樣的芯片是唯一路徑嗎?
另一條路: 算力競(jìng)賽算法優(yōu)化
從設(shè)備的算力競(jìng)賽轉(zhuǎn)到大模型的算法優(yōu)化,RockAI 一直堅(jiān)持一條不一樣的道路, 以通用的端側(cè)大模型去適配不同算力的終端設(shè)備, 無(wú)需裁剪, 無(wú)損部署, 最大程度保證 AI 功能的完整呈現(xiàn)。
1.全新架構(gòu)
非 Transformer 架構(gòu)類腦激活機(jī)制
當(dāng)前市場(chǎng)上主流大模型普遍采用 Transformer 架構(gòu)、Attention 機(jī)制, 對(duì)算力的要求非常高, 這也是廠商升級(jí)芯片、設(shè)備的主要原因之一。許多業(yè)界人士提出 AI 的發(fā)展路線不應(yīng)局限于 Transformer 架構(gòu), 開(kāi)發(fā)成本、計(jì)算資源、終端響應(yīng)速度等因素倒逼大模型的革新。
在“高算力才能負(fù)載大模型”中尋找突破點(diǎn),RockAI 從底層神經(jīng)網(wǎng)絡(luò)著手, 自研 Yan 架構(gòu)大模型, 以 MCSD (Multi-channel slope and decay) 架構(gòu)替代 Transformer 的 Attention 機(jī)制, 并實(shí)現(xiàn)類腦分區(qū)激活, 大大減少了計(jì)算復(fù)雜度和算力消耗。
2.全線適配
真端側(cè)真無(wú)損 0 壓 0 裁
本地部署隱私安全
今年 7 月的 WAIC 大會(huì)上, 未經(jīng)壓縮裁剪的 Yan1.2, 能跑通算力不到普通家用筆記本的 1/8、且低于絕大多數(shù)智能手機(jī)的樹(shù)莓派 5, 說(shuō)明 Yan 架構(gòu)大模型已經(jīng)具備部署在大多數(shù)設(shè)備上的能力。
RockAI 最新發(fā)布的 Yan1.3 群體智能單元大模型, 作為一個(gè) 3B 參數(shù)的多模態(tài)大模型, 能夠處理文本、語(yǔ)音、視覺(jué)等多模態(tài)信息, 可在主流消費(fèi)級(jí) CPU 等端側(cè)設(shè)備上無(wú)損運(yùn)行, 且綜合性能已經(jīng)超越了 Llama3。
與昂貴旗艦芯才有良好體驗(yàn)的大模型, 或經(jīng)過(guò)壓縮量化性能有損的大模型相比,Yan1.3 是更具普適性、高中低端設(shè)備輕松駕馭的“滿血”端側(cè)大模型。
目前,Yan1.3 已經(jīng)實(shí)現(xiàn)了手機(jī)、PC、無(wú)人機(jī)、機(jī)器人等設(shè)備的本地部署, 從低算力到高算力, 從消費(fèi)級(jí)到工業(yè)級(jí), 讓智能不受限。
人工智能為人類帶來(lái)前所未有的便利, 也引發(fā)了不容忽視的安全風(fēng)險(xiǎn)。無(wú)論個(gè)人還是企業(yè), 對(duì)數(shù)據(jù)安全和隱私保護(hù)的訴求日益提升。在本地部署的 Yan1.3, 天然具有保護(hù)隱私的優(yōu)勢(shì)。以手機(jī)、PC 為例, 一方面可以在本地處理用戶數(shù)據(jù), 將數(shù)據(jù)保留在終端上, 避免重要資料、個(gè)人信息的外泄, 另一方面也減少了對(duì)網(wǎng)絡(luò)傳輸?shù)囊蕾? 可以滿足高鐵辦公、離線會(huì)議總結(jié)等網(wǎng)絡(luò)狀況不佳或斷網(wǎng)場(chǎng)景下的需求, 讓用戶感受到 AI 的便利。
在本地運(yùn)算的端側(cè)大模型不依賴網(wǎng)絡(luò)傳輸, 意味著響應(yīng)速度更快, 可以直接在終端設(shè)備上進(jìn)行智能化決策, 是交互效率提升的理想選擇。憑借出色的架構(gòu)設(shè)計(jì)和多模態(tài)處理能力,Yan1.3 能夠?qū)崿F(xiàn)設(shè)備上的高效運(yùn)行, 在 CPU 上秒級(jí)響應(yīng),GPU 上更是百毫秒級(jí)實(shí)時(shí)處理, 超強(qiáng)模力讓不同終端的交互體驗(yàn)十分絲滑。
3.群體智能
自主學(xué)習(xí)持續(xù)進(jìn)化
強(qiáng)交互高協(xié)同
RockAI 認(rèn)為群體智能才是通往人工智能的最終路徑, 而實(shí)現(xiàn)群體智能包括四個(gè)發(fā)展階段: 創(chuàng)新性基礎(chǔ)架構(gòu)、多元化硬件生態(tài)、自適應(yīng)智能進(jìn)化、協(xié)同化群體智能。隨著 Yan 1.3 成功在多元設(shè)備端部署,RockAI 已經(jīng)完成了第二階段, 為打通智能生態(tài)創(chuàng)造條件。
從生物的群體智能源起, 機(jī)器的群體智能以一個(gè)個(gè)智能單元的協(xié)同、交互激發(fā)群體的智慧。Yan 架構(gòu)大模型作為 RockAI 面向機(jī)器的群體智能單元大模型, 不只是為了提升單個(gè)設(shè)備的能力, 更是為機(jī)器注入新的智能基因, 讓世界上每一臺(tái)設(shè)備擁有自己的智能。
它們或許外觀不同、功能不同、適用場(chǎng)景不同, 當(dāng)智能體間的交互壁壘被打破, 可以像人類一樣交流協(xié)作, 釋放出超越個(gè)體的能力, 形成群體智能系統(tǒng), 掀開(kāi)群體智能的新篇章。
創(chuàng)新 > follow
在 AI 滲透到各行各業(yè)的今天, 或許我們更需要思考, 為什么出發(fā)以及怎樣前進(jìn)?
為了 AI 而 AI, 還是從人本主義出發(fā)普惠大眾?
獨(dú)立思考持續(xù)創(chuàng)新, 還是 follow?
RockAI 不斷探索人工智能的出發(fā)點(diǎn)是,AI 普惠。當(dāng)下, 還有更大多數(shù)值得我們關(guān)注, 我們期待, 通過(guò)另辟蹊徑, 在實(shí)現(xiàn)商業(yè)價(jià)值的同時(shí), 最大程度實(shí)現(xiàn)社會(huì)價(jià)值, 為 AI 普惠貢獻(xiàn)力量。
本文鏈接:http://www.www897cc.com/showinfo-26-125078-0.html高端手機(jī)才能用 AI?NO!RockAI 讓 AI 觸手可及
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: Soul App 自研多模態(tài)大模型,全面賦能用戶社交體驗(yàn)
下一篇: 華為云開(kāi)源時(shí)序數(shù)據(jù)庫(kù) openGemini:使用列存引擎解決時(shí)序高基數(shù)問(wèn)題