日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 數(shù)碼

Ollama發(fā)布自研多模態(tài)AI引擎,本地推理性能實現(xiàn)大幅提升

來源: 責(zé)編: 時間:2025-05-18 15:58:57 45觀看
導(dǎo)讀近期,科技領(lǐng)域迎來了一項新的技術(shù)突破。據(jù)WinBuzzer于5月16日報道,開源大語言模型服務(wù)工具Ollama宣布成功研發(fā)出一款多模態(tài)AI定制引擎,這一創(chuàng)新成果標(biāo)志著Ollama在技術(shù)上實現(xiàn)了對llama.cpp框架的直接依賴的擺脫。此前,lla

近期,科技領(lǐng)域迎來了一項新的技術(shù)突破。據(jù)WinBuzzer于5月16日報道,開源大語言模型服務(wù)工具Ollama宣布成功研發(fā)出一款多模態(tài)AI定制引擎,這一創(chuàng)新成果標(biāo)志著Ollama在技術(shù)上實現(xiàn)了對llama.cpp框架的直接依賴的擺脫。wQD28資訊網(wǎng)——每日最新資訊28at.com

此前,llama.cpp項目通過整合libmtmd庫,為項目增添了全面的視覺支持功能。這一進展引發(fā)了社區(qū)對Ollama與llama.cpp之間關(guān)系的廣泛討論。針對這一話題,Ollama團隊成員在Hacker News平臺上進行了澄清,強調(diào)他們的引擎是基于golang獨立開發(fā)的,并未直接借鑒llama.cpp的C++實現(xiàn),并對社區(qū)的反饋表示了感謝。wQD28資訊網(wǎng)——每日最新資訊28at.com

在官方聲明中,Ollama指出,隨著各大科技公司如meta的Llama 4、Google的Gemma 3、阿里巴巴的Qwen 2.5 VL以及Mistral Small 3.1等推出的AI模型復(fù)雜性日益增加,現(xiàn)有的技術(shù)架構(gòu)已難以滿足高效處理的需求。因此,Ollama決定推出這款全新的多模態(tài)AI定制引擎。wQD28資訊網(wǎng)——每日最新資訊28at.com

wQD28資訊網(wǎng)——每日最新資訊28at.com

這款新引擎在本地推理精度上實現(xiàn)了顯著突破,特別是在處理大型圖像并生成大量token時,表現(xiàn)尤為突出。Ollama通過引入圖像處理附加元數(shù)據(jù),優(yōu)化了批量處理和位置數(shù)據(jù)管理,有效避免了圖像分割錯誤導(dǎo)致的輸出質(zhì)量下降問題。他們還采用了KVCache優(yōu)化技術(shù),進一步加速了transformer模型的推理速度。wQD28資訊網(wǎng)——每日最新資訊28at.com

在內(nèi)存管理方面,新引擎也進行了大幅優(yōu)化,并新增了圖像緩存功能。這一功能確保了圖像處理后的數(shù)據(jù)可以重復(fù)使用,避免了數(shù)據(jù)的提前丟棄,從而提高了資源利用效率。為了進一步提升性能,Ollama還與NVIDIA、AMD、Qualcomm、Intel和Microsoft等硬件巨頭展開合作,通過精準(zhǔn)檢測硬件元數(shù)據(jù),對內(nèi)存估算進行了優(yōu)化。wQD28資訊網(wǎng)——每日最新資訊28at.com

針對像meta的Llama 4 Scout(一款擁有1090億參數(shù)的混合專家模型MoE)這樣的復(fù)雜模型,Ollama的新引擎還支持分塊注意力(chunked attention)和2D旋轉(zhuǎn)嵌入(2D rotary embedding)等先進技術(shù)。這些技術(shù)的引入,使得Ollama在處理復(fù)雜模型時能夠展現(xiàn)出更高的效率和準(zhǔn)確性。wQD28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-24-151084-0.htmlOllama發(fā)布自研多模態(tài)AI引擎,本地推理性能實現(xiàn)大幅提升

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 螞蟻集團CTO何征宇:數(shù)據(jù)短缺成大模型發(fā)展最大瓶頸

下一篇: ChatGPT將支持MCP協(xié)議,企業(yè)可無縫對接第三方AI服務(wù)?

標(biāo)簽:
  • 熱門焦點
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數(shù)據(jù)來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內(nèi)市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 十個可以手動編寫的 JavaScript 數(shù)組 API

    JavaScript 中有很多API,使用得當(dāng),會很方便,省力不少。 你知道它的原理嗎? 今天這篇文章,我們將對它們進行一次小總結(jié)。現(xiàn)在開始吧。1.forEach()forEach()用于遍歷數(shù)組接收一參
  • 服務(wù)存儲設(shè)計模式:Cache-Aside模式

    Cache-Aside模式一種常用的緩存方式,通常是把數(shù)據(jù)從主存儲加載到KV緩存中,加速后續(xù)的訪問。在存在重復(fù)度的場景,Cache-Aside可以提升服務(wù)性能,降低底層存儲的壓力,缺點是緩存和底
  • 三分鐘白話RocketMQ系列—— 如何發(fā)送消息

    我們知道RocketMQ主要分為消息 生產(chǎn)、存儲(消息堆積)、消費 三大塊領(lǐng)域。那接下來,我們白話一下,RocketMQ是如何發(fā)送消息的,揭秘消息生產(chǎn)全過程。注意,如果白話中不小心提到相關(guān)代
  • 一個注解實現(xiàn)接口冪等,這樣才優(yōu)雅!

    場景碼猿慢病云管理系統(tǒng)中其實高并發(fā)的場景不是很多,沒有必要每個接口都去考慮并發(fā)高的場景,比如添加住院患者的這個接口,具體的業(yè)務(wù)代碼就不貼了,業(yè)務(wù)偽代碼如下:圖片上述代碼有
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人員可能會涉及各種各樣的安全任務(wù),包括但不限于:開發(fā)某些安全工具的插件,滿足自己特定的安全需求;自定義github搜索工具,快速查找所需的安全資料、漏洞poc、exp
  • 中國家電海外掘金正當(dāng)時|出海專題

    作者|吳南南編輯|胡展嘉運營|陳佳慧出品|零態(tài)LT(ID:LingTai_LT)2023年,出海市場戰(zhàn)況空前,中國創(chuàng)業(yè)者在海外紛紛摩拳擦掌,以期能夠把中國的商業(yè)模式、創(chuàng)業(yè)理念、戰(zhàn)略打法輸出海外,他們依
  • 自律,給不了Keep自由!

    來源 | 互聯(lián)網(wǎng)品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • 滴滴違法違規(guī)被罰80.26億 共存在16項違法事實

    滴滴違法違規(guī)被罰80.26億 存在16項違法事實開始于2121年7月,歷經(jīng)一年時間,網(wǎng)絡(luò)安全審查辦公室對“滴滴出行”網(wǎng)絡(luò)安全審查終于有了一個暫時的結(jié)束。據(jù)“網(wǎng)信
Top 主站蜘蛛池模板: 秀山| 漳平市| 施秉县| 自贡市| 綦江县| 大兴区| 白山市| 左权县| 吉木萨尔县| 临汾市| 乌什县| 兴安县| 承德县| 曲阜市| 青铜峡市| 江安县| 廊坊市| 襄垣县| 承德县| 安泽县| 麦盖提县| 原平市| 天台县| 商水县| 台山市| 邓州市| 湘乡市| 瑞昌市| 永定县| 教育| 营山县| 齐河县| 禹州市| 岳普湖县| 花莲市| 马山县| 吉林省| 江油市| 临泉县| 广南县| 怀来县|