當前位置：首頁 > 元宇宙 > AI

小成本大作為！Fastino任務特定語言模型超越GPT-4o，延遲狂降99倍

來源：責編：時間：2025-05-15 09:52:49 72觀看

導讀在人工智能領域，盡管現有的頂尖大語言模型（SOTA）展現了卓越智能，部分任務表現甚至超越人類，但其龐大的參數規模——動輒數千億乃至萬億級別，導致了高昂的訓練、部署及推理成本。對于企業及開發者而言，在處理相對簡單卻需大規

在人工智能領域，盡管現有的頂尖大語言模型（SOTA）展現了卓越智能，部分任務表現甚至超越人類，但其龐大的參數規模——動輒數千億乃至萬億級別，導致了高昂的訓練、部署及推理成本。對于企業及開發者而言，在處理相對簡單卻需大規模、高并發處理的任務時，這些頂尖模型并非性價比最優的選擇。

針對這一痛點，新興初創公司Fastino應運而生。該公司利用低端游戲GPU，以平均不足10萬美元的成本，成功訓練出一系列名為“任務特定語言模型”（TLMs）的小型模型。這些模型在特定任務上的性能可媲美大型語言模型，且推理速度快了99倍。

近期，Fastino宣布獲得由Khosla Ventures領投的1750萬美元種子輪融資，Insight Partners、Valor Equity Partners及知名天使投資人Scott Johnston（前Docker首席執行官）和Lukas Biewald（Weights & Biases首席執行官）參與跟投。加上2024年11月由M12（微軟旗下）和Insight Partners領投的700萬美元前種子輪融資，Fastino累計融資額已近2500萬美元。

Fastino由連續創業者Ash Lewis（首席執行官）和George Hurn-Maloney（首席運營官）共同創立。Ash Lewis此前還參與創立了DevGPT、Ashtv AI等多家AI原生公司。他們組建了一支技術團隊，成員來自谷歌DeepMind、斯坦福大學、卡內基梅隆大學及蘋果等頂尖機構，能夠從底層技術革新，訓練出“任務特定語言模型”。

Fastino的TLM模型在成本效益和性能上表現突出。隨著AI模型規模的不斷擴大，雖然數千億至上萬億參數的SOTA模型在智能上持續提升，甚至在某些初級任務上替代人力，但高昂的訓練、部署及推理成本使得它們在經濟性上并不總是最優選擇。即便是擁有近10億周活用戶的OpenAI，也面臨著用戶增長帶來的成本飆升壓力。

Ash Lewis談及創業初衷時表示：“我們上一家創業公司在走紅后，基礎設施成本急劇上升。有一段時間，語言模型的開支甚至超過了整個團隊的費用，這促使我們創立了這家公司。”

除了高昂的運行成本，大尺寸模型的通用性與專用性之間的矛盾也是一大問題。雖然大尺寸模型帶來了強大的智力和通用性，但在特定專用任務上性能可能并不突出，且需為通用性支付額外成本。大尺寸模型運行速度慢，影響了用戶體驗。當前的AI工作負載更看重精準度、速度和可擴展性，而非泛化的推理能力。

George Hurn-Maloney指出：“AI開發者不需要在無數無關數據點上訓練的大語言模型，他們需要適合其任務的正確模型。因此，我們推出了高精度、輕量化的模型，讓開發者能夠無縫集成。”

Fastino的TLMs專為需要低延遲、高精度AI的開發者和企業設計，不針對消費級用戶，無需通用性。這些模型結合了基于Transformer的注意力機制，并在架構、預訓練和后訓練階段引入任務專精。它們優先考慮緊湊性和硬件適應性，同時不犧牲任務準確性。這種架構和技術創新使得TLM模型能夠在低端硬件上高效運行，同時提升任務準確性。

相比OpenAI GPT-4o的4000ms延遲，Fastino的TLM模型延遲低至100ms，快了99倍。在性能方面，Fastino對比了TLM模型在意圖檢測、垃圾信息過濾、情感傾向分析、有害言論過濾、主題分類和大型語言模型防護等基準上的表現，結果顯示其F1分數比GPT-4o高出17%。

Fastino的TLM模型并非單一模型，而是針對每個特定用例訓練的一組模型。首批模型能夠應對一些需求最明確且廣泛的企業和開發者核心任務，如文本摘要、函數調用、文本轉JSON、個人身份信息屏蔽、文本分類、臟話過濾和信息提取等。

在收費模式上，Fastino采用了訂閱制，對初級開發者和中小企業較為友好。個人開發者每月有1萬次免費請求，Pro用戶每月10萬次請求僅需45美元，團隊用戶300萬次請求每月1275美元。Pro用戶和團隊用戶還享有更快模型速度、更安全模型訪問及更大上下文窗口等額外優勢。

Fastino的TLM模型能夠針對開發者和小企業用戶提供服務，得益于其極低的模型運行成本。對于企業客戶，TLM可部署在客戶的虛擬私有云、本地數據中心或邊緣設備上，使企業能夠在保留敏感信息控制權的同時，利用先進的人工智能能力。

目前，Fastino的TLM已在多個行業產生影響，從金融和醫療領域的文檔解析到電子商務中的實時搜索查詢智能，財富500強企業正利用這些模型優化運營、提升效率。

在模型規模不斷擴大的趨勢下，小模型在企業應用中展現出獨特優勢。低成本、低延遲以及在特定任務上不弱于大尺寸通用模型的優點，使得小模型受到企業和開發者的青睞。這一趨勢不僅適用于Fastino，其他模型廠商如Cohere和Mistral也提供強大的小尺寸模型。國內大廠如阿里云的Qwen3也推出了4B、1.7B甚至0.6B的模型。小尺寸模型在成本效益、推理時延和能力匹配上的優勢，為它們在AI領域贏得了生存空間。

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

階躍星辰Step1X-3D大模型開源，賦能3D內容創作新高度

05-14

TikTok AI新玩法：靜態照片秒變生動短視頻

05-14

騰訊一季度研發投入近190億，AI戰略布局再提速！

05-14

AI浪潮下，新華三如何以自我進化引領產業智能化變革？

目前，新華三在AI領域正聚焦于兩大戰略：即通過“AI in ALL”，增強算力與聯接的協同效應；同時，加速“AI for ALL”，以AI技術、產品和解決方案，賦能百行百業的智能化變革，與產業參與者一道，通…

05-14

即夢AI登頂，張楠能否借此重回字節權力核心？

兩款產品數據量上的差距，一定程度上反映了字節和快手對視頻生成產品的不同策略：即夢AI更傾向發展普通用戶，優先追求用戶擴張；可靈AI則更重視專業用戶的滲透，優先追求收入增長。產品功能趨同、月活用戶數更高的即夢…

05-14

騰訊一季度AI戰略加速，275億資本開支開啟新增長引擎

05-14

AI手機競賽白熱化，品牌如何跨越成本與功能挑戰？

05-14

加州律所AI造假，法官嚴懲：3.1萬美元罰款警示行業亂象

05-14

谷歌AI同事即將亮相，軟件開發將迎來“同事級”助手？

外媒TheInformation在今年1月曾首次報道，OpenAI正開發一款面向高級軟件工程師的AI工具A-SWE，旨在協助處理更復雜的編程任務。如果谷歌真的率先推出其AI編程代理工具，那么在最新Gem…

05-14

騰訊一季度資本開支激增91%，AI產品矩陣全面滲透用戶場景

05-14

明略科技DOMO多謀引擎：以真聲驅動，解鎖品牌長效增長新路徑

05-14

騰訊控股2025年Q1：AI賦能業務，加大元寶應用與微信AI新機遇投入

新榜訊 5 月 14 日電，騰訊控股宣稱，在 2025 年第一季度，AI能力已切實為效果廣告及長青游戲等業務作出貢獻。同時，公司進一步加大了在元寶應用和微信內的 AI 等新 AI 機遇方面的投入。處于 AI…

05-14

階躍星辰發布Step1X-3D：3D大模型領域新突破，開啟AI創作新篇章

05-14

不同年齡段，ChatGPT竟有這些差別用法！

05-14

邁瑞醫療：業績穩健海外發力，券商持續看好“推薦”評級

05-14

點擊查看更多 +

全站最新

谷歌AI戰：搜索帝國如何重塑未來？

極狐T1上海車展亮相，以用戶需求為導向，星愿小車能否匹敵？

比亞迪擋位設計遭吐槽，網友質疑“黑公關”，李云飛：此非首次！

東風日產N7續航挑戰遇窘境，距充電站500米竟“趴窩”？

王化談雷軍微博評論門檻：為防水軍，設置已久不必大驚小怪

比亞迪擋位設計遭吐槽，是真實反饋還是“黑公關”在作祟？

熱門內容

夸克AI新升級：深度搜索賦能，信息獲取更高效智能
英偉達全球總部或將落戶中國臺灣，黃仁勛下周宣布這一重大決定？
ChatGPT喊你名字了？用戶反應不一，個性化嘗試遭遇“恐怖谷”
夸克AI新升級“深度搜索”，解鎖高效獲取信息新技能
螞蟻集團慷慨分紅，單季凈利達136億，阿里持股33%共享成果
教育部新規：學生禁直接復制AI作業，強化獨立思考與批判性思維
通義千問3重磅登場！全球頂尖開源模型，通義App與網頁版等你來體驗
中國首部規范AI氣象服務規章6月施行，氣象領域將迎來新變革！
小米5月下旬新品爆發：手機平板眼鏡手表，你期待哪一款？
蘋果新款Apple TV 4K即將發布，四大升級能否重塑智能客廳體驗？
小米16曝光：或將新增多功能按鍵，輕薄機身年底亮相？
360納米AI新推MCP萬能箱，打造個性化智能體提升效率
教育部新規：中小學分階段用AI，嚴禁復制答案強化獨立思考
華為HDC2025開發者大會6月來襲，早鳥票明日開搶，你準備好了嗎？
蘋果高管預警：AI發展迅猛，iPhone未來十年或被淘汰？

本欄最新

階躍星辰Step1X-3D大模型開源，賦能3D內容創作新高度

TikTok AI新玩法：靜態照片秒變生動短視頻

騰訊一季度研發投入近190億，AI戰略布局再提速！

AI浪潮下，新華三如何以自我進化引領產業智能化變革？

即夢AI登頂，張楠能否借此重回字節權力核心？

AI手機競賽白熱化，品牌如何跨越成本與功能挑戰？

本文鏈接：http://www.www897cc.com/showinfo-45-12867-0.html小成本大作為！Fastino任務特定語言模型超越GPT-4o，延遲狂降99倍

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：日本氣象廳新動向：AI將助力天氣預報，精確度能否一飛沖天？

下一篇：黃仁勛2025財年薪酬大漲近半，股票獎勵成主因

標簽：

熱門焦點

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

每到年底，社交媒體總少不了年度盤點、年度總結、年度熱詞。如果讓你來總結2021年度熱詞，你會想到什么？柯林斯詞典將年度熱詞頒給了“NFT”，而其理由是：一個縮寫詞的
企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
以太坊升級將會帶來的5個改變

以太坊自2015年誕生以來就廣受歡迎，但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用，用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感覺可能與我一樣，這是一個讓人十分糾結的項目。之所以糾結，一方面他的團隊陣容強大，各種來自前英特爾、IBM、coinbase、fa
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決
多位全國政協委員提交元宇宙提案，國金證券稱元宇宙仍處初期投資階段

財聯社|區塊鏈日報2日訊今日《元宇宙新鮮事》有：全國政協委員劉偉建議出臺“元宇宙中國”的頂層設計方案；國金證券稱元宇宙仍處初期投資龐大獲利不易階段；阿聯酋
電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現的術語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模
76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

“元宇宙的開拓者”是我們針對元宇宙的發展而設立的專欄，主要面向那些深挖元宇宙產業或者在元宇宙進行“淘金”的從業者，分享這些企業或者創業者們的故事，以獨特
超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

在2021年《福布斯》區塊鏈50強榜單中，29家企業使用Hyperledger超級賬本技術，占比近60%。同年，研究機構Blockdata發布了的調查報告顯示，訪問Top100上市公司中，有 81

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

小成本大作為！Fastino任務特定語言模型超越GPT-4o，延遲狂降99倍

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

以太坊升級將會帶來的5個改變

頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

如何在元宇宙中建立品牌忠誠度

多位全國政協委員提交元宇宙提案，國金證券稱元宇宙仍處初期投資階段

電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

最新推薦

不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

中國區塊鏈產業生態地圖報告（2021）

2021年中國元宇宙行業用戶行為分析熱點報告

頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

FTX 加密貨幣交易所開始向游戲公司提供加密服務

我們離元宇宙的實現只差一副眼鏡？

猜你喜歡

熱門推薦

相關資訊