日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 數碼

國產大模型第一梯隊玩家 為什么pick了CPU?

來源: 責編: 時間:2024-07-11 09:25:57 143觀看
導讀 AI一天,人間一年。現在不論是大模型本身,亦或是AI應用的更新速度簡直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅應用一個接一個問世。也正如來自InfoQ的調查數據顯示的那般,雖

AI一天,人間一年。XdH28資訊網——每日最新資訊28at.com

現在不論是大模型本身,亦或是AI應用的更新速度簡直令人直呼跟不上——XdH28資訊網——每日最新資訊28at.com

Sora、Suno、Udio、Luma……重磅應用一個接一個問世。XdH28資訊網——每日最新資訊28at.com

也正如來自InfoQ的調查數據顯示的那般,雖然AIGC目前還處于起步階段,但市場規模已初具雛形:XdH28資訊網——每日最新資訊28at.com

預計到2030年將達4500億人民幣。AIGC應用正呈現多點開花之勢,逐步從通用場景向行業縱深滲透。XdH28資訊網——每日最新資訊28at.com

行業整體迅速發展固然是好事,但具體到每個的應用或者大模型的落地來說,面臨的競爭也越發激烈了。XdH28資訊網——每日最新資訊28at.com

例如前不久各個大模型廠商之間展開的非常激烈的“價格戰”,主打一個比誰更便宜,甚至直接把大模型價格推向“厘時代”。XdH28資訊網——每日最新資訊28at.com

加上近OpenAI的“斷供”事件,更是讓國內廠商們在打出“輕松搬家”計劃的同時,再加碼Tokens送送送的力度。XdH28資訊網——每日最新資訊28at.com

究其原因,也是與當下應用為王,尤其是以盡量低的成本把業務快速落地的這一大趨勢緊密相關。XdH28資訊網——每日最新資訊28at.com

那么問題來了,大模型玩家們何以在又快又好又省之間做到平衡?XdH28資訊網——每日最新資訊28at.com

這就回到了那個避不開,同時又是成本里占絕對大頭的因素——算力。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?XdH28資訊網——每日最新資訊28at.com

現在提及大模型的訓練和推理,很多人的第一反應或許就是想到了GPU。XdH28資訊網——每日最新資訊28at.com

誠然GPU在高性能上占據著一定的優勢,但它所存在“硬傷”也是比較明顯,那便是供應不足、價格昂貴。XdH28資訊網——每日最新資訊28at.com

何以破局?國產大模型第一梯隊玩家百度智能云千帆大模型平臺,就給出了自己的一個更具“效價比”的解法:XdH28資訊網——每日最新資訊28at.com

除了少數大客戶對大型模型追求卓越的性能表現外,大多數企業和機構在采用大型模型時,需要全面評估其使用效果、性能表現以及成本效益,也就是所謂的”性價比”。XdH28資訊網——每日最新資訊28at.com

具體到算力的部署上,百度智能云AI與大模型平臺總經理忻舟認為:XdH28資訊網——每日最新資訊28at.com

跑AI這件事,其實早期一直是CPU在發揮作用;GPU的火爆也是近幾年的事情。XdH28資訊網——每日最新資訊28at.com

很多場景之下,GPU雖然有高密度的計算能力,但實測表明,現在的高端CPU同樣也可以完全勝任。XdH28資訊網——每日最新資訊28at.com

而且整個AI業務流中不止是有大模型需要做計算,同樣涉及前期的數據清洗等環節,這些環節中CPU起到了非常重要的作用。XdH28資訊網——每日最新資訊28at.com

一言蔽之,在大模型時代,CPU甚至比以往更加重要了,而且是能讓大模型和應用做到“快好省”落地的關鍵因素之一。XdH28資訊網——每日最新資訊28at.com

那么具體“上崗”效果又是如何,我們繼續往下看。XdH28資訊網——每日最新資訊28at.com

國產頭部大模型玩家,pick了CPUXdH28資訊網——每日最新資訊28at.com

國內AIGC應用爆發,這其中,百度智能云千帆大模型平臺功不可沒。XdH28資訊網——每日最新資訊28at.com

作為企業使用大模型的”一站式”服務平臺,千帆大模型平臺自去年3月發布以來已有超12萬客戶使用,累計調優模型2萬個,孵化應用4.2萬個。XdH28資訊網——每日最新資訊28at.com

這些應用覆蓋教育、金融、辦公、醫療等眾多場景,為行業數字化轉型提供了有力支撐。XdH28資訊網——每日最新資訊28at.com

在教育領域,千帆大模型平臺賦能了試題生成、在線批改、題目解析等應用,大大提升了教學和備考效率。XdH28資訊網——每日最新資訊28at.com

例如用戶可以提供參考材料,設定題型和難度,平臺就能自動生成高質量的試題。而交互式的題目解析,則可以針對每位學生的薄弱環節,提供個性化的學習指導。XdH28資訊網——每日最新資訊28at.com

在辦公場景,千帆大模型平臺與業內頭部企業合作,共同打造了智能寫作助手等創新應用,能夠根據用戶輸入的關鍵詞,快速生成招聘文案、營銷方案、數據報告等專業文檔。XdH28資訊網——每日最新資訊28at.com

還可以專注于各類寫作場景,可以智能生成論文大綱、項目匯報、品牌宣傳稿等,大大提升了行政和營銷人員的工作效率。XdH28資訊網——每日最新資訊28at.com

醫療健康是千帆大模型平臺的另一大應用賽道。基于醫療知識庫訓練的模型,可以自動生成體檢報告解讀,用通俗易懂的語言向用戶解釋各項指標,并給出個性化的健康指導。XdH28資訊網——每日最新資訊28at.com

這讓普通大眾也能更好地了解自己的身體狀況,實現”健康自主管理”。XdH28資訊網——每日最新資訊28at.com

可以看到,千帆大模型平臺在多個領域實現了AI模型的”后一公里”落地。XdH28資訊網——每日最新資訊28at.com

那么千帆大模型平臺是怎么支撐如此多AI應用的呢?XdH28資訊網——每日最新資訊28at.com

答案是:讓CPU成為客戶的選擇之一,讓“效價比”的紅利普惠千行百業。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?XdH28資訊網——每日最新資訊28at.com

之所以如此,百度智能云所給出的解釋是:XdH28資訊網——每日最新資訊28at.com

目前,行業還存在大量離線的LLM應用需求,如生成文章總結、摘要、數據分析等,與在線場景相比,離線場景通常會利用平臺的閑時算力資源,對于推理的時延要求不高,而對于推理的成本較為敏感,因此用戶更加傾向采用低成本、易獲得的CPU來進行推理。XdH28資訊網——每日最新資訊28at.com

百度智能云等云平臺中部署著大量基于CPU的云服務器,釋放這些CPU的AI算力潛力將有助于提升資源利用率,滿足用戶快速部署 LLM 模型的需求。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?XdH28資訊網——每日最新資訊28at.com

至于效果,以Llama-2-7B為例,在第四代英特爾至強可擴展處理器上輸出 Token 吞吐可達 100 TPS 以上,相比第三代提升了60%。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?△Llama-2-7b模型輸出Token吞吐XdH28資訊網——每日最新資訊28at.com

在低延遲的場景,同等并發下,第四代至強可擴展處理器的首Token時延比第三代至強可降低50%以上。XdH28資訊網——每日最新資訊28at.com

在將處理器升級為第五代至強可擴展處理器之后,較上代的吞吐可提升45%左右,首 Token 時延下降50%左右。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?△Llama-2-7b模型首Token時延XdH28資訊網——每日最新資訊28at.com

并且千帆大模型平臺團隊根據實踐經驗還表示:XdH28資訊網——每日最新資訊28at.com

針對30B以下規模的LLM模型,皆可采用英特爾至強?可擴展處理器來獲得良好性能體驗。XdH28資訊網——每日最新資訊28at.com

不僅如此,利用充足的CPU資源,降低對于AI加速卡的需求,從而降低 LLM 推理服務的總體擁有成本 (TCO),特別是在離線的 LLM 推理場景中表現出色。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?XdH28資訊網——每日最新資訊28at.com

而且在千帆大模型平臺上,可不止是有自家的ERNIE,還有很多主流的大模型都集成于此。XdH28資訊網——每日最新資訊28at.com

這也在一定程度上從側面印證了第五代英特爾? 至強? 可擴展處理器在性能上的過關。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?XdH28資訊網——每日最新資訊28at.com

英特爾第五代至強,如何讓性能和效率變得Pro Max?XdH28資訊網——每日最新資訊28at.com

百度智能云千帆大模型平臺,不止需要大模型推理一種工作負載,它其實是一個覆蓋大模型全生命周期的平臺。XdH28資訊網——每日最新資訊28at.com

具體來說,千帆大模型平臺提供數據標注,模型訓練與評估,推理服務與應用集成的全面功能服務,以及快速應用編排與插件集成,助力大模型多場景落地應用。這樣一來,比起專為大模型推理部署專用加速器,充分利用平臺已廣泛部署的CPU資源,就是更劃算的選擇了。XdH28資訊網——每日最新資訊28at.com

對于千帆大模型平臺上存在的大量離線大模型應用需求來說,如生成文章總結、摘要、評估多個模型的效果等,這類需求對推理的時延要求其實不高,但內存容易成為瓶頸。XdH28資訊網——每日最新資訊28at.com

采用CPU來做,擴展內存更方便,還可以利用起平臺閑時的算力資源,進一步提高資源利用率,起到降低總擁有成本的作用。XdH28資訊網——每日最新資訊28at.com

在這個大背景下,第五代英特爾至強可擴展處理器中的性能密集型通用計算應用負載(類似P Core性能核)的設計就尤為關鍵了。XdH28資訊網——每日最新資訊28at.com

與E Core(能效核)相比,P Core采用了追求性能大化的設計,能承載非常重的負載,同時還兼顧了AI推理加速。XdH28資訊網——每日最新資訊28at.com

采用此設計的第五代至強可擴展處理器,在兼顧AI推理加速這一點上可不是說說而已,而是軟硬件協同優化,各方面都考慮到位了。XdH28資訊網——每日最新資訊28at.com

硬件方面,英特爾AMX(高級矩陣擴展)技術,正是為大模型推理重深度學習中大量的矩陣乘法運算專門優化的,可以理解成”CPU 里的 Tensor Core”。XdH28資訊網——每日最新資訊28at.com

有了英特爾AMX,處理器每個時鐘周期可完成高達2048個INT8運算,比上一代AVX512_VNNI指令提升8倍之多。XdH28資訊網——每日最新資訊28at.com

更重要的是,英特爾AMX加速器是內置在CPU核心里的,讓矩陣存儲和運算更近,這一特性應用在大模型推理上,能夠降低處理下一個Token的時延,讓終端用戶的體驗更好。XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?△英特爾AMX 可以更高效的實現 AI 加速XdH28資訊網——每日最新資訊28at.com

軟件方面,百度智能云千帆大模型平臺已經引入了針對英特爾至強可擴展平臺深度優化的大模型推理軟件解決方案xFasterTransformer (xFT),并將其作為后端推理引擎。主要優化策略如下:XdH28資訊網——每日最新資訊28at.com

-充分利用 AMX/AVX512 等指令集,高效實現核心算子如Flash Attention等XdH28資訊網——每日最新資訊28at.com

-采用低精度量化,降低數據訪存量,發揮 INT8/BF16 運算的優勢XdH28資訊網——每日最新資訊28at.com

-支持超大規模模型的多機多卡并行推理XdH28資訊網——每日最新資訊28at.com

國產大模型第一梯隊玩家 為什么pick了CPU?△英特爾至強可擴展處理器 LLM 推理軟件解決方案XdH28資訊網——每日最新資訊28at.com

后還要補充的一點是,要知道選擇一種硬件平臺,不止關乎于設備本身的采購價格,還會影響到后續的維護成本,甚至人才儲備成本。XdH28資訊網——每日最新資訊28at.com

所以正如百度智能云所言,高性價比的算力基礎設施,與先進的大模型算法和平臺軟件相輔相成,讓上層的開發者們能夠更加平滑地應用,構建他們的業務,才能大化云計算平臺的商業價值。XdH28資訊網——每日最新資訊28at.com

大模型時代,CPU大有可為XdH28資訊網——每日最新資訊28at.com

縱觀當下,大模型正從實驗室走向產業,從少數人的“玩具”變為大眾可用的“工具”。XdH28資訊網——每日最新資訊28at.com

這意味著,大模型服務不僅要有優秀的性能表現,還要做到價格親民、部署便捷。一言以蔽之,“快好省”成了大模型商業化的關鍵一環。XdH28資訊網——每日最新資訊28at.com

而要實現“快好省”,算力基礎設施的選擇至關重要。XdH28資訊網——每日最新資訊28at.com

傳統觀點認為,專用加速器才是AI的“標配”。但在供應緊張、成本高企的背景下,專用加速器的優勢正在減弱。XdH28資訊網——每日最新資訊28at.com

相比之下,優化良好的高端 CPU 不僅能提供足夠應對大模型推理的算力,而且具有更廣泛的部署基礎和更成熟的軟件生態、以及更好的安全保障,開始受到越來越多業界玩家的青睞。XdH28資訊網——每日最新資訊28at.com

以英特爾至強系列為代表的x86架構CPU,擁有成熟完善的軟件生態和廣泛的應用基礎。數以百萬計的開發者可以利用現有工具和框架,快速構建和優化AI應用,而無需額外學習專門的加速器軟件棧,大大降低了開發難度和遷移成本。XdH28資訊網——每日最新資訊28at.com

同時,企業級用戶還可以利用CPU內置的多層次安全技術,實現從硬件到軟件的全棧保護,充分保障數據安全和隱私。這些優勢,是當前專用加速器難以比擬的。XdH28資訊網——每日最新資訊28at.com

由此可見,充分利用CPU進行推理,讓AI從“燒錢游戲”變為“普惠科技”,正是AIGC產業應對算力門檻,推動規模化應用落地的關鍵一招。未來,隨著技術創新和生態完善,這一模式還將為更多企業創造價值,為產業發展注入新的動力。XdH28資訊網——每日最新資訊28at.com

除了直接加速推理任務外,CPU在完整的端到端AI管線中還能高效完成數據預處理、特征工程等AI全流程中的關鍵步驟。而支持機器學習和圖分析的各類數據庫,也主要是構建在CPU之上的。以至強可擴展處理器為例,除了英特爾AMX之外,還有諸如英特爾數據保護與壓縮加速技術(英特爾QAT)、英特爾存內分析加速器(英特爾? IAA)等一系列數據分析引擎內置于處理器中,通過卸載特定任務使CPU得到更好的利用,從而提升工作負載整體性能,實現數據分析加速。XdH28資訊網——每日最新資訊28at.com

由此可見,構建“快、準、穩”的 AI 應用,既要靠專用加速器強大的算力,也離不開CPU超強的通用計算能力去釋放整個系統的潛力。XdH28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.www897cc.com/showinfo-24-100276-0.html國產大模型第一梯隊玩家 為什么pick了CPU?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 899元 銘瑄終結者B760M GKD5 ICE主板上市:銀白外觀 支持DDR5-8600

下一篇: HBM產量明年有望翻倍:三星、SK海力士和美光齊發力

標簽:
  • 熱門焦點
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 石頭智能洗地機A10 Plus體驗:雙向自清潔治好了我的懶癌

    一、前言和介紹專為家庭請假懶人而生的石頭科技在近日又帶來了自己的全新旗艦新品,石頭智能洗地機A10 Plus。從這個產品名上就不難看出,這次石頭推出的并不是常見的掃地機器
  • 把LangChain跑起來的三個方法

    使用LangChain開發LLM應用時,需要機器進行GLM部署,好多同學第一步就被勸退了,那么如何繞過這個步驟先學習LLM模型的應用,對Langchain進行快速上手?本片講解3個把LangChain跑起來
  • K8S | Service服務發現

    一、背景在微服務架構中,這里以開發環境「Dev」為基礎來描述,在K8S集群中通常會開放:路由網關、注冊中心、配置中心等相關服務,可以被集群外部訪問;圖片對于測試「Tes」環境或者
  • 多線程開發帶來的問題與解決方法

    使用多線程主要會帶來以下幾個問題:(一)線程安全問題  線程安全問題指的是在某一線程從開始訪問到結束訪問某一數據期間,該數據被其他的線程所修改,那么對于當前線程而言,該線程
  • 一文掌握 Golang 模糊測試(Fuzz Testing)

    模糊測試(Fuzz Testing)模糊測試(Fuzz Testing)是通過向目標系統提供非預期的輸入并監視異常結果來發現軟件漏洞的方法。可以用來發現應用程序、操作系統和網絡協議等中的漏洞或
  • 年輕人的“職場羞恥感”,無處不在

    作者:馮曉亭 陶 淘 李 欣 張 琳 馬舒葉來源:燃次元“人在職場,應該選擇什么樣的著裝?”近日,在網絡上,一個與著裝相關的帖子引發關注,在該帖子里,一位在高級寫字樓亞洲金
  • 華為將推出盤古數字人大模型 可幫助用戶12小時完成數字人生成

    在今日舉行的2023年華為云數字文娛AI創新峰會上,華為云全球Marketing與銷售服務總裁石冀琳表示,華為云將在后續推出盤古數字人大模型,可幫助用戶12小
  • iQOO Neo8 Pro搶先上架:首發天璣9200+ 安卓性能之王

    經過了一段時間的密集爆料,昨日iQOO官方如期對外宣布:將于5月23日推出全新的iQOO Neo8系列新品,官方稱這是一款擁有旗艦級性能調校的作品。隨著發布時
Top 主站蜘蛛池模板: 金溪县| 静乐县| 长乐市| 龙井市| 绥中县| 舞钢市| 孟村| 夏河县| 邵阳市| 鄱阳县| 仪陇县| 襄汾县| 驻马店市| 二连浩特市| 清丰县| 密云县| 新津县| 会宁县| 平阳县| 怀化市| 鸡泽县| 友谊县| 英德市| 临沧市| 环江| 东丽区| 泽普县| 库伦旗| 三江| 那坡县| 惠州市| 彰武县| 马公市| 谷城县| 台东市| 蕲春县| 长子县| 古浪县| 民和| 绵竹市| 扎兰屯市|