日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 數碼

DeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種

來源: 責編: 時間:2025-03-19 09:41:20 52觀看
導讀 什么?H20都變搶手貨,漲價10萬那種?!近有市場消息稱,原本不受青睞的英偉達H20咨詢量暴漲幾十倍,8卡H20機器的價格也較年前漲價十萬(單價110萬左右),有從業者預測“價格不會下來了”。要知道,H20是中國特供版

什么?H20都變搶手貨,漲價10萬那種?!XGS28資訊網——每日最新資訊28at.com

近有市場消息稱,原本不受青睞的英偉達H20咨詢量暴漲幾十倍,8卡H20機器的價格也較年前漲價十萬(單價110萬左右),有從業者預測“價格不會下來了”。XGS28資訊網——每日最新資訊28at.com

要知道,H20是中國特供版,顯存帶寬等方面明顯受限,性能及性價比都遠不如H100。XGS28資訊網——每日最新資訊28at.com

如今市場風向有了變化,業內人士爆料某互聯網大廠已經下單10-20萬卡,整體市場H20的訂單量都大幅增加。XGS28資訊網——每日最新資訊28at.com

背后原因,直觀來看是DeepSeek熱潮。更深入則是——XGS28資訊網——每日最新資訊28at.com

AI推理需求爆了。XGS28資訊網——每日最新資訊28at.com

H20盡管性能只有H100的1/10,但是做推理綽綽有余,顯存夠、適合跑大規模參數模型,價格還便宜更多。XGS28資訊網——每日最新資訊28at.com

AI Infra廠商PPIO派歐云聯合創始人兼CEO姚欣向量子位透露,去年年底H20還沒有這么搶手,但是到了春節后又是另一番景象,AI算力供需正在極速變化。XGS28資訊網——每日最新資訊28at.com

與之相對應,英偉達CEO黃仁勛在新一季財報發布后也表示,當前AI模型所需的算力是此前模型的100倍,帶動算力需求增加的關鍵是AI推理。XGS28資訊網——每日最新資訊28at.com

見微知著,AI算力行業風向已經發生變化,新的機遇也已經在醞釀。XGS28資訊網——每日最新資訊28at.com

DeepSeek重構算力邏輯,推理需求面臨爆發XGS28資訊網——每日最新資訊28at.com

先一句話總結,DeepSeek以算法創新重構AI算力邏輯,推動AI計算從“訓練為主”向“推理為主”范式轉變,AI推理需求因此迎來全面爆發。XGS28資訊網——每日最新資訊28at.com

首先來看DeepSeek做了什么?XGS28資訊網——每日最新資訊28at.com

它今年開源的兩款模型,在架構和算法上實現了訓練推理效率提升。XGS28資訊網——每日最新資訊28at.com

第一,DeepSeek-V3采用MoE(混合專家模型)架構,在AI Infra層面提出大規模跨節點專家并行(Expert Parallelism/EP)。XGS28資訊網——每日最新資訊28at.com

EP使得batch size大大增加,從而提高GPU矩陣乘法的效率,提高吞吐。專家模型分散在不同的GPU上,每個GPU只需要計算很少的專家(因此更少的訪存需求),從而降低延遲。XGS28資訊網——每日最新資訊28at.com

同時,DeepSeek-V3的專家模型數量從上一版的160個增加到256個。“大量小專家”模型架構能進一步降低單次推理時激活的參數量。XGS28資訊網——每日最新資訊28at.com

第二,DeepSeek-R1-Zero邁出利用強化學習提升語言模型推理能力第一步。在沒有任何監督數據的情況下,通過純強化學習過程進行自我進化,從而獲得推理能力。DeepSeek-R1采用FP8混合精度訓練框架和動態學習率調度器等技術,將訓練成本降低到560萬美元,遠低于OpenAI。同時還能將模型能力蒸餾到更小的密集模型中。XGS28資訊網——每日最新資訊28at.com

這種低成本模式使得模型能夠更廣泛應用于AI推理場景。XGS28資訊網——每日最新資訊28at.com

DeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種XGS28資訊網——每日最新資訊28at.com

其次,為啥DeepSeek可以成為推動算力趨勢轉變的導火索?XGS28資訊網——每日最新資訊28at.com

從大模型整體發展進程來看,預訓練Scaling Law已經放緩,推理Scaling Law成為新方向。XGS28資訊網——每日最新資訊28at.com

推理Scaling Law的核心是通過增加推理時計算資源(如推理時間、算力)來提升模型性能。以o1為代表的推理模型都是通過在推理階段引入多步驟的思維鏈和強化學習,顯著提升了推理能力,這導致推理計算需求的大幅增加。XGS28資訊網——每日最新資訊28at.com

o1模型固然好用,但是卻不開源。DeepSeek正是為此而來,它們為全行業提供了一個性能優秀的開源可替代方案,瞬間改變整體局面。XGS28資訊網——每日最新資訊28at.com

憑借低成本、高性能的特點,DeepSeek引發全社會范圍熱潮。不僅是普通人能夠免費用,大中小企業也能將DeepSeek系列模型與自身業務融合。XGS28資訊網——每日最新資訊28at.com

尤其是ToB領域,優質開源模型解決了企業在數據維度的顧慮——沒有人愿意將自己或用戶的數據免費貢獻給閉源模型做訓練。同時DeepSeek暫時沒有將模型商業化的考慮,更接近真正意義上的開源。這也點燃了企業擁抱AI的熱情,更加速了AI落地進程,推理需求空前爆發。XGS28資訊網——每日最新資訊28at.com

由此,量變引發質變,AI計算的需求以及底層邏輯發生變化。XGS28資訊網——每日最新資訊28at.com

相較于預訓練,推理計算在硬件門檻、集群建設等方面要求都更低。XGS28資訊網——每日最新資訊28at.com

超大規模集群不再是必需,小集群甚至單機,將是未來AI Infra的主要特性。XGS28資訊網——每日最新資訊28at.com

PPIO姚欣結合DeepSeek一系列動向以及行業現狀給出分析,DeepSeek提出的跨節點專家并行系統,已經一定程度上體現出了分布式的思想,它把不常用的專家模型集中到一臺機器上,常用的專家模型分配更多算力。由此形成調度上的平衡。XGS28資訊網——每日最新資訊28at.com

DeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種XGS28資訊網——每日最新資訊28at.com

這進一步扭轉了算力行業的深層邏輯。原本大家都在期待英偉達如何從硬件層面帶來更好的推理性能,如今通過EP的方式,可以用H800跑出H100的性能。XGS28資訊網——每日最新資訊28at.com

也解釋了為何DeepSeek可以影響英偉達的股價。因為通過系統優化,底層硬件的護城河沒有那么深了。XGS28資訊網——每日最新資訊28at.com

由此看到,H20這樣原本不被大廠推崇的推理計算卡開始搶手。甚至更進一步,英偉達本身的地位也會受到影響。XGS28資訊網——每日最新資訊28at.com

姚欣判斷,未來,英偉達一家獨大的情況也會有所改變,推理時代,推理芯片將百花齊放。比如根據DeepSeek研究人員的測試結果,推理任務中昇騰910C性能可達H100的60%。XGS28資訊網——每日最新資訊28at.com

這進一步影響算力供給側的結構和邏輯。再具體一點,就是AI Infra架構的轉變。XGS28資訊網——每日最新資訊28at.com

該朝著哪個方向做?即將爆發的AI應用落地浪潮已經給出指引——優化與降本。XGS28資訊網——每日最新資訊28at.com

AI Infra扛起推理時代成本優化重任XGS28資訊網——每日最新資訊28at.com

相較于預訓練時代,推理時代對云計算、AI Infra有著全新需求。XGS28資訊網——每日最新資訊28at.com

預訓練時代,云廠商提供的服務更傾向于一個裸金屬的訓練環境。因為是集中式集群,每一臺機器幾乎都是跑滿的,云廠商能優化的空間有限。推理時代,每個企業更傾向于選擇公有云服務部署模型。XGS28資訊網——每日最新資訊28at.com

這意味著云廠商接下來的競爭點應該是從不同卡型到模型層的全棧優化。XGS28資訊網——每日最新資訊28at.com

不過為啥由AI Infra/云廠商來做?XGS28資訊網——每日最新資訊28at.com

從技術底層到實際成本優化上,AI Infra/云廠商有自己的生態位優勢。XGS28資訊網——每日最新資訊28at.com

從技術角度出發,并不是所有AI廠商都具備處理高并發、高流量、高彈性的互聯網服務經驗。XGS28資訊網——每日最新資訊28at.com

比如前不久DeepSeek突然公布成本利潤率理論值可達545%,引發諸多業內爭議。XGS28資訊網——每日最新資訊28at.com

PPIO姚欣表示:XGS28資訊網——每日最新資訊28at.com

作為作為一個真正服務過4.5億用戶的創始人來說,在真實情況下,所有互聯網用戶請求都一定有波峰、波谷,一天的用戶請求變化應該是一條曲線。如果在高峰的時候,突然變成一條直線了,這意味著,在那個時間段用戶請求進不來。XGS28資訊網——每日最新資訊28at.com

所以總結來說,春節期間DeepSeek的服務崩潰,滿足不了用戶、企業服務。XGS28資訊網——每日最新資訊28at.com

DeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種XGS28資訊網——每日最新資訊28at.com

換言之,DeepSeek的服務和技術架構更進一步需要“彈性”算力,才可能解決這樣的問題。PPIO派歐云在春節期間第一時間接入DeepSeek,利用分布式推理和大規模算力調度,從而實現了更大彈性的負載均衡,保證客戶的服務質量、穩定性。XGS28資訊網——每日最新資訊28at.com

另外,在基礎設施建設上,AI Infra廠商更有先天優勢。XGS28資訊網——每日最新資訊28at.com

其中一部分玩家通過自建IDC提供多種算力服務,代表玩家有阿里云等;還有一部分玩家選擇通過分布式網絡提供算力服務,它們不自建IDC、不購入GPU,而是通過獨特的算力共享調度的方式,代表玩家有PPIO派歐云。XGS28資訊網——每日最新資訊28at.com

二者比較,前者能提供的綜合性服務更多,后者在性價比和資源調度上更有優勢。XGS28資訊網——每日最新資訊28at.com

如PPIO的分布式架構,打破了傳統集中式架構的瓶頸,不僅為企業大幅降低了運維壓力,還將系統的處理效率提升到了一個全新的高度。通過PPIO提供的AI推理平臺,企業可以免去自行部署后臺服務的繁冗過程,直接調用API服務即可,不再需要自行運維,成本直接減少了40%。XGS28資訊網——每日最新資訊28at.com

速度方面,得益于PPIO遍布全球的分布式云服務網絡,無論用戶身處何地,都能找到近距離的算力節點,獲得20毫秒級的低延遲體驗。PPIO通過獨特方式調用全國范圍的算力節點,能為企業用戶帶來更彈性、更穩定、更劃算的AI推理服務。XGS28資訊網——每日最新資訊28at.com

據了解,PPIO在整個春節期間ToB方向的DeepSeek服務可用性做到了99.9%,無TPM限制。其中關鍵就在于底層足夠彈性。現階段,PPIO平臺的日均tokens消耗量已經突破了1300億,與“六小龍”日均tokens消耗量不相上下。XGS28資訊網——每日最新資訊28at.com

此外,在算法層面,PPIO還提出KV Cache稀疏化壓縮算法、Hydra Sampling投機采樣技術以及端到端FP8推理三大核心技術,進一步突破顯存、算力和帶寬對大模型推理性能的限制。由此,PPIO能夠迅速適配和優化各種開源大模型。比如,PPIO算力云產品已為百川智能提供大規模AI推理服務。XGS28資訊網——每日最新資訊28at.com

DeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種XGS28資訊網——每日最新資訊28at.com

“只有當AI Infra公司能提供足夠高性能和低成本的基礎建設,讓大量AI 應用的收入足以覆蓋所有的推理成本,才會迎來AI應用落地的大爆發,用戶也會迎來AI 應用的免費時代。”姚欣表示。XGS28資訊網——每日最新資訊28at.com

DeepSeek振臂一揮之后,還需要全產業上下游通力合作,才能進一步加速大規模應用落地。XGS28資訊網——每日最新資訊28at.com

如今,值得關注的玩家紛紛站出來,承接流量的同時,更進一步推進新浪潮發生。AI Infra玩家們的動作,還只是表現之一。XGS28資訊網——每日最新資訊28at.com

而隨著越來越多產業伙伴加入,更龐大的需求和市場還在醞釀之中。XGS28資訊網——每日最新資訊28at.com

趨勢轉變之后,又是一個新開始。XGS28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.www897cc.com/showinfo-24-137859-0.htmlDeepSeek讓英偉達H20都被瘋搶 漲價10萬的那種

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘇姿豐亮相AMD AI PC創新峰會:AI是50年來具變革性的技術 AMD賦能下一輪AI創新浪潮

下一篇: AMD Jack Huynh:AI PC有三大趨勢!全力服務全球超5億游戲玩家

標簽:
  • 熱門焦點
  • 7月安卓手機性能榜:紅魔8S Pro再奪榜首

    7月份的手機市場風平浪靜,除了紅魔和努比亞帶來了兩款搭載驍龍8Gen2領先版處理器的新機之外,別的也想不到有什么新品了,這也正常,通常6月7月都是手機廠商修整的時間,進入8月份之
  • 把LangChain跑起來的三個方法

    使用LangChain開發LLM應用時,需要機器進行GLM部署,好多同學第一步就被勸退了,那么如何繞過這個步驟先學習LLM模型的應用,對Langchain進行快速上手?本片講解3個把LangChain跑起來
  • Golang 中的 io 包詳解:組合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是對Reader和Writer接口的組合,
  • 三分鐘白話RocketMQ系列—— 如何發送消息

    我們知道RocketMQ主要分為消息 生產、存儲(消息堆積)、消費 三大塊領域。那接下來,我們白話一下,RocketMQ是如何發送消息的,揭秘消息生產全過程。注意,如果白話中不小心提到相關代
  • Temu起訴SHEIN,跨境電商戰事升級

    來源 | 伯虎財經(bohuFN)作者 | 陳平安日前據外媒報道,拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟,訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
  • 破圈是B站頭上的緊箍咒

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之每年的暑期檔都少不了瞄準追劇女孩們的古偶劇集,2021年有優酷的《山河令》,2022年有愛奇藝的《蒼蘭訣》,今年卻輪到小破站抓住了追
  • 2天漲粉255萬,又一賽道在抖音爆火

    來源:運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期,旅游賽道徹底火了:有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億;有的「博主」火了&m
  • 三星Galaxy Z Fold/Flip 5國行售價曝光 :最低7499元/12999元起

    據官方此前宣布,三星將于7月26日也就是明天在韓國首爾舉辦Unpacked活動,屆時將帶來帶來包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • 華為舉行春季智慧辦公新品發布會 首次推出電子墨水屏平板

    北京時間2月27日晚,華為在巴塞羅那舉行春季智慧辦公新品發布會,在海外市場推出之前已經在中國市場上市的筆記本、平板、激光打印機等辦公產品,并首次推出搭載
Top 主站蜘蛛池模板: 中卫市| 盐城市| 海晏县| 汝南县| 都昌县| 余姚市| 德令哈市| 普兰店市| 汉阴县| 西充县| 台江县| 洮南市| 巴彦县| 芜湖市| 日照市| 肃南| 灵丘县| 承德县| 白银市| 海晏县| 莆田市| 宝清县| 隆化县| 信丰县| 新营市| 铅山县| 涟源市| 湟源县| 宜兰县| 永修县| 安图县| 平阴县| 双城市| 抚松县| 汕头市| 长治县| 文化| 门头沟区| 黎城县| 荔浦县| 明光市|