隨著生成式AI的崛起,GPU算力需求持續增長。然而,高昂的GPU價格和供不應求的市場環境給許多企業和研究機構帶來了挑戰。為了解決這一問題,AWS近日推出了一項創新服務——「亞馬遜彈性運算云(EC2)機器學習容量區塊」(Amazon Elastic Compute Cloud Capacity Blocks for ML),允許客戶在需要的時候租用GPU算力,以執行特定的AI相關任務。
這項新的服務讓客戶能夠預約NVIDIA H100 Tensor Core GPU實例,并在EC2 UltraCluster中獲取低延遲、高吞吐量的連接,以便進行分散式訓練。客戶可以根據需要靈活地安排GPU算力的使用時間點以及時數,從而降低整體費用。
這項服務特別適合那些只需要在少數工作中使用到昂貴的GPU資源的情況。通過EC2容量區塊,客戶可以在1到14天內保留GPU算力容量,從1個到64個叢集,每個叢集配置8顆GPU(最高為512顆GPU),從而可以靈活地執行各種AI工作負載。
該服務最早可提前8周預約,并已在亞馬遜的美國東部(俄亥俄州)區域推出。這項服務的推出不僅能幫助客戶降低成本,同時也為AWS提供了將GPU資源效率最大化的機會,確保了相關的營收。然而,這些GPU資源的價格將根據實際的供需情況動態浮動。
AWS新的GPU租賃服務為那些需要執行AI工作負載但又面臨GPU價格和供應挑戰的客戶提供了新的選擇。通過按需租賃GPU算力,客戶可以更靈活地滿足其特定需求,同時降低了整體費用。
本文鏈接:http://www.www897cc.com/showinfo-27-25505-0.htmlAWS推出GPU租賃服務:降低AI工作負載成本
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
下一篇: 藍隊競技啟動:半導體和金融等行業參與其中