快科技2月2日消息,據(jù)國內(nèi)媒體報道稱,DeepSeek在研發(fā)大模型時繞過了英偉達的護城河CUDA,這讓美國不少巨頭們感到了很大的威脅,而現(xiàn)在這件事才剛剛開始。
DeepSeek真的繞過了CUDA,那這件事意味著什么?對此,北京航空航天大學黃雷副教授接受采訪時表示,繞過CUDA,可以直接根據(jù)GPU的驅(qū)動函數(shù)做一些新的開發(fā),從而實現(xiàn)更加細粒度的操作。
譬如DeepSeek在多節(jié)點通信時繞過了 CUDA 直接使用 PTX(Parallel Thread Execution),其多只能實現(xiàn)以算法的方式來高效利用硬件層面的加速。
一旦速度變得更快,打個比方這就意味著別人家的模型要訓練十天,而DeepSeek只需要訓練五天,那么就能給模型喂更多的數(shù)據(jù),即能讓模型在同等時間內(nèi)看到更多的數(shù)據(jù),間接提高模型的效果。
按照消息人士的說法,DeepSeek擁有一些擅長寫PTX語言的內(nèi)部開發(fā)者。
那么,假如它之后使用國產(chǎn)GPU,其在硬件適配方面將會更得心應手,其只要了解這些硬件驅(qū)動提供的一些基本函數(shù)接口,就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產(chǎn)硬件。
本文鏈接:http://www.www897cc.com/showinfo-24-128392-0.html繞開英偉達護城河CUDA!消息稱DeepSeek準備適配國產(chǎn)GPU
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com