OpenAI在沉寂六年后,終于重返開源領(lǐng)域,近期震撼發(fā)布了兩款全新大語言模型——gpt-oss-120b與gpt-oss-20b。這一舉動(dòng)標(biāo)志著OpenAI自2019年GPT-2之后,再次向公眾敞開了其技術(shù)的大門,盡管近年來它更多地聚焦于付費(fèi)專有模型的研發(fā)。
gpt-oss-120b,這款龐然大物擁有驚人的1170億總參數(shù),其中每token激活51億參數(shù),專為高推理能力的生產(chǎn)級(jí)和通用場景量身打造。它能夠在單塊配備80GB顯存的英偉達(dá)H100 GPU上流暢運(yùn)行,展現(xiàn)了強(qiáng)大的處理能力和效率。而gpt-oss-20b,雖然規(guī)模稍小,總參數(shù)達(dá)到210億,每token激活36億參數(shù),但它卻以低延遲和本地化設(shè)計(jì)為亮點(diǎn),僅需16GB內(nèi)存便能在邊緣設(shè)備,如家用筆記本電腦或臺(tái)式機(jī)上輕松運(yùn)行,極大地拓寬了應(yīng)用場景。

這兩款模型均為純文本語言模型,它們在文本處理、代碼生成以及數(shù)學(xué)問題求解等領(lǐng)域展現(xiàn)出了非凡的實(shí)力。更令人興奮的是,gpt-oss系列采用了Apache 2.0許可協(xié)議,這意味著無論是個(gè)人用戶、開發(fā)者還是企業(yè),都可以免費(fèi)下載這些模型,并根據(jù)自身需求進(jìn)行參數(shù)級(jí)的微調(diào),以適應(yīng)特定的應(yīng)用場景。更重要的是,這些調(diào)整后的模型還可以用于商業(yè)服務(wù)或創(chuàng)收,而無需向OpenAI支付任何費(fèi)用,這與國內(nèi)如DeepSeek、Qwen 3等開源模型的做法不謀而合。

本文鏈接:http://www.www897cc.com/showinfo-21-176268-0.htmlOpenAI重啟開源之路,發(fā)布gpt-oss系列兩大語言模型
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com