在近期舉辦的第39屆國(guó)際人工智能大會(huì)(AAAI 2025)上,作業(yè)幫公司憑借其研發(fā)的“偏好導(dǎo)向監(jiān)督微調(diào)(PoFT)”技術(shù)脫穎而出,該技術(shù)被大會(huì)正式收錄并獲得了廣泛關(guān)注。此次大會(huì)聚焦深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理及知識(shí)計(jì)算等多個(gè)前沿技術(shù)領(lǐng)域,而PoFT技術(shù)正是這些領(lǐng)域的又一重要?jiǎng)?chuàng)新。
在教育智能化應(yīng)用的大背景下,大型語(yǔ)言模型的核心挑戰(zhàn)在于準(zhǔn)確理解指令并給出恰當(dāng)?shù)幕貞?yīng)。以數(shù)學(xué)題目講解為例,模型需確保解題步驟的嚴(yán)謹(jǐn)與表達(dá)的通俗易懂,這要求模型進(jìn)行深入的“對(duì)齊訓(xùn)練”。然而,高質(zhì)量的教學(xué)配對(duì)數(shù)據(jù)成本高昂,傳統(tǒng)監(jiān)督微調(diào)技術(shù)使用的“交叉熵”損失函數(shù)未能區(qū)分?jǐn)?shù)據(jù)的重要性,導(dǎo)致模型可能學(xué)習(xí)到低質(zhì)內(nèi)容,進(jìn)而產(chǎn)生理解偏差、解答質(zhì)量不高或表述模糊等問(wèn)題。
作業(yè)幫的PoFT技術(shù)針對(duì)這一難題提出了新穎的解決方案,其核心在于利用多個(gè)模型作為專家,對(duì)學(xué)習(xí)數(shù)據(jù)進(jìn)行權(quán)重評(píng)估,引導(dǎo)目標(biāo)模型有選擇性地高效學(xué)習(xí)。在訓(xùn)練階段,PoFT要求目標(biāo)模型對(duì)數(shù)據(jù)的“置信度”必須超過(guò)一組標(biāo)桿模型的平均水平,從而確保學(xué)習(xí)的有效性和可靠性。
PoFT技術(shù)還具備出色的兼容性,它可以與現(xiàn)有的數(shù)據(jù)過(guò)濾技術(shù)(例如IFD和Instag)結(jié)合使用,先去除明顯劣質(zhì)的數(shù)據(jù),再通過(guò)PoFT進(jìn)一步調(diào)整學(xué)習(xí)權(quán)重,提升性能。同時(shí),PoFT也能與偏好對(duì)齊算法(如DPO)協(xié)同工作,形成“兩步訓(xùn)練”流程。在Alpacaeval 2.0基準(zhǔn)測(cè)試中,PoFT與DPO的組合方案相比傳統(tǒng)DPO方法,勝率提高了2.74個(gè)百分點(diǎn),特別是在復(fù)雜教學(xué)場(chǎng)景下,過(guò)擬合風(fēng)險(xiǎn)顯著降低。
教育應(yīng)用對(duì)模型的容錯(cuò)率要求極為嚴(yán)格。例如,在解答數(shù)學(xué)題時(shí),模型需準(zhǔn)確識(shí)別并優(yōu)先采用“步驟簡(jiǎn)潔”和“邏輯清晰”的解法。若因?qū)W習(xí)低質(zhì)量數(shù)據(jù)而導(dǎo)致解析錯(cuò)誤,可能會(huì)對(duì)學(xué)生產(chǎn)生誤導(dǎo)。PoFT技術(shù)通過(guò)“標(biāo)桿模型打分”機(jī)制,使模型能夠優(yōu)先學(xué)習(xí)高質(zhì)量數(shù)據(jù),精確捕捉教學(xué)過(guò)程中的特定偏好,從而提升教學(xué)效果。
目前,PoFT技術(shù)已被應(yīng)用于智能解析和個(gè)性化輔導(dǎo)等產(chǎn)品中,取得了顯著成效。此次PoFT技術(shù)在AAAI 2025的成功入選,不僅彰顯了作業(yè)幫在大模型優(yōu)化領(lǐng)域的強(qiáng)大技術(shù)實(shí)力,也為智能教育場(chǎng)景的模型適配提供了新的解決方案,即在不依賴高成本優(yōu)質(zhì)數(shù)據(jù)的情況下,也能實(shí)現(xiàn)模型性能的穩(wěn)定提升。作業(yè)幫自成立以來(lái),一直致力于利用技術(shù)手段解決教育領(lǐng)域的問(wèn)題,在語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖像識(shí)別、大數(shù)據(jù)、云原生及音視頻技術(shù)等多個(gè)領(lǐng)域不斷探索,并多次榮獲國(guó)內(nèi)外頂級(jí)獎(jiǎng)項(xiàng),包括中國(guó)信通院的應(yīng)用優(yōu)秀案例、卓越創(chuàng)新案例以及MIT全球十大突破技術(shù)等。
舉報(bào) 0收藏 0打賞 0評(píng)論 0分享 0 更多>同類資訊
申昊科技等聯(lián)手廣東新設(shè)智維科技,注冊(cè)資本高達(dá)2000萬(wàn)09-05
咸亨國(guó)際杭州新設(shè)數(shù)字科技公司,注冊(cè)資本高達(dá)500萬(wàn)!09-05
拓維信息湖南新設(shè)云智科技公司,注冊(cè)資本高達(dá)千萬(wàn)!09-05
海博思創(chuàng)與第四范式聯(lián)手,新設(shè)能量晶體科技公司,注冊(cè)資本高達(dá)千萬(wàn)09-05
智譜AI攜手浦東建設(shè)等巨頭,共注資2.2億成立云智科技服務(wù)公司09-05
優(yōu)必選與珠城科技聯(lián)手,新設(shè)機(jī)器人科技公司,注冊(cè)資本達(dá)百萬(wàn)09-05OpenAI估值躍升至5000億美金,103億二級(jí)股票交易彰顯市場(chǎng)熱捧09-04微軟Copilot Appearance:動(dòng)態(tài)AI助手即將全球普及,提升用戶交互體驗(yàn)09-04
工廠智能化轉(zhuǎn)型新引擎:璞華大數(shù)據(jù)HawkEye設(shè)備物聯(lián)平臺(tái)深度解析工廠設(shè)備物聯(lián)平臺(tái)中加入物聯(lián)網(wǎng)、AR、VR和機(jī)器學(xué)習(xí)等技術(shù)能夠幫助制造業(yè)企業(yè)實(shí)現(xiàn)節(jié)能減排、保障員工安全等方面并廣泛用于工業(yè)4.0環(huán)境,具有與大數(shù)據(jù)云計(jì)算相關(guān)的可擴(kuò)展性、高可用性,盡管的工廠設(shè)備物聯(lián)平臺(tái)在國(guó)外…09-04
百度智能云發(fā)布2025年AI基礎(chǔ)設(shè)施安全白皮書(shū):構(gòu)建全方位防護(hù)體系百度基于萬(wàn)卡級(jí)AI算力集群建設(shè)與運(yùn)營(yíng)經(jīng)驗(yàn),從多維度構(gòu)建AI基礎(chǔ)設(shè)施安全體系,為行業(yè)提供實(shí)踐指南。合規(guī)與標(biāo)準(zhǔn)規(guī)范層面,覆蓋多項(xiàng)法規(guī)與標(biāo)準(zhǔn);核心安全域分層防護(hù),涵蓋模型應(yīng)用、云服務(wù)、云平臺(tái)、算力調(diào)度平臺(tái)安全;管理…09-04
海底科技新突破:Elementz攜手AI加速器Tide Breaker革新海底作業(yè)新的人工智能加速器項(xiàng)目Tide Breaker于9月3日星期三在OffshoreEurope公布,旨在通過(guò)將初創(chuàng)公司與行業(yè)數(shù)據(jù)、基礎(chǔ)設(shè)施和專業(yè)知識(shí)直接聯(lián)系起來(lái),將海底創(chuàng)新轉(zhuǎn)化為現(xiàn)實(shí)世界的影響。 Tide…09-04
AI結(jié)果優(yōu)化實(shí)戰(zhàn)指南:青山不語(yǔ)網(wǎng)絡(luò)分享深度干貨與經(jīng)驗(yàn)?zāi)P秃苡锌赡茌斎氩煌蔚臄?shù)據(jù)就質(zhì)量特性差異比較大嘍 假如第一次輸入一批稍微模糊 的文本內(nèi)容和第二次很清晰、標(biāo)注精確而且完整時(shí)候 給到它 運(yùn)算結(jié)果不同也不出奇;而且說(shuō)不定就是模型調(diào)優(yōu)得還不到火候,沒(méi)有徹底深入…09-04
新華三喬剡:網(wǎng)絡(luò)成智算時(shí)代核心,優(yōu)化網(wǎng)絡(luò)可激活超30%算力潛能新華三集團(tuán)交換機(jī)產(chǎn)品線產(chǎn)品管理部部長(zhǎng)陳伯超解釋,端網(wǎng)協(xié)同的核心是讓 GPU 或網(wǎng)卡 “感知” 網(wǎng)絡(luò)狀態(tài):“我們通過(guò)與網(wǎng)卡對(duì)接來(lái)獲取整網(wǎng)的通信關(guān)系,并在網(wǎng)絡(luò)側(cè)針對(duì)GPU間的通信關(guān)系進(jìn)行精準(zhǔn)調(diào)優(yōu),實(shí)現(xiàn)高效協(xié)同效…09-04蘋(píng)果與谷歌攜手推進(jìn)AI:Siri將整合Gemini模型,擱置Perplexity收購(gòu)計(jì)劃09-04一起教育科技Q2財(cái)報(bào):營(yíng)收增長(zhǎng)17.3%,發(fā)布生成式AI智能體“17同學(xué)”09-04點(diǎn)擊查看更多 +全站最新
華為Mate XTs非凡大師開(kāi)售:起售價(jià)17999元,麒麟9020芯片強(qiáng)勢(shì)回歸
OPPO Find X9系列電池容量大增,厚度控制得當(dāng),續(xù)航與手感雙贏
華為Mate XTs折疊屏新升級(jí):手機(jī)也能享受PC級(jí)應(yīng)用體驗(yàn)
華為MatePad mini亮相:8.8英寸OLED屏,1800尼特亮度護(hù)眼新體驗(yàn)
華為Mate XTs非凡大師三折疊新機(jī)發(fā)布,起價(jià)17999元搭載麒麟9020
華為MatePad Mini亮相:8.8英寸便攜平板,支持通話,起售價(jià)3299元熱門內(nèi)容
申昊科技等聯(lián)手廣東新設(shè)智維科技,注冊(cè)資本高達(dá)2000萬(wàn)
咸亨國(guó)際杭州新設(shè)數(shù)字科技公司,注冊(cè)資本高達(dá)500萬(wàn)!
拓維信息湖南新設(shè)云智科技公司,注冊(cè)資本高達(dá)千萬(wàn)!
海博思創(chuàng)與第四范式聯(lián)手,新設(shè)能量晶體科技公司,注冊(cè)資本高達(dá)千萬(wàn)
智譜AI攜手浦東建設(shè)等巨頭,共注資2.2億成立云智科技服務(wù)公司
優(yōu)必選與珠城科技聯(lián)手,新設(shè)機(jī)器人科技公司,注冊(cè)資本達(dá)百萬(wàn)
本文鏈接:http://www.www897cc.com/showinfo-45-27320-0.html作業(yè)幫PoFT技術(shù)亮相AAAI 2025,智能教育模型優(yōu)化獲國(guó)際認(rèn)可
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 三星9100 PRO 8TB固態(tài)硬盤(pán)評(píng)測(cè):海量存儲(chǔ),PCIe5.0時(shí)代的高性能標(biāo)桿