12 月 28 日消息,螞蟻集團(tuán)今日宣布開源首個(gè)醫(yī)療專科推理數(shù)據(jù)集。該數(shù)據(jù)集由訓(xùn)練、驗(yàn)證、測試三部分組成,包含 2132 個(gè)問答對,每個(gè)問答對由醫(yī)生根據(jù)臨床經(jīng)驗(yàn)編寫的問題、專家提供的回答以及用于幫助推理的上下文構(gòu)成,病種覆蓋了 97.6% 以上的泌尿科就醫(yī)人群,號稱能“真實(shí)復(fù)刻診療場景”。
在醫(yī)療行業(yè),通用型語言模型在應(yīng)對醫(yī)療問診時(shí),會直接給出答案,而醫(yī)生則會根據(jù)專業(yè)知識進(jìn)行反復(fù)的癥狀探討,才能給出答案。此外,大模型的幻覺問題和推理能力不足,當(dāng)前高質(zhì)量的中文醫(yī)學(xué)專科數(shù)據(jù)集又較為稀缺,這對訓(xùn)練出色的醫(yī)療領(lǐng)域大模型提出了挑戰(zhàn)。
據(jù)介紹,為克服這些難題,螞蟻集團(tuán)與上海仁濟(jì)醫(yī)院泌尿科專家團(tuán)隊(duì)聯(lián)合研發(fā),基于醫(yī)生團(tuán)隊(duì)臨床經(jīng)驗(yàn),通過構(gòu)造模擬病例數(shù)據(jù)的方式,推出了中文醫(yī)療專科問答推理數(shù)據(jù)集 RJUA-QA,這也是業(yè)內(nèi)首個(gè)臨床專科數(shù)據(jù)集。
專業(yè)性上,由于醫(yī)療行業(yè)有超百個(gè)科室,每個(gè)專科和疾病,都需要專業(yè)的調(diào)試。螞蟻集團(tuán)聯(lián)合醫(yī)療專家共同研發(fā)了多模態(tài)醫(yī)療知識引擎,進(jìn)一步推動中國專業(yè)醫(yī)療數(shù)據(jù)集的構(gòu)建與開放。
查詢發(fā)現(xiàn),RJUA-QA 已在 GitHub 上開源,README 頁面顯示“本數(shù)據(jù)集的病例數(shù)據(jù)由專業(yè)醫(yī)生的根據(jù)臨床經(jīng)驗(yàn)編寫而成,因此不涉及任何醫(yī)患個(gè)人隱私”。
本文鏈接:http://www.www897cc.com/showinfo-45-3103-0.html螞蟻集團(tuán)開源首個(gè)醫(yī)療專科推理數(shù)據(jù)集,覆蓋 97.6% 泌尿就醫(yī)人群
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com