7 月 5 日消息,“數字甲骨共創中心”今日正式開源全球最大的甲骨文多模態數據集,共包含一萬片甲骨的拓片、摹本,甲骨單字對應位置、對應字頭、對應釋文以及辭例分組、釋讀順序等數據。
據介紹,所有研究者都能基于該數據集研發甲骨文檢測、識別、摹本生成、字形匹配和釋讀等算法,加速甲骨文研究智能化進程。
查詢獲悉,數字甲骨共創中心由安陽師范學院甲骨文信息處理教育部實驗室、騰訊 SSV 數字文化實驗室、騰訊優圖實驗室、中國社會科學院甲骨學殷商史研究中心、中國社會科學院考古研究所安陽工作站、廈門大學多媒體可信感知與高效計算教育部重點實驗室、鄭州大學漢字文明研究中心等單位共同發起,并獲得中國社會科學院古代史研究所、英國劍橋大學、法國高等研究實踐學院、日本立命館大學、美國羅格斯大學、加州大學洛杉磯分校等全球高校和研究機構的支持。
騰訊優圖實驗室、騰訊 SSV 數字文化實驗室、廈門大學、安陽師范學院聯合開發了 AI 模型技術:
甲骨字檢測模型:標注準確率超 90%
摹本生成模型:摹本-拓片逐像素對齊
字形匹配模型:自動匹配相近字
甲骨校重模型:在大量拓片和摹本中實現“摹本去重”和“拓片探源”
全球最大甲骨文多模態數據集已在“甲骨文 AI 協同平臺”上線,該平臺還可以查詢甲骨文、甲骨片信息,具體功能可以自行訪問體驗:
https://www.jgwlbq.org.cn/home
本文鏈接:http://www.www897cc.com/showinfo-45-5024-0.html全球最大甲骨文“數據集”開源
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com