阿里云優惠券 先領券再下單
近日,上海合合信息科技股份有限公司(簡稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,憑借其多維度升級,為降低大模型“幻覺”風險、推動大模型精準應用提供了強大助力。
訓練數據是影響大模型“認知能力”的關鍵,合合信息“大模型加速器 2.0”基于領先的智能文檔處理技術,從數據源頭入手,對復雜文檔的版式、布局和元素進行精準解析及結構化處理,讓大模型在與人類溝通中“更靠譜”。
(“大模型加速器 2.0”文檔解析引擎助力知識庫理解手寫筆記示意圖)
升級后的“大模型加速器”在多方面實現新突破。在復雜版面理解、表格及圖表處理、內容溯源等能力上表現卓越。它能精準識別上千種文檔中的跨頁表格、合并單元格、密集表格、手寫字符及公式,解析穩定率達99.99%,單頁處理耗時較行業可比產品降低超30%;還可“逆還原”十余種專業圖表數據,轉化為大模型可理解的結構化數據。此外,新增知識庫系列開源組件,助力醫療、制造、教育等行業開發者構建個性化知識庫。
在教育領域,大模型需要不斷“吸收”正確的專業知識才能應對實際應用問題。賽爾教育科技發展有限公司CTO楊林提到,教育行業文檔格式多樣,包含表格、公式、手寫字符、多語言文字等信息,高效準確提取文本信息并非易事。合合信息文檔解析技術為教育行業大模型建設提供了專業支持,在“大模型加速器”的支持下,合合信息與賽爾教育共同協作,提升大模型對復雜版面、元素的“理解力”,減少AI“幻覺”現象。其圖表解析模塊可智能提取多種圖表中的關鍵數據點等,還原為完整的Excel表格數據,作用于教育行業大模型微調、學科知識庫建設、智能審閱等環節。
(知識庫對財報數據所在表格進行精準溯源)
在金融行業,多家券商機構接入大模型以提高工作效率。“大模型加速器 2.0”上線知識庫產品組件,支持復雜文檔的智能問答、總結與檢索。為保障行業“安心”使用大模型,知識庫產品推出溯源功能,通過在文件中標記空間位置信息,實現對句子、段落的精確溯源。以財務分析為例,券商分析師可利用溯源功能定位原表格,對信息進行復核,防止錯誤、遺漏。
目前,知識庫組件已面向開發者開源,此前合合信息已開源智能文檔處理“百寶箱”系列產品,未來“大模型加速器”將持續優化迭代,助力大模型在各行各業中“百花齊放”。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
本文鏈接:http://www.www897cc.com/showinfo-20-146172-0.html“大模型加速器 2.0”正式發布,合合信息以技術升級破解大模型應用難題
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com