日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 通信

合合信息TextIn發布“大模型加速器2.0”,文檔單頁處理耗時降低超30%

來源: 責編: 時間:2025-03-25 10:05:10 115觀看
導讀 阿里云優惠券 先領券再下單隨著大模型在社會應用中逐漸普及,人們在享受便利的同時,也面臨著“AI 幻覺”產生的風險。訓練數據是影響大模型“認知能力”的關鍵要素,近期,上海合合信息科技股份有限公

 阿里云優惠券 先領券再下單Mpw28資訊網——每日最新資訊28at.com

隨著大模型在社會應用中逐漸普及,人們在享受便利的同時,也面臨著“AI 幻覺”產生的風險。訓練數據是影響大模型“認知能力”的關鍵要素,近期,上海合合信息科技股份有限公司(簡稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,基于領先的智能文檔處理技術,對復雜文檔的版式、布局和元素進行精準解析及結構化處理,從數據源頭降低大模型“幻覺”風險,讓大模型在與人類的溝通中“更靠譜”。Mpw28資訊網——每日最新資訊28at.com

Mpw28資訊網——每日最新資訊28at.com

圖說:“大模型加速器 2.0”文檔解析引擎助力知識庫理解手寫筆記示意圖Mpw28資訊網——每日最新資訊28at.com

據悉,升級后的“大模型加速器”在復雜版面理解、表格及圖表處理、內容溯源等能力上實現新突破,可精準識別上千種文檔中的跨頁表格、合并單元格、密集表格、手寫字符及公式,解析穩定率達99.99%,單頁處理耗時較行業可比產品降低超30%;可“逆還原”十余種專業圖表數據,并將其轉化為大模型可理解的結構化數據。此外,“大模型加速器 2.0”版本新增知識庫系列開源組件,助力醫療、制造、教育等行業開發者構建個性化的知識庫。Mpw28資訊網——每日最新資訊28at.com

文檔解析技術助力教育大模型建設Mpw28資訊網——每日最新資訊28at.com

大模型需要不斷“吸收”正確的專業知識,才能應對實際應用問題。合合信息技術團隊成員表示,在處理年報、論文、實驗室報告等專業文檔的過程中,一個符號的解析失誤,便可能“誤導”大模型,得出與事實相悖的結論。可信性的缺失,也制約了大模型在實際應用場景中的縱深拓展。Mpw28資訊網——每日最新資訊28at.com

賽爾教育科技發展有限公司(簡稱“賽爾教育”)系“中國教育和科研計算機網CERNET”的運營公司賽爾網絡的重要子公司,是教育國際化、教育信息化、數字化教育方案的提供商。賽爾教育CTO、教育數字化事業部總經理楊林提到,教育行業中所涉及的文檔格式多樣,在內容上也包含了表格、公式、手寫字符、多語言文字等信息。如何高效準確地提取各類文檔中的文本信息,并非易事。Mpw28資訊網——每日最新資訊28at.com

“教育行業的大模型建設工作中,數據的數量和質量起著決定性作用。我們做了很多嘗試,模型的速度和準確性都達不到要求,嚴重影響科研工作的進展。”楊林表示,行業知識庫的構建基于大量文檔的文本信息提取,需要高效率、高準確率的工具。合合信息文檔解析技術提供了專業的技術支持和服務,有效解決了文檔處理過程中的問題。Mpw28資訊網——每日最新資訊28at.com

在“大模型加速器”的支持下,合合信息與賽爾教育共同協作,提升大模型對復雜版面、元素的“理解力”,使其按照人類正常的閱讀順序識別文檔結構,智能劃分標題、段落、表格和圖表等內容塊,幫助大模型理解版面、內容間的對應關系,減少AI“幻覺”現象。Mpw28資訊網——每日最新資訊28at.com

Mpw28資訊網——每日最新資訊28at.com

圖說:圖表解析模塊將圖表還原為表格數據Mpw28資訊網——每日最新資訊28at.com

除了復雜的版面布局,種類繁多、空間結構復雜的圖表元素也是解析難點所在。“大模型加速器2.0”圖表解析模塊可智能提取多種圖表中的關鍵數據點、坐標軸信息、圖例說明等,在精準解析不同類型圖表數據的基礎上,將其還原為一組完整的Excel表格數據,作用于教育行業大模型微調,學科知識庫建設、智能審閱等環節。Mpw28資訊網——每日最新資訊28at.com

智能溯源讓大模型用得更“安心”Mpw28資訊網——每日最新資訊28at.com

近期,多家券商機構紛紛宣布接入大模型,幫助分析師、行業研究員等專業人士提高工作效率。為幫助用戶簡化專業文檔數據篩選和數據抽取流程,提升文檔內容解讀效率與準確率,“大模型加速器 2.0” 上線了知識庫產品組件,支持復雜文檔的智能問答、總結與檢索。Mpw28資訊網——每日最新資訊28at.com

為了讓行業“安心”使用大模型,知識庫產品推出溯源功能,通過在“投喂”給知識庫的Markdown及JSON文件中標記頁碼、坐標等空間位置信息,實現對句子、段落的精確溯源,為用戶提供了一個快速檢驗的路徑。以財務分析為例,大模型在多份高達上千頁的財報文件中找到收入、利潤等關鍵數據后,券商分析師可利用溯源功能定位原表格,對信息進行復核,防止錯誤、遺漏。Mpw28資訊網——每日最新資訊28at.com

Mpw28資訊網——每日最新資訊28at.com

圖說:知識庫對財報數據所在表格進行精準溯源Mpw28資訊網——每日最新資訊28at.com

目前,知識庫組件已面向開發者開源,幫助其根據自身需要快速構建個性化行業知識庫。此前,合合信息已開源智能文檔處理“百寶箱”系列產品,解決文檔解析精度低、解析效果評估難等問題,開發者可根據研發需求靈活搭配使用。未來,“大模型加速器”將持續優化迭代,助力大模型在各行各業中“百花齊放”。Mpw28資訊網——每日最新資訊28at.com

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!Mpw28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-20-138484-0.html合合信息TextIn發布“大模型加速器2.0”,文檔單頁處理耗時降低超30%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2025 AWE海信璀璨精彩綻放,四款產品榮膺艾普蘭獎詮釋東方美學新高度

下一篇: 潤和軟件亮相華為中國合作伙伴大會2025,發布DeepSeek一體機,引領行業大模型敏捷落地

標簽:
  • 熱門焦點
  • 7月安卓手機好評榜:三星S23Ultra好評率第一

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年7月1日至7月31日,僅限國內市場。第一名:三星Galaxy S23 Ultra好評率:95.71%在即將迎來新
  • K8S | Service服務發現

    一、背景在微服務架構中,這里以開發環境「Dev」為基礎來描述,在K8S集群中通常會開放:路由網關、注冊中心、配置中心等相關服務,可以被集群外部訪問;圖片對于測試「Tes」環境或者
  • 量化指標是與非:挽救被量化指標扼殺的技術團隊

    作者 | 劉新翠整理 | 徐杰承本文整理自快狗打車技術總監劉新翠在WOT2023大會上的主題分享,更多精彩內容及現場PPT,請關注51CTO技術棧公眾號,發消息【WOT2023PPT】即可直接領取
  • 2天漲粉255萬,又一賽道在抖音爆火

    來源:運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期,旅游賽道徹底火了:有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億;有的「博主」火了&m
  • 當家的盒馬,加速謀生

    來源 | 價值星球Planet作者 | 歸去來自己“當家”的盒馬,開始加速謀生了。據盒馬官微消息,盒馬計劃今年開放生鮮供應鏈,將其生鮮商品送往食堂。目前,盒馬在上海已經與
  • 華為Mate 60系列用上可變靈動島:正式版體驗將會更出色

    這段時間以來,關于華為新旗艦的爆料日漸密集。據此前多方爆料,今年華為將開始恢復一年雙旗艦戰略,除上半年推出的P60系列外,往年下半年的Mate系列也將
  • AMD的AI芯片轉單給三星可能性不大 與臺積電已合作至2nm制程

    據 DIGITIMES 消息,英偉達 AI GPU 出貨逐季飆升,接下來 AMD MI 300 系列將在第 4 季底量產。而半導體業內人士表示,近日傳出 AMD 的 AI 芯片將轉單給
  • 三星顯示已開始為AR設備研發硅基LED微顯示屏

    7月18日消息,據外媒報道,隨著蘋果首款頭顯產品Vision Pro在6月份正式推出,AR/VR/MR等頭顯產品也就將成為各大公司下一個重要的競爭領域,對顯示屏這一關
  • 與兆芯合作 聯想推出全新旗艦版筆記本電腦開天N7系列

    聯想與兆芯合作推出全新聯想旗艦版筆記本電腦開天 N7系列。這個系列采用兆芯KX-6640MA處理器平臺,KX-6640MA 處理器是采用了陸家嘴架構,16nm 工藝,4 核 4 線
Top 主站蜘蛛池模板: 宁安市| 子洲县| 甘孜县| 刚察县| 鄂州市| 凤台县| 梅州市| 内江市| 栾川县| 丰台区| 澄城县| 安乡县| 嘉黎县| 和政县| 大庆市| 青阳县| 自贡市| 兴海县| 银川市| 彰化市| 辉南县| 西丰县| 肥西县| 象山县| 韶关市| 化州市| 衡阳市| 遂溪县| 方正县| 佳木斯市| 宝清县| 玉龙| 天全县| 华蓥市| 宁安市| 凭祥市| 玉田县| 台东县| 滁州市| 晋宁县| 台南市|