日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

防止聊天機器人“造謠”,谷歌 Deepmind、斯坦福大學研究人員推出 AI 事實核查工具

來源: 責編: 時間:2024-04-02 17:06:18 160觀看
導讀 3 月 31 日消息,無論當下 AI 聊天機器人有多么強大,都會或多或少存在一大飽受詬病的行為 —— 以看上去令人信服的方式,向用戶提供與事實不符的回答。簡單來說,AI 有時會在回答中“滿口跑火車”,甚至“造謠”。圖

3 月 31 日消息,無論當下 AI 聊天機器人有多么強大,都會或多或少存在一大飽受詬病的行為 —— 以看上去令人信服的方式,向用戶提供與事實不符的回答。簡單來說,AI 有時會在回答中“滿口跑火車”,甚至“造謠”。3Jw28資訊網——每日最新資訊28at.com

3Jw28資訊網——每日最新資訊28at.com

圖源 Pixabay

防止 AI 大模型出現這種行為并非易事,且是一項技術性的挑戰。不過據外媒 Marktechpost 報道,谷歌 DeepMind 和斯坦福大學似乎找到了某種變通辦法。3Jw28資訊網——每日最新資訊28at.com

研究人員推出了一種基于大語言模型的工具 —— 搜索增強事實評估器(注:原名為 Search-Augmented Factuality Evaluator,簡稱 SAFE),可對聊天機器人生成的長回復進行事實核查。其研究結果與實驗代碼、數據集現已公布,點此查看3Jw28資訊網——每日最新資訊28at.com

該系統可通過四個步驟對聊天機器人生成的回復進行分析、處理和評估,以驗證準確性和真實性:將答案分割成單個待核查內容、對上述內容進行修正、再與谷歌搜索結果進行比較。隨后,該系統還會檢查各個事實與原始問題的相關性。3Jw28資訊網——每日最新資訊28at.com

為評估其性能,研究人員創建了包含約 16000 個事實的數據集 LongFact,并在來自 Claude、Gemini、GPT、PaLM-2 的 13 個大語言模型上測試了該系統。結果顯示,在對 100 個有爭議的事實進行的重點分析中,SAFE 的判定在進一步審查下正確率達到 76% 。與此同時,該框架還具備經濟性優勢:成本比人工注釋便宜 20 多倍。3Jw28資訊網——每日最新資訊28at.com

3Jw28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-3785-0.html防止聊天機器人“造謠”,谷歌 Deepmind、斯坦福大學研究人員推出 AI 事實核查工具

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 保時捷逐步淘汰燃油跑車,純電動718呼之欲出

下一篇: Databricks 推出 1320 億參數大語言模型 DBRX,號稱“現階段最強開源 AI”

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 白河县| 云霄县| 义乌市| 通化市| 泾阳县| 棋牌| 江口县| 彭州市| 青阳县| 宁安市| 中宁县| 寿光市| 肃宁县| 远安县| 恭城| 扬州市| 涟源市| 兴文县| 长白| 宁国市| 济阳县| 新建县| 德昌县| 陵水| 青海省| 怀集县| 九龙坡区| 伊宁县| 东辽县| 石泉县| 抚州市| 深圳市| 宜阳县| 阜阳市| 台前县| 馆陶县| 项城市| 塔城市| 新巴尔虎左旗| 西乡县| 普陀区|