當前位置：首頁 > 科技 > 通信

OpenAI和科大訊飛，瞄準了同一件事

來源：責編：時間：2025-08-12 10:56:11 66觀看

導讀　阿里云優惠券先領券再下單夏季大模型行業的密集上新隨著上周GPT-5的推出終于落下帷幕。北京時間8月8日凌晨，OpenAI正式發布下一代旗艦模型GPT-5，距離上代模型GPT-4的推出已經過去了29個月。但GPT-5上線初期的反饋卻

　阿里云優惠券先領券再下單

夏季大模型行業的密集上新隨著上周GPT-5的推出終于落下帷幕。北京時間8月8日凌晨，OpenAI正式發布下一代旗艦模型GPT-5，距離上代模型GPT-4的推出已經過去了29個月。

但GPT-5上線初期的反饋卻有些兩極分化。GPT-5仍然是當前能力最為全面的模型，但和此前OpenAI一直保持著斷代式的模型性能領先相比，GPT-5并未與市場主流模型拉開顯著差距，部分基準測試場景下甚至被馬斯克的Grok 4或者同期發布的Claude Opus 4.1超越。

部分原因在于OpenAI的先發優勢正在減弱，但更關鍵的原因或許在于OpenAI試圖將大模型從“能用”推向“好用”。和此前發布的旗艦模型不同，OpenAI在此次GPT-5發布會中尤其強調他們在減少模型幻覺、提升指令遵循能力和降低模型諂媚性方面的進展。

這和此前國內大模型代表星火 X1 的升級不謀而合。作為當前市面上唯一全棧自主可控的全國產大模型，星火X1在7月25日的升級同樣著重強調對大模型實用痛點尤其是幻覺問題的精準攻克上。

在對模型幻覺問題治理上，星火X1取得顯著突破，無論是對自身生成內容真實性的把控（事實性幻覺治理），還是參考外部資料時對原文的忠實程度都有顯著改善（忠誠性幻覺治理），大大提升了大模型在行業應用中的可靠性。

甚至二者在技術路線的探索上都頗為一致。OpenAI在官網介紹，針對模型幻覺問題，他們在GPT-5訓練中加入了多目標獎勵機制以及思維鏈監控等手段，來改善模型幻覺問題。多目標獎勵改變了此前模型單一獎懲機制容易迎合用戶的弊病，即便模型給出不確定性回答也可以得到正向反饋，思維鏈監控則可以有限防止推理模型在深度思考過程中的幻覺問題。

大模型幻覺的后果

在強化學習技術上，科大訊飛同樣試圖改進大模型粗糙的數值獎勵機制，將評語模型與細粒度反饋的強化學習技術結合起來，就像是給AI配了一個耐心的老師，能在解題的每個環節給出具體建議。這種做法讓復雜的數學推理訓練變得更加高效，也解決了強化學習訓練中“獎勵太少”的痛點問題。

此外，科大訊飛提出的基于多路徑采樣驗證及事實性約束強化學習的幻覺治理技術，則可以在大模型思考過程及恢復生成階段，實現客觀問題與標準答案的深度對齊，從而大幅減少慢思考下的幻覺率。

但在治理模型幻覺問題上，作為大模型國家隊的科大訊飛還是比OpenAI更多走了一步。科大訊飛不僅從模型訓練與監督角度入手，還深入介入了大模型訓練更前置的數據環節。

在此前已經建立行業高質量數據集以及訊飛知識工程平臺的基礎上，科大訊飛還開創性地提出了基于多路徑采樣驗證及事實性約束強化學習的幻覺治理技術，在大模型思考過程及回復生成階段，實現客觀問題與標準答案的深度強對齊，大幅減少了在慢思考下的幻覺率讓大模型回復通用常識及專業知識問題更加可靠。

從全國產大模型代表的星火X1，到海外大模型代表的GPT-5，全球頂尖大模型同時強調模型可靠性的升級。這背后是因為，大模型已經日益深入到社會應用的方方面面，在性能穩步提升的同時，也對模型的可靠性和易用性提出了更高要求。

“我們的核心追求的是模型的實際應用價值以及大眾的可訪問性/可負擔性。我們可以發布更智能的模型，但更重要的這次的模型可以讓超過十億人受益。”OpenAI創始人兼CEO薩姆·奧爾特曼說。

縱觀此次OpenAI針對GPT-5的升級，你可能會感到些許熟悉。在發布會中，模型性能的提升一筆帶過，更多時間都用在了講述GPT-5的具體行業應用，尤其是編程、寫作以及醫療等三個大模型核心應用場景上。

其實，大模型行業中最早呼吁關注模型行業應用價值的正是科大訊飛。早在科大訊飛立項攻堅大模型時，就確立了“1+N”的研發方向，在研發一個通用大模型的同時，也同步推出教育、醫療、法律等行業大模型。過去幾年來，訊飛星火圍繞醫療、教育、法律、汽車、科研等多個重點行業發布多個行業大模型，同時與多個行業龍頭、央國企展開深入合作，共同推進大模型落地應用。

7月25日全新升級的星火X1，更是科大訊飛推動模型從“能用”走向“好用”的關鍵一步。二者雖然只一字之差，但背后的技術深度和應用廣度完全不同。升級后的星火X1已全面賦能教育、醫療、企業應用、代碼、科研等行業大模型和智能體，在復雜行業場景任務上進一步滿足用戶核心需求。

星火代碼大模型已深度賦能金融、制造、能源、科技等100余家關鍵領域客戶，在典型應用場景中驅動研發效率提升超過50%。測試集合來源：測試集合來自認知智能全國重點實驗室構建的代碼實用場景測試集

大模型產業已經到了產業化與規模化落地的關鍵時期，大模型不僅要能用，更要好用。作為大模型產業真正的國家隊代表，星火X1更是肩負著中國大模型產業真正自主可控的使命要求。在保持性能領先的同時，也要真正賦能關乎社會民生的重點行業，為世界提供第二種選擇。

量子位智庫

星火X1能夠先于GPT-5提出大模型要從“能用”走向“好用”，要在智能領先的同時擁有更廣的行業應用，這背后彰顯了中國人工智能產業已經從追趕逐漸走向領先階段。

今年是國家《新一代人工智能發展規劃》“第二步”的關鍵之年，在人工智能基礎理論實現重大突破的同時，尤為強調在技術與應用達到世界領先水平，人工智能成為帶動我國產業升級和經濟轉型的主要動力。

作為大模型國家隊的突出代表，星火X1更要率先解決橫亙在大模型行業落地難的關鍵技術與應用難題。從這個角度上來說，星火X1已經交出了一份出色的答卷。

申請創業報道，分享創業好點子。點擊此處，共同探討創業新機遇！

本文鏈接：http://www.www897cc.com/showinfo-20-176623-0.htmlOpenAI和科大訊飛，瞄準了同一件事

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：唐人街-錦鯉國際11周年慶暨喬遷盛典：以專業深耕跨境服務，開啟國際化新篇章

下一篇：我店科技全球總部正式落戶海南儋州海花島借力自貿港政策開啟戰略新篇章

標簽：

熱門焦點

一加Ace2 Pro官宣：普及16G內存引領24G

一加官方今天繼續為本月發布的新機一加Ace2 Pro帶來預熱，公布了內存方面的信息。“淘汰 8GB ，12GB 起步，16GB 普及，24GB 引領，還有呢？#一加Ace2Pro#，2023 年 8 月，敬請期待。”同時
石頭自清潔掃拖機器人G10S評測：多年黑科技集大成之作懶人終極福音

科技圈經常能看到一個詞叫“縫合怪”，用來形容那些把好多功能或者外觀結合在一起的產品，通常這樣的詞是貶義詞，但如果真的是產品縫合的好、縫合的實用的話，那它就成了中性詞，今
一篇聊聊Go錯誤封裝機制

%w 是用于錯誤包裝（Error Wrapping）的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞，用于將一個錯誤（或其他可打印的值）包裝在一個新的錯誤中。使
Flowable工作流引擎的科普與實踐

一.引言當我們在日常工作和業務中需要進行各種審批流程時，可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
騰訊蓋樓，字節拆墻

來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎？一起上晶核，即刻暴打！”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
重估百度丨大模型，能撐起百度的“今天”嗎?

自象限原創作者｜程心羅輯2023年之前，對于自己的“今天”，百度也很迷茫。“新業務到 2022 年底還是 0，希望 2023 年出來一個 1。”這是2022年底，李彥宏
iQOO Neo8 Pro即將開售：到手價3099元起安卓性能最強旗艦

5月23日，iQOO如期舉行了新品發布會，全新的iQOO Neo8系列也正式與大家見面，包含iQOO Neo8和iQOO Neo8 Pro兩個版本，其中標準版搭載高通驍龍8+，而Pro版更
回歸OPPO兩年，一加贏了銷量，輸了品牌

成為OPPO旗下主打性能的先鋒品牌后，一加屢創佳績。今年618期間，一加手機全渠道銷量同比增長362%，憑借一加 11、一加 Ace 2、一加 Ace 2V三款爆品，一加
蘋果140W USB-C充電器：采用氮化鎵技術

據10 月 30 日 9to5 Mac 消息報道，當蘋果推出新的 MacBook Pro 2021 時，該公司還推出了新的 140W USB-C 充電器，附贈在 MacBook Pro 16 英寸機型的盒子里，也支

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

OpenAI和科大訊飛，瞄準了同一件事

一加Ace2 Pro官宣：普及16G內存引領24G

石頭自清潔掃拖機器人G10S評測：多年黑科技集大成之作懶人終極福音

一篇聊聊Go錯誤封裝機制

Flowable工作流引擎的科普與實踐

騰訊蓋樓，字節拆墻

重估百度丨大模型，能撐起百度的“今天”嗎?

iQOO Neo8 Pro即將開售：到手價3099元起安卓性能最強旗艦

回歸OPPO兩年，一加贏了銷量，輸了品牌

蘋果140W USB-C充電器：采用氮化鎵技術

最新推薦

猜你喜歡

熱門推薦

相關資訊