不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

2月11日，科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

商迪安 ·

喧囂的紅包大戰(zhàn)之外，推理模型成為大模型廠商競爭的無聲戰(zhàn)場。去年12月24日，字節(jié)跳動(dòng)Seed團(tuán)隊(duì)宣布推出形式化數(shù)學(xué)推理專用模型Seed Prover 1.5。1月26日，阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking。2月11日，科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

美國公司把推理當(dāng)作通往通用智能的必經(jīng)臺(tái)階，中國公司則把它當(dāng)作下一輪商業(yè)化的分水嶺：當(dāng)多模態(tài)把輸入做得更豐富、通用模型把對(duì)話做得更順滑，推理模型開始把重點(diǎn)放在另一件事上——更穩(wěn)定的思考鏈路、更可控的輸出邊界、更高的準(zhǔn)確率與一致性。三條路線正在分野：多模態(tài)追求感知與交互的上限，通用模型追求覆蓋與成本的平衡，推理模型追求把復(fù)雜問題拆解、把結(jié)果做對(duì)、把過程跑穩(wěn)。

科大訊飛選的是第三條，而且?guī)缀跏侵袊竽Ｐ凸纠镒睢皩?duì)號(hào)入座”的選擇。訊飛的優(yōu)勢從來不是做一個(gè)最吸睛的聊天入口，而是長期在教育、醫(yī)療、司法、政企等縱深行業(yè)里，把 AI 變成可交付、可驗(yàn)收、可規(guī)模化的生產(chǎn)力工具。行業(yè)客戶要的不是偶爾靈光一現(xiàn)的回答，而是穩(wěn)定的正確、可復(fù)現(xiàn)的質(zhì)量、足夠低的幻覺概率，以及在流程里能被審計(jì)、能被追責(zé)的執(zhí)行。推理模型天然更適合這類需求：它把不確定性壓到更窄的區(qū)間，把輸出從好不好聊，推向能不能用、敢不敢用、能不能持續(xù)用。

在這樣的背景下，基于全國產(chǎn)算力訓(xùn)練的深度推理大模型訊飛星火 X2 上線，就不只是一次常規(guī)迭代，而更像是訊飛把自身戰(zhàn)略定位寫進(jìn)模型底座的一次確認(rèn)。從 X1.5 到 X2，訊飛把升級(jí)重點(diǎn)放在兩件事上：一是整體能力上臺(tái)階，尤其在數(shù)學(xué)、答題、語言理解與智能體能力上，追求對(duì)標(biāo)全球最高水平；二是把推理能力進(jìn)一步壓進(jìn)行業(yè)場景，讓行業(yè)大模型繼續(xù)領(lǐng)先，并在產(chǎn)品與方案層面出現(xiàn)肉眼可見的進(jìn)步。

外部公開高難任務(wù)效果對(duì)比

推理模型之所以更像訊飛的路徑，關(guān)鍵在于穩(wěn)定與準(zhǔn)確這兩個(gè)詞在行業(yè)里意味著什么。醫(yī)療場景里，一個(gè)建議要能站得住腳，最好還能解釋得清楚、依據(jù)能回溯；教育場景里，一個(gè)解題過程要能復(fù)現(xiàn)，錯(cuò)因定位要能貫穿，才能形成學(xué)習(xí)閉環(huán)；司法場景里，任何提效都必須建立在可核驗(yàn)的證據(jù)鏈和流程合規(guī)之上；政企場景更是如此，模型不是為了展示能力，而是要落在規(guī)則、制度和責(zé)任體系里。推理模型把模型能力從展示型的聰明，推向工程化的可靠，正好與訊飛多年積累的行業(yè)數(shù)據(jù)、專家協(xié)同、交付體系形成互相加成。

因此，X2 的行業(yè)敘事也更強(qiáng)調(diào)可用性與落地。醫(yī)療上，星火醫(yī)療大模型 X2 強(qiáng)調(diào)在多個(gè)關(guān)鍵任務(wù)上超越外部主流模型，并首發(fā)大模型賦能下的超擬人外呼隨訪，把能力從問答延伸到患者管理；個(gè)人健康助手率先通過權(quán)威評(píng)測驗(yàn)證，補(bǔ)齊行業(yè)最在意的信任鏈條。教育上，X2 底座全面賦能，業(yè)內(nèi)率先實(shí)現(xiàn)錯(cuò)因貫穿的個(gè)性化學(xué)習(xí)能力，讓啟發(fā)式講解與個(gè)性化答疑更契合學(xué)生思路，從 AI 學(xué)習(xí)機(jī)的自主學(xué)習(xí)閉環(huán)到校園教學(xué)的小時(shí)級(jí)反饋，去做因材施教與減負(fù)增效這道長期題。司法上，圍繞案多人少的痛點(diǎn)，以庭審時(shí)長縮短、檢察辦案提效 3 倍等指標(biāo)來證明可交付。汽車座艙則把推理能力轉(zhuǎn)成模糊意圖理解，讓交互從口令式控制走向更自然的對(duì)話式協(xié)作，像老朋友一樣讀懂潛臺(tái)詞。

更值得注意的是，訊飛把推理模型與智能體平臺(tái)綁在一起。行業(yè)客戶真正想要的往往不是一個(gè)更強(qiáng)的模型，而是一套能把復(fù)雜任務(wù)拆成可執(zhí)行步驟、能調(diào)用工具、能在長時(shí)任務(wù)中保持一致性的系統(tǒng)能力。X2 帶來的智能體能力提升，與星辰 Agent 平臺(tái)升級(jí)、企業(yè)級(jí)精品智能體的擴(kuò)容形成閉環(huán)：模型負(fù)責(zé)更可靠地思考，平臺(tái)負(fù)責(zé)更可控地執(zhí)行，最后在招采、行業(yè)分析等場景里用準(zhǔn)確率與效率提升去完成驗(yàn)收。

全國產(chǎn)算力訓(xùn)練，則是這條路徑的另一塊拼圖。對(duì)訊飛來說，國產(chǎn)化不是口號(hào)，而是把推理能力做成可部署、可規(guī)?；⒖沙掷m(xù)迭代的工程路線。行業(yè)縱深意味著客戶分布廣、算力與部署條件差異大、合規(guī)要求更復(fù)雜，模型必須能在不同環(huán)境中穩(wěn)定運(yùn)行，并且能隨著數(shù)據(jù)與專家共創(chuàng)不斷增強(qiáng)。在這種語境下，推理模型的穩(wěn)定與準(zhǔn)確，再疊加國產(chǎn)化算力平臺(tái)的可控性，構(gòu)成了訊飛在行業(yè)戰(zhàn)場上更適配的底層能力組合。

如果把多模態(tài)、通用、推理三條路線看作三種不同的勝負(fù)手，那么訊飛顯然不是去追逐最熱鬧的那一條，而是在選擇最能把優(yōu)勢放大的那一條。X2 的上線，強(qiáng)化的是一種更務(wù)實(shí)的判斷：當(dāng)模型競爭從發(fā)布會(huì)走進(jìn)業(yè)務(wù)流程，決定勝負(fù)的往往不是誰更會(huì)聊天，而是誰更可靠、誰更穩(wěn)定、誰更能在真實(shí)場景里持續(xù)做對(duì)并被信任。對(duì)于一個(gè)把行業(yè)縱深作為長期戰(zhàn)略定位的公司來說，推理模型不是新賽道，而是把舊優(yōu)勢升級(jí)成新底座的最短路徑。

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

科大訊飛

3.7k

科大訊飛：2025年凈利同比預(yù)增40%-70%14天前
科大訊飛2025年凈利潤預(yù)增超預(yù)期，軟件ETF(159852)一鍵布局AI軟件投資機(jī)遇14天前

評(píng)論

暫無評(píng)論哦，快來評(píng)價(jià)一下吧！

下載界面新聞

微信公眾號(hào)

微博

科大訊飛

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

2月11日，科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

商迪安 · 2026/02/11 17:04

外部公開高難任務(wù)效果對(duì)比

全國產(chǎn)算力訓(xùn)練，則是這條路徑的另一塊拼圖。對(duì)訊飛來說，國產(chǎn)化不是口號(hào)，而是把推理能力做成可部署、可規(guī)模化、可持續(xù)迭代的工程路線。行業(yè)縱深意味著客戶分布廣、算力與部署條件差異大、合規(guī)要求更復(fù)雜，模型必須能在不同環(huán)境中穩(wěn)定運(yùn)行，并且能隨著數(shù)據(jù)與專家共創(chuàng)不斷增強(qiáng)。在這種語境下，推理模型的穩(wěn)定與準(zhǔn)確，再疊加國產(chǎn)化算力平臺(tái)的可控性，構(gòu)成了訊飛在行業(yè)戰(zhàn)場上更適配的底層能力組合。

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

歷史搜索全部刪除

熱門搜索

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

科大訊飛

評(píng)論

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

科大訊飛

評(píng)論

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率

不拼熱鬧入口，科大訊飛要拼大模型最穩(wěn)定的正確率