四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

掃一掃下載界面新聞APP

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

2月11日,科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

喧囂的紅包大戰(zhàn)之外,推理模型成為大模型廠商競爭的無聲戰(zhàn)場。去年12月24日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)宣布推出形式化數(shù)學(xué)推理專用模型Seed Prover 1.5。1月26日,阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking。2月11日,科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

美國公司把推理當(dāng)作通往通用智能的必經(jīng)臺(tái)階,中國公司則把它當(dāng)作下一輪商業(yè)化的分水嶺:當(dāng)多模態(tài)把輸入做得更豐富、通用模型把對(duì)話做得更順滑,推理模型開始把重點(diǎn)放在另一件事上——更穩(wěn)定的思考鏈路、更可控的輸出邊界、更高的準(zhǔn)確率與一致性。三條路線正在分野:多模態(tài)追求感知與交互的上限,通用模型追求覆蓋與成本的平衡,推理模型追求把復(fù)雜問題拆解、把結(jié)果做對(duì)、把過程跑穩(wěn)。

科大訊飛選的是第三條,而且?guī)缀跏侵袊竽P凸纠镒睢皩?duì)號(hào)入座”的選擇。訊飛的優(yōu)勢從來不是做一個(gè)最吸睛的聊天入口,而是長期在教育、醫(yī)療、司法、政企等縱深行業(yè)里,把 AI 變成可交付、可驗(yàn)收、可規(guī)模化的生產(chǎn)力工具。行業(yè)客戶要的不是偶爾靈光一現(xiàn)的回答,而是穩(wěn)定的正確、可復(fù)現(xiàn)的質(zhì)量、足夠低的幻覺概率,以及在流程里能被審計(jì)、能被追責(zé)的執(zhí)行。推理模型天然更適合這類需求:它把不確定性壓到更窄的區(qū)間,把輸出從好不好聊,推向能不能用、敢不敢用、能不能持續(xù)用。

在這樣的背景下,基于全國產(chǎn)算力訓(xùn)練的深度推理大模型訊飛星火 X2 上線,就不只是一次常規(guī)迭代,而更像是訊飛把自身戰(zhàn)略定位寫進(jìn)模型底座的一次確認(rèn)。從 X1.5 到 X2,訊飛把升級(jí)重點(diǎn)放在兩件事上:一是整體能力上臺(tái)階,尤其在數(shù)學(xué)、答題、語言理解與智能體能力上,追求對(duì)標(biāo)全球最高水平;二是把推理能力進(jìn)一步壓進(jìn)行業(yè)場景,讓行業(yè)大模型繼續(xù)領(lǐng)先,并在產(chǎn)品與方案層面出現(xiàn)肉眼可見的進(jìn)步。

外部公開高難任務(wù)效果對(duì)比

推理模型之所以更像訊飛的路徑,關(guān)鍵在于穩(wěn)定與準(zhǔn)確這兩個(gè)詞在行業(yè)里意味著什么。醫(yī)療場景里,一個(gè)建議要能站得住腳,最好還能解釋得清楚、依據(jù)能回溯;教育場景里,一個(gè)解題過程要能復(fù)現(xiàn),錯(cuò)因定位要能貫穿,才能形成學(xué)習(xí)閉環(huán);司法場景里,任何提效都必須建立在可核驗(yàn)的證據(jù)鏈和流程合規(guī)之上;政企場景更是如此,模型不是為了展示能力,而是要落在規(guī)則、制度和責(zé)任體系里。推理模型把模型能力從展示型的聰明,推向工程化的可靠,正好與訊飛多年積累的行業(yè)數(shù)據(jù)、專家協(xié)同、交付體系形成互相加成。

因此,X2 的行業(yè)敘事也更強(qiáng)調(diào)可用性與落地。醫(yī)療上,星火醫(yī)療大模型 X2 強(qiáng)調(diào)在多個(gè)關(guān)鍵任務(wù)上超越外部主流模型,并首發(fā)大模型賦能下的超擬人外呼隨訪,把能力從問答延伸到患者管理;個(gè)人健康助手率先通過權(quán)威評(píng)測驗(yàn)證,補(bǔ)齊行業(yè)最在意的信任鏈條。教育上,X2 底座全面賦能,業(yè)內(nèi)率先實(shí)現(xiàn)錯(cuò)因貫穿的個(gè)性化學(xué)習(xí)能力,讓啟發(fā)式講解與個(gè)性化答疑更契合學(xué)生思路,從 AI 學(xué)習(xí)機(jī)的自主學(xué)習(xí)閉環(huán)到校園教學(xué)的小時(shí)級(jí)反饋,去做因材施教與減負(fù)增效這道長期題。司法上,圍繞案多人少的痛點(diǎn),以庭審時(shí)長縮短、檢察辦案提效 3 倍等指標(biāo)來證明可交付。汽車座艙則把推理能力轉(zhuǎn)成模糊意圖理解,讓交互從口令式控制走向更自然的對(duì)話式協(xié)作,像老朋友一樣讀懂潛臺(tái)詞。

更值得注意的是,訊飛把推理模型與智能體平臺(tái)綁在一起。行業(yè)客戶真正想要的往往不是一個(gè)更強(qiáng)的模型,而是一套能把復(fù)雜任務(wù)拆成可執(zhí)行步驟、能調(diào)用工具、能在長時(shí)任務(wù)中保持一致性的系統(tǒng)能力。X2 帶來的智能體能力提升,與星辰 Agent 平臺(tái)升級(jí)、企業(yè)級(jí)精品智能體的擴(kuò)容形成閉環(huán):模型負(fù)責(zé)更可靠地思考,平臺(tái)負(fù)責(zé)更可控地執(zhí)行,最后在招采、行業(yè)分析等場景里用準(zhǔn)確率與效率提升去完成驗(yàn)收。

全國產(chǎn)算力訓(xùn)練,則是這條路徑的另一塊拼圖。對(duì)訊飛來說,國產(chǎn)化不是口號(hào),而是把推理能力做成可部署、可規(guī)?;⒖沙掷m(xù)迭代的工程路線。行業(yè)縱深意味著客戶分布廣、算力與部署條件差異大、合規(guī)要求更復(fù)雜,模型必須能在不同環(huán)境中穩(wěn)定運(yùn)行,并且能隨著數(shù)據(jù)與專家共創(chuàng)不斷增強(qiáng)。在這種語境下,推理模型的穩(wěn)定與準(zhǔn)確,再疊加國產(chǎn)化算力平臺(tái)的可控性,構(gòu)成了訊飛在行業(yè)戰(zhàn)場上更適配的底層能力組合。

如果把多模態(tài)、通用、推理三條路線看作三種不同的勝負(fù)手,那么訊飛顯然不是去追逐最熱鬧的那一條,而是在選擇最能把優(yōu)勢放大的那一條。X2 的上線,強(qiáng)化的是一種更務(wù)實(shí)的判斷:當(dāng)模型競爭從發(fā)布會(huì)走進(jìn)業(yè)務(wù)流程,決定勝負(fù)的往往不是誰更會(huì)聊天,而是誰更可靠、誰更穩(wěn)定、誰更能在真實(shí)場景里持續(xù)做對(duì)并被信任。對(duì)于一個(gè)把行業(yè)縱深作為長期戰(zhàn)略定位的公司來說,推理模型不是新賽道,而是把舊優(yōu)勢升級(jí)成新底座的最短路徑。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

科大訊飛

3.7k
  • 科大訊飛:2025年凈利同比預(yù)增40%-70%
  • 科大訊飛2025年凈利潤預(yù)增超預(yù)期,軟件ETF(159852)一鍵布局AI軟件投資機(jī)遇

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

2月11日,科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

不拼熱鬧入口,科大訊飛要拼大模型最穩(wěn)定的正確率

喧囂的紅包大戰(zhàn)之外,推理模型成為大模型廠商競爭的無聲戰(zhàn)場。去年12月24日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)宣布推出形式化數(shù)學(xué)推理專用模型Seed Prover 1.5。1月26日,阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking。2月11日,科大訊飛升級(jí)發(fā)布旗下深度推理模型星火X2。

美國公司把推理當(dāng)作通往通用智能的必經(jīng)臺(tái)階,中國公司則把它當(dāng)作下一輪商業(yè)化的分水嶺:當(dāng)多模態(tài)把輸入做得更豐富、通用模型把對(duì)話做得更順滑,推理模型開始把重點(diǎn)放在另一件事上——更穩(wěn)定的思考鏈路、更可控的輸出邊界、更高的準(zhǔn)確率與一致性。三條路線正在分野:多模態(tài)追求感知與交互的上限,通用模型追求覆蓋與成本的平衡,推理模型追求把復(fù)雜問題拆解、把結(jié)果做對(duì)、把過程跑穩(wěn)。

科大訊飛選的是第三條,而且?guī)缀跏侵袊竽P凸纠镒睢皩?duì)號(hào)入座”的選擇。訊飛的優(yōu)勢從來不是做一個(gè)最吸睛的聊天入口,而是長期在教育、醫(yī)療、司法、政企等縱深行業(yè)里,把 AI 變成可交付、可驗(yàn)收、可規(guī)模化的生產(chǎn)力工具。行業(yè)客戶要的不是偶爾靈光一現(xiàn)的回答,而是穩(wěn)定的正確、可復(fù)現(xiàn)的質(zhì)量、足夠低的幻覺概率,以及在流程里能被審計(jì)、能被追責(zé)的執(zhí)行。推理模型天然更適合這類需求:它把不確定性壓到更窄的區(qū)間,把輸出從好不好聊,推向能不能用、敢不敢用、能不能持續(xù)用。

在這樣的背景下,基于全國產(chǎn)算力訓(xùn)練的深度推理大模型訊飛星火 X2 上線,就不只是一次常規(guī)迭代,而更像是訊飛把自身戰(zhàn)略定位寫進(jìn)模型底座的一次確認(rèn)。從 X1.5 到 X2,訊飛把升級(jí)重點(diǎn)放在兩件事上:一是整體能力上臺(tái)階,尤其在數(shù)學(xué)、答題、語言理解與智能體能力上,追求對(duì)標(biāo)全球最高水平;二是把推理能力進(jìn)一步壓進(jìn)行業(yè)場景,讓行業(yè)大模型繼續(xù)領(lǐng)先,并在產(chǎn)品與方案層面出現(xiàn)肉眼可見的進(jìn)步。

外部公開高難任務(wù)效果對(duì)比

推理模型之所以更像訊飛的路徑,關(guān)鍵在于穩(wěn)定與準(zhǔn)確這兩個(gè)詞在行業(yè)里意味著什么。醫(yī)療場景里,一個(gè)建議要能站得住腳,最好還能解釋得清楚、依據(jù)能回溯;教育場景里,一個(gè)解題過程要能復(fù)現(xiàn),錯(cuò)因定位要能貫穿,才能形成學(xué)習(xí)閉環(huán);司法場景里,任何提效都必須建立在可核驗(yàn)的證據(jù)鏈和流程合規(guī)之上;政企場景更是如此,模型不是為了展示能力,而是要落在規(guī)則、制度和責(zé)任體系里。推理模型把模型能力從展示型的聰明,推向工程化的可靠,正好與訊飛多年積累的行業(yè)數(shù)據(jù)、專家協(xié)同、交付體系形成互相加成。

因此,X2 的行業(yè)敘事也更強(qiáng)調(diào)可用性與落地。醫(yī)療上,星火醫(yī)療大模型 X2 強(qiáng)調(diào)在多個(gè)關(guān)鍵任務(wù)上超越外部主流模型,并首發(fā)大模型賦能下的超擬人外呼隨訪,把能力從問答延伸到患者管理;個(gè)人健康助手率先通過權(quán)威評(píng)測驗(yàn)證,補(bǔ)齊行業(yè)最在意的信任鏈條。教育上,X2 底座全面賦能,業(yè)內(nèi)率先實(shí)現(xiàn)錯(cuò)因貫穿的個(gè)性化學(xué)習(xí)能力,讓啟發(fā)式講解與個(gè)性化答疑更契合學(xué)生思路,從 AI 學(xué)習(xí)機(jī)的自主學(xué)習(xí)閉環(huán)到校園教學(xué)的小時(shí)級(jí)反饋,去做因材施教與減負(fù)增效這道長期題。司法上,圍繞案多人少的痛點(diǎn),以庭審時(shí)長縮短、檢察辦案提效 3 倍等指標(biāo)來證明可交付。汽車座艙則把推理能力轉(zhuǎn)成模糊意圖理解,讓交互從口令式控制走向更自然的對(duì)話式協(xié)作,像老朋友一樣讀懂潛臺(tái)詞。

更值得注意的是,訊飛把推理模型與智能體平臺(tái)綁在一起。行業(yè)客戶真正想要的往往不是一個(gè)更強(qiáng)的模型,而是一套能把復(fù)雜任務(wù)拆成可執(zhí)行步驟、能調(diào)用工具、能在長時(shí)任務(wù)中保持一致性的系統(tǒng)能力。X2 帶來的智能體能力提升,與星辰 Agent 平臺(tái)升級(jí)、企業(yè)級(jí)精品智能體的擴(kuò)容形成閉環(huán):模型負(fù)責(zé)更可靠地思考,平臺(tái)負(fù)責(zé)更可控地執(zhí)行,最后在招采、行業(yè)分析等場景里用準(zhǔn)確率與效率提升去完成驗(yàn)收。

全國產(chǎn)算力訓(xùn)練,則是這條路徑的另一塊拼圖。對(duì)訊飛來說,國產(chǎn)化不是口號(hào),而是把推理能力做成可部署、可規(guī)模化、可持續(xù)迭代的工程路線。行業(yè)縱深意味著客戶分布廣、算力與部署條件差異大、合規(guī)要求更復(fù)雜,模型必須能在不同環(huán)境中穩(wěn)定運(yùn)行,并且能隨著數(shù)據(jù)與專家共創(chuàng)不斷增強(qiáng)。在這種語境下,推理模型的穩(wěn)定與準(zhǔn)確,再疊加國產(chǎn)化算力平臺(tái)的可控性,構(gòu)成了訊飛在行業(yè)戰(zhàn)場上更適配的底層能力組合。

如果把多模態(tài)、通用、推理三條路線看作三種不同的勝負(fù)手,那么訊飛顯然不是去追逐最熱鬧的那一條,而是在選擇最能把優(yōu)勢放大的那一條。X2 的上線,強(qiáng)化的是一種更務(wù)實(shí)的判斷:當(dāng)模型競爭從發(fā)布會(huì)走進(jìn)業(yè)務(wù)流程,決定勝負(fù)的往往不是誰更會(huì)聊天,而是誰更可靠、誰更穩(wěn)定、誰更能在真實(shí)場景里持續(xù)做對(duì)并被信任。對(duì)于一個(gè)把行業(yè)縱深作為長期戰(zhàn)略定位的公司來說,推理模型不是新賽道,而是把舊優(yōu)勢升級(jí)成新底座的最短路徑。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。