四虎AV成人在线观看|免费免费特黄的欧美大片|人妻丝袜中文字幕一区三区|性爱一级二级三级|日本黄色视频在线观看免费|亚洲午夜天堂超碰大香蕉中出|国产日韩三级黄色AV一区二区三区|a片网站在线观看视频|人人AV播放日韩操在线|国产伦清品一区二区三区

正在閱讀:

DeepSeek、月之暗面、MiniMax被點“非法提取”,它們做錯了嗎? | 電廠

掃一掃下載界面新聞APP

DeepSeek、月之暗面、MiniMax被點“非法提取”,它們做錯了嗎? | 電廠

2026開年不到3個月,這已是國產(chǎn)模型第二次陷入此類爭議。

DeepSeek、月之暗面、MiniMax被點“非法提取”,它們做錯了嗎? | 電廠

當?shù)貢r間2月23日,美國大模型公司Anthropic發(fā)布官方聲明,稱旗下大模型Claude遭到了中國模型企業(yè)DeepSeek(深度求索)、Moonshot(月之暗面)、MiniMax(稀宇科技)的“非法提取(illicitly extract)”。

2026開年不到3個月,這已是國產(chǎn)模型第二次陷入此類爭議。2月上旬流出的一份OpenAI備忘錄曾寫道,DeepSeek正借助ChatGPT及其他美國領先AI模型來進行自身訓練。

而本次Anthropic則披露了更多數(shù)據(jù),據(jù)稱三家中國企業(yè)以約 2.4萬個欺詐賬戶與Claude進行了超1600萬次互動,并以這些對話信息作為訓練素材、改進了國產(chǎn)模型的性能。

點名三家企業(yè)隔天,Anthropic即開展了一場直播,展示Claude的最新能力。

與此同時,受到指控的國產(chǎn)三小龍則一片“靜悄悄”。迄今,DeepSeek、MiniMax、MoonShot對此均無回應。

三小龍撞上最“MAGA”的美國大模型

根據(jù)Anthropic聲明,DeepSeek、Moonshot、MiniMax所采用的技術(shù)手段名為“蒸餾(distill)”。

這種模型訓練手段可追溯至2015年,最早由諾獎得主、有“深度學習教父”之稱的Geoffrey Hinton及其團隊提出。

根據(jù)Anthropic指控,在蒸餾過程中,Claude被作為“教師模型”,DeepSeek、Moonshot、MiniMax通過與Claude進行大量交互,獲得輸出概率分布等信息。這些信息進而成為了DeepSeek等學生模型的模型訓練素材、使學生模型能夠以較小的數(shù)據(jù)樣本迅速學習“教師”的行為。

圖/視覺中國

就職北京一家大模型企業(yè)的Lulu告訴電廠:“蒸餾本身是常見的讓模型快速進化的手段。借助這個過程,蒸餾模型可以在短時間內(nèi)迅速逼近被蒸餾模型的智力邊界,理論上得到的學生模型參數(shù)量也較小、推理速度更快?!?/p>

如其所言,頂尖的大模型廠商、AI實驗室常常在自研大版本模型的基礎上,蒸餾出更小版本模型。比如阿里巴巴團隊就在Qwen2大模型發(fā)布(2024年6月7日)5個月后,蒸餾出了DistilQwen2。

但除了自行蒸餾之外,許多大模型都將用戶或競品對自家模型的蒸餾定義為“竊取智能”的行為,并在服務條款中明確禁止了這種操作。比如Claude在其“隱私與法律”一節(jié)中就寫道:“(用戶)禁止在未獲書面許可的情況下將這些(Claude的)輸出用于訓練或開發(fā) AI 模型”。

在聲明之中,Anthropic稱三家中國大模型公司所進行的輸入行為在“提示詞的數(shù)量、結(jié)構(gòu)、焦點”方面,與正常使用模式截然不同。其中,DeepSeek與Claude進行了15萬次交換、Moonshot進行了340萬次交換、MiniMax進行了1300萬次交換。并且,Anthropic認為上述行為針對Claude最獨特的三大能力——代理推理、工具使用、編碼進行了有意提取。

基于這些觀察,Anthropic將三家公司的行為定義為“蒸餾攻擊(distillation attacks)”。

此外,長期以來Claude及其背后的公司Anthropic,都是對中國用戶及客戶最不“友好”的大模型公司之一。

Anthropic及其CEO Dario Amodei曾多次表態(tài)支持美國的出口管制政策。2025年9月,Claude曾特別更新其銷售地區(qū)限制,專門指出將不向位于“對手國家”中國,或是中資持股超50%的海外子公司提供Claude商業(yè)訪問渠道,隨后還禁用了大批中國用戶對Claude Code等工具的訪問權(quán)限。

圖/Anthropic

而在本次聲明中,Anthropic也指出,其認為DeepSeek、Moonshot和MiniMax通過商業(yè)代理繞開了Claude的禁用限制,進行了違法訪問,并呼吁其他美國AI企業(yè)、云服務商、政策制定者與其協(xié)同應對此類行為。

至此,這已不只是簡單的技術(shù)和商業(yè)問題,更融入了地緣角斗的時代背景。

有關(guān)技術(shù)、商業(yè)、地緣的復雜博弈

盡管迄今三家中國企業(yè)尚未回應Anthropic的公開聲明,此前他們已經(jīng)多番陷入同類爭議,也曾以不同方式進行過回應。

從2023年開始,全球閉源AI大模型“三巨頭”O(jiān)penAI、Anthropic、Google陸續(xù)將禁止蒸餾的相關(guān)條款寫入使用協(xié)議。在那之后,有關(guān)中美之間的“模型蒸餾”爭議逐步發(fā)酵。

比如在2025年1月,曾有OpenAI研究人員稱DeepSeek可能使用了OpenAI模型的輸出來訓練R1大模型。DeepSeek則在9月登刊Nature的論文中回應這一猜測稱,其部分訓練數(shù)據(jù)源于網(wǎng)頁隨機抓取,“沒有故意加入OpenAI生成的合成數(shù)據(jù)”,并公開了相關(guān)技術(shù)細節(jié)。

2026年1月底,Moonshot新模型Kimi K2.5發(fā)布后,坊間也曾質(zhì)疑其蒸餾自Claude。公司創(chuàng)始人楊植麟在一場Ask Me Anything活動中公開對此回應,否認了這種猜測。據(jù)他解釋,Kimi K2.5有時會在回答中提及Claude系因:“我們在預訓練中采樣了最新的互聯(lián)網(wǎng)數(shù)據(jù),而這些數(shù)據(jù)與‘Claude’這個 token關(guān)聯(lián)較多?!?/p>

Moonshot公司創(chuàng)始人楊植麟,圖/視覺中國

但除了雙方的指控與自辨,如何確證模型蒸餾行為的存在、怎么定性模型蒸餾行為、是否涉及合同法/版權(quán)法/不正當競爭等法律問題……凡此種種,都還沒有明確的路徑可循。

另一方面,無論中美,各家大模型訓練時都從互聯(lián)網(wǎng)中爬取了無數(shù)語料。這些語料由萬千互聯(lián)網(wǎng)用戶生產(chǎn),使用它們進行訓練是否涉及授權(quán)問題,同樣有待商榷。

“中國企業(yè)蒸餾美國模型”已被塑造為某種單向敘事。在較長一段時間內(nèi),有關(guān)“蒸餾”的爭議,都將是一場懸而未決的“輿論戰(zhàn)”。而這還將持續(xù)下去。

但值得一提的是無論產(chǎn)學界,對蒸餾技術(shù)的使用本身,從來都不只是某種單方行為。

中國多款領先的大模型系列都接受特定開源協(xié)議、允許蒸餾行為。

比如DeepSeek主要模型系列(如 DeepSeek-V2、V3、R1)遵循MIT許可證開源發(fā)布,允許學術(shù)研究和商業(yè)應用,用戶可自由下載模型權(quán)重進行本地部署或微調(diào);MiniMax-M1、Kimi K2、阿里巴巴旗下Qwen3等系列模型遵循Apache 2.0許可證,允許用戶自由使用、修改、再發(fā)布、甚至將代碼直接用于閉源商業(yè)軟件,且無需支付費用等。

許多閉源模型同樣受益于此。比如據(jù)市場消息,美國科技巨頭Meta正秘密研發(fā)一款代號為“Avocado(牛油果)”的閉源模型,計劃于今春發(fā)布。

曾有知情人士透露,Meta在訓練Avocado時,會使用包括Qwen在內(nèi)的多家第三方模型進行蒸餾。

從這一角度而言,對模型蒸餾的爭議也引出了模型開閉源路線之爭的老問題。

在這個缺乏產(chǎn)業(yè)秩序的新市場,技術(shù)先進程度不再是唯一的發(fā)展追求,生態(tài)、人才、法律、地緣等因素被一一疊加,競爭邏輯的維度不斷豐富。相較以往,每個市場玩家都更加迫切,希望筑好技術(shù)競爭力的圍墻,但也逃不開其他參與者的審視與圍觀。

 

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

DeepSeek、月之暗面、MiniMax被點“非法提取”,它們做錯了嗎? | 電廠

2026開年不到3個月,這已是國產(chǎn)模型第二次陷入此類爭議。

DeepSeek、月之暗面、MiniMax被點“非法提取”,它們做錯了嗎? | 電廠

當?shù)貢r間2月23日,美國大模型公司Anthropic發(fā)布官方聲明,稱旗下大模型Claude遭到了中國模型企業(yè)DeepSeek(深度求索)、Moonshot(月之暗面)、MiniMax(稀宇科技)的“非法提?。╥llicitly extract)”。

2026開年不到3個月,這已是國產(chǎn)模型第二次陷入此類爭議。2月上旬流出的一份OpenAI備忘錄曾寫道,DeepSeek正借助ChatGPT及其他美國領先AI模型來進行自身訓練。

而本次Anthropic則披露了更多數(shù)據(jù),據(jù)稱三家中國企業(yè)以約 2.4萬個欺詐賬戶與Claude進行了超1600萬次互動,并以這些對話信息作為訓練素材、改進了國產(chǎn)模型的性能。

點名三家企業(yè)隔天,Anthropic即開展了一場直播,展示Claude的最新能力。

與此同時,受到指控的國產(chǎn)三小龍則一片“靜悄悄”。迄今,DeepSeek、MiniMax、MoonShot對此均無回應。

三小龍撞上最“MAGA”的美國大模型

根據(jù)Anthropic聲明,DeepSeek、Moonshot、MiniMax所采用的技術(shù)手段名為“蒸餾(distill)”。

這種模型訓練手段可追溯至2015年,最早由諾獎得主、有“深度學習教父”之稱的Geoffrey Hinton及其團隊提出。

根據(jù)Anthropic指控,在蒸餾過程中,Claude被作為“教師模型”,DeepSeek、Moonshot、MiniMax通過與Claude進行大量交互,獲得輸出概率分布等信息。這些信息進而成為了DeepSeek等學生模型的模型訓練素材、使學生模型能夠以較小的數(shù)據(jù)樣本迅速學習“教師”的行為。

圖/視覺中國

就職北京一家大模型企業(yè)的Lulu告訴電廠:“蒸餾本身是常見的讓模型快速進化的手段。借助這個過程,蒸餾模型可以在短時間內(nèi)迅速逼近被蒸餾模型的智力邊界,理論上得到的學生模型參數(shù)量也較小、推理速度更快。”

如其所言,頂尖的大模型廠商、AI實驗室常常在自研大版本模型的基礎上,蒸餾出更小版本模型。比如阿里巴巴團隊就在Qwen2大模型發(fā)布(2024年6月7日)5個月后,蒸餾出了DistilQwen2。

但除了自行蒸餾之外,許多大模型都將用戶或競品對自家模型的蒸餾定義為“竊取智能”的行為,并在服務條款中明確禁止了這種操作。比如Claude在其“隱私與法律”一節(jié)中就寫道:“(用戶)禁止在未獲書面許可的情況下將這些(Claude的)輸出用于訓練或開發(fā) AI 模型”。

在聲明之中,Anthropic稱三家中國大模型公司所進行的輸入行為在“提示詞的數(shù)量、結(jié)構(gòu)、焦點”方面,與正常使用模式截然不同。其中,DeepSeek與Claude進行了15萬次交換、Moonshot進行了340萬次交換、MiniMax進行了1300萬次交換。并且,Anthropic認為上述行為針對Claude最獨特的三大能力——代理推理、工具使用、編碼進行了有意提取。

基于這些觀察,Anthropic將三家公司的行為定義為“蒸餾攻擊(distillation attacks)”。

此外,長期以來Claude及其背后的公司Anthropic,都是對中國用戶及客戶最不“友好”的大模型公司之一。

Anthropic及其CEO Dario Amodei曾多次表態(tài)支持美國的出口管制政策。2025年9月,Claude曾特別更新其銷售地區(qū)限制,專門指出將不向位于“對手國家”中國,或是中資持股超50%的海外子公司提供Claude商業(yè)訪問渠道,隨后還禁用了大批中國用戶對Claude Code等工具的訪問權(quán)限。

圖/Anthropic

而在本次聲明中,Anthropic也指出,其認為DeepSeek、Moonshot和MiniMax通過商業(yè)代理繞開了Claude的禁用限制,進行了違法訪問,并呼吁其他美國AI企業(yè)、云服務商、政策制定者與其協(xié)同應對此類行為。

至此,這已不只是簡單的技術(shù)和商業(yè)問題,更融入了地緣角斗的時代背景。

有關(guān)技術(shù)、商業(yè)、地緣的復雜博弈

盡管迄今三家中國企業(yè)尚未回應Anthropic的公開聲明,此前他們已經(jīng)多番陷入同類爭議,也曾以不同方式進行過回應。

從2023年開始,全球閉源AI大模型“三巨頭”O(jiān)penAI、Anthropic、Google陸續(xù)將禁止蒸餾的相關(guān)條款寫入使用協(xié)議。在那之后,有關(guān)中美之間的“模型蒸餾”爭議逐步發(fā)酵。

比如在2025年1月,曾有OpenAI研究人員稱DeepSeek可能使用了OpenAI模型的輸出來訓練R1大模型。DeepSeek則在9月登刊Nature的論文中回應這一猜測稱,其部分訓練數(shù)據(jù)源于網(wǎng)頁隨機抓取,“沒有故意加入OpenAI生成的合成數(shù)據(jù)”,并公開了相關(guān)技術(shù)細節(jié)。

2026年1月底,Moonshot新模型Kimi K2.5發(fā)布后,坊間也曾質(zhì)疑其蒸餾自Claude。公司創(chuàng)始人楊植麟在一場Ask Me Anything活動中公開對此回應,否認了這種猜測。據(jù)他解釋,Kimi K2.5有時會在回答中提及Claude系因:“我們在預訓練中采樣了最新的互聯(lián)網(wǎng)數(shù)據(jù),而這些數(shù)據(jù)與‘Claude’這個 token關(guān)聯(lián)較多?!?/p>

Moonshot公司創(chuàng)始人楊植麟,圖/視覺中國

但除了雙方的指控與自辨,如何確證模型蒸餾行為的存在、怎么定性模型蒸餾行為、是否涉及合同法/版權(quán)法/不正當競爭等法律問題……凡此種種,都還沒有明確的路徑可循。

另一方面,無論中美,各家大模型訓練時都從互聯(lián)網(wǎng)中爬取了無數(shù)語料。這些語料由萬千互聯(lián)網(wǎng)用戶生產(chǎn),使用它們進行訓練是否涉及授權(quán)問題,同樣有待商榷。

“中國企業(yè)蒸餾美國模型”已被塑造為某種單向敘事。在較長一段時間內(nèi),有關(guān)“蒸餾”的爭議,都將是一場懸而未決的“輿論戰(zhàn)”。而這還將持續(xù)下去。

但值得一提的是無論產(chǎn)學界,對蒸餾技術(shù)的使用本身,從來都不只是某種單方行為。

中國多款領先的大模型系列都接受特定開源協(xié)議、允許蒸餾行為。

比如DeepSeek主要模型系列(如 DeepSeek-V2、V3、R1)遵循MIT許可證開源發(fā)布,允許學術(shù)研究和商業(yè)應用,用戶可自由下載模型權(quán)重進行本地部署或微調(diào);MiniMax-M1、Kimi K2、阿里巴巴旗下Qwen3等系列模型遵循Apache 2.0許可證,允許用戶自由使用、修改、再發(fā)布、甚至將代碼直接用于閉源商業(yè)軟件,且無需支付費用等。

許多閉源模型同樣受益于此。比如據(jù)市場消息,美國科技巨頭Meta正秘密研發(fā)一款代號為“Avocado(牛油果)”的閉源模型,計劃于今春發(fā)布。

曾有知情人士透露,Meta在訓練Avocado時,會使用包括Qwen在內(nèi)的多家第三方模型進行蒸餾。

從這一角度而言,對模型蒸餾的爭議也引出了模型開閉源路線之爭的老問題。

在這個缺乏產(chǎn)業(yè)秩序的新市場,技術(shù)先進程度不再是唯一的發(fā)展追求,生態(tài)、人才、法律、地緣等因素被一一疊加,競爭邏輯的維度不斷豐富。相較以往,每個市場玩家都更加迫切,希望筑好技術(shù)競爭力的圍墻,但也逃不開其他參與者的審視與圍觀。

 

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。