文|融中財經
在全球人工智能領域,中美都孕育出了眾多表現(xiàn)出色的大模型獨角獸。這些企業(yè)都在本土市場展現(xiàn)出了強大的創(chuàng)新能力和市場活力,成為全球AI技術發(fā)展的領頭羊。
當視線擴展到中美之外,盡管AI獨角獸企業(yè)的涌現(xiàn)沒有中美那樣頻繁,但它們依然像世界各地散落的珍珠,每一顆都以其獨特的光芒閃耀著。從歐洲的心臟地帶到亞洲的新興市場,再到北美的科技巨頭,這些大模型獨角獸的發(fā)展軌跡,推動了各自國家和地區(qū)的科技創(chuàng)新,而且為全球人工智能技術的發(fā)展注入了多元化的視角和創(chuàng)新動力。
這場全球AI競賽,正變得越來越精彩。
法德爭奪“歐洲版OpenAI”
OpenAI作為這次AI熱潮的導火索和行業(yè)領先者,對行業(yè)生態(tài)有廣泛和深遠的影響。后進者們紛紛以OpenAI的成就為目標,致力于開發(fā)自己的大模型技術。
在法國,有一家公司被視為OpenAI在歐洲的主要競爭對手,法國總統(tǒng)馬克龍稱其是“法國天才”。這家備受矚目的公司名為Mistral AI,2023年4月在巴黎成立。Mistral AI由前DeepMind和Meta的科學家共同組建,主要聚焦開源模型及企業(yè)級服務。
Mistral AI開源的Mistral系列大模型受到了業(yè)界的廣泛贊譽。2024年4月,Mistral AI推出了全新專家混合(MoE)大模型Mixtral8x22B磁力鏈接。該模型在文本生成、問答理解等方面表現(xiàn)出色。Mixtral8x22B的具體特點包括對64K超長上下文的支持,多語言能力,尤其在法語、德語、西班牙語等語言上表現(xiàn)流暢,以及采用Apache2.0開源協(xié)議等。與相應規(guī)模的開源模型對比,除了部分評測不如Command R+外,Mixtral 8x22B模型在其它結果都大幅領先。
根據(jù)社區(qū)評測,Mistral 8X22B在多項基準測試中的表現(xiàn)超越了當前市場上的主流模型,如GPT-3.5和Llama 2(Meta開發(fā)的大語言模型),甚至有潛力與OpenAI的最新的GPT-4 Turbo相提并論。
這樣快速的進步和技術創(chuàng)新也吸引了大量投資者的關注。在該公司B輪融資中籌集到了6億歐元(約合6.4億美元或47億元),新融資使得Mistral AI估值達到60億歐元(約合64億美元或470億元)。該輪融資由美國的風險投資公司General Catalyst領投,其他投資者包括Lightspeed、法國巴黎銀行、英偉達、Salesforce、三星等。
資本的注入為Mistral AI的技術發(fā)展提供了強大動力,而該公司在技術合作方面的戰(zhàn)略布局同樣引人注目。Mistral AI與微軟建立了長期合作伙伴關系,利用Azure AI的超級計算基礎設施進行模型訓練,共同為客戶提供MIstral AI的模型服務,成為繼OpenAI后第二家在微軟Azure云平臺上提供商業(yè)語言模型的公司。
將目光從法國轉向歐洲大陸的另一個工業(yè)大國——德國,其也有著自己的OpenAI。成立于2019年的人工智能初創(chuàng)公司Aleph Alpha,將自身定位為歐洲本地AI技術的領導者。
2023年,Aleph Alpha在資本市場上取得了顯著成就,當年6月,Aleph Alpha獲得1億歐元A+輪融資,晉級德國AI獨角獸。2023年底,Aleph Alpha宣布完成超5億美元規(guī)模的B輪融資。該輪融資的投資方主要來自于德國本土,由創(chuàng)新園人工智能(Ipai)、博世風險投資(BoschVentures)和施瓦茨集團(SchwarzGroup)的公司領投。
Aleph Alpha主打“數(shù)據(jù)主權”的概念,即存儲在某個國家的數(shù)據(jù)受該國法律的約束,以確保數(shù)據(jù)的安全性。其生成式人工智能解決方案致力于為企業(yè)和政府提供突破性的人工智能技術。
技術層面上,Aleph Alpha自研的Luminous系列大語言模型,與ChatGPT的功能類似,提供生成文本/代碼、總結內容、翻譯等服務。2022年4月,AlephAlpha發(fā)布了Luminous系列第一個大語言模型,有130億、300億和700億三種參數(shù)。生成內容可解釋性是該模型的技術亮點,可以幫助客戶確保模型安全、可靠地處理其數(shù)據(jù),并對生成的內容進行合理的解釋。
Transformer創(chuàng)始八子締造大模型獨角獸
人工智能領域近年來的一系列突破性進展,如ChatGPT很大程度上要歸功于一種名為Transformer的模型架構,該架構提供了一種更有效的方式來訓練大型語言模型。Transformer在《Attention is All You Need》論文中首次提出,該論文由8位作者共同撰寫。
起初,Transformer模型在谷歌內部迅速流行并得到廣泛應用。然而,這一模型在谷歌之外的認知度和應用范圍相對有限。為了盡快將想法推向市場,論文的8位作者選擇離開原有的研究機構,投身于創(chuàng)業(yè)的浪潮中。在這些研究人員的引領下,也誕生了Character AI和Adept AI等初創(chuàng)公司,并迅速成長為市場上的獨角獸。
8位作者中,年輕且經驗最少的Aidan Gomez也萌生了離開的想法。Aidan Gomez出生在加拿大,曾在多倫多大學攻讀計算機專業(yè)。機緣巧合下,Aidan Gomez認識了多倫多大學校友華人Ivan Zhang。兩人一拍即合,于是在2019年,Cohere創(chuàng)立于加拿大多倫多。隨后在2020年,同樣畢業(yè)于多倫多大學計算機科學系,曾是谷歌大腦Hinton團隊成員的Nick Frosst加入了Cohere。值得一提的是,三位創(chuàng)始人均是90后。
Aidan Gomez意識到,要使大模型技術得到更廣泛的應用,需要克服兩大障礙:首先是計算資源的限制,構建和訓練大模型需要巨大的算力支持;其次是AI技術的高門檻,AI和機器學習領域的專業(yè)人才相對稀缺。因此,Cohere的愿景是創(chuàng)建一個平臺,消除這些障礙,使得原本只有大公司和專家才能實現(xiàn)的復雜任務變得更加簡單和易于訪問。
2024年4月,Cohere推出Command R+,該模型擁有1040億參數(shù),支持英語、中文、法語、德語等10種語言。在檢索增強生成(RAG)能力和工具應用方面取得了突破性進展。據(jù)其發(fā)布的性能測試數(shù)據(jù),在多語言、RAG、工具使用三大模塊,Command R+的性能基本與GPT-4 Turbo差不多。
與ChatGPT等大模型內卷To C市場不同,Cohere專注于To B市場,利用 AI 模型為企業(yè)應用提供人工智能服務,適用于寫作、內容審核、數(shù)據(jù)分類和信息提取等多種業(yè)務應用。
差異化戰(zhàn)略也令Cohere在競爭激烈的人工智能市場中脫穎而出。據(jù)外媒報道,Cohere已經與Jasper、Salesforce等行業(yè)知名企業(yè)建立了合作關系。這一戰(zhàn)略不僅擴大了Cohere的市場影響力,也為其帶來了穩(wěn)健的收益增長。截至今年3月底,Cohere的年化收入已經達到了3500萬美元,顯示出公司業(yè)務的強勁增長勢頭。
得益于創(chuàng)始人的學術背景和行業(yè)經驗,Cohere在早期就獲得了眾多AI領域重量級人物的支持,包括圖靈獎得主Geoffrey Hinton、Uber首席科學家Raquel Urtasun、英偉達多倫多研究實驗室主任Sanja Fidler以及斯坦福教授李飛飛等。
2024年6月,據(jù)媒體報道,在拿到英偉達、Salesforce、思科等知名投資方的4.5億美元融資后,Cohere估值飆升至50億美元,成為大模型領域的又一獨角獸企業(yè)。這輪融資不僅為Cohere的進一步發(fā)展提供了充足的資金支持,也反映了市場對其技術和愿景的高度認可。
亞洲大模型獨角獸多元化崛起
在亞洲,中國的大模型獨角獸企業(yè)活躍,互聯(lián)網(wǎng)大廠如百度、阿里、騰訊等憑借在各自領域的深厚積累,積極投身于這場科技競賽。同時,一些早已聲名顯赫的大佬,如美團的王慧文、前搜狗CEO王小川等的加入為這場競賽帶來了新的變數(shù),也為AI大模型的發(fā)展注入了新的活力。此外,一些新興的大模型企業(yè),如月之暗面、智譜AI等,也在這場競賽中嶄露頭角。它們憑借獨特的技術優(yōu)勢,拿到的一筆筆的融資額度不斷刷新著記錄。
若將目光投向中國之外,AI領域的獨角獸企業(yè)雖然數(shù)量不多,但每家公司都是該地區(qū)科技創(chuàng)新的璀璨明珠,具有不可替代的價值和獨特性。
印度,以其龐大的市場和人才儲備,孕育出了本土的AI獨角獸,成為了技術創(chuàng)新的熱土。
根據(jù)AMiner發(fā)布的《全球十個大模型核心團隊成員分析報告》,印度的教育機構在全球AI領域扮演著舉足輕重的角色。比如印度理工學院,它為全球十個大模型的核心團隊輸送了21位杰出人才,雖然僅占總數(shù)的2.2%,但這一比例在全球范圍內的頂尖高校中已足夠引人注目,凸顯了印度在培養(yǎng)人工智能領域專業(yè)人才方面的顯著成就和不懈努力。
2024年是印度AI領域的一個重要轉折點,當?shù)谹I初創(chuàng)公司Krutrim在完成經緯印度牽頭的5000萬美元融資后,估值達到了10億美元的里程碑,正式邁入獨角獸企業(yè)之列。這一成就不僅彰顯了Krutrim的快速成長,也代表了印度在人工智能技術領域取得的又一顯著進展。
Krutrim由印度知名企業(yè)家、Ola網(wǎng)約車平臺的創(chuàng)始人巴維什?阿加瓦爾(Bhavish Aggarwal)領導,該公司致力于大型語言模型(LLM)技術的開發(fā)與推廣。公司名稱Krutrim在梵語中意為“人工”,該公司還在開發(fā)數(shù)據(jù)中心,并設定了為AI生態(tài)系統(tǒng)制造服務器和超級計算機的宏偉目標。
在技術成就方面,Krutrim已經成功推出了同名的大型語言模型。這款模型以印度本土數(shù)據(jù)為核心,通過使用超過2萬億個語料庫進行訓練。據(jù)悉,Krutrim模型不僅能理解20種印度語言,還能生成包括故事、詩歌在內的多種文本,證明了其在多語言處理和內容創(chuàng)作方面的卓越性能。
從印度轉向亞洲的另一端,位于亞洲西部的以色列,不僅屬于亞洲版圖的一部分,還是亞洲、歐洲和非洲三大洲的交匯點。獨特的地理位置賦予了以色列豐富的文化多樣性,也為其科技創(chuàng)新提供了獨特的視角和機遇。在人工智能領域,以色列正以其深厚的科技創(chuàng)新和國防技術底蘊,孕育出本土AI獨角獸企業(yè)。
2023年,以色列AI大模型公司AI21 Labs 在C輪融資中獲得1.55億美元,其估值攀升至14億美元,躋身獨角獸之列。該次投資者包括Samsung Next、英偉達、谷歌等。
AI21 Labs成立于2017年,總部位于以色列特拉維夫,由Ori Goshen、Amnon Shashua教授和斯坦福大學教授YoavShoham于2017年共同創(chuàng)立,其中Amnon Shashua是著名自動駕駛巨頭Mobileye的聯(lián)合創(chuàng)始人。
AI21 Labs有基礎大模型Jurassic-2,開發(fā)者平臺AI21 studio,以及面向消費者的產品Wordtune和WordtuneRead。其中,Jurassic-2專注于“閱讀和寫作相關用例”,為應對大模型慣有的“幻覺”和可靠性問題,采用了一種創(chuàng)新的解決方案——MRKL Systems。這種方法通過結合一個或多個大型語言模型、外部知識庫以及符號推理專家系統(tǒng),有效降低了模型產生錯誤信息的風險。
AI視頻生成等多點開花
在全球人工智能領域,除了大模型的快速發(fā)展外,視頻和語音生成技術以及針對特定行業(yè)的應用也催生了一批獨角獸企業(yè)。這些企業(yè)以其創(chuàng)新技術和市場潛力贏得了投資者的青睞。
在AI視頻生成領域,基于人工智能的視頻生成平臺Synesia,2023年6月從包括英偉達在內的投資者處獲得9,000萬美元的融資資金,彼時估值達到10億美元。
Synesia 2017年成立,總部位于英國倫敦,該公司開發(fā)的軟件可以讓人們制作自己的數(shù)字化身,用來發(fā)表企業(yè)演講、培訓視頻,甚至可以使用120多種不同的語言來進行演示。Synesia等AI獨角獸的誕生也體現(xiàn)了投資者對于AI技術在多媒體內容創(chuàng)作等領域潛力的認可。
同樣在英國,另一家AI初創(chuàng)公司Quantexa也在2023年初完成了1.29億美元的融資,由新加坡主權財富基金GIC領投,現(xiàn)有投資者Warburg Pincus、Dawn Capital、British Patient Capital、Evolution Equity Partners、HSBC等跟投。這輪融資之后,Quantexa的估值飆升至18億美元,成為AI領域的又一家獨角獸企業(yè)。
Quantexa的業(yè)務始于金融服務行業(yè),其基于機器學習的方法能夠搜索公司數(shù)據(jù),尋找欺詐、洗錢和其他非法活動的信號。隨著公司技術的發(fā)展和市場需求的增長,Quantexa將其業(yè)務范圍擴展到了醫(yī)療保健、政府和保險等其他領域,利用其決策智能技術幫助構建完整的客戶檔案,了解客戶合規(guī)性。在政府部門,Quantexa 的軟件也被用于識別人口販賣等非法活動。
跨越英吉利海峽,德國也在AI領域積極探索。2024年5月,專注于深度學習的語言人工智能公司DeepL,宣布完成了3億美元的C輪融資,估值達到了20億美元。這輪融資由Index Ventures領投,ICONIQ Growth、Teachers' Venture Growth等也參與其中,標志著DeepL在AI翻譯領域的領先地位得到了資本市場的高度認可。
DeepL的發(fā)展歷程同樣充滿故事。2008年,前Google科學家Gereon Frahling在德國科隆創(chuàng)立了Linguee GmbH,這是DeepL的前身。經過多年的技術積累和創(chuàng)新,2017年,DeepL推出了其翻譯器產品,支持包括英語、德語、法語、西班牙語、意大利語、波蘭語和荷蘭語在內的多種語言翻譯。DeepL采用的神經網(wǎng)絡技術,能夠深入處理和理解語言的上下文,提供高質量的翻譯服務,這與傳統(tǒng)的基于規(guī)則的翻譯方法形成了鮮明對比。DeepL的翻譯質量在多個評價體系中超越了谷歌翻譯、亞馬遜翻譯、微軟翻譯以及Facebook翻譯等競爭對手,確立了其在AI翻譯領域的領先地位。
這些AI獨角獸企業(yè),作為行業(yè)的佼佼者,雖然在商業(yè)化路徑、解決方案和技術創(chuàng)新上各有側重點,但它們都秉承著共同的目標:解決現(xiàn)有大模型的挑戰(zhàn),突破局限。企業(yè)都在積極探索如何利用人工智能技術滿足特定的市場需求,無論是在提高大模型的準確性、降低運算成本、還是增強模型的可解釋性和安全性方面。展望未來,隨著技術的持續(xù)進步和全球化趨勢的加強,這些AI獨角獸企業(yè)預期將不斷擴大其全球影響力,推動行業(yè)向更高效、更智能的方向發(fā)展。

