文|allinone 沛林
編輯|沐風(fēng)
豆包手機的底層系統(tǒng),竟然出現(xiàn)了錘子SmartisanOS的代碼?!
近日,字節(jié)聯(lián)合中興,推出了搭載了豆包AI助手的手機,售價3499元,備貨3萬臺,第一批已售罄,出貨量字節(jié)并未透露。
消息一出,科技圈被點燃了,手機二手版被黃牛一度炒到7000元。
當(dāng)開發(fā)者真正收到手機,并陸續(xù)發(fā)出體驗帖,甚至是吐槽帖,黃牛價格又逐漸跌回4000元以下。
有開發(fā)者把系統(tǒng)解包后,在代碼里竟然看到了smartisan、smartisanos等字樣——難道錘子手機系統(tǒng),在豆包手機上復(fù)活了?
不管豆包手機打幾分,短短幾天之內(nèi),它帶來的驚喜,足夠吸引我們關(guān)注——
這到底是一款怎樣的手機?
01 新一代硬件交互模板?
12月1日,字節(jié)跳動豆包團隊,發(fā)布豆包手機助手技術(shù)預(yù)覽版。
豆包手機助手,是在豆包APP的基礎(chǔ)上,基于豆包大模型的能力和手機廠商的授權(quán),在操作系統(tǒng)層面做出的AI助手軟件。
開發(fā)者可以在豆包與中興合作的工程樣機nubia M153上,體驗豆包手機助手的技術(shù)預(yù)覽版本。
主推功能,是使用語音指令,便可讓AI Agent自由調(diào)用APP,試圖定義新一代人機交互關(guān)系。
從豆包手機助手的定位來看,字節(jié)并不想從頭做一個全新的底層系統(tǒng),而是把豆包手機助手,當(dāng)作手機上的代理層——你告訴它一個指令,它調(diào)用各個APP,幫你把任務(wù)完成。
例如,你想買一件羽絨服,只需對豆包手機說一句:“幫我在全平臺比價下單xx款羽絨服”,AI 就能自動跨應(yīng)用跳轉(zhuǎn),搜索同款、對比價格、領(lǐng)券,甚至幫你選好最低價的商品填入購物車。
這里體現(xiàn)的,是底層系統(tǒng)具備精準(zhǔn)的圖形界面(GUI)識別能力,說人話就是AI看得懂屏幕,理解“購物車”按鍵,看得明白不同頁面價格顯示等含義,這源自豆包大模型在多模態(tài)能力上的積累。
豆包在官方視頻中,還演示了更復(fù)雜任務(wù)的執(zhí)行。
當(dāng)用戶提出“下個月去巴黎,幫我把收藏的餐廳標(biāo)在地圖上,看看哪天有展并訂票”,這句話包含多條指令,AI能迅速拆解任務(wù),并按順序執(zhí)行查詢社交媒體收藏、高德地圖標(biāo)記、攜程訂票、整理進備忘錄。
這里體現(xiàn)的,是手機助手打通多項APP權(quán)限的調(diào)用能力,和穩(wěn)定的輸入輸出能力,說人話,就是能接收語音/文字/手勢等各種形式的指令輸入,然后使用AI Agent,調(diào)用所需APP,在監(jiān)督下安全完成支付等任務(wù),和自動復(fù)制粘貼的能力。
總結(jié)來說,豆包手機助手,走的是一條“系統(tǒng)級 RPA(機器人流程自動化) + 大模型 + 視覺理解”的路。
這個過程中,APP之間的界限消除,不可避免地帶來權(quán)限與隱私的隱患。
果然,手機發(fā)貨第二天,吐槽就來了。
02 剛出貨,就塌房?
最先出現(xiàn)的問題,是微信賬號被強制退出。
這簡直是暴擊,畢竟現(xiàn)在還有誰離得開微信?
后來,陸續(xù)出現(xiàn)了其它類似問題,如支付寶支付行為被截停、無法喚餓了么進行外賣訂單支付......
人們懷疑,豆包在沒有獲得APP廠商API授權(quán)的情況下,強行接管應(yīng)用。
豆包手機暴露的第二個問題,是操作沒有視頻演示的絲滑,體驗拉胯。
大家想象中的AI,是使用者不用打字,說兩句話,消息立馬發(fā)出。
但是有網(wǎng)友在直播中展示“發(fā)消息”,左搞右搞,半分鐘過去了,消息還沒發(fā)出去。
“這還不如自己動手?!庇腥送虏鄣馈?/p>
第三個問題,是使用者對隱私安全的質(zhì)疑。
豆包手機助手之所以能工作,是因為它擁有“上帝視角”,能實時讀取你的屏幕、聊天記錄、相冊、通訊錄、外賣/購物等信息。
人們不僅會想:這些數(shù)據(jù)是在本地處理,還是傳回了云端?用戶隱私是否被侵犯?甚至有人質(zhì)問:這算黑客操作嗎?突破Android權(quán)限的調(diào)用了吧?
豆包隨后發(fā)布了一篇長文澄清。關(guān)于微信登錄異常的情況,豆包沒有解釋APP官方是否授權(quán),直接說明,已下線手機助手操作微信的能力。
對于更棘手的,關(guān)于未經(jīng)授權(quán)、侵犯隱私,甚至黑客嫌疑,豆包承認調(diào)用權(quán)限的確是系統(tǒng)級能力,該權(quán)限用途在清單中有披露,在目前業(yè)內(nèi)所有AI助手中,屬于常規(guī)操作,且每次調(diào)用必須經(jīng)過用戶主動授權(quán)。
可以想象,大概在決定售賣工程機之前,字節(jié)就想到過,可能有這樣那樣的公關(guān)風(fēng)險出現(xiàn)。這也是為什么,這次只是限量的工程機發(fā)售。
而且字節(jié)對這次“技術(shù)預(yù)覽版”定位的強調(diào),也是在傳達,這是一場技術(shù)探索,先把原型放出來,讓行業(yè)看到目前可達到、下一代系統(tǒng)級能力的雛形。
03 彩蛋:豆包手機驚現(xiàn)錘子代碼
最讓人驚訝的,不是豆包手機對AI Agent調(diào)用能力的實現(xiàn),或者實際操作中的“翻車”體驗,而是當(dāng)開發(fā)者把豆包手機的系統(tǒng)解包后,在代碼里看到了smartisan、smartisanos、smartisan tracker appid的字段。
另一位科技博主發(fā)現(xiàn),系統(tǒng)內(nèi)置鈴聲里,還留著錘子時代的經(jīng)典鈴聲“米店”、“被禁忌的游戲”。
竟然,豆包手機的底層,有SmartisanOS的代碼!
這時人們突然想起,2019年,字節(jié)跳動收購錘子科技部分專利使用權(quán),相當(dāng)于接收了SmartisanOS系統(tǒng)。
同時,字節(jié)也接收了一部分錘子團隊,原堅果手機負責(zé)人吳德周等核心成員,連同大批OS與硬件工程師,一起進了字節(jié)。
羅永浩曾說過:“錘子的真正核心競爭力不是硬件,而是系統(tǒng)層的設(shè)計哲學(xué)。”
錘子作為公司,當(dāng)年死于融資和供應(yīng)鏈。但作為產(chǎn)品,SmartisanOS這個基于 Android底層深度重寫的操作系統(tǒng),擁有完整的桌面、系統(tǒng)服務(wù)棧和輸入法,也是少數(shù)在交互和審美上,都形成獨特氣質(zhì)的國產(chǎn)OS之一。
錘粉們因豆包手機,紛紛懷念起,SmartisanOS當(dāng)年最酷炫的兩項核心功能:閃念膠囊和Big Bang——
閃念膠囊(Idea Pills),是一項能夠快速記錄一閃而過想法的能力,它通過長按快捷鍵啟動,允許用戶用語音輸入來快速記錄靈感,并將語音轉(zhuǎn)化為文字膠囊,無需手動打開記事本,從而大大提高了日常記錄的便利性;
Big Bang功能,是一種智能文字識別和拆分技術(shù)。它允許用戶通過大面積按壓屏幕上的文字,將一段文字“炸開”,并智能地將其拆分成單個漢字或詞語,方便用戶進行后續(xù)操作,如搜索、分享和復(fù)制。
這兩項錘子手機獨創(chuàng)的功能,本質(zhì)上都是跨應(yīng)用的信息與操作能力重組。它們與豆包AI助手“跨APP操作”的理念,異常契合。
更何況,SmartisanOS系統(tǒng)當(dāng)初的定位,就是針對高頻人機交互場景而設(shè)計,例如前面舉例的閃念膠囊和Big Bang功能。當(dāng)SmartisanOS與大模型結(jié)合,本身就有天然的化學(xué)反應(yīng)空間。
六年后,隨著豆包手機的出現(xiàn),“smartisan”重見天日,怎么不能說是一次,給科技愛好者們,猝不及防的彩蛋呢。
04 結(jié)語
豆包手機,或許并不是未來硬件的最終形態(tài),但字節(jié)通過“軟硬結(jié)合”,表現(xiàn)出將AI落地C端的渴望。
也許這次的豆包手機并不完美,甚至問題迭出,但是人們想象了很久的語音直接發(fā)指令、用AI Agent打通APP 間調(diào)用,和重構(gòu)人機交互邏輯,我們總算有了一次真實體驗。
這種深入操作系統(tǒng)底層,追求“說一句話就直達服務(wù)”的嘗試,仍然比單純的 Chatbot,更具創(chuàng)新意義。
而SmartisanOS的復(fù)現(xiàn),讓我們看到,好產(chǎn)品的價值,并不會因一時的成敗,被人們遺忘。這大概也是,技術(shù)愛好者們守護的浪漫情懷吧。
參考資料:
極客公園《首銷備貨 3 萬臺,豆包 AI 手機要賣給誰?》
Z Finance《深度|老羅的 SmartisanOS 真的沒死,它以「豆包手機助手」的方式,在 2025年偷偷復(fù)活了》
路人甲TM《豆包手機翻車了!被反手一巴掌》
科技博主wuxianlin微博
科技博主白徵明微博

