AI测试 豆包手机围剿战与 AutoGLM 开源:AI 手机生死局

andyguo · 2025年12月10日 · 478 次阅读

这几天科技圈最炸裂的新闻,莫过于 “豆包手机” 引发的这场互联网大乱斗,以及智谱 AI 紧随其后的 “掀桌子” 式开源。如果你还在吃瓜,觉得这只是几个 App 之间的吵架,那你可能低估了这件事的分量。
这不仅仅是一款手机被封杀,这是 中国互联网历史上最大规模 “武装械斗” 的前夜,是 AI 时代人机交互范式的一次剧烈碰撞。
本内容我们大概用 5 到 10 分钟,我们不仅要聊八卦,更要深度复盘:豆包手机为什么遭到围剿?AI 手机的未来到底在哪里?AutoGLM 的开源又将如何改写战局?


第一部分:豆包手机为何遭 “全网抵制”?
事情的起因是 12 月 1 日,字节跳动联合中兴努比亚发布了 “豆包手机”(nubia M153),搭载了 “豆包手机助手”。这个助手能干嘛?它能跨 App 帮你点外卖、发微信、比价购物,你动动嘴,它就帮你跑腿。
但很快,反击来了。微信提示环境异常甚至封号,淘宝频繁弹出人机验证,各大银行 App 拒绝在录屏状态下运行。
为什么各大厂商反应这么激烈?

  1. 表面原因:安全与隐私的 “遮羞布” 厂商们的官方理由是 “安全与隐私”。豆包手机助手索取的权限极高,包括 injection-event 这种顶级系统权限,甚至直接读取屏幕缓冲区数据。对于银行和社交软件来说,这就好比你把家里的钥匙交给了第三方,不仅能看你聊天,还能模拟你的手指操作,风控系统自然会报警。
  2. 深层原因:流量入口与商业模式的生死战 更本质的原因是利益。AI 手机正在试图重构流量的分配逻辑。 • 入口之争: 在过去,App 是一个个独立的孤岛,用户必须点开 App 才能使用服务。但在 AI 手机时代,操作系统(OS)成了意图的第一接收者。你说 “我要打车”,AI 决定唤起哪个 App,而不是你自己去选。各大 App 担心自己沦为纯粹的 “后端数据库” 和 “工具人”,失去了与用户直接接触的机会。 • 商业模式崩塌: 互联网大厂靠什么赚钱?广告和流量分发。如果 AI 帮你买东西,它会跳过开屏广告,忽略推荐位,直接执行任务。美团、淘宝、抖音(虽然是自家的)靠烧钱建立的护城河,可能被 AI 一个 “比价指令” 瞬间填平。 • 数据护城河: 类似于微信、淘宝这样的超级 App,绝不允许第三方 AI 在自己的地盘上随意抓取数据、分析用户习惯。这是它们的核心资产。 所以,这场抵制不是简单的技术故障,而是 App 厂商为了保卫流量入口和数据主权发起的 “自卫反击战”。 -------------------------------------------------------------------------------- 第二部分:AI 手机的未来与困境——GUI 还是 API? 这次冲突,把 AI 手机发展的两条核心技术路线——GUI(图形用户界面)范式与 API(应用程序接口)范式——的矛盾彻底公开化了。
  3. 当前的困境:技术 “暴力” 破解 vs. 生态壁垒 豆包手机走的是 GUI 范式。它不依赖 App 开发者配合,直接用视觉大模型 “看” 屏幕,模拟人类点击。 • 优点: 通用性强,理论上人能用的 App 它都能用。 • 缺点: 正如我们看到的,它遭到了 App 厂商的强烈抵制;而且它效率较低,需要像人一样一步步操作,还容易出错。 另一种是苹果 Apple Intelligence 代表的 API 范式。 • 优点: 稳定、隐私好、效率高。 • 缺点: 需要 App 开发者主动配合接入接口。但在国内这种 “围墙花园” 林立的生态下,让微信给手机厂商开接口?这太难了。
  4. 未来的发展:融合与博弈 未来的 AI 手机不会是单选题,而是两者的融合: • 高敏感操作(支付、金融): 必须走 API 模式,通过严格的授权机制,确保安全。 • 长尾需求(查询、浏览): GUI 模式将通过视觉大模型在端侧运行,解决隐私上传云端的问题。 但在这个未来到来之前,手机厂商、大模型厂商和 App 巨头之间,还将经历漫长的博弈和法律界定。例如,AI 代理用户操作 App,到底算不算侵权?这在法律上目前还是一片模糊。 -------------------------------------------------------------------------------- 第三部分:AutoGLM 开源——AI 手机的 “安卓时刻”? 就在豆包被围剿得灰头土脸时,12 月 9 日,智谱 AI 做了一个惊人的决定:开源 AutoGLM。 如果说豆包是想自己做 “超级入口”,智谱这一手就是直接给所有硬件厂商发了武器。这对未来 AI 手机的发展影响巨大:
  5. 打破巨头垄断,人人皆可造 “豆包” AutoGLM 开源了一整套 “Phone Use” 能力框架。这意味着,荣耀、小米、OPPO,甚至普通的个人开发者,都可以基于这个框架,低成本地打造自己的 AI 手机助手。技术的门槛被瞬间夷平,互联网巨头可以围剿一个 “豆包”,但很难围剿千千万万个基于开源框架的 AI 助手。
  6. 技术路线的降维打击 与豆包依赖系统底层权限不同,AutoGLM 采用的是 ADB(Android 调试桥)+ 视觉大模型 的方案。它的逻辑是 “看截图 -> 分析 -> 模拟点击”。这种基于纯视觉的方案,更接近人类的操作直觉,App 厂商想要通过代码检测来防御会变得非常困难——只要人眼能看懂,AI 就能操作。
  7. 隐私问题的 “解法” 智谱不仅开源了模型,还支持本地化部署。这意味着数据可以不出手机,在端侧完成识别和决策。这直接瓦解了 App 厂商以 “隐私泄露” 为由进行封杀的合法性基础。
  8. 倒逼生态开放 当市场上出现海量的 AI Agent 都在试图操作 App 时,继续修筑高墙可能导致用户体验极度下降(比如每次都要输验证码)。这可能会倒逼 App 厂商坐到谈判桌前,变 “堵” 为 “疏”,主动开放标准化的 API 接口,从而推动整个移动互联网生态的重构。

总结
我们正处在移动互联网从 App 时代向 Agent(智能体)时代跃迁的前夜。
豆包手机的遭遇告诉我们,旧势力(超级 App)不会轻易交出权杖;而 AutoGLM 的开源则宣告了,新时代的技术浪潮无法被单一力量阻挡。
未来的 AI 手机,不再只是一个装满了 App 的硬件,它将成为一个全能的私人助理。虽然现在体验还有瑕疵,虽然巨头还在打架,但端侧智能体经济的大门已经轰然开启。

暫無回覆。
需要 登录 後方可回應,如果你還沒有帳號按這裡 注册