AI测试 a16z 领投,前 Deepmind 研究员创立 Ethos:基于语音智能体的人才匹配平台;印度成为 Wispr Flow 第二大市场丨日报

RTE开发者社区 · May 12, 2026 · 44 hits

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、中国移动发布 AI-eSIM 智能服务体系:运营商码号即大模型账号

图片

中国移动正式发布 AI-eSIM 多生态智能服务体系。该体系实现「运营商码号即大模型账号」,用户无需额外注册即可使用 AI 服务,通过手机号直接接入大模型能力

AI-eSIM 将通信能力与 AI 能力深度融合,支持多设备间 AI 服务无缝切换。中国移动此前已推出 MoMA AI 平台,接入超 300 款 AI 模型并压降单位 Token 成本 30%。此次 AI-eSIM 是运营商在 AI 基础设施领域的又一重要布局。

运营商拥有庞大的用户基数和数据通道优势,将手机号作为统一身份标识打通 AI 服务,有望大幅降低 AI 应用的使用门槛。这一创新模式可能成为通信行业向 AI 服务转型的参考范式

(@ 新浪财经)

02 有亮点的产品

1、Google 发布 Fitbit Air:99 美元无屏手环配合 Gemini AI 订阅,健康穿戴重心转向「建议式」智能体

图片

Google 正式发布无屏健康手环 Fitbit Air,标志着穿戴设备从「传感器 + 屏幕」向「传感器 + 后端 AI」的范式转移。通过剥离硬件交互层并整合 Gemini AI 智能体,Google 试图将穿戴设备转型为以订阅制为核心的个人健康操作系统,直接挑战 Apple Health 的数据中枢地位。

  • 硬件去屏幕化设计:Fitbit Air 采用完全无显示屏方案,定价 99.99 美元。硬件功能回归为纯粹的数据采样终端,交互层完全转移至移动端。

  • 平台架构重组:沿用十余年的 Fitbit App 正式更名为 Google Health,成为归集 Pixel Watch、Fitbit 及第三方 Health Connect 数据的数据中枢

  • Gemini Health Coach 订阅服务:月费 10 美元。该服务利用 Gemini LLM 解析原始传感器数据(如 HRV、心率、深睡时长),提供基于上下文的行动建议,而非单纯显示原始参数。

  • 商业模式向 SaaS 转型:借鉴 WHOOP 的订阅模式,Google 弱化硬件溢价,通过持续的 AI 订阅服务提升用户生命周期价值(LTV),将竞争维度从硬件参数堆叠转向 LLM 的解析与预测能力。

  • 生态卡位策略:通过在 Google Health 中增加「AI 顾问层」,填补了 Apple Health 长期以来只记录数据而缺乏主动干预建议的缺口。

(@ 极客公园)

2、Wispr Flow 进军印度市场:上线 Hinglish 混合语音模型,移动端使用占比达 50%

图片

语音 AI 初创公司 Wispr Flow 正式发力印度市场,推出原生支持印地语 - 英语混合(Hinglish)的语音输入模型及 Android 版本。此举使印度迅速成为该公司全球第二大市场,月增长率(MoM)由 60% 加速至 100%

  • Hinglish 混合语言模型上线:针对印度特有的语序和混说习惯(Hindi + English),完成 Hinglish 模型 Beta 测试并转入正式应用,计划在 12 个月内扩展至更多印度本土语言组合。

  • 移动端占比显著提升:在原有 Mac 和 Windows 基础上新增 Android 支持;印度市场移动端与桌面端使用比例为 50:50,远高于美国市场的 20:80,显示出强烈的移动社交场景渗透

  • 激进的价格本地化策略:印度订阅价格定为 320 卢比/月(约 3.4 美元),较其 12 美元的全球标准定价降低约 72%,并计划未来利用规模效应将成本压降至每月 10-20 卢比。

  • 高留存与人才配置:披露其 12 个月留存率达 70%;团队雇佣两名全职语言学博士持续优化多语言模型,并计划一年内将印度本地团队(涵盖工程、增长与合作伙伴关系)扩充至 30 人。

  • 市场渗透数据:2025 年 10 月至 2026 年 4 月期间,全球累计下载量超 250 万次,印度市场贡献了 14% 的下载量,但目前仅占应用内购买收入的 2%。

( @TechCrunch)

3、Ethos 获 a16z 投资 2275 万美元:推出基于语音智能体的隐性知识提取与人才匹配平台

图片

图片

前 DeepMind 研究员与 SoftBank 投资人联合创立的 AI 平台 Ethos 宣布完成由 a16z 领投的 2275 万美元 A 轮融资。该平台通过语音智能体提取专业经验,并结合公开网络数据构建机器可读的「专家知识图谱」,使基础 AI 实验室与金融机构能够通过自然语言直接匹配并调用长尾领域的专家知识。

  • 多源数据融合与实体图谱构建:放弃传统静态表单,采用语音智能体通过对话提取履历之外的隐性知识(sub-specializations),并将其与学术论文、博客、社交链接等公开数据进行交叉验证和融合,生成动态知识库。

  • 高颗粒度自然语言检索引擎:企业端支持通过复合自然语言输入复杂业务需求。系统可直接解析并匹配类似「寻找在特定领域发表过论文,同时具备药物研发实操经验的医生」等长尾逻辑组合。

  • 高人效与 30% 抽成机制:团队目前仅 8 人,向 B 端企业(基础 AI 实验室、对冲基金、私募股权等)按单收取 30% 及以上的项目抽成,年经常性收入(ARR)已达千万美元级别,个人专家最高月入超 1 万美元。

  • 定向邀请驱动的节点增长:网络扩张采用系统定向邀请制,当前专家档案库每周新增约 3.5 万名数据节点,覆盖从水电工到投行、医疗等全域职业。

https://agent.askethos.com/

( @a16z Blog, @TechCrunch)

4、「逗逗 AI」海外版 HakkoAI 全球注册用户突破 1000 万:集成实时场景识别与 RAG 架构的 AI 游戏助手

图片

图片

图片

LynkSoul(心影随形)推出的 AI 陪伴产品 HakkoAI(国内版名为「逗逗 AI」)全球注册用户已超过 1000 万。该产品通过将 AI 智能体封装为「桌面宠物」形态切入高频游戏场景,利用多模态交互与垂直领域知识库,填补了通用大模型缺乏游戏语境与传统工具缺乏情绪价值的市场空白。

  • 实时场景识别与决策辅助:通过视觉识别技术监控游戏画面,针对《原神》、《黑神话:悟空》等游戏提供实时跑图引导、收集品位置标注及 BOSS 战术建议,实现从「对话」到「感知」的跨越。

  • 基于垂直领域 RAG 的知识引擎:集成特定游戏知识库,支持通过自然语言查询任务攻略、道具属性及竞技对局建议,其回复精度高于通用大模型。

  • 低延迟多模态语音交互:支持实时语音连麦,AI 智能体能根据对局结果(如胜利、卡关)给予情绪反馈,并在 Ultra 订阅版中开放长期记忆功能,以维持角色人设的连续性。

  • UGC 角色工坊与定制化生态:提供 DIY 工具包,支持用户制作并上传角色形象、音色及性格设定;国内版通过授权引入 B 站 UP 主虚拟形象,利用粉丝经济降低获客成本。

  • 跨场景功能迁移(Beta):产品正在测试从单一游戏助手向日常陪伴(网购、学习、工作协同)的场景扩张,试图通过强化本地语言处理能力提升非游戏时段的活跃度。

(@ 扬帆出海)

5、维他动力完成近 5 亿元融资,将同步启动人形机器人的研发

5 月 11 日,具身智能公司 Vbot 维他动力(下称「维他」)宣布完成 Pre-A 轮融资,本轮融资金额近 5 亿元,由东方嘉富、华泰紫金、复星锐正联合领投,上汽集团旗下尚颀资本、明荟致远共同参与投资,凯辉基金、今日资本、高瓴创投、渶策资本、BV 百度风投、柏睿资本等老股东继续投资。官方称,该轮融资是消费级具身赛道目前最大的单笔融资

本轮融资是公司成立近一年半以来的第 4 轮融资,截至目前维他已经实现累计超过 7 亿元的融资。官方称,本轮融资将用于大规模量产、销售网络建设和新一代人形机器人的研发。

维他动力成立于 2024 年 12 月,由前地平线副总裁余轶南、地平线前软件平台总架构师宋巍、理想汽车前智能驾驶产品总监赵哲伦联合创立。

公司成立之初就选择了做消费级机器人。首款产品——Vbot 超能机器狗已于今年 5 月 8 日正式启动交付,首批 500 台产品已完成量产下线。5 月内预计将完成超过 1500 名用户的产品交付,6 月产能将提升到 2500 台以上,进一步加速预订用户的产品交付。

今年以来,维他已完成线下体验网络的首批布局:上海长宁来福士体验店、北京蓝色港湾体验店都已开业并开启运营

除完成首款机器狗产品的销售及量产交付外,维他动力将同步启动人形机器人的产品研发,由新引入的研发副总裁秦海龙负责。

秦海龙在今年 3 月正式加入维他,负责包括世界模型、空间智能、Agent OS、人形机器人等在内的技术研发。

加入维他前,秦海龙是千里智驾公司首席科学家,也曾在蔚来汽车担任自动驾驶高级总监,曾主导多模态基础模型、强化学习及端到端技术应用于下一代智能驾驶方案的研发与工程落地,在物理 AI 领域积累了丰富研发经验。秦海龙的加入,将进一步加速维他在多形态具身智能产品的迭代演进。

(@ 证券时报网)

03 有态度的观点

1、美国企业开始回避「AI 原生」毕业生:会用 ChatGPT,但不会独立思考

多家美国企业发现,近年来进入职场的「AI 原生」大学毕业生普遍存在思维深度不足的问题,部分雇主已开始主动回避具备 AI 使用能力的 STEM 毕业生,转而青睐人文学科背景的求职者

一位纽约金融业从业者向《金融时报》记者 Gillian Tett 表示,其所在机构目前更看重批判性思维能力,而非 AI 操作技能,并已调整招聘策略。

报道指出,美国高校学生将课业大量「外包」给 ChatGPT 等 AI 工具的情况已相当普遍,这一趋势不仅影响了学生的书面表达能力,也开始波及课堂面对面讨论的参与质量。

加州州立大学奇科分校伦理学教授 Troy Jollimore 在接受《纽约客》采访时警告,「大量学生将带着学位走出大学、进入职场,而他们实际上处于文盲状态」

(@APPSO)

04 Real-Time AI Demo

1、Chormex 集成 GPT-Realtime-2:实现浏览器全场景音频实时翻译

我刚在 Chromex 中通过 GPT-Realtime-2 添加了实时 AI 翻译……这感觉实在太超现实了。

它适用于 YouTube 视频、直播、会议、演示文稿,基本上是任何在 Chrome 中播放音频的地方。

你可以在实时翻译的同时,在直播上下文中使用 Codex。

「总结一下。」

「关键点是什么?」

「把它变成笔记。」

「解释它们的意思。」

「组织讨论。」

…而视频或会议仍在进行中。

感觉浏览器真的在进化成实时 AI 操作系统。

我们正接近一个互联网语言障碍完全消失的世界。

https://github.com/GENEXIS-AI/chromex

(@arrakis_ai\@X)

05 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、BEYOND HACK DAY 创新创意赛道招募|凭一个 AI 创意,拿大奖、锁 offer、对接资方!

作为亚洲最大的科技创新与生态系统博览会 BEYOND Expo 核心赛事之一,BEYOND HACK DAY 正式开启「创新创意赛道」招募。

本赛道由 BEYOND Expo 联合传德科技、行云科技共同举办,以「AI for All,人人皆可创新」为核心,彻底打破技术、年龄、身份、专业的所有边界,向全球每一个有想法、有创意、有作品的人发出英雄帖 —— 无论你是手握成熟 AI 作品的技术开发者,还是只有天马行空想法的小白,都能在这里让创意落地,让价值被看见。

即日起至 5 月 20 日,扫描下方二维码,可提交你的创意方案或 AI 作品参赛,最终评审结果预计将于 5 月 24 日左右通过官方全渠道公示。被筛选后优秀想法或者项目,可参加 BEYOND HACK DAY 线下比赛。

图片

我们为所有脱颖而出的优秀作品与参赛选手,准备了覆盖现金奖励、职业发展、国际曝光、产业对接、资本赋能的全链路重磅权益,让你的创意不止于一场比赛。

详情链接:

https://mp.weixin.qq.com/s/w4DpZ8BsJwyvhZ3tZISn5A

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考

No Reply at the moment.
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up