图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、Zyphra 开源 ZONOS2:8B 参数 MoE 架构实时语音合成模型,吞吐量提升 4 倍

图片

AI 研发公司 Zyphra 开源了实时文本转语音模型 ZONOS2,采用 Apache 2.0 协议,将稀疏混合专家架构引入开源语音合成领域。该模型拥有 80 亿总参数和 9 亿激活参数,在模型规模相比前代扩大 5 倍的同时实现了 4 倍的实时吞吐量提升,并支持高保真零样本声音克隆。

(@zyphra)

2、LiveBand 推出本地实时 AI 伴奏系统:采用因果音频自编码器与 KV 缓存,实现零感知延迟

研究人员推出实时 AI 伴奏系统 LiveBand,支持在 MacBook 本地运行并可同时生成多种乐器伴奏。该系统通过前瞻性预测机制为硬件留出推理时间缓冲区,并结合自定义因果自编码器与单步 KV 缓存技术,消除了传统生成式音频模型的延迟瓶颈,实现了无感知延迟的实时人机协同演奏

https://arxiv.org/abs/2606.03803

( @marco_ppasini\@X)

02 有亮点的产品

1、默造科技推出 MuteVox S1 智能消音口罩:融合物理消音与 AI 降噪,支持耳语级语音识别

图片

图片

深圳默造科技推出智能消音口罩 MuteVox S1,通过物理隔音结构与 AI 降噪算法相结合,实现公共场所下的私密语音交互。该产品主打「耳语级对话」与静音收音,旨在解决开放空间人声隐私泄露与环境噪音干扰,目前已开启众筹,定价 499 元。

(@ 多知)

2、钉钉发布首款医生 AI 硬件 DingTalk A1 豆蔻医生版:内置 6nm 音频芯片与 122B/32B 医疗大模型

图片

钉钉正式推出专为医生群体定制的 AI 硬件 DingTalk A1 豆蔻医生版,售价 999 元。该设备深度融合 122B/32B 参数规模的豆蔻医疗大模型及超级助理,支持语音病历转写、文献检索与临床决策辅助。目前,其搭载的医疗大模型已在国内超过 1000 家医疗机构投入规模化应用。

@HC3i 中数新医)

3、奇点灵智发布 Duoki OS:基于智能体架构,实现儿童硬件端本地 Vibe Coding 与自进化

图片

奇点灵智为其多奇 AI 机器人推出全新操作系统 Duoki OS,引入由多智能体协同驱动的本地自编程(Vibe Coding)与自进化机制。该系统允许无技术背景的家长通过自然语言在 1-2 分钟内为硬件现场生成、部署个性化轻应用,并实现物理传感器与软件能力的解耦,推动儿童硬件从「出厂即固化」向自主进化智能体演进

(@ 多知)

4、Equal AI 推出 AI 电话代接助理:自动应答过滤骚扰与快递电话,支持 10+ 语种混合识别

图片

图片

印度 AI 通话助手初创公司 Equal AI 宣布完成 3000 万美元 B 轮融资,累计融资额达 4200 万美元。该公司开发的安卓端 AI 通话助理通过代接来电、获取来电意图、生成转录摘要并提供快捷语音回复,帮助用户拦截垃圾来电和对接物流,其月活跃用户已突破 100 万。

(@TechCrunch)

03 有态度的观点

1、苹果高管:Siri AI 是实用工具,不是情感伴侣

图片

苹果软件工程高级副总裁 Craig Federighi 与营销主管 Greg Joswiak 在 WWDC 2026 期间接受了《Mostly Human》采访,深入探讨了苹果对 AI 的功能定位、隐私策略及儿童安全等议题。

在前天举行的采访中,Federighi 明确了 Siri 的工具属性,并强调其设计初衷并非 AI 伴侣。针对市面上部分 AI 产品侧重于通过建立情感连接来提升参与度的现状,Federighi 表示:

现有许多聊天机器人很大程度上专注于参与度,甚至带有某种「谄媚」色彩。它们想方设法吸引你,可能会鼓励你透露个人信息,并以此为基础建立某种联系。我们对此持完全相反的观点。在我们的设计中,Siri 会明确表示:「听着,那不是我的职责。我是来帮你的,我可以帮你完成任务,帮你了解世界。」但如果你试图把 Siri 当作浪漫伴侣,Siri 是不会配合的。

Joswiak 补充提到,苹果并不追求「为了 AI 而做 AI」,而是致力于将 AI 技术无感地融入现有产品中。他表示,苹果希望技术能够「消失」,让用户专注于内容本身,且不希望 iPhone 用户必须成为「提示词专家」才能使用 AI 功能。在隐私保护方面,Federighi 强调了苹果「隐私先行」的原则。

他指出,用户数据保留在 iPhone 本地并由用户完全控制,苹果公司无法获取这些信息。他认为,这种将本地知识与公司获取权限彻底隔离的做法,是苹果区别于行业内其他竞争对手的关键优势。

(@APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流