图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、Grok Voice 发布 Voice Agent Builder:原生 speech-to-speech 语音智能体构建平台,支持 MCP 协议与 SIP 接入

Grok Voice 推出免代码语音智能体构建平台 Voice Agent Builder(测试版)。该平台基于原生 speech-to-speech 架构,避开了传统的 STT-LLM-TTS 拼接模式,允许开发者与运营人员在两分钟内配置并部署具备生产级电话、工具调用和知识检索能力的语音智能体。

目前已开启公测。API 资费为 0.05 美元/分钟音频(包含内置音色,无平台订阅费),使用平台提供的免费电话号码需额外支付 0.01 美元/分钟的通话费。

(@x.ai)

2、上海人工智能实验室与清华大学发布 AuDirector:闭环多智能体音频故事生成框架,自然语言编辑成功率达 90%

图片

上海人工智能实验室与清华大学联合推出了面向沉浸式音频故事生成的自反思闭环多智能体框架 AuDirector。该系统通过主管、选角、声学制作和质检等智能体的协同,将音频故事创作转化为可迭代的闭环工作流。其核心突破在于支持用户通过自然语言对生成音频进行局部、定向的精细化重生成,无需重新生成整段音频。

论文链接:

https://arxiv.org/pdf/2605.11866

代码链接:

https://github.com/Riddae/AuDirector

Demo 链接:

https://riddae.github.io/AuDirector_demopage

(@ 语音之家)

3、Tether 推出 BrainOS 脑机接口技术栈与 1.7B 边缘医疗模型,脑电信号转文字词错率降至 2% 以下

图片

数字资产公司 Tether 宣布推出其脑机接口操作技术栈 BrainOS,并发布了点对点本地 AI 框架 QVAC 及其 1.7B 参数的边缘医疗模型 QVAC MedPsy。该系统通过本地化硬件和对等网络协议进行数据流隔离,实现了单通道和批处理皮层内信号转文字词错率低于 2% 的转换。这一框架旨在为肌萎缩侧索硬化症和闭锁综合征患者重建无创沟通管道,并支持控制辅助机械臂等外部设备。

(@TechCrunch)

02 有亮点的产品

1、Oasis Devices 发布智能指环 OASIS 1:集成降噪麦克风与光学触控板,主打私密语音输入与无键盘编辑

Oasis Devices 推出首款智能指环 OASIS 1,旨在通过硬件创新实现无键盘的私密语音交互。该设备集成了降噪麦克风与光学触控板,允许用户在不便大声说话的场景下通过轻声低语完成文本输入,并配合指环表面进行高精度文本编辑

首批产品已在官网开启限量预售,定价 289 美元,预计于 2026 年圣诞节期间发货。

(@oasisdevices\@X)

2、Weave 发布家用移动机器人 Isaac 1:配备 21 自由度与可伸缩躯干,支持自主与远程操控协同

机器人初创公司 Weave 推出家用移动机器人 Isaac 1,采用全栈自研执行器与可收缩躯干设计。该机器人旨在自主完成衣物折叠、杂物整理等家务任务,并支持在复杂场景下引入远程操控协同,为家庭环境提供软硬件一体化的自动化服务。

(@weaverobotics\@X)

03 有态度的观点****

1、扎克伯格:AI 不必然导致大规模失业,关键在「赋能个人」

图片

据报道,Meta CEO 马克·扎克伯格昨日在接受 Complex 频道《Idea Generation》现场访谈时表示,他不认为人工智能必然会导致大规模失业。

扎克伯格在访谈中指出,目前部分领先的 AI 公司一心推动知识工作自动化,结果可能并不理想。他提倡一种平衡状态,即部分公司负责提高企业运营效率,而另一部分公司则致力于发展「个人超级智能」,旨在赋能个人并提升劳动者的生产力。

他认为,如果个人生产力的提升速度快于企业实现自动化的速度,未来的就业岗位理论上应该会增加

目前,Meta 已投入数十亿美元用于人才挖掘和 AI 战略调整。扎克伯格将这一转型过程称为一次「重启」,并透露 Meta 的超级智能实验室成立尚不足一年。尽管 Meta 在生成式 AI 领域已取得显著进展,但扎克伯格表示公司仍有提升空间。

值得注意的是,Meta 的财务文件显示,截至今年 4 月,公司总员工数为 77986 人。然而,Meta 在 5 月份开启了约 10% 的裁员计划,涉及约 8000 个岗位,包括网络安全和内容设计等团队。公司此前表示,裁员是为了提高运营效率,以抵消在 AI 等领域的持续投资。

(@APPSO)

04 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、活动推荐|令人心动的 AI 硬件」48H 挑战|DIIS BUILD 4.0 张江特别版  ↓

图片

张江 AI 小镇、高瓴创投 Aseed+ 联合 D.Transformer,打造 AI 硬件的浪漫 gtm 和创造现场❤最高 3w 奖金,价值 300w+ 孵化权益,更有 top fund 投资人、创业者、大企业、供应链、AI 应用商店选品团队,陪你放大信号。

我们在找:

· 100 位硬件 builder:25 组古灵精怪、不同寻常的 toC 硬件产品,新终端/新交互/新形态...可以抽象,不能平庸:)

· 100 位硬件观察员:早期硬件头号玩家来给喜欢的产品送花写情书,也有机会被反选获奖

⏰时间:2026.7.10-7.12

📍地点:张江人工智能创新小镇 · AI 服务中心

🆓全程免费,欢迎全职创业者&独立开发者,有最大胆硬件创想的 maker 点击推文扫码报名!也欢迎推荐身边最酷&需要这次机会的硬件 builder 来玩~

详情见推文:

「令人心动的 AI 硬件」48H 挑战 张江特别版 | DIIS BUILD 4.0

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流