开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、Meta 发布 Brain2Qwerty v2:非侵入式脑磁图信号实时解码,单词识别准确率达 61%

Meta 联合巴斯克认知、大脑与语言中心发布非侵入式脑机接口解码系统 Brain2Qwerty v2。该系统采用端到端深度学习架构,可将非侵入式脑磁图记录的原始脑电信号实时解码为连贯文本。其单词解码准确率相比前代及同类非侵入式技术实现大幅提升,性能水平逼近侵入式手术植入技术。

图片

https://github.com/facebookresearch/brain2qwerty

https://huggingface.co/datasets/bcbl190626/SpanishBCBL

(@JeanRemiKing\@X)

2、Vercel** 宣布其 AI Gateway 推出语音功能支持:集成实时音频、TTS 与 STT,原生支持 AI SDK 7**

Vercel 宣布其 AI Gateway 在 AI SDK 7 中推出音频与语音支持 beta 版,将实时语音、文本转语音(TTS)和语音转文本(STT)集成到统一的 API 路由中。该功能首批支持 OpenAI 和 xAI 模型,使开发者能直接在网关层面统一进行音频模型的路由、观测、身份鉴权和费用控制。

(@vercel\@X)

3、乐鑫科技发布 ESP-WebRTC:为 ESP32 系列 SoC 提供原生 WebRTC 与 Data Channel 支持

图片

乐鑫科技推出专为 ESP32 系列 SoC 设计的 ESP-WebRTC 音视频实时通信方案。该方案基于 WebRTC 标准,打通了从边缘设备端媒体采集、编解码、传输到云端信令接入的完整链路,使物联网硬件无需额外网关即可实现低延迟音视频对讲与数据交互

(@ 乐鑫信息科技)

02 有亮点的产品

1、Meta AI 眼镜测试 Meta One 订阅服务:端侧「对话聚焦」功能转为最高 15 小时限额收费

图片

Meta 开始测试名为 Meta One Premium 的付费订阅服务,月费 19.99 美元。该服务将 Meta AI 眼镜原免费的「对话聚焦」功能转为限额使用,非订阅用户每月限用 3 小时,付费订阅后限用 15 小时。由于该功能完全在本地端侧运行,此举标志着 Meta 开启了针对无需云端算力的端侧 AI 算法进行软件收费的商业化尝试。

图片

(@XR Vision)

2、G7 易流发布 30 克 AI 穿戴硬件「拍拍豆」:支持语音自动打标与开放 API 接口

图片

图片

G7 易流发布面向物流交付场景的 30 克可穿戴 AI 硬件「拍拍豆」。该设备通过磁吸无感交互与语音触发打标,解决了司机下车交接环节的「车下黑洞」留证难题,将交付过程转化为可追溯的结构化事件流

在消费级 AI 硬件(如 AI 眼镜、智能徽章)普遍因场景弱需求而难以落地的背景下,垂直 B 端场景展现出极强的刚需属性。物流交付、验收、质检等环节存在天然的「合规自证」痛点。该产品的核心逻辑并非依赖复杂的端侧大模型实时推理,而是将「极简硬件」作为低成本的物理数据采集终端,利用 AI 进行后端的语音打标与事件结构化,并通过 API 融入企业已有的 ERP 和协同工作流。这种「轻硬件、重流程、高 ROI」的模式,为 AI 硬件在工业与物流领域的落地提供了可行样本。

(@ 极客公园)

03 有态度的观点

1、研究:把 AI 智能体叫做「员工」,会让人类犯更多错误

图片

据报道,将 AI 智能体包装成「数字员工」的营销方式,可能正在系统性地削弱人类员工的判断力与责任感

波士顿大学商学院研究员 Emma Wiles 的研究发现,当 AI 工具被定义为「AI 员工」而非普通聊天机器人时,参与实验的管理者识别错误的能力下降了 18%,且有 44% 更倾向于将有问题的结果上报给上级,而非自行纠正

参与研究的 1,261 名管理者中,已有近三分之一表示其所在公司将 AI 智能体定性为「员工」,甚至有 23% 的公司将其列入组织架构图。

MIT 经济学家、2024 年诺贝尔奖得主 Daron Acemoglu 也表示,当前 AI 智能体「被当作替代人类的工具来营销,这是一条走不通的路」,并认为其应当被优化为增强人类能力的工具,而非替代品。

MIT Technology Review 指出,「数字员工」的叙事本质上是一种品牌包装,并不能提升工具本身的能力,却会让周围的人类员工表现更差。随着 AI 智能体加速渗透医疗、教育、政务等关键领域,如何在部署方式上避免责任真空,已成为不可忽视的系统性风险。

(@APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流