图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、米哈游创始人蔡浩宇 AI 团队开源 Agentopia:利用 100 智能体十年社交模拟,大模型拟人化提升 23.7%

图片

图片

Anuttacon 研究团队发布多智能体社会系统 Agentopia,模拟 100 个智能体在虚拟社区生活 10 年,以此生成高质量社交与行为数据。该研究通过闭环微调,在无需人工标注数据的前提下,显着提升了大模型的角色扮演与拟人性表现。

(@ 游戏葡萄)

2、Gradium 推出 stt-translate 与 s2s-translate:支持自定义克隆声线的实时语音翻译工具

图片

Gradium 宣布推出实时语音转文本工具 stt-translate 与实时语音转语音工具 s2s-translate。该产品通过将传统的「语音转文本、文本翻译、文本转语音」三阶段级联简化为双阶段架构,在保障翻译质量的同时,实现了 3.0 秒的平均端到端延迟。该服务通过单一双工 WebSocket 连接传输,并允许用户在输出中无缝调用自定义克隆声线以保留说话人身份。

试用链接:https://gradium.ai/translate

( @Gradium.ai)

3、Google 在 Gemini 3.5 Flash 中原生集成 computer use 功能:支持跨端自动化与对抗性训练防御

Google 在其轻量级模型 Gemini 3.5 Flash 中原生集成了 computer use 功能,废弃了此前需依赖独立专用模型的架构。该更新允许开发者直接通过 Flash 模型构建跨浏览器、移动端和桌面端的自动化智能体,在大幅降低延迟和成本的同时,提供了企业级的抗提示词注入防护。

(@GoogleAIStudio\@X)

02 有亮点的产品

1、Assort Health 获 1.2 亿美元 C 轮融资:发布专有模型 Synapse 与跨触点患者记忆系统

图片

医疗 AI 智能体平台 Assort Health 完成由 Menlo Ventures 领投的 1.2 亿美元 C 轮融资估值达 12 亿美元。该公司依托专有模型 Synapse,将语音 AI 智能体扩展为覆盖预约、转诊、付款等八大环节的医疗流程全自动闭环平台,在 15 个月内实现营收 20 倍增长。

图片

(@ 深思圈)

2、语音与对话智能体评估平台 Coval 获 2800 万美元 A 轮融资:引入自动驾驶级仿真与评估技术,解决语音智能体落地信任瓶颈

语音与对话智能体评估平台 Coval 完成 2800 万美元 A 轮融资,由 Norwest VP 领投,Base10 Partners、Twilio Ventures 和 Y Combinator 等参投。该公司将自动驾驶领域的仿真与评估技术引入语音 AI 领域,旨在解决企业在大规模部署自主对话系统时的安全与信任难题。目前其评估方案已在 Deepgram、Perplexity 及 Zoom 等企业中落地。

(@bnicholehopkins\@X)

3、Reachy Mini 发布对话应用 0.8.0:新增持久化长期记忆,支持本地 SmolVLM2 视觉与多模态实时 API

开源机器人 Reachy Mini 发布其对话应用 0.8.0 版本。该版本引入了跨重启保持的持久化长期记忆,并支持通过 fastrtc* 调用 OpenAI Realtime 与 Gemini Live 等主流多模态实时 API。此外,应用新增端侧本地视觉选项,实现了低延迟的音视频实时交互与分层动作控制*。

https://github.com/pollen-robotics/reachy_mini_conversation_app

( @GitHub@ailozovskaya\@X)

03 有态度的观点

1、EA 高管:AI 已提升工作室创造力,可减少开发流程阻力

图片

据 Eurogamer 报道,EA 企业发展总裁劳拉・米耶勒在日前 Summer Game Fest 期间的《Game Business Live》活动上表示,AI 工具已经在 EA 旗下工作室带来「真正的创造力提升」,部分环节或能缩短游戏开发周期。

在被问及 AI 工具的兴起是否会带来更短开发周期时,米耶勒称,部分环节「或许会」。她表示,自己一直希望帮助工作室开发者减少流程阻力,并协助他们打造职业生涯中的代表性作品。

AI 能够帮助我们减少管线、工具和工作流中的阻力,这一点令人兴奋。它移除了一些枯燥工作,我看到了更快的原型制作、更快的创意产出,以及围绕创意达成一致时更短、更高效的沟通。

米耶勒称,当开发过程中部分重复性任务被移除后,创意工作会出现「真正的提升」。

( @APPSO)

04 Real-Time AI Demo

1、开发者与语音智能体一起游玩交互式游戏「西蒙说」:利用 gpt-realtime-2 模型构建且响应延迟低于 100ms

开发者@jxnlco\@X

Computah! Activate Firewall!

使用 gpt-realtime-2,你可以根据具体情境来设定唤醒词、推理过程,甚至可以创建一些有趣的小游戏。

看看我玩「西蒙说」这个游戏的样子吧……

剧透:它打败了我。

(@jxnlco\@X)

05 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、活动推荐|「2026 AI 发现者峰会・新加坡站」

AI 的上半场,是能力;下半场,是生意。2024 到 2025 年,AI 赛道最大的变化不是模型又升级了,而是:能跑模型的公司一抓一大把,能跑通商业化的公司凤毛麟角。Demo 满天飞,收入见不着;融资见涨,现金流见跌。进入 2026 年,问题变了 —— AI 的问题,已经从「能不能做」,变成了「能不能赚钱」。

如何赚到第一笔 AI 收入?

企业级应用落地的真正场景在哪里?

从 Agent 到商业化跃迁,真正的护城河怎么建?

2026年6月30日,崔牛会主办的「2026 AI 发现者峰会 · 新加坡站」将正式启幕。我们邀请了顶尖的 AI 实践者、出海先锋与东南亚本地生态伙伴,抛开宏大叙事,只聊最干的 “赚钱硬道理”。

详情见链接:6 月 30 日,新加坡见

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流