每年 RTE 开发者社区的重磅活动—— RTE Open Day ,也在六月的 AGI Playground 现场开启今年的行程。这是 RTE Open Day 第五期现场,这期我们的关键词是「Real-Time AI」和「Voice Agent」,不仅有来自社区的 16 个项目,还有两场对话式 AI workshop。
两场对话式 AI workshop,由开源框架 TEN Framework 和 RTE 开发者社区联合主办。
一场是前沿讨论,拆解 YC 押注的 Voice Agent 新浪潮 ,从到开源框架、模型、到真实产品落地,来自 TEN 、MiniMax 和 Folotoy 的嘉宾对技术和场景进行分享。
一场是动手实践,一小时极速构建你的实时语音对话 Avatar ,基于 TEN、阶跃星辰 和 Trulience 构建语音数字人。
策划这两场对话式 AI workshop,不仅是因为我们在关注语音领域,而且是因为它是市场的真实爆发点。RTE 开发者社区的 Voice Agent 学习笔记就有提到,「自 2020 年以来,Y Combinator 已经孵化了 90 家语音智能体公司,且这一趋势正在加速,最新的尚未完全公布的 W25 批次中就有 10 家。值得注意的是,在 2023 年之前成立的公司中,大部分都是在过去一年内转型进入语音智能体领域的。」所以,在模型、通用平台、垂直场景等方向,还有很多问题可以讨论。
RTE 开发者社区发起人、声网生态运营中心负责人杨慧,首次公开 《对话式 AI 白皮书》 计划,分享了 Voice Agent 关键框架与行业趋势,并现场发起开源共建者招募。如果你对共创白皮书感兴趣,请加入我们!
Plutoless,开源 Agent 框架 TEN Framework 联合发起人,介绍了 TEN 开源框架的核心理念与应用场景,展示了 TEN 如何快速构建具备多模态能力的 Voice Agent。
MiniMax 架构师冯雯,深入解析了 TTS 在 Voice Agent 时代下的技术演进,特别强调在真实语音交互中,MiniMax Speech 02 模型实现了 Zero-Shot 的音色定制能力,并将首包延时压缩到 300ms,极大地提升了交互体验。
郭兴华,Folotoy 联合创始人,从实际产品落地角度出发,分享了在儿童陪伴场景中的技术取舍与产品经验,尤其是「把技术隐藏起来」这一点引发了大家的思考共鸣。
最后一个 lightning demo 环节,欢迎观众即兴上台,现场有两位观众分别分享了自己做儿童英文绘本教育项目 Metabooks 和旅行助手的产品与想法。
这次 RTE Open Day 展区共有 16 家社区里成长的项目参展,覆盖 AI 语音顾客访谈智能体、AI 玩具、AI 陪伴、AI 外呼、AI 教育、语音模型与记忆层等诸多实时互动上下游场景。
其中有今年新涌现的项目,也有在过去一年不断迭代成长的产品,更集中围绕「Real-Time AI」和「Voice Agent」两个关键词提供了全局视野。
游园打卡的「夸夸贴纸」和「拼图打卡」玩法返场,为展商提供一些「情绪价值」,也是一种「催更」,希望产品能早日被更多人体验到。同时现场观众也能把最终拼好的「RTE Open Day」带回家,期待下一次我们会有什么主题呢?
Dev Party\@RTE Open Day 是我们为社区开发者准备的固定的环节,在第一天的灵感和技术交流后,总需要换一个轻松氛围认识新朋友、分享新想法。
3 分钟,分享你的项目——来自 Tmind AI(心理咨询师 AI 培训)、deepsip.cn(AI+SIP )、RWKV、赛博创力(语音互动硬件)、ANP 开源社区(智能体通讯协议)、星连资本、MiBai 空间交互桌面机器人、Lemon.ai、openmcp.app 等项目的开发者做了分享。
当一群人聚在 RTE Open Day 现场,就会有新的灵感和机会出现!
听见 AI,看见 2025。RTE Open Day 期待在年底的 RTE 大会上与大家再次相见!
点击👇查看过往 RTE Open Day
在这里游玩和创造,见证实时互动和 AI 的融合爆发丨年末场 RTE Open Day@RTE2024 回顾
当一群人聚在 RTE Open Day 现场|S 创上海 2024 回顾
不一样的 RTE Open Day,对话最专业的 RTE+AGI Builders!丨 AGI Playground 现场回顾
更多 Voice Agent 学习笔记:
11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨 Voice Agent 学习笔记
实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨 Voice Agent 学习笔记
级联 vs 端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨 Voice Agent 学习笔记
a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场丨 Voice Agent 学习笔记
a16z 合伙人:语音交互将成为 AI 应用公司最强大的突破口之一,巨头们在 B2C 市场已落后太多丨 Voice Agent 学习笔记
ElevenLabs 33 亿美元估值的秘密:技术驱动 + 用户导向的「小熊软糖」团队丨 Voice Agent 学习笔记
端侧 AI 时代,每台家居设备都可以是一个 AI Agent 丨 Voice Agent 学习笔记
世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过