如果您正在开发具备语音对话、视觉识别等多模态能力的 AI Agent,或者对探索下一代人机交互方式充满热情,欢迎你预约并收看 27 日(周四)晚八点的 RTE Dev Talk!

昨晚 Amazon 发布了新一代 Alexa+,6 亿台智能设备终端瞬间获得了新一代 AI 的能力。

现场演示中,Alexa+ 可以根据用户的语音指令切换播放设备,让音乐、视频在不同房间流转;能与安防摄像头联动,自主调出与用户指令相关的视频片段,如「遛狗了吗」等;可以完成各种复杂指令,如根据家庭成员的习惯选择餐厅、预定餐厅,叫出租车去机场接客人,然后实时同步出租车信息等。

将 AI 融入端侧的公司远不止 Amazon,2025 年,三星、苹果等巨头将 GenAI 融入智能手机,而小米等智能音箱等家用设备、各家汽车智能座舱也将全面拥抱 GenAI—— 生成式 AI 开始真正地走进千家万户。

那么,GenAI 目前在端侧的技术发展到什么程度?又蕴藏着哪些值得开发者关注的机遇?

今晚(27 日周四)8 点 ,RTE 开发者社区邀请到了来自 智谱、TEN 和声网 的多位实时多模态 AI 专家,一同探讨其中的挑战和机遇。

GenAI 已经从文本框交互迅速走向更自然、更拟人的多模态实时互动,期待和你一起探索和成长。

RTE Dev Talk 嘉宾和主持人

时间:2 月 27 日(周四)20:00~21:15pm

地址:线上直播,欢迎提前预约,接收开播提醒

活动主办:RTE 开发者社区

社区伙伴支持:BigModel、TEN Framework、智谱

更多 Voice Agent 学习笔记:

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布

对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点

这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势

语音即入口:AI 语音交互如何重塑下一代智能应用

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……


↙↙↙阅读原文可查看相关链接,并与作者交流