如果您正在开发具备语音对话、视觉识别等多模态能力的 AI Agent,或者对探索下一代人机交互方式充满热情,欢迎你预约并收看 27 日(周四)晚八点的 RTE Dev Talk!
昨晚 Amazon 发布了新一代 Alexa+,6 亿台智能设备终端瞬间获得了新一代 AI 的能力。
现场演示中,Alexa+ 可以根据用户的语音指令切换播放设备,让音乐、视频在不同房间流转;能与安防摄像头联动,自主调出与用户指令相关的视频片段,如「遛狗了吗」等;可以完成各种复杂指令,如根据家庭成员的习惯选择餐厅、预定餐厅,叫出租车去机场接客人,然后实时同步出租车信息等。
将 AI 融入端侧的公司远不止 Amazon,2025 年,三星、苹果等巨头将 GenAI 融入智能手机,而小米等智能音箱等家用设备、各家汽车智能座舱也将全面拥抱 GenAI—— 生成式 AI 开始真正地走进千家万户。
那么,GenAI 目前在端侧的技术发展到什么程度?又蕴藏着哪些值得开发者关注的机遇?
今晚(27 日周四)8 点 ,RTE 开发者社区邀请到了来自 智谱、TEN 和声网 的多位实时多模态 AI 专家,一同探讨其中的挑战和机遇。
GenAI 已经从文本框交互迅速走向更自然、更拟人的多模态实时互动,期待和你一起探索和成长。
贾世坤,智谱开放平台 BigModel 产品负责人。
Plutoless,实时语音 Agent 开源框架 Ten Framework 联合发起人。
李忻玮(主持人),声网大语言模型实验室高级研究员,RTE 开发者社区布道师。
时间:2 月 27 日(周四)20:00~21:15pm
地址:线上直播,欢迎提前预约,接收开播提醒
活动主办:RTE 开发者社区
社区伙伴支持:BigModel、TEN Framework、智谱
更多 Voice Agent 学习笔记:
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……