AI测试 东京 Voice AI Agent 工作坊!1 小时让你的 AI 能听能说

RTE开发者社区 · 2025年04月03日 · 416 次阅读

想不想拥有一个能和你流畅对话的 AI 语音助手?在学英语时,为你提供口语陪练;在你办公时,通过语音操控你的电脑打开文件;在你旅游时,为你提供实时语音讲解。

一个能够听、说、看,与人类进行自然交流的 AI Agent,听起来是不是很酷,但你觉得实现起来很难?

TEN 作为 Github 排名第一的 Voice Agent 开发框架,能够帮助开发者快速高效构建支持多模态交互的 Voice Agent。TEN 已与 Azure OpenAI 无缝集成,强强联手,可以充分使用强大的模型能力,让你的 AI 能听能说,如虎添翼。

现场不仅有行业专家分享 AI 语音模型的变革与 Voice Agent 的场景和最佳实践,为大家带来灵感火花,还有技术专家手把手教你打造自己的第一个 Voice Agent!你将学习如何本地部署 Voice Agent,并掌握如何进行个性化定制以满足您的业务所需。

如果您对 AI 语音交互技术感兴趣,或者希望为您的项目添加更智能的语音功能,我们诚挚地邀请您参加本次工作坊。春天正是万物新生的季节,欢迎报名,与我们在东京相见!

日期:2024年4月22日(星期二)

时间: 13:00~17:30(东京时间 UTC+9)

地点: 东京·涩谷地铁站附近(具体地址报名审核通过后可见)

适合人群

AI Agent 开发者

想要探索 AI 语音交互应用场景的工程师 / 产品经理

个人开发者 / 企业开发者

报名方式

活动费用: 免费

报名期间: 4/3-4/18

👇扫描下方二维码,即可报名👇

(审核制,限额 50 人,审核通过后通知具体地址)

活动流程

[本场活动的分享环节使用日/英文]

13:00 - 13:30 签到

13:30 - 14:30 主题分享

  • 微软: AI 时代的语音模型变革

  • TEN Framework: 开源 Voice Agent 框架与最佳实践

  • Agora: 会话型 AI 引擎 – 通过超低延迟的实时对话型 AI 开创未来

  • Dify: 基于 Dify 的 AI Agent 编排与多模态支持

14:30 - 17:30 动手实操

  • 阶段 1: 本地部署 TEN Agent 并成功开启对话

  • 阶段 2: 在 playground 界面配置 Azure OpenAI Service 和 Speech Service,定制你自己的 Voice Agent

* 挑战成功的朋友均可以领取开发者周边礼品🎁

特别挑战: 使用 Dify 编排 Azure OpenAI 并接入 TEN 完成 Voice Agent,可获取 Dify 特别礼品

软硬件准备【必备】:

  • 设备要求: 自备笔记本电脑

  • 基础知识: 熟悉命令行、Git、Codespace

场地照片

本活动由 TEN Framework 与微软联合主办,Agora 协办,特邀 Dify 社区成员,社区支持 MeltingHack、Supersonic。

关于 TEN Framework

https://github.com/TEN-framework/TEN-Agent

TEN 是一个用以创建实时语音 AI 智能体的开源框架,目前已获得全球开发者 5.5k star。支持语音、文本和图像的输入与输出,内置优化的实时通信能力,以提供低延时、可打断的交互体验。通过内置的 STT(语音转文本)、LLM(大语言模型)和 TTS(文本转语音)模块,以及插件化开发与灵活编排,开发者能够快速测试和迭代对话体验。TEN 可用于构建各种类型的 AI 智能体,比如语音 AI 助手、computer use(LUI)、智能家居助手、实时呼叫中心等。

关于 Microsoft Azure OpenAI GPT-4o Realtime API

https://azure.microsoft.com/ja-jp/

Azure OpenAI GPT-4o Realtime API 是 GPT-4o 模型家族的一部分,支持低延迟的 “语音输入,语音输出” 对话交互。GPT-4o 音频实时 API 旨在处理实时、低延迟的对话交互,非常适合涉及用户与模型之间实时交互的用例,例如客户支持代理、语音助手和实时翻译。

关于 Agora

Agora 是全球实时互动领域的领导者,为开发者提供简单、灵活且强大的 API,使其能够在应用程序和物联网设备中集成实时对话式 AI、语音、视频、互动直播和聊天功能。Agora 总部位于美国加利福尼亚州圣克拉拉,全球已有 1,700 多家领先企业信赖 Agora,助力其在社交媒体、直播购物、教育、远程医疗等领域打造卓越的实时互动体验。欲了解更多信息(NASDAQ: API),请访问:www.agora.io

个人信息处理声明

我们会收集参与者的姓名和电子邮件地址等信息,这些信息仅用活动组织和入场时的身份确认,提供个人信息即表示同意其用于上述目的。

期待在工作坊现场与您共同探索 AI 开发的无限可能!


暫無回覆。
需要 登录 後方可回應,如果你還沒有帳號按這裡 注册