AI测试 2 行代码,15 分钟部署对话式 AI Agent!丨社区来稿

RTE开发者社区 · 2025年02月19日 · 1059 次阅读

// 本文来自声网的投稿。

基于开源框架 TEN Framework 构建,声网近日推出了最新的对话式 AI 引擎。这是一个「开箱即用」的对话式 AI 部署解决方案。2 行代码,15 分钟,即使像 DeepSeek 这样的文本大模型也能快速转变为对话式多模态大模型,具备能说会道的能力。

通过官方 demo 网站,你可以体验到智能助手、情感陪伴、口语陪练、智能客服等多种对话式 AI 的使用场景。

快来体验和 AI 实时对话

👇https://conversational-ai.shengwang.cn

Beta 测试阶段限时免费,更多产品介绍和文档:

https://www.shengwang.cn/ConversationalAI/

近期,DeepSeek 旋风席卷全球,其独有的深度思考 + 联网模式让用户纷纷惊叹好用,如果你想脱离与 AI 的文字互动,与 DeepSeek 进行更具真实感的语音对话,声网的对话式 AI 引擎让你 15 分钟内就能做到。

今天,声网对话式 AI 引擎 Beta 版也正式上线,支持开发者在 Console 后台自行开通服务接入 API,并在 Playground 中实际调参、测试并生成代码,仅需 2 行代码,15 分钟即可部署基于大模型的对话式 AI Agent。

声网对话式 AI 引擎官网也已同步上线,开发者在了解产品功能的同时,也可通过官网申请体验最新的 Demo 应用。

5 大能力让你的大模型能说会道

AI 语音秒回: AI 秒回你的提问,语音对话延迟低至 650ms

对话人声锁定: 屏蔽 95% 环境人声、噪声干扰,精准识别对话人声

智能打断: 模拟真人对话节奏,随时打断与 AI 的对话,响应低至 340ms

全模型适配: 实现 DeepSeek、ChatGPT 等全模型适配,更有音视频 SDK 支持 30000+ 终端机型适配,解决多设备兼容性的后顾之忧

不惧弱网: 地铁、地下车库等弱网环境下,人与 AI 也能流畅对话

声网对话式 AI 引擎将为开发者带来极致的对话体验、极简的开发部署, 即使像 DeepSeek 这样的文本大模型也能快速转变为对话式多模态大模型,具备能说会道的能力 。同时,对话式 AI 引擎同样支持基于阿里云、腾讯云的稳定满血版 DeepSeek ,不用担心出现 “服务器繁忙,请稍后再试”。

如何快速部署对话式 AI 引擎

开发者想要快速调用声网对话式 AI 引擎 RESTful API 实现与 AI 语音互动,根据以下流程就可通过 2 行代码,15 分钟快速实现从打开 Console 后台到说『Hello Agent』,大幅降低开发门槛。

前提条件:

1、已在声网 Console 控制台开通服务,并获得 App ID、临时 Token、客户 ID 和客户密钥等信息。

2、已联系声网技术支持为你的项目开通声网对话式 AI 引擎。

3、你的 App 已实现基本的实时音视频功能。

4、已获取大模型提供商的 API key 和回调 URL。

5、已获取文本转语音 (TTS) 提供商的 API key。

满足以上前提条件,就可实现与 Agent 的语音互动。具体流程如下图所示:

总体来说部署流程分为三个核心步骤: 第一步:加入 RTC 频道 ,在你的 App 中调用『 joinChannel 』加入一个 RTC 频道。

第二步:创建对话式智能体 :调用『 创建对话式智能体』创建一个智能体实例,并传入上一步中使用的频道名和 Token 让智能体加入同一个 RTC 频道。完成该步骤后,声网会推荐你前往 “控制台 - 对话式 AI 引擎 - Playground” 快速体验与 AI 对话,正确配置各项参数并完成体验后,点击右上角的 View code 复制自动生成的服务端 API 调用示例代码。

第三步:停止对话式智能体 :结束对话后,调用『停止对话式智能体』,让智能体离开 RTC 频道。

更多具体的详细部署流程可点击查看官网的文档中心

此外,声网对话式 AI 引擎 在 Beta 测试阶段限时免费,欢迎各行各业的开发者参与部署并与我们交流。同时,也可通过声网官网或下方的二维码,申请体验声网对话式 AI 引擎最新的 Demo 应用。

更多 Voice Agent 学习笔记:

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布

对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点

这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势

语音即入口:AI 语音交互如何重塑下一代智能应用

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册