测试之家
社区
问答
招聘
社区学堂
新
开源项目
活动
Wiki
注册
登录
会员
Agora (RTE开发者社区)
第 67896 位会员 /
2022-03-07
554
篇帖子 •
3
条回帖
73
关注者
0
正在关注
0
收藏
未设置 GitHub 信息.
個人信息
個人專欄
帖子
回帖
收藏
正在關注
關注者
AI测试
对话 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
RTE开发者社区
• 发布于
2024年12月25日
AI测试
阿里发布多模态推理模型 QVQ-72B,视觉、语言能力双提升;OpenAI 正在研发人形机器人丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月25日
AI测试
Hume 语音模型 OCTAVE:实现情感语音合成、声音克隆和多角色对话生成;通义开源多模态说话人识别项目 3D-Speaker
RTE开发者社区
• 发布于
2024年12月24日
AI测试
OpenAI 推出嵌入式硬件 SDK,支持 ESP32 语音开发;INFP:音频驱动的双人对话头像生成,自动区分说话者和倾听者
RTE开发者社区
• 发布于
2024年12月23日
AI测试
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
RTE开发者社区
• 发布于
2024年12月23日
AI测试
GPT 论文作者 Alec Radford 离开 OpenAI,曾参与开发 Whisper;闪极 AI 拍照眼镜支持全天候记录
RTE开发者社区
• 发布于
2024年12月20日
AI测试
李飞飞团队多模态模型统一动作与语言;OpenAI 推出电话服务,让更多人与 Chatgpt 对话丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月19日
AI测试
直播预告:OpenAI 开始拥抱 RTC!为什么 LLM+RTC 才是多模态 AI 的未来?丨 RTE Dev Talk
RTE开发者社区
• 发布于
2024年12月18日
AI测试
OpenAI Realtime API 升级,集成 WebRTC 且降价 60%;豆包发布视觉理解模型,实时语音模型也将上线
RTE开发者社区
• 发布于
2024年12月18日
AI测试
Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……
RTE开发者社区
• 发布于
2024年12月17日
AI测试
ChatGPT 支持语音实时搜索;Meta Ray-Ban 智能眼镜新增视频识别与实时语音翻译功能丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月17日
AI测试
CosyVoice 2.0 支持双向流式语音合成;无问芯穹开源全模态理解端侧模型丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月16日
AI测试
谷歌发布 Android XR 集成 Gemini 语音对话;Voice Agent 平台 Vapi 获 2000 万美元融资
RTE开发者社区
• 发布于
2024年12月13日
AI测试
帮助用户与 AI 实时练习口语,Speak 为何能估值 10 亿美元?丨 Voice Agent 学习笔记
RTE开发者社区
• 发布于
2024年12月12日
AI测试
谷歌 Gemini 2.0 支持音频和图像输出;吴恩达:当下最重要的技术是 Agentic AI,视觉 AI 是下个趋势
RTE开发者社区
• 发布于
2024年12月12日
AI测试
活动报名:Voice Agent 开发者分享会丨 RTE Meetup
RTE开发者社区
• 发布于
2024年12月11日
AI测试
AI 口语学习应用 Speak 新一轮融资估值 10 亿美元;YouTube 推出 AI 多语言配音丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月11日
AI测试
前 OpenAI 音频 AI 负责人获投 4000 万,打造情感通用智能;TEN Agent 一键让 Coze Bot 开口对话
RTE开发者社区
• 发布于
2024年12月10日
AI测试
市场规模超 60 亿美元,语音如何改变对话式 AI?
RTE开发者社区
• 发布于
2024年12月10日
AI测试
Google PaliGemma 2 新增情绪识别能力;OpenAI 即将发布全新 Sora 视频生成器丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月09日
AI测试
通义开源语音处理框架 ClearerVoice-Studio;亚马逊 Nova 计划明年发布端到端语音模型丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月06日
AI测试
Fish Speech 1.5 发布,TTS-Arena 排名开源第一;DeepMind Genie 2,一键生成无限虚拟世界
RTE开发者社区
• 发布于
2024年12月05日
AI测试
11Labs 推出 Conversational AI,可定制交互式语音智能体;Recall.ai:视频会议智能体通用 API
RTE开发者社区
• 发布于
2024年12月04日
AI测试
Voice Agent 开发者必读,2024 最前沿语音模型梳理
RTE开发者社区
• 发布于
2024年12月04日
AI测试
Hume AI 语音控制功能:创建个性化语音;李飞飞空间智能首个模型:单图生成 3D 交互场景丨 RTE 开发者日报
RTE开发者社区
• 发布于
2024年12月03日