图片


开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@ 瓒 an、@ 鲍勃**

01 有话题的技术

1、Qwen3-TTS 全面升级,49 种音色 + 10 种语言 + 9 种方言

#####

图片

Qwen3-TTS 是支持多音色、多语种和多方言的旗舰语音合成模型,致力于实现稳定、自然和高效的语音生成,目前可通过 Qwen API 访问。

主要改进:

@Qwen Team)

#####

2、NineNineSix 开源 KaniTTS:实时语音生成模型,性能比肩商业级产品

#####

图片

吉尔吉斯斯坦 AI 初创公司 NineNineSix 发布了开源的文本转语音(TTS)模型 KaniTTS。该模型在消费级 GPU 上实现了接近实时的语音生成,性能可与 ElevenLabs、OpenAI 等商业模型媲美,并采用 Apache 2.0 许可证完全免费提供。

KaniTTS 模型已开源,可通过 Hugging Face 下载(已下载超过 15,000 次)。未来计划支持语音克隆功能。

Hugging Face: 

https://huggingface.co/nineninesix

(@TechIntelPro / NineNineSix)

#####

3、被 Gemini3 整怕了,曝 GPT-5.2 本周发布

图片

据 The Verge 援引知情人士消息称,OpenAI 计划最早于本周初发布 GPT-5.2 模型, 这一时间表较原定的 12 月下旬计划大幅提前。目前公司已将发布日期暂定为 12 月 9 日。

消息人士称, 此次提前发布直接源于竞争对手施加的压力。


Google 上月推出的 Gemini 3 模型在多项评测排行榜中领先, 其表现甚至令 OpenAI CEO Sam Altman 感到震惊。知情人士表示,GPT-5.2 的性能提升将有望缩小 Google 此前建立的领先优势。

最近,X 博主 @iruletheworldmo 也分享了关于这款基础模型的基准测试成绩。不过,真实性尚未得到确认,请谨慎看待。

除了新模型发布,OpenAI 正在调整产品战略方向。未来数月内,ChatGPT 的改进重点将从增加新奇功能转向提升 ChatGPT 的响应速度、系统稳定性和个性化定制能力。

( @APPSO)


02 有亮点的产品

1、Meta XR 产品线大地震:全面拥抱 AI 可穿戴设备,高端 MR 头显延至 2027,Quest 4 聚焦游戏定位

图片

Meta 近日泄露的内部备忘录显示,公司正在大幅调整其扩展现实产品路线图。原计划于 2026 年下半年发布的超轻薄混合现实头显 Phoenix/Puffin 将推迟至 2027 年上半年上市,而新一代专注于沉浸式游戏的 Quest 4 已确认正在开发中。

备忘录揭示了 Meta 在 XR 和可穿戴设备战略上的重大转变:放缓高端 MR 头显进度以「打磨细节」,同时转向更务实、更注重盈利的产品策略。


Meta 战略重心从「元宇宙优先」转向「AI 硬件优先」,计划对 Reality Labs 部门削减高达 30% 预算,2026 年发布限量版可穿戴设备 Malibu 2。

收购 AI 硬件初创公司 Limitless 并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管,加速 AI 可穿戴设备布局。

(@ 三次方 AIRX、@NathieVR\@X

2、ElevenLabs 推出「对话式读书」功能,用户可与书籍进行实时语音互动

#####

ElevenLabs 于 12 月 6 日通过其官方社交账号发布全新互动阅读功能,旨在为用户打造个性化的「语音读书俱乐部」。该功能依托其 ElevenLabs Agents 平台,允许读者与书籍进行语音对话,实现更深度的阅读体验。

#####

用户可通过配套应用程序「ElevenReader」向书籍直接提问,内容涵盖人物、情节、背景、主题等任意方向。系统提供的虚拟叙述者能够记忆对话上下文,并严格依据书籍原文进行回应,帮助读者在阅读过程中随时探索故事细节。

官方示例界面展示了以《傲慢与偏见》为对象的对话场景,界面提示「向我提问…《傲慢与偏见》」,背景采用渐变粉紫色设计,突出沉浸式互动氛围,并强调让读者「走进最喜欢的故事」。

https://elevenreader.io/

@ElevenLabs\@X

3、众擎老板亲自挑战机器人,被一脚踹翻

#####

近期,众擎机器人官方发布视频称,团队十分好奇机器人 T800 一脚踹到人身上到底有啥感觉。对此「用老板做了个实验测试下」。

从众擎团队公布的视频来看,T800 对准众擎机器人 CEO 赵同阳伸腿后,赵同阳整个人向后「飞」出去。

挨踹后的赵同阳直呼:「太暴力了、太残暴了。如果不戴护具没人能撑得住,绝对会骨折。」有网友表示:「你们员工太狠了,让老板亲自上阵。多少带了点私人恩怨。」

据了解,众擎 T800 身高 1.73 米,自重 75 千克,系众擎发布的首款「打工机器人」,售价为 18 万元起。

( @APPSO)


03 有态度的观点 

###

1、AI 教父 Hinton 预言:Google Gemini 将超越 OpenAI GPT,引领 AI 市场

「AI 教父」Geoffrey Hinton 近期表示,Google 凭借 Gemini 3、自研芯片、强大的数据资源和研究团队,正在超越 OpenAI。Hinton 认为 Google 凭借其综合优势,必将赢得这场 AI 领域的双雄之争,并且认为 Google「早该赢了」。

Gemini 3 Pro 已发布,并在多项基准测试中刷新纪录。Gemini 产品正通过 Android 系统内置等方式扩大其全球市场份额。

(@ 新智元)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

作者提示: 个人观点,仅供参考​


↙↙↙阅读原文可查看相关链接,并与作者交流