AI测试 Nari Labs 更新 TTS 模型 Dia2,将推出语音到语音引擎;谷歌或重启 AI 眼镜,最快明年四季度发布丨日报

RTE开发者社区 · 2025年11月29日 · 13 次阅读

图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@ 鲍勃 @Gemini(即将带👓版)

01 有话题的技术

1、Nari Labs 发布 Dia2:流式对话式 TTS 模型,提供 1B 和 2B 参数版本

#####

Nari Labs 发布了名为「Dia2」的流式对话式文本到语音(TTS)模型,其核心亮点在于能够边接收输入边生成音频,实现实时、自然的语音交互。该模型目前提供 1B 和 2B 参数版本,旨在加速 TTS 领域的研究。

  • 流式生成:「Dia2」模型无需等待完整文本输入即可开始生成音频,大大缩短了响应延迟,适用于实时对话场景。

  • 条件生成: 支持通过音频输入进行条件生成,可以利用现有音频(如前段对话)来生成更符合上下文的语音,提升对话的自然度。

  • 模型版本: 提供 1B 和 2B 参数两种模型检查点,满足不同性能和资源需求的研究场景。

  • 易于集成: 提供快速上手指南(Quickstart)和 Gradio 应用,方便开发者快速部署和体验。

目前,「Dia2」支持不超过 2 分钟的英文音频生成。Nari Labs 计划推出「Dia2 TTS Server」以支持真正的流式传输,并发布基于「Dia2」的语音到语音引擎「Sori」。

https://huggingface.co/nari-labs/Dia2-2B

(@Huggingface)

2、消息称谷歌重启 AI 眼镜:富士康代工、三星设计,最快明年四季度发布

#####

11 月 27 日消息,据报道,谷歌已于去年年底立项两个 AI 眼镜项目,目前两项目已经进入 POC(小批量试产)阶段,正在密集推进选型、ID 设计。知情人士透露,谷歌 AI 眼镜的硬件代工由富士康负责,参考设计由三星提供,而芯片则由高通供应。此外,谷歌近期还与包括歌尔在内的中国供应商进行了接触。

报道称,谷歌的 AI 眼镜预计最早将于 2026 年第四季度发布。在产品方面,该设备大概率将采用波导片光学方案,并配备摄像头。项目负责人之一是 Google Labs 的平台工程负责人 Michael Klug,他曾是明星创业公司 Magic Leap 的核心成员,在光场显示等领域拥有丰富经验。

据了解,谷歌是智能眼镜行业的先驱。早在 2012 年,谷歌创始人谢尔盖・布林通过一场跳伞直播演示,向全世界发布了 Google Glass,开启了可穿戴设备及增强现实概念的新篇章。然而,由于公众场合拍照引发的隐私问题,Google Glass 在 2015 年宣告关闭。2017 年以后,谷歌重新启动相关项目,策略也更加审慎。产品思路从炫技的概念机转变为解决实际问题的工具,商业化方向也从消费级市场转向企业级(toB)应用。

@IT 之家)

3、全国首例「医保价」脑机接口手术完成 置入费 6552 元/次

#####

11 月 27 日消息,据媒体综合报道,11 月 26 日,在华中科技大学同济医院神经外科,我国首例按照政府核定医疗服务价格项目执行的脑机接口手术顺利完成。

此次手术采用武汉衷华脑机融合科技发展有限公司生产的植入式脑机接口设备,可用于监测大脑手部运动和感觉区域的脑电信号。

值得一提的是,本次手术是我国首例按照政府核定医疗服务价格项目执行的脑机接口临床操作(即侵入式脑机接口置入费 6552 元/次,不含脑机接口设备等费用),标志着脑机接口技术从科研探索阶段正式进入医疗服务收费目录体系,在推动技术普惠化与产业化方面迈出重要一步。

今年 3 月 31 日,湖北省医保局率先发布全国首个脑机接口医疗服务价格,明确「侵入式脑机接口置入费」为 6552 元/次。这一开创性的政策,为脑机接口技术纳入规范化诊疗体系铺设了制度通道。

但从政策出台到临床落地仍需关键一跃。同济医院负责人表示,本次手术的费用虽然是由研究经费承担,无需患者自付费用,但这是全国率先将脑机接口手术纳入医院诊疗项目体系,并按照规范标准进行收费结算的临床实践。

(@ 快科技)


02 有亮点的产品

1、无问芯穹完成近 5 亿元 A+ 轮融资

#####

图片

近日,完成近 5 亿元 A+ 轮融资,本轮融资由珠海科技集团、孚腾资本(元创未来基金)领投,惠远资本、尚颀资本和弘晖基金跟投,老股东洪泰基金、达晨财智、尚势资本&海棠基金、联想创投、君联资本、申万宏源、徐汇科创投、元智未来持续追投。此次融资阵容汇聚国家产业资本与头部市场化基金,「国资 + 市场」的双重认可,既肯定了公司面向国家重大战略需求的技术创新,也充分鼓励着无问芯穹,在人工智能产业落地及基础设施生态建设中持续夯实价值创造。

本轮募集资金将主要被投入三大方向:一是持续扩大无问芯穹软硬协同、多元异构的技术领先优势;二是推动 AI 云产品与 AI 终端方案在产业中的规模化拓展;三是加大智能体基础设施研发投入,构建一流的智能体服务平台及配套云、端基础设施,加速实现智能体在数字世界与物理世界中的规模化普惠应用。

(@ 无问芯穹)

2、Klariqo AI Voice Assistants:面向中小企业,实现 3 分钟部署全天候智能客服

#####

Klariqo AI Voice Assistants 推出了一个「业务优先」的 AI 语音智能体平台,旨在革新中小企业和 SaaS 公司的客户支持体验。该平台通过提供无代码、3 分钟快速部署的全天候智能体,简化了传统 AI 工具的复杂性,有效解决企业电话和网站客服痛点,从而提升客户满意度和销售转化率。

  • 极简部署与无代码体验: Klariqo 宣称用户可在 3 分钟内完成设置,无需任何 API、webhook 或复杂开发知识,彻底降低了 AI 语音智能体的技术门槛,让非技术背景的企业主也能轻松上手。

  • 全渠道 24/7 智能互动: 智能体能以自然语音和口音(如美式、澳式)全天候接听电话,并同步处理网站聊天,确保客户的咨询总能得到及时响应,告别传统枯燥的文本聊天机器人。

  • 内置业务管理功能: 集成「日历」和「潜在客户管理」功能,智能体能自动预订预约、捕获潜在客户信息,并回答常见问题,帮助企业在非工作时间也能持续运营和销售。

  • 智能体与人工无缝协作: Klariqo 提供按需转接人工客服的功能,以应对复杂查询或客户明确要求,实现了自动化与个性化服务之间的灵活切换。

  • 深度数据洞察: 平台允许用户追踪通话记录、阅读对话记录,并分析用户情绪,为企业提供宝贵的数据支持,以便持续优化客户服务策略。

(@Product Hunt)

3、Quo(原 OpenPhone)融资 1.05 亿美元,提供中小企业客服

原「OpenPhone」公司现已更名为「Quo」,并宣布获得包括 General Catalyst 在内的现有投资者 1.05 亿美元(9600 万美元增长投资 + 900 万美元股权)融资。此次融资将加速其 AI 驱动的商业电话解决方案的产品创新和市场扩张,标志着公司进入高速增长新阶段。

  • 品牌重塑与融资: OpenPhone 正式更名为 Quo,并获得 1.05 亿美元融资,将重点投入到 AI 功能的研发和市场拓展上。

  • AI 驱动的「智能体」Sona: Quo 推出的 AI 电话「智能体」Sona 现已对所有客户免费开放,并升级了转接和更智能的场景处理能力,已处理超过 200,000 通电话,显著提升了中小企业的客户沟通效率。

  • 中小企业市场聚焦: Quo 致力于为占美国和加拿大公司总数近 99% 的中小企业提供先进的通讯解决方案,帮助它们在 AI 时代更好地服务客户,缩小与大型企业的技术差距。

  • 产品创新与定价模型: 新的定价模型采用分级、按使用量付费,并增加了多级电话菜单和临时呼叫流程等功能,以满足不同规模企业的灵活需求。

  • 用户增长显著: 过去六个月,Quo 吸引了超过 30,000 家新客户,总用户数接近 90,000 家,并在 G2 平台上获得 #1 的客户满意度评级。

(@Quo)


03 有态度的观点 

1、 Cognitive Resonance 创始人:AI 并不能思考
Cognitive Resonance 创始人 Benjamin Riley 认为 AI 并不能思考。

今天的 AI 热是基于一个根本性的误解:语言的建模并不等同于智能。根据目前的神经学,人类的思维在很大程度上独立于人类语言,几乎没有理由相信,越来越复杂的语言建模能达到甚至超越人类水平的智能。

人类用语言交流,用语言创造比喻去描述推理过程。失去语言能力的人仍然能展示出推理能力。当人类对现有的比喻不满时他们能创造出新的知识。爱因斯坦的相对论不是基于科学研究。他是在思想实验的基础上发展起来的,因为他不满足于当时的比喻。常识不过是一堆死气沉沉的比喻,而 AI 只会以有趣的方式重新排列旧的比喻,AI 永远不会对现有的数据或比喻感到不满。AI 基于的大语言模型使用的数据收集自互联网。互联网上使用的语言并不能代表现实世界上的语言。比如因纽特人的语言使用的比喻在欧洲语言中找不到。而如果互联网上没有这些比喻,那么 AI 也不可能创造出来。这并不意味着 AI 毫无用处。但它与人类智能相去甚远。

@Solidot

图片

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示:个人观点,仅供参考

暫無回覆。
需要 登录 後方可回應,如果你還沒有帳號按這裡 注册