图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

** 1、逻辑智能发布 SE-Bridge-TTS:基于 CosyVoice2 解决低资源语音合成退化,泰语、老挝语等跨语言提示合成准确率达 83.4%**

图片

逻辑智能团队研发的低资源语音合成方案 SE-Bridge-TTS 已被 ICML 2026 接收。该方案基于 CosyVoice2 开源底座,通过构建 DGSA 与 TDSC 两套自对齐框架,系统性解决了低资源语种在合成数据扩容时面临的表现力退化问题。评测显示,该方案在泰语、老挝语的跨语言零样本声音克隆任务上达到 SOTA 水平。

https://github.com/InsiderX-Pro/video-translator

免费体验:https://luoji.cn/

(@ 机智流)

2、ElevenLabs 接入 SynthID 音频水印:首字节延迟零增加,支持抗裁剪压缩与 C2PA 标准

图片

ElevenLabs 宣布与 Google DeepMind 达成合作,在其生成的音频中直接嵌入 SynthID 数字水印技术。该技术可在不降低音频质量、不增加生成延迟的前提下,为 AI 生成音频引入抗篡改的隐式标识,并配套上线了免费的音频检测器(ElevenLabs Audio Detector)供公众验证。

( @elevenlabs)

02 有亮点的产品

1、Fika Jobs 获 400 万美元种子前轮融资:利用 Gemini 驱动的视频智能体自动生成结构化面试画像

图片

瑞典招聘平台 Fika Jobs 获得 400 万美元种子前轮融资,投资方包括 Luminar Ventures 及 King 联合创始人。该平台利用 Gemini 模型驱动的视频智能体与求职者进行 10 分钟交互面试,并自动将面试过程切片生成结构化视频档案。此举旨在通过 AI 智能体前置初筛流程,颠覆传统的简历投递与筛选模式。

( @TechCrunch)

2、作业帮布局健康穿戴与海外 AI 陪伴:招聘智能穿戴产品经理主导 PPG 与 ECG 软硬件方案,出海 AI 陪伴项目瞄准 Z 世代女性

图片

图片

作业帮近期释放多个核心岗位招聘,重点布局智能健康穿戴设备与海外 AI 情感陪伴业务。其中,智能穿戴产品线正从教育场景向健康、运动监测领域延伸,而海外 AI 陪伴项目则定位 Z 世代女性用户群。此举旨在通过软硬件技术升级与垂直应用出海,拓展其非教育类的软硬件业务版图

(@ 多知)

3、工信部指导发布《AI 眼镜可信视界自律公约》:不得超范围收集获取用户个人信息,本地化优先处理

图片

中国信通院 6 月 25 日宣布,在工业和信息化部信息通信管理局的指导下,中国信息通信研究院泰尔终端实验室联合深圳市 AI 眼镜产业联盟研究起草了《AI 眼镜可信视界自律公约》(以下简称《公约》),得到产业链上下游企业的积极响应。

《公约》发布仪式在 2026 人工智能眼镜生态大会(深圳)上举行。工业和信息化部信息通信管理局设备处、中国信通院、深圳市 AI 眼镜产业联盟,以及雷鸟创新、立讯精密、Rokid、莫界、千问、明智云、芯视佳、亿道、影目、中兴通讯的相关负责人,共同见证了《公约》的正式发布。

信通院泰尔终端实验室副主任果敢指出,随着人工智能技术与增强现实技术的深度融合,AI 眼镜作为下一代智能计算终端,正以前所未有的速度走进大众生活。音视频采集模组的广泛应用使得用户隐私保护面临考验,AI 算法的复杂性与不透明性,也引发了公众对技术可控性的深度关切,同时海量数据的采集、传输与处理,对全链路数据合规治理提出了更高要求。AI 眼镜正从「看得见」走向「看得懂」,从单一工具进化为智能伙伴,技术进步必须以信任为基石,产业发展必须以安全为前提。

IT 之家整理主要内容如下:

《AI 眼镜可信视界自律公约》(主要条款)

第一章用户隐私守护

第一条最小必要原则

各签署单位承诺,在 AI 眼镜产品设计与开发过程中,严格遵循数据采集的 “最小必要” 原则。仅采集实现产品核心功能所必需的用户数据,不得超范围收集、滥用或变相获取用户个人信息。对于摄像头、麦克风等敏感传感器的数据采集,必须提供明确的启用提示与用户授权机制,确保用户知情权与选择权。

第二条透明告知义务

承诺以清晰、易懂、完整的方式向用户告知数据收集的目的、范围、方式及存储期限。隐私政策应避免冗长晦涩的技术术语,采用分层展示结构,确保普通用户能够充分理解其数据将如何被使用。涉及第三方数据共享的,须明确告知接收方身份、共享目的及用户退出机制。

第三条用户自主控制

产品须为用户提供便捷、有效的数据管理工具,包括但不限于:一键查看已采集数据、随时撤回授权、批量删除历史数据、导出个人数据副本等功能。用户撤回授权后,相关数据采集行为应立即停止,已采集数据应按照约定及时删除或匿名化处理。

第四条生物特征保护

对于虹膜识别、面部特征、声纹等生物特征数据的采集与使用,须采取最高级别的安全保护措施。生物特征原始数据原则上应在本地设备处理,确需上传服务器的,必须经过加密传输与加密存储,且不得用于产品功能以外的任何目的。

第二章终端技术可控

第五条算法可解释性

承诺持续提升 AI 算法的透明度与可解释性。对于涉及用户权益的关键决策(如内容推荐、身份验证、风险提示等),应提供可理解的决策依据说明。建立算法影响评估机制,定期审视算法可能带来的偏见与歧视风险,及时采取纠正措施。

第六条本地化优先处理

倡导 “端侧智能、隐私优先” 的技术路线。在算力允许的前提下,优先在设备端完成数据处理与分析,减少原始数据向云端传输。对于必须在云端处理的数据,应采用联邦学习、安全多方计算等隐私增强技术,实现 “数据可用不可见”。

第七条安全更新机制

建立完善的安全漏洞发现与修复机制。对于已知安全漏洞,应在合理时间内发布补丁更新;对于可能影响用户隐私的重大安全事件,应在确认后 72 小时内向主管部门报告,并在 7 日内通知受影响用户。产品生命周期内持续提供安全更新支持,不得低于 5 年。

第八条开源与标准化

积极参与 AI 眼镜相关技术标准与安全规范的制定工作。鼓励在保障商业机密的前提下,开放安全相关的技术接口与测试工具,接受第三方安全审计。支持行业建立统一的安全评估框架与认证体系,推动安全能力的共建共享。

第三章全链数据合规

第九条数据分类分级

建立覆盖数据全生命周期的分类分级管理制度。按照数据敏感程度与重要性,划分为一般数据、重要数据、核心数据三个等级,分别制定差异化的采集、存储、使用、传输、删除策略。涉及个人信息处理的,严格遵守《个人信息保护法》等法律法规要求。

第十条跨境传输合规

数据出境活动严格遵循《数据出境安全评估办法》等相关规定。涉及个人信息出境的,须通过安全评估、标准合同备案或个人信息保护认证等法定途径。向用户明确告知数据跨境传输的目的、接收方所在国家 / 地区及当地数据保护水平。

第十一条供应链安全管理

将数据安全要求延伸至供应链各环节。对硬件供应商、软件开发商、云服务商等合作伙伴建立安全评估与准入机制,在合同中明确数据保护责任与义务。定期开展供应链安全审计,确保全链条数据安全措施的有效落实。

第十二条应急响应体系

建立数据安全事件应急响应机制,制定分级响应预案。发生数据泄露、篡改、丢失等安全事件时,立即启动应急响应流程,采取技术措施防止损害扩大,按照规定向监管部门报告,并及时告知受影响用户。定期开展应急演练,持续提升响应能力。

第四章监督与发布

第十三条自查与审计

定期开展全面的数据合规自查,鼓励引入独立第三方机构开展年度安全审计。

第十四条动态修订

本公约根据产业发展与技术进步需要,定期进行评估与修订。

第十五条发布生效

本公约自发布之日起生效。我们呼吁更多企业加入本公约,共同守护用户隐私、保障技术可控、维护数据合规,携手共建可信、透明、可持续的 AI 眼镜产业生态。

@IT 之家)

4、章鱼动力完成 5000 万美元融资:推行 SYNTH「手脑一体」架构,引入肌电信号与车规双目重构 WM2 物理世界模型

图片

图片

物理 AI 基础设施公司章鱼动力宣布完成 5000 万美元新一轮融资,近 3 个月累计融资额近 10 亿元人民币。资金将用于加速研发基于 SYNTH 架构的「手脑一体」平台及 WM2 阶段物理世界基础模型,推动具身智能从受限场景跨任务通用(L3)向开放场景通用操作(L4)演进

计划于 2026 年下半年发布物理基础模型并推出核心产品,目前下一轮 5 亿元人民币的融资也已接近完成。

@AI 科技评论)

03 有态度的观点

1、李飞飞:10 年后,职场或只剩两类工作者

图片

在日前的 Silicon Valley Girl 访谈中,美国国家工程院院士、World Labs 创始人李飞飞围绕 AI 对未来职场的影响表示,面对一种认知能力快速提升的技术,个人最需要培养的是「agency」,即主动理解、使用并驾驭工具的能力

她认为,AI 不应被简单视为取代人类的技术,而是一种需要被人类学习、设计和约束的强大工具。

面对这样一种认知能力很强的技术,agency 是关键。在谈到未来 10 年的公司形态时,李飞飞以产品经理为例称,过去产品经理通常需要在用户、市场、设计师和工程师之间协调,完成一个原型可能需要数月;现在,部分产品经理已经可以借助 AI 完成初步设计和代码编写,缩短从想法到反馈的周期。她强调,这并不意味着设计师和工程师会被取代,而是让他们有机会投入更复杂的工作

访谈中,MasterClass CEO David Rogier 将这一变化概括为职场的「杠铃效应」:一端是某一领域能力极强的顶尖专业人士,另一端是能够借助 AI 完成多类任务的高主动性通才。

李飞飞对此表示认同,并补充称,无论处在专家还是通才的位置,核心都在于是否具备主动使用工具、形成判断并创造性解决问题的能力

( @APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流