开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@koki、@ 鲍勃

01 有话题的技术

** 1、逻辑智能发布 SE-Bridge-TTS：基于 CosyVoice2 解决低资源语音合成退化，泰语、老挝语等跨语言提示合成准确率达 83.4%**

逻辑智能团队研发的低资源语音合成方案 SE-Bridge-TTS 已被 ICML 2026 接收。该方案基于 CosyVoice2 开源底座，通过构建 DGSA 与 TDSC 两套自对齐框架，系统性解决了低资源语种在合成数据扩容时面临的表现力退化问题。评测显示，该方案在泰语、老挝语的跨语言零样本声音克隆任务上达到 SOTA 水平。

首次量化 Synthetic Erosion（合成侵蚀）效应：研究表明，合成数据并非越多越好。在泰语实验中，当合成数据比例超过 50% 后，虽然发音错误率持续下降，但由于合成语音分布平坦、熵值较低，模型继承自预训练底座的表现力遭到侵蚀，导致重复率大幅上升至 9.83%，自然度 MOS 降至 3.08。
DGSA 框架实现韵律 - 音色解耦自对齐：针对有少量真实参考语音的场景，利用流匹配模型天然的结构特性，通过控制 style token 生成「高表现力（高错误）」与「高稳定性（平淡）」的互补候选样本。以真实语音为正向锚点进行双目标 DPO 对齐训练，在 80% 高合成比例下成功恢复了语音的自然度与说话人相似度。
TDSC 框架实现极低资源自我修正：针对几无真实语音的极困难场景，通过多温度采样产生多元化候选，利用 ASR 过滤、长度及重复率校验构建自评判闭环。优质样本用于 SFT，差异样本用于 DPO 偏好学习。在老挝语实验中，该框架将 WER 从 38.5% 降至 29.8%，重复率由 7.62% 降至 4.15%。
FLEURS 跨语言提示合成指标达 SOTA：在「中文/英文提示音 → 老挝语/泰语目标语」的跨语言测试中，SE-Bridge-TTS 的校准合成准确率达到 83.4%，优于 Higgs Audio v3（78.2%）和 OmniVoice（75.9%），并实现了 1020 个测试样本的全语种覆盖。

https://github.com/InsiderX-Pro/video-translator

免费体验：https://luoji.cn/

（@ 机智流）

2、ElevenLabs 接入 SynthID 音频水印：首字节延迟零增加，支持抗裁剪压缩与 C2PA 标准

ElevenLabs 宣布与 Google DeepMind 达成合作，在其生成的音频中直接嵌入 SynthID 数字水印技术。该技术可在不降低音频质量、不增加生成延迟的前提下，为 AI 生成音频引入抗篡改的隐式标识，并配套上线了免费的音频检测器（ElevenLabs Audio Detector）供公众验证。

首字节延迟零增加：引入 SynthID 水印算法后，音频生成服务的首字节延迟（TTFB）保持零增加，且水印在人耳听觉频域完全不可闻，不造成任何听感上的音质损失。
高鲁棒性防篡改能力：该数字水印直接隐式嵌入音频波形数据中。即使音频经历裁剪、变速、有损压缩、去除元数据、改变文件格式等常见编辑操作，水印仍能被精准提取，且无法被伪造或复制到非 ElevenLabs 生成的音频中。
发布免费 ElevenLabs Audio Detector：配套上线免费检测网页，替代原有的 AI 语音分类器。该工具利用 SynthID 识别机制，支持公众直接上传音频，核验其是否源自 ElevenLabs 平台。
兼容 C2PA 软绑定标准：方案符合多国监管对 AI 生成内容需具备「机器可读标记」的合规要求。团队计划将 SynthID 引入 C2PA 软绑定列表，确保音频即使在内容凭证被恶意擦除后，仍能重新关联并恢复原始归属元数据。

( @elevenlabs)

02 有亮点的产品

1、Fika Jobs 获 400 万美元种子前轮融资：利用 Gemini 驱动的视频智能体自动生成结构化面试画像

瑞典招聘平台 Fika Jobs 获得 400 万美元种子前轮融资，投资方包括 Luminar Ventures 及 King 联合创始人。该平台利用 Gemini 模型驱动的视频智能体与求职者进行 10 分钟交互面试，并自动将面试过程切片生成结构化视频档案。此举旨在通过 AI 智能体前置初筛流程，颠覆传统的简历投递与筛选模式。

Gemini 驱动的个性化面试：平台接入 Gemini 模型，自动分析求职者的 LinkedIn 背景数据并生成定制化面试问题，由视频智能体与求职者进行约 10 分钟的音视频实时交互面试。
自动化视频切片建档：面试完成后，系统自动将候选人的视频回答分割为结构化的短视频片段，并整理为动态个人画像，供雇主直接检索，无需候选人针对不同岗位重复申请。
10% 首年年薪佣金模式：该平台对求职者免费，仅在雇主成功录用后收取候选人首年年薪的 10% 作为服务费，低于传统猎头 20% 至 30% 的费率标准。
视频招聘的偏见与合规挑战：与传统盲筛简历不同，视频首选模式会将候选人的外貌、年龄、口音及族裔提前暴露给雇主，在提升筛选效率的同时，增加了合规性与主观偏见风险。

( @TechCrunch)

2、作业帮布局健康穿戴与海外 AI 陪伴：招聘智能穿戴产品经理主导 PPG 与 ECG 软硬件方案，出海 AI 陪伴项目瞄准 Z 世代女性

作业帮近期释放多个核心岗位招聘，重点布局智能健康穿戴设备与海外 AI 情感陪伴业务。其中，智能穿戴产品线正从教育场景向健康、运动监测领域延伸，而海外 AI 陪伴项目则定位 Z 世代女性用户群。此举旨在通过软硬件技术升级与垂直应用出海，拓展其非教育类的软硬件业务版图

集成 PPG 与 ECG 传感技术：新型智能穿戴产品将聚焦心率、血氧、心电、血压等健康及运动监测指标。产品经理需主导结合 PPG 与 ECG 等核心传感技术的软硬件一体化方案设计及量产交付。
硬件定位转向健康与医疗级：该岗位要求候选人具备 5 年以上硬件经验，优先考虑拥有可穿戴类医疗器械从业经验、出海 3C 消费电子背景，或主导过智能眼镜、耳机等爆款硬件研发运营经验的人才。
手腕场景产品线的升级转型：作业帮自 2022 年起布局手腕场景，曾推出支持表体拆卸、主打碎片化学习的 X9、K9 及 X9 Pro 学习手表。本次健康监测传感器的引入，意味着其穿戴硬件正从教育安全定位向通用健康监测设备升级。
开辟海外 AI 陪伴第二曲线：同步招聘的海外女性向陪伴类产品总监，负责面向海外 Z 世代女性情感场景的 AI 产品。招聘信息透露，其团队所属中心目前已运营有一款全球前三（Top 3）的 AI 陪伴类产品。

（@ 多知）

3、工信部指导发布《AI 眼镜可信视界自律公约》：不得超范围收集获取用户个人信息，本地化优先处理

中国信通院 6 月 25 日宣布，在工业和信息化部信息通信管理局的指导下，中国信息通信研究院泰尔终端实验室联合深圳市 AI 眼镜产业联盟研究起草了《AI 眼镜可信视界自律公约》（以下简称《公约》），得到产业链上下游企业的积极响应。

《公约》发布仪式在 2026 人工智能眼镜生态大会（深圳）上举行。工业和信息化部信息通信管理局设备处、中国信通院、深圳市 AI 眼镜产业联盟，以及雷鸟创新、立讯精密、Rokid、莫界、千问、明智云、芯视佳、亿道、影目、中兴通讯的相关负责人，共同见证了《公约》的正式发布。

信通院泰尔终端实验室副主任果敢指出，随着人工智能技术与增强现实技术的深度融合，AI 眼镜作为下一代智能计算终端，正以前所未有的速度走进大众生活。音视频采集模组的广泛应用使得用户隐私保护面临考验，AI 算法的复杂性与不透明性，也引发了公众对技术可控性的深度关切，同时海量数据的采集、传输与处理，对全链路数据合规治理提出了更高要求。AI 眼镜正从「看得见」走向「看得懂」，从单一工具进化为智能伙伴，技术进步必须以信任为基石，产业发展必须以安全为前提。

IT 之家整理主要内容如下：

《AI 眼镜可信视界自律公约》（主要条款）

第一章用户隐私守护

第一条最小必要原则

各签署单位承诺，在 AI 眼镜产品设计与开发过程中，严格遵循数据采集的 “最小必要” 原则。仅采集实现产品核心功能所必需的用户数据，不得超范围收集、滥用或变相获取用户个人信息。对于摄像头、麦克风等敏感传感器的数据采集，必须提供明确的启用提示与用户授权机制，确保用户知情权与选择权。

第二条透明告知义务

承诺以清晰、易懂、完整的方式向用户告知数据收集的目的、范围、方式及存储期限。隐私政策应避免冗长晦涩的技术术语，采用分层展示结构，确保普通用户能够充分理解其数据将如何被使用。涉及第三方数据共享的，须明确告知接收方身份、共享目的及用户退出机制。

第三条用户自主控制

产品须为用户提供便捷、有效的数据管理工具，包括但不限于：一键查看已采集数据、随时撤回授权、批量删除历史数据、导出个人数据副本等功能。用户撤回授权后，相关数据采集行为应立即停止，已采集数据应按照约定及时删除或匿名化处理。

第四条生物特征保护

对于虹膜识别、面部特征、声纹等生物特征数据的采集与使用，须采取最高级别的安全保护措施。生物特征原始数据原则上应在本地设备处理，确需上传服务器的，必须经过加密传输与加密存储，且不得用于产品功能以外的任何目的。

第二章终端技术可控

第五条算法可解释性

承诺持续提升 AI 算法的透明度与可解释性。对于涉及用户权益的关键决策（如内容推荐、身份验证、风险提示等），应提供可理解的决策依据说明。建立算法影响评估机制，定期审视算法可能带来的偏见与歧视风险，及时采取纠正措施。

第六条本地化优先处理

倡导 “端侧智能、隐私优先” 的技术路线。在算力允许的前提下，优先在设备端完成数据处理与分析，减少原始数据向云端传输。对于必须在云端处理的数据，应采用联邦学习、安全多方计算等隐私增强技术，实现 “数据可用不可见”。

第七条安全更新机制

建立完善的安全漏洞发现与修复机制。对于已知安全漏洞，应在合理时间内发布补丁更新；对于可能影响用户隐私的重大安全事件，应在确认后 72 小时内向主管部门报告，并在 7 日内通知受影响用户。产品生命周期内持续提供安全更新支持，不得低于 5 年。

第八条开源与标准化

积极参与 AI 眼镜相关技术标准与安全规范的制定工作。鼓励在保障商业机密的前提下，开放安全相关的技术接口与测试工具，接受第三方安全审计。支持行业建立统一的安全评估框架与认证体系，推动安全能力的共建共享。

第三章全链数据合规

第九条数据分类分级

建立覆盖数据全生命周期的分类分级管理制度。按照数据敏感程度与重要性，划分为一般数据、重要数据、核心数据三个等级，分别制定差异化的采集、存储、使用、传输、删除策略。涉及个人信息处理的，严格遵守《个人信息保护法》等法律法规要求。

第十条跨境传输合规

数据出境活动严格遵循《数据出境安全评估办法》等相关规定。涉及个人信息出境的，须通过安全评估、标准合同备案或个人信息保护认证等法定途径。向用户明确告知数据跨境传输的目的、接收方所在国家 / 地区及当地数据保护水平。

第十一条供应链安全管理

将数据安全要求延伸至供应链各环节。对硬件供应商、软件开发商、云服务商等合作伙伴建立安全评估与准入机制，在合同中明确数据保护责任与义务。定期开展供应链安全审计，确保全链条数据安全措施的有效落实。

第十二条应急响应体系

建立数据安全事件应急响应机制，制定分级响应预案。发生数据泄露、篡改、丢失等安全事件时，立即启动应急响应流程，采取技术措施防止损害扩大，按照规定向监管部门报告，并及时告知受影响用户。定期开展应急演练，持续提升响应能力。

第四章监督与发布

第十三条自查与审计

定期开展全面的数据合规自查，鼓励引入独立第三方机构开展年度安全审计。

第十四条动态修订

本公约根据产业发展与技术进步需要，定期进行评估与修订。

第十五条发布生效

本公约自发布之日起生效。我们呼吁更多企业加入本公约，共同守护用户隐私、保障技术可控、维护数据合规，携手共建可信、透明、可持续的 AI 眼镜产业生态。

（@IT 之家）

4、章鱼动力完成 5000 万美元融资：推行 SYNTH「手脑一体」架构，引入肌电信号与车规双目重构 WM2 物理世界模型

物理 AI 基础设施公司章鱼动力宣布完成 5000 万美元新一轮融资，近 3 个月累计融资额近 10 亿元人民币。资金将用于加速研发基于 SYNTH 架构的「手脑一体」平台及 WM2 阶段物理世界基础模型，推动具身智能从受限场景跨任务通用（L3）向开放场景通用操作（L4）演进。

聚焦 WM2 阶段世界模型与 L4 级物理 AI：公司技术路线锁定在具备强宏观物理建模能力的 WM2 阶段，目标是使模型从「预测下一帧画面」跳转为「预测物理状态与行动因果」；以此推动具身智能跨越单任务泛化，向家庭等非结构化开放场景下的 L4 级通用操作演进。
SYNTH 架构构建数据与推演闭环：该架构由负责操作数据沉淀的 SYNData、学习物理因果的 SYNWorld 以及执行策略转化的 SYNAction 组成，实现从真实数据、物理建模到执行的完整闭环。
首次引入高密度肌电信号规避视觉遮挡：在 SYNData 数据体系中提出 Bio2Robot 理念，通过大模型将人体生物学信号转换为机器人可用数据。高密度肌电信号能够捕捉视觉难以观测的接触力度与发力细节，弥补了单一视觉方案的力控死角。

计划于 2026 年下半年发布物理基础模型并推出核心产品，目前下一轮 5 亿元人民币的融资也已接近完成。

（@AI 科技评论）

03 有态度的观点

1、李飞飞：10 年后，职场或只剩两类工作者

在日前的 Silicon Valley Girl 访谈中，美国国家工程院院士、World Labs 创始人李飞飞围绕 AI 对未来职场的影响表示，面对一种认知能力快速提升的技术，个人最需要培养的是「agency」，即主动理解、使用并驾驭工具的能力。

她认为，AI 不应被简单视为取代人类的技术，而是一种需要被人类学习、设计和约束的强大工具。

面对这样一种认知能力很强的技术，agency 是关键。在谈到未来 10 年的公司形态时，李飞飞以产品经理为例称，过去产品经理通常需要在用户、市场、设计师和工程师之间协调，完成一个原型可能需要数月；现在，部分产品经理已经可以借助 AI 完成初步设计和代码编写，缩短从想法到反馈的周期。她强调，这并不意味着设计师和工程师会被取代，而是让他们有机会投入更复杂的工作。

访谈中，MasterClass CEO David Rogier 将这一变化概括为职场的「杠铃效应」：一端是某一领域能力极强的顶尖专业人士，另一端是能够借助 AI 完成多类任务的高主动性通才。

李飞飞对此表示认同，并补充称，无论处在专家还是通才的位置，核心都在于是否具备主动使用工具、形成判断并创造性解决问题的能力。

( @APPSO)

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点，仅供参考

↙↙↙阅读原文可查看相关链接，并与作者交流