开发者朋友们大家好:
这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@ 鲍勃
据网信上海,上海市网信办在执法办案工作中发现,部分企业开发使用生成式人工智能功能,未依法开展安全评估工作、未采取必要的安全防护措施防范违规信息生成、未采取限制措施防止被滥用,导致相关功能被用于「换脸变声」「变装造假」等侵犯他人个人信息权益行为,产出「开盒」「洗钱」等违法违规内容,以及生成色情低俗图片等信息内容。「亮剑浦江·2025」专项执法行动将「整治 AI 滥用」作为年度治理重点,以执法促合规护航新兴产业高质量发展。专项行动期间,兼顾执法力度与温度,多措并举引导生成式人工智能领域企业合规运营。一是加强日常管理。二是强化处置处罚。三是首违企业免罚。
(@ 证券时报)
小米具身智能团队正式发布了首篇论文,提出统一具身智能与自动驾驶的新模型 MiMo-Embodied。模型在 17 项具身任务和 12 项自动驾驶任务中取得领先表现,更重要的是,它从工程层面展示了这两个长期分离的技术领域可以在同一框架下实现统一建模。
小米智驾团队的郝孝帅是论文的核心第一作者,小米智驾团队首席科学家陈龙博士担任 project leader。
该模型是陈龙团队的首个重大成果。由于以罗福莉团队之前发布的 MiMo-VL 作为基座进行了 continue-train,这也是文章作者栏中有「罗福莉」的原因。此前有媒体曾误解为罗福莉首个小米成果,也引发了当事人发朋友圈澄清事实。
这篇论文关注的核心问题是:同一套视觉语言模型,能否在面对「抓取物体」与「驾驶车辆」这两类差异极大的任务时,仍保持一致的理解方式和决策逻辑。
这一问题长期困扰多场景智能体的研究,而 MiMo-Embodied 正是小米对这一方向给出的首次系统回应。
这篇论文中主要围绕两个主要方向进行了系统实验:具身智能与自动驾驶。
整体结果非常突出,可以用一句话概括:MiMo-Embodied 在 17 个具身智能任务和 12 个自动驾驶任务中,都取得了全面领先的表现,在多数关键基准上都处于第一。
在具身智能方面,实验评测涵盖可供性推断、任务规划和空间理解三个能力。
###
#####
Typeless 发布了其 AI 驱动的语音输入和写作助手,旨在解决用户思考速度与打字速度之间的巨大生产力鸿沟。通过提供智能转录、语境感知和实际场景下的易用性,Typeless 试图从根本上改变内容创作方式,将其定位为一款超越普通听写工具的「AI 写作伙伴」。
智能转录,不止于听写: Typeless 能够智能去除口语中的填充词和重复,确保输出内容清晰精准,甚至能理解并写出用户「本意」而非「字面」所说的话,这在用户测试中反响最为强烈。
语境感知,适应多重场景: 与传统「一刀切」的听写工具不同,Typeless 能根据应用场景自动调整语气,如在聊天应用中使用休闲语气,在邮件中体现专业,在文档中保持简洁,极大地提升了专业用户的体验。
「耳语模式」解放公共场合: 针对用户在公共环境中难以使用语音输入的痛点,Typeless 推出了「耳语模式」,使其能在更广泛的实际工作环境中得到应用。
新增「写作与阅读助手」: 新功能允许用户通过语音指令编辑文本(如「让这段文字更专业」、「修正语法」)或查询内容(如「总结这段文字」、「找出行动项」),将 Typeless 从单一输入工具升级为全面的 AI 写作伙伴。
跨平台可用性: Typeless 已在 Windows 和 Mac 平台上推出,覆盖了绝大多数桌面专业用户群体。
(@Product Hunt)
#####
AI 视频平台公司 Kaltura 今日宣布,已与以色列初创公司 eSelf.ai 达成最终收购协议,交易额约为 2700 万美元。eSelf.ai 专注于开发能够与用户实时对话的 AI 生成数字人类(Conversational Avatars),其联合创始人曾是 Snap 公司 AI 团队的核心成员。此次收购将显著增强 Kaltura 在实时、多语言对话式 AI 视频领域的实力,标志着公司从纯视频平台向视频驱动的客户与员工体验提供商的战略转型。
收购 eSelf.ai 增强 AI 对话能力: Kaltura 收购了专注于 Conversational Avatars 的初创公司 eSelf.ai,该公司由前 Snap AI 团队成员创办,技术专长涵盖语音到视频生成、低延迟语音识别以及屏幕理解。
实时、多语言交互是核心: eSelf.ai 的平台支持超过 30 种语言,并提供用户友好的工作室,用于创建和部署逼真的数字头像,Kaltura CEO 强调其在「实时、同步对话」方面的「最佳竞争力」。
推动视频平台向体验平台转型: Kaltura 计划将 eSelf.ai 的技术整合到其视频产品线中,旨在实现能够实时倾听、说话并理解用户屏幕内容的智能体,将公司定位为视频驱动的客户与员工体验提供商。
人才与技术整合: eSelf.ai 的联合创始人及约 15 名 AI 专家团队将加入 Kaltura,负责技术整合,Kaltura CEO Ron Yekutiel 表示,此次收购不仅是技术层面的,也看重团队的文化与地域契合度。
Kaltura 的战略性收购: 这是 Kaltura 迄今为止的第四次收购,显示了公司持续通过并购来拓展技术和市场能力的战略。Kaltura 是一家公开上市公司,年收入约 1.8 亿美元,拥有约 600 名员工。
( @TechCrunch)
#####
《科创板日报》记者从知情人士获悉,大模型创企月之暗面 Moonshot AI 即将完成一轮美元融资,此次融资可能使其估值提升至约 40 亿美元。据了解,意向投资机构包括 IDG 资本、腾讯等,融资金额可能达数亿美元。此外,月之暗面或于明年启动 IPO。
(@ 科创板日报)
由前 Salesforce 联合 CEO Bret Taylor 与前谷歌高管 Clay Bavor 创办的 AI 客服代理公司 Sierra 宣布,最新年度经常性收入(ARR)已达 1 亿美元,距离 2024 年 2 月公开亮相仅 21 个月,当前估值 100 亿美元,对应百倍市销率。
客户侧,Sierra 已签下 Deliveroo、Discord、Rivian、SoFi、ADT、Cigna、Vans 等 30 余家客户,覆盖金融、医疗、零售、IoT 领域,可处理身份验证、退货、补卡、房贷申请等原本需人工坐席的复杂流程。公司采用「结果定价」模式——按实际完成工单数计费,而非传统 SaaS 订阅,Taylor 称此举让客户 ROI>300%,推动老客户年度扩容超 150%。
竞争层面,Sierra 与 Decagon、Intercom、Zendesk AI 等同台竞技,但宣称在「AI 客服」垂直赛道客户数与收入规模均居首位;下一版本将加入语音实时坐席与 RPA 流程挖掘,目标 2026 年 ARR 破 5 亿美元。
( @AI Base)
#####
继 Neo NPC 之后,育碧再推生成式 AI 重磅研究项目——可玩实验游戏《队友》(Teammates),以实时语音交互重构游戏体验。玩家将在虚拟世界中与 AI 语音助手贾斯帕及两名 NPC 队友协同作战,通过自然语言指令主导剧情走向与战斗策略,展现了生成式 AI 在游戏领域的全新可能。
作为一款聚焦 AI 技术探索的实验性作品,《队友》以第一人称射击为基础玩法,核心亮点在于深度语音交互。玩家可通过自然对话向 AI 队友下达攻击指令、询问剧情细节,甚至调整游戏设置,AI 角色能结合场景语境实时响应,例如指挥 NPC 利用环境掩护、精准锁定目标。AI 语音助手贾斯帕不仅是功能工具,更以剧情角色身份存在,为玩家提供世界观解读与行动指引,增强沉浸感。
与传统游戏固定脚本不同,《队友》的 NPC 具备即兴互动能力。育碧团队通过「边界框架」设计,让 NPC 在预设的剧情和角色动机范围内自由发挥,玩家的每一句对话都可能触发独特反应,实现「千人千面」的个性化体验。这种设计既保留了人类创作者的核心创意,又借助 AI 技术突破了传统叙事的局限,让玩家从「被动跟随」变为「主动塑造」剧情。
育碧明确表示,该项目的目标并非取代游戏创作者,而是通过 AI 与人类创造力的结合,拓展游戏互动边界。目前,《队友》已完成数百人封闭测试,玩家反馈将用于技术优化。团队后续还将发布解说视频,分享更多研发细节,并计划进一步完善系统,探索 AI 在更多游戏类型中的应用。
(@ 环球网科技)
###
#####
11 月 22 日消息,近日,百川智能创始人王小川在参加某活动时谈到「其实 2021 年我把公司卖给腾讯时,告别信里就写到了,我的梦想是生命科学和大健康,有人问我是不是在找方向,其实我不是在找方向,我的方向早就明确了,我是在等技术,那个时候技术还没到。」他回忆道,「2023 年我创立公司时,就想做生命科学相关的医疗领域,但当时投资者觉得做 AGI 更好,认为医疗领域商业模式不明确,技术前景也不明朗。」
随后,他分享称「绕了一圈回来后,我发现还是想做自己想做的事,去年已经有很多行业专家提到,未来 10 年我们可以一起治愈所有疾病,让人人身边都有一位医生陪伴,现在这已经逐步形成共识,2025 年也是这个领域的元年。」提到王小川,搜狗是绕不开的话题。2004年8月3日,王小川与团队正式推出了拥有独立知识产权的搜索引擎——搜狗。后在马云的支持下,搜狗得以分拆并独立运营。搜狗不仅创立了中国第一大输入法,其搜索引擎也拥有独立知识产权,在市场上占据了一席之地。
2019 年,腾讯马化腾入股搜狗,双方开启了合作新篇章。而搜狗发展的新契机出现在 2021 年,由于腾讯的商业版图中缺少搜索引擎相关业务,腾讯总裁马化腾决定以 20 亿美元全资收购搜狗。搜狗 CEO 王小川随后宣布卸任,并于 4 月 10 日宣布成立百川智能,立志为生命健康与医学逐梦,致力于创立中国版的 OpenAI。
(@ 快科技、雷锋网)
招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)
#####
RTE 开发者社区·运营实习生(实时互动 / Voice AI 方向,本招聘长期有效)
地点:北京·朝阳区望京南/上海·杨浦区五角场
这份实习将给你带来:
产品与技术成长:深入学习垂类 AI 产品从技术到落地的全生命周期,构建全面的产品视角。
社区运营实战:与高潜力的开发者和创业者深度交流,共同探索行业前沿;并亲身体验顶级 AI 大会,拓展行业视野。****
【你的职责】
Voice AI / RTE 情报官:每日关注 Voice AI /实时互动领域的最新动态,提炼整理并分享行业洞察,定期撰写学习笔记,帮助团队和社区保持信息前沿。
社区连接者:负责 RTE 领域开发者、初创企业等核心群体的社群运营,主动建立并深化联系,鼓励并协助他们融入社区,共同维护社区的活力与生态。
活动协作者:深度参与 RTE Open Day、Meetup、Dev Talk 等线上线下活动的全流程运营,包括前期策划、中期执行、后期复盘,从实践中提升组织和协调能力。
行业洞察者:协助开展 RTE 相关行业及应用场景调研、产品竞争力分析,整理相关资料,形成对业务的深入理解和独到见解。
【希望你】
本科及以上学历,商业、技术、产品、媒体专业或经验背景优先,具备良好英文能力;
对 RTE / Voice AI 有浓厚兴趣和求知欲;具备优秀的信息收集与整合能力,乐于快速学习新事物,并具备严谨的逻辑思维。
能保证每周至少 4 天的工作时间,持续 3 个月以上。
【薪资】
180-220 元/天 ****
【投递方式】
实习地点北京或上海,请将简历发送至 rtedevcommunity\@gmail.com ;邮件标题请注明:【社区运营实习 - 姓名 - 学校 - 毕业年份 - 到岗日期 - 城市】
阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。