图片

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@ 鲍勃

01 有话题的技术

1、OpenAI 开源 realtime-voice-component:使用语音控制交互界面

OpenAI 发布了基于 OpenAI Realtime API 构建的开源参考实现 realtime-voice-component。该库专为 React 环境设计,旨在为具有明确预定义工具的应用提供低延迟、状态可感知的语音交互界面

https://github.com/openai/realtime-voice-component/

(@OpenAIDevs)

2、HeyGen 开源 HyperFrames:原生支持 AI 智能体的 HTML-to-MP4 视频渲染框架

视频生成平台 HeyGen 开源了 HyperFrames,这是一款专为 AI 智能体(Agent)设计的端到端视频工作空间框架。该工具通过将 HTML/CSS/GSAP 动画转化为逐帧确定的 MP4 视频,允许开发者在 Codex、Claude Code、Cursor 等编码环境中通过自然语言指令完成视频的编写、编辑与渲染

https://github.com/heygen-com/hyperframes/

(@HeyGen\@X)

3、开源 AI-HR 招聘平台:集成 TEN Framework 与 FastAPI,实现 < 1s 延迟实时语音面试

AI-HR 发布了基于 Python FastAPI 与 TEN Framework 的端到端智能招聘自动化系统。该平台通过 LLM 与实时通信(RTC)技术的深度解耦与重组,实现了从简历语义解析到「无人值守」实时语音面试的全流程闭环,将面试交互延迟降低至秒级

https://github.com/shenlan-ai/AI-HR

( @GitHub)

4、商汤开源 SenseNova U1:基于 NEO-unify 原生架构实现图文理解生成统一

图片

连续性图文创作输出示例

商汤发布并开源日日新 SenseNova U1 系列原生理解生成统一模型。该模型基于自研 NEO-unify 架构,在单一模型架构内实现了多模态理解、推理与生成的深度融合,其轻量化版本在 8B 规模下实现了比肩大型闭源商用模型的生成质量与推理效率。

GitHub: 

https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face: 

https://huggingface.co/collections/sensenova/sensenova-u1

(@ 商汤科技)

02 有亮点的产品

1、Jovida 完成千万级 Pre-Seed 轮融资:上线主动式生活智能体,支持 WhatsApp 触达与跨模态视觉解析

由前字节跳动产品合伙人创立的 AI 公司 Jovida 宣布完成数千万元人民币 Pre-Seed 轮融资(锦秋基金领投,百度风投跟投)。该公司正式发布 iOS 端主动式生活智能体,产品放弃传统对话框交互,采用「后台感知 +IM 主动触达」的「人类闭环(Human Loop)」范式,通过跨应用上下文调用与垂直技能生态(Agent Square),接管泛健康等长线个人目标的拆解与执行。

发布计划 iOS 客户端现已在 App Store 上线;Agent Square 已开放皮肤管理、减脂等数十款垂类技能模块供一键激活。

https://jovida.ai/agents

( @Founder Park)

2、Tin Can 发布儿童 VoIP 座机:硬件摒弃屏幕与电池,建立订阅制语音闭环

图片

图片

初创公司 Tin Can 推出一款针对儿童市场的 VoIP 语音终端。该产品通过彻底移除屏幕、摄像头及短信功能,并强制采用插电使用的非移动设计,配合家长端 App 的白名单过滤,试图在智能手机之外建立一套受控的、去沉迷化的儿童社交通讯系统

https://tincan.kids/

( @APPSO)

03 有态度的观点

1、Replit CEO:AI 已经能写代码,但它替代不了系统思维

图片

据《商业内幕》报道,AI 编程平台公司 Replit CEO Amjad Masad 昨日在《20VC》播客节目中表示,年轻人不应仅仅因为薪资前景而选择修读计算机科学专业

如果你对它没有那种如飞蛾扑火般的吸引力,就不要因为别人告诉你能在 Google 赚大钱而去读计算机科学,这「相当愚蠢」。

Masad 指出,21 世纪初入行者大多出于真实热情,此后该专业逐渐被「炒热」,各大高校计算机系急速扩张,核心原因只有一个 —— 容易赚钱。而 AI 崛起后,这一逻辑已不再成立。

他同时强调,对真正感兴趣的人而言,机器学习与 AI 方向依然大有可为;数据结构与算法等基础知识不会因 AI 进化而过时,行业始终需要理解底层原理的人才

这一观点在科技界并非孤例。「AI 教父」Geoffrey Hinton 去年也表示,计算机科学是「学习系统思维的绝佳专业」,AI 替代部分编程任务并不意味着相关学位失去价值

Masad 于 2016 年联合创办 Replit,该公司已从在线集成编程环境转型为以 AI 智能体为核心的应用构建平台,与微软旗下 GitHub、Cursor 及 Lovable 等 vibe coding 工具展开竞争。

( @APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

图片

作者提示: 个人观点,仅供参考


↙↙↙阅读原文可查看相关链接,并与作者交流