AI测试 Meta 公布首款 AR 眼镜 Orion，成本 1 万美元；OpenAI CTO Mira Murati 离职丨 RTE 开发者日报

RTE开发者社区 · 2024年09月26日 · 3551 次阅读

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@SSN，@ 鲍勃

01 有话题的新闻

1、OpenAI CTO Mira Murati 离职，高层动荡继续

OpenAI 又迎来「地震级」高层人员变动。

今日凌晨三点半，OpenAI CTO Mira Murati 在 X 上发帖表示，在 OpenAI 工作了六年多后，她将离开公司进行自己的探索。

Mira 曾在去年 Sam Altman 被罢免之后短暂担任临时 CEO 的职位，同时在他返回 OpenAI 时发挥了重要作用。

如今 Mira 也离开了，加上正在休长假的 Greg Brockman 以及离职的首席科学家 Ilya Sutskever，曾经的 OpenAI「四大天王」，只剩 Sam Altman 一个人。（@ 机器之心）

2、国内首个视频大模型 Vidu 宣布开放 API

9 月 25 日，生数科技旗下视频大模型 Vidu 宣布正式开放 API，并同步接入百度智能云千帆大模型平台，成为平台接入的首个视频大模型。

作为国内首个纯自研的视频大模型，Vidu 在高动态性、多风格化、极致推理等方面具备领先优势，并上线全球首个「主体参照」功能，突破视频模型一致性生成难题。

通过 API 开放，Vidu 的视频生成能力可以快速融入各行业和应用场景，落地企业个性化的解决方案，满足企业对规模化、低成本的视频内容生产需求，以及高度自由的创作需求。

另外，在技术研发方面，Vidu 在模型训练环节选择了百度百舸·AI 异构计算平台。Vidu 借助百舸的算力集群和高效的资源调度系统，训练效率得到大幅提升，模型优化也得到强有力的支持。(@APPSO)

3、Meta Connect 2024：Meta 首款全息眼镜 Orion 发布

今天凌晨，Meta Connect 2024 正式举办。此次大会正值发布会十周年的重要节点，扎克·伯格也带来了多款新品：

- Meta Orion 智能眼镜： 由眼镜本体、手势追踪腕带、遥控器大小的「计算模块」三部分组成；机身采用了镁材料打造，Orion 眼镜本体重量仅 98 克；据 The Verge 的测试，眼镜视场角高达 70 度；交互层面， Meta Orion 支持眼动追踪、手势操控和 AI 语音操作，佩戴配套的腕带能够实现更精细的手势操作。

- Meta Quest 3S 头显 MR 眼镜： 搭载 Snapdragon XR2 Gen 2 处理器；新增 Hyperscale 功能，通过手机扫描房间的轮廓细节后，就能在 Quest 3S 重新构建出一个接近 1:1 的复原场景；推出沉浸式社交的增强功能。MetaQuest 3S 共提供 128GB/256GB 两个版本，售价分别为 299.99 元/399.99 美元。

- Meta 首个开源大模型 Llama 3.2 ： 包括两个视觉模型（11B 和 90B）和两个轻量级的纯文本模型（1B 和 3B），可同时处理文本和图像。

- Meta Ray-Ban 迎来 AI 新功能： 借助 Llama 3.2 的能力， Ray-Ban 现在可进行实时翻译、个性穿搭建议等功能。(@APPSO)

4、「稚晖君」创业项目，智元自主研发的机器人中间件 AimRT 开源

9 月 25 日，智元自主研发的机器人中间件 AimRT 开源上线。官方表示，AimRT 是一个更现代、轻量易用，且高效稳定的通信开发框架，具备机器人开发流程所必备的许多实用特性，并解决了主流开源中间件的一些痛点：

- 在软件开发效率方面 ，AimRT 基于现代 C++ 新标准开发，轻量易部署，将现代化设计模式应用在资源管控、异步编程、部署配置等方面，使得机器人应用的开发更加快捷和高效。

- 在工具链与调测效率方面 ，AimRT 提供了完善的调试、性能分析工具，以及良好的可观测性支持，有助于快速发现并解决系统中的问题，相比较传统的通信框架能够更加有力的保证机器人系统的稳定运行。

- 在生态兼容方面 ，AimRT 能够兼容 ROS2、Http、Grpc 等传统机器人生态或云服务生态，开发者可以根据需要选择合适的通信后端，并支持渐进式升级存量系统，可广泛应用于机器人端侧、边缘端、云端等多种部署场合，与最新的 AI 技术更亲和。

- 在扩展性方面 ，AimRT 提供了全面的插件开发接口，还提供了十余种官方插件，同时也支持开发者们进行二次开发以适配更多场景。

以「天才少年」身份加入华为的稚晖君于 2022 年底宣布离职，创业智元机器人。今年 9 月 3 日，智元机器人完成 A++++++ 轮融资，估值已超过 70 亿元，得到了包括北汽、上汽、比亚迪在内的国内汽车巨头支持。（@IT 之家）

5、MIMO：给定一个参考图像、视频几分钟即可生成一个可以控制动作和场景的动画人物

MIMO 是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息（如图片、动作序列或视频），生成一个可以控制动作和场景的动画人物，而且这个人物可以与场景中的物体进行互动。

即给定一个参考图像，MIMO 能够通过几分钟的推理生成可动画的虚拟形象。

该模型突破了传统 3D 角色视频生成方法的局限，不需要多视角拍摄或针对每个角色单独训练。通过结合 2D 视频信息和 3D 空间建模，MIMO 可以高效地生成角色动画，并支持在真实世界的复杂场景中与物体进行交互。

MIMO 的核心优势在于它可以根据用户的需求自由控制动画中的角色、动作和场景，适应不同的应用场景，如虚拟人动画、电影特效、游戏角色等。（@ 小互 AI）

02 有态度的观点

1、百度李彦宏：智能体是我最看好的 AI 应用方向

在昨日 2024 百度云智能大会上，百度创始人李彦宏发表颁奖致辞时指出，智能体是他最看好的 AI 原生应用发展方向。李彦宏表示，「越来越多的人靠自然语言提示词，就可以做出很有用的智能体」，相当于 PC 时代的网站和自媒体时代的账号。

李彦宏表示，智能体最明显的特点是门槛足够低，谁都能上手，但同时天花板又足够高，可以做出非常复杂，非常强大的应用，未来将会有数以百万量级的智能体出现，形成庞大的智能体生态。在今年文心杯创业大赛中，有超过 60% 参赛团队聚焦智能体的应用，超过 30% 参赛团队没有专业程序员。

「面对新的技术周期，坚持长期主义的创业者必将脱颖而出。」现场，李彦宏重申坚持举办「文心杯」创业大赛的初衷。他说，大模型热潮已经持续两年，当度过最初的兴奋，回归现实和落地时，许多创业者可能会感到失落、迷茫，甚至怀疑未来，「因为人们总是高估技术的短期价值，却低估技术的长期价值。」在他看来，大模型是一次颠覆式的技术革命，长期前景非常乐观，「悲观者永远正确，而未来却是由乐观者创造的」。

李彦宏表示，「百度希望能与所有的创业领域企业共建一个繁荣的 AI 产业应用和智能生态，帮助创业者更早的找到 PMF，做出超级应用。」（@ 有新 Newin）

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。