AI测试 Pi 母公司将开发情感 AI 商业机器人；Meta 科学家：Sora 不是视频生成唯一方向丨 RTE 开发者日报 Vol.214

RTE开发者社区 · 2024年05月29日 · 3383 次阅读

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@CY，@JLT，@ 鲍勃

01 有话题的新闻

1、 Inflection AI 计划将情感 AI 嵌入商业机器人

AI 独角兽 Inflection AI（情感型聊天机器人 Pi 的母公司），在经历投资方微软「挖角」之后，公布了其由经验丰富的硅谷老将组成的新领导团队，计划将情感 AI 嵌入商业机器人，凭借其在 AI 情感智能领域的领先地位进军 2B 市场。（@ 新智元）

2、剪映字幕识别功能收费，从最初的 178 元涨到现在的 188 元，最新回应

近日，有网友发帖称剪映更新后发现其字幕识别功能开启了 VIP 收费模式，每个月只有 5 次免费使用机会。有网友反映此功能不仅开启收费模式并且一周涨一次价，从最初的 178 元涨到现在的 188 元。网友们纷纷表示拒绝更新。对此剪映官方客服表示：因为市场环境和 app 规划原因确实开启了收费模式，但多次涨价这个情况并没有查询到相关信息。（@ 网易科技）

3、前 OpenAI 安全负责人加入竞争对手 Anthropic

5 月 29 日消息，据外媒报道，刚刚从 OpenAI 安全团队（专注于长期风险）离职的前联席主管 Jan Leike 宣布将加入 OpenAI 人工智能竞争对手 Anthropic。Leike 于 5 月 15 日凌晨宣布辞去 OpenAI 职务，几天后该公司解散了他共同领导的超级联盟小组。

Leike 表示，他在 Anthropic 的工作重点与他在 OpenAI 的工作类似，即与所谓超人类人工智能模型的控制相关的安全问题。此类人工智能模型目前尚不存在，但 OpenAI 和 Anthropic 等公司正在研究如果未来建成这些模型，如何对其进行控制。Leike 表示：我很高兴加入@AnthropicAI，继续完成超级对齐任务。（@ 鞭牛士）

4、黄仁勋净资产飙升至 910 亿美元，明年有望超越马斯克成全球首富，NVIDIA 暂无接班人

英伟达 CEO 黄仁勋个人净资产过去五年急剧膨胀，其持有英伟达约 8676 万股股票，占该公司已发行股份的 3.5% 以上。根据最新数据，英伟达创始人、总裁兼 CEO 黄仁勋的个人财富已达到约 936 亿美元（折合人民币约 6780 亿元），在亿万富翁指数榜上升至全球富豪榜第 17 位。按照目前的增长速度，黄仁勋有望在 2025 年之前取代特斯拉 CEO 马斯克，成为全球新首富。

然而，与公司业务和市值的蓬勃发展形成鲜明对比的是，英伟达目前并没有明确的接班人计划。黄仁勋在近期的一次对话中被问及退休问题时，以幽默的方式回应自己没有其他事可做，暗示暂无退休计划。（@ 腾讯科技）

5、首个未成年游戏退费标准发布：监护人与网游服务提供者按错比例担责

中国互联网协会发布首个未成年游戏退费标准，明确了监护人和网游服务提供者的责任比例。网游服务提供者未接入国家认证系统导致未成年人无限制充值时，承担 100% 责任；若已配置防沉迷措施但监护人帮助绕过，服务提供者根据情况承担 30%-70% 责任，监护人承担剩余责任。（@ 北京商报）

02 有态度的观点

1、Yann LeCun：如果你对下一代人工智能系统感兴趣，不要研究大型语言模型

虽然 Meta 推出了开源大型语言模型 Llama，但 Yann LeCun 作为 Meta 的首席人工智能科学家及 FAIR（Facebook AI Research）负责人，对 LLM 的不看好却是尽人皆知。

他最近还直接对学生喊话：如果你对下一代人工智能系统感兴趣，不要研究大型语言模型。

在近日与英国《金融时报》的一次访谈中，他反对依赖不断发展的 LLMs 来追求人类级别的智能，因为这些模型只有在被输入正确的训练数据时才能准确回答问题，因此「本质上是不安全的」。

谷歌 DeepMind 还花了几年时间寻找构建 AGI 的替代方法，包括强化学习等方法，其中人工智能代理在类似游戏的虚拟环境中从周围环境中学习。

所以他转而专注于一种根本性的替代方法，正在努力开发一个全新的 AI 系统，希望这些系统能够为机器提供人类级别的智能，尽管他表示这一愿景可能需要 10 年才能实现。

LeCun 认为，LLM 的自回归性质（根据之前的单词预测下一个单词）从根本上限制了它们实现真正智能的能力。他主张联合嵌入预测架构（JEPA）作为一种更有前景的 AGI 方法。LeCun 还批评了当前对基于文本的学习的关注，认为需要观察物理世界并与物理世界互动，以建立对规划和推理至关重要的全面世界模型。（@ 硅星人 Pro）

03 有思考的文章

《对话｜Meta 科学家 Bichen Wu：在硅谷，Sora 不是视频生成的唯一方向》

视频生成效果最好的其实是图形学（Graphics pipeline）的技术路线，并不是这一轮生成式 AI 的技术……在这一波生成式 AI 浪潮中，主要的技术路线分为两条。一条是以 Diffusion 模型为基础，OpenAI 的 Sora 和 Meta 的 Emu Video 都是这个路线；另一条是 Google 的 VideoPoet 模型所采用的路线，模型基于 Transformer 开发，用 LLM（大语言模型）的架构做视频生成，将视频拆解为多个小块，每个小块相当于一个 token，根据已有的 token 来预测下一个 token，最终这些小块会被解码器重新组合成视频。VideoPoet 模型把视频看作是由「许多词」组成的「句子」或「文章」。

文章推荐人 @ 鲍勃：推荐这篇「新皮层」与 Bichen Wu 的对话。虽然他没有透露在 Meta 做的具体项目，但是他表态：「尽管 Sora 将视频生成的潜力推向了新的高度，但这并不是视频生成的终极解决方案。无论是在训练还是推理阶段，我相信存在更高效的视频生成模型，能够以更低的成本生成更高质量的内容。」

写在最后：

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。