AI测试 Pi 母公司将开发情感 AI 商业机器人;Meta 科学家:Sora 不是视频生成唯一方向丨 RTE 开发者日报 Vol.214

RTE开发者社区 · 2024年05月29日 · 1859 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY@JLT,@ 鲍勃

01 有话题的新闻

1、 Inflection AI 计划将情感 AI 嵌入商业机器人

AI 独角兽 Inflection AI(情感型聊天机器人 Pi 的母公司),在经历投资方微软「挖角」之后,公布了其由经验丰富的硅谷老将组成的新领导团队,计划将情感 AI 嵌入商业机器人,凭借其在 AI 情感智能领域的领先地位进军 2B 市场。(@ 新智元)

2、剪映字幕识别功能收费,从最初的 178 元涨到现在的 188 元,最新回应

近日,有网友发帖称剪映更新后发现其字幕识别功能开启了 VIP 收费模式,每个月只有 5 次免费使用机会。有网友反映此功能不仅开启收费模式并且一周涨一次价,从最初的 178 元涨到现在的 188 元。网友们纷纷表示拒绝更新。对此剪映官方客服表示:因为市场环境和 app 规划原因确实开启了收费模式,但多次涨价这个情况并没有查询到相关信息。(@ 网易科技)

3、前 OpenAI 安全负责人加入竞争对手 Anthropic

5 月 29 日消息,据外媒报道,刚刚从 OpenAI 安全团队(专注于长期风险)离职的前联席主管 Jan Leike 宣布将加入 OpenAI 人工智能竞争对手 Anthropic。Leike 于 5 月 15 日凌晨宣布辞去 OpenAI 职务,几天后该公司解散了他共同领导的超级联盟小组。

Leike 表示,他在 Anthropic 的工作重点与他在 OpenAI 的工作类似,即与所谓超人类人工智能模型的控制相关的安全问题。此类人工智能模型目前尚不存在,但 OpenAI 和 Anthropic 等公司正在研究如果未来建成这些模型,如何对其进行控制。Leike 表示:我很高兴加入@AnthropicAI,继续完成超级对齐任务。(@ 鞭牛士)

4、黄仁勋净资产飙升至 910 亿美元,明年有望超越马斯克成全球首富,NVIDIA 暂无接班人

英伟达 CEO 黄仁勋个人净资产过去五年急剧膨胀,其持有英伟达约 8676 万股股票,占该公司已发行股份的 3.5% 以上。根据最新数据,英伟达创始人、总裁兼 CEO 黄仁勋的个人财富已达到约 936 亿美元(折合人民币约 6780 亿元),在亿万富翁指数榜上升至全球富豪榜第 17 位。按照目前的增长速度,黄仁勋有望在 2025 年之前取代特斯拉 CEO 马斯克,成为全球新首富。

然而,与公司业务和市值的蓬勃发展形成鲜明对比的是,英伟达目前并没有明确的接班人计划。黄仁勋在近期的一次对话中被问及退休问题时,以幽默的方式回应自己没有其他事可做,暗示暂无退休计划。(@ 腾讯科技)

5、首个未成年游戏退费标准发布:监护人与网游服务提供者按错比例担责

中国互联网协会发布首个未成年游戏退费标准,明确了监护人和网游服务提供者的责任比例。网游服务提供者未接入国家认证系统导致未成年人无限制充值时,承担 100% 责任;若已配置防沉迷措施但监护人帮助绕过,服务提供者根据情况承担 30%-70% 责任,监护人承担剩余责任。(@ 北京商报)

02 有态度的观点

1、Yann LeCun:如果你对下一代人工智能系统感兴趣,不要研究大型语言模型

虽然 Meta 推出了开源大型语言模型 Llama,但 Yann LeCun 作为 Meta 的首席人工智能科学家及 FAIR(Facebook AI Research)负责人,对 LLM 的不看好却是尽人皆知。

他最近还直接对学生喊话:如果你对下一代人工智能系统感兴趣,不要研究大型语言模型。

在近日与英国《金融时报》的一次访谈中,他反对依赖不断发展的 LLMs 来追求人类级别的智能,因为这些模型只有在被输入正确的训练数据时才能准确回答问题,因此「本质上是不安全的」。

谷歌 DeepMind 还花了几年时间寻找构建 AGI 的替代方法,包括强化学习等方法,其中人工智能代理在类似游戏的虚拟环境中从周围环境中学习。

所以他转而专注于一种根本性的替代方法,正在努力开发一个全新的 AI 系统,希望这些系统能够为机器提供人类级别的智能,尽管他表示这一愿景可能需要 10 年才能实现。

LeCun 认为,LLM 的自回归性质(根据之前的单词预测下一个单词)从根本上限制了它们实现真正智能的能力。他主张联合嵌入预测架构(JEPA)作为一种更有前景的 AGI 方法。LeCun 还批评了当前对基于文本的学习的关注,认为需要观察物理世界并与物理世界互动,以建立对规划和推理至关重要的全面世界模型。(@ 硅星人 Pro)

03 有思考的文章

《对话|Meta 科学家 Bichen Wu:在硅谷,Sora 不是视频生成的唯一方向》

视频生成效果最好的其实是图形学(Graphics pipeline)的技术路线,并不是这一轮生成式 AI 的技术……在这一波生成式 AI 浪潮中,主要的技术路线分为两条。一条是以 Diffusion 模型为基础,OpenAI 的 Sora 和 Meta 的 Emu Video 都是这个路线;另一条是 Google 的 VideoPoet 模型所采用的路线,模型基于 Transformer 开发,用 LLM(大语言模型)的架构做视频生成,将视频拆解为多个小块,每个小块相当于一个 token,根据已有的 token 来预测下一个 token,最终这些小块会被解码器重新组合成视频。VideoPoet 模型把视频看作是由「许多词」组成的「句子」或「文章」。

文章推荐人 @ 鲍勃:推荐这篇「新皮层」与 Bichen Wu 的对话。虽然他没有透露在 Meta 做的具体项目,但是他表态:「尽管 Sora 将视频生成的潜力推向了新的高度,但这并不是视频生成的终极解决方案。无论是在训练还是推理阶段,我相信存在更高效的视频生成模型,能够以更低的成本生成更高质量的内容。」

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册