AI测试 Kimi 探索版发布，搜索量增强 10 倍；北大&快手开源 Pyramid Flow Matching 丨 RTE 开发者日报

RTE开发者社区 · 2024年10月12日 · 4505 次阅读

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@SSN，@ 鲍勃

01 有话题的新闻

1、月之暗面发布 Kimi 探索版：搜索量相比普通版增强 10 倍，可精读 500 个页面

具备 AI 自主搜索能力的 Kimi 探索版于昨日（10 月 11 日）上线，其搜索量是普通版的 10 倍，一次搜索即可精读 500 个页面。

据官方介绍，该功能会模拟人类的推理思考过程并执行深度搜索，帮助用户更高效完成分析调研。通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤，用户可以获得更准确和全面的答案。

官方更称，测试表明 Kimi 探索版对比国内外主流 AI 助手和搜索类产品，综合性能超过同类产品至少 30%。

产品负责人介绍，「如果 Kimi 搜不到的信息，那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为 AI 更擅长调用的工具，人只需要专注于提出好的问题，AI 就可以结合模型本身的能力在庞大的互联网中自主海量搜索，不断反思迭代，更精准地找到所需答案。」目前该功能已逐步开放，下周一前推送至全量用户。（@IT 之家）

2、北大&快手开源 Pyramid Flow Matching，轻松生成 10 秒高质量视频的自回归方法

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。（@IT 之家）

3、AMD 发布英伟达竞品 AI 芯片

北京时间 10 月 11 日凌晨，AMD 首席执行官苏姿丰在旧金山举行的 Advancing AI 2024 活动上，发布了 Instinct MI355X 加速卡、Ryzen AI Pro 300 系列处理器等一系列产品。

Instinct MI355X 加速卡：提供了业界领先的内存容量和带宽，256GB HBM3E 支持 6.0TB/s，比英伟达 H200 提供了高 1.8 倍的容量和 1.3 倍的带宽。与 H200 相比，AMD Instinct MI325X 的峰值理论 FP16 和 FP8 计算性能提高了 1.3 倍。

Ryzen AI Pro 300 系列处理器：CPU 采用 4nm 工艺打造，使用该公司最新的微架构，结合 GPU 与 Microsoft Copiliot+ 认证的神经处理单元 ( NPU) ，可实现 55 TOPS 性能的 AI 算力。AMD 表示，搭载 MI355X GPU 的平台将在明年下半年上市，与 MI325X 正面迎战英伟达的 BlackWell 架构产品。（@APPSO）

4、苹果研究人员质疑 AI 的推理能力：简单数学问题稍作改动就会答错

周四，苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性的论文，揭示 LLM 在解决数学问题时容易受到干扰。研究人员通过对数学问题的微小改动，例如添加无关的信息，来测试 LLM 的推理能力。结果发现，这些模型在面对这样的变化时，其表现急剧下降。

例如，当研究人员给出一个简单的数学问题：「奥利弗星期五摘了 44 个奇异果，星期六摘了 58 个奇异果。星期日，他摘的奇异果是星期五的两倍。奥利弗一共摘了多少个奇异果？」时，LLM 能够正确地计算出答案。然而，当研究人员添加一个无关的细节，「星期日，他摘的奇异果是星期五的两倍，其中 5 个比平均小」时，LLM 的回答却出现了错误。例如，GPT-o1-mini 的回答是：「... 星期日，其中 5 个奇异果比平均小。我们需要从星期日的总数中减去它们：88（星期日的奇异果）- 5（较小的奇异果）= 83 个奇异果。」

上面只是一个简单的例子，研究人员修改了数百个问题，几乎所有问题都导致模型的回答成功率大幅下降。研究人员认为，这种现象表明 LLM 并没有真正理解数学问题，而是仅仅根据训练数据中的模式进行预测。但一旦需要真正的「推理」，例如是否计算小的奇异果，它们就会产生奇怪的、不合常理的结果。

这一发现对 AI 的发展具有重要的启示。虽然 LLM 在许多领域表现出色，但其推理能力仍然存在局限性。未来，研究人员需要进一步探索如何提高 LLM 的推理能力，使其能够更好地理解和解决复杂的问题。（@IT 之家）

5、传字节跳动在马来西亚裁员 700 多人

据路透社报道，有两位知情人士表示，字节跳动已经在马来西亚的子公司裁员 700 多名员工，因为字节跳动正在将重点转向使用 AI 进行内容审核上。

有消息人士表示，这些受到影响的员工大多从事的都是内容审核工作，并且已经在周三通过电子邮件收到了解雇通知。

而 TikTok 方面也在周五向路透社证实了裁员的消息，同时表示，作为其改善其审核运营的更广泛计划的一部分，预计全球将有数百名员工受到影响。（@ 爱范儿）

02 态度的观点

1、黄仁勋：AI 未来在于「推理」，芯片成本大降是关键！

英伟达 CEO 黄仁勋最新表示，人工智能（AI）的未来将是能够「推理」的服务，但要达到这样的阶段需要先把计算成本降下来。黄仁勋表示，下一代工具将能够通过数百或数千个步骤并反思自己的结论来响应人类提出的问题。这将使未来的软件具有推理能力，与当前他每天都在用的、OpenAI 的聊天机器人 ChatGPT 完全不同。英伟达将通过每年把芯片性能提高到两至三倍，同时保持相同的成本和能耗水平，来为这些进步奠定基础。这将改变 AI 系统处理推论的方式——从数据中识别出规律或模式，并基于这些模式得出合理的结论。（@AI 科技评论）

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。