AI测试英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

RTE开发者社区 · 2024年07月23日 · 3706 次阅读

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@JLT，@ 鲍勃

01 有话题的新闻

1、英伟达 Mistral AI 联手发布 12B 参数小模型 Mistral Nemo，碾压 Llama 3 单张 4090 可跑

英伟达与 Mistral AI 合作发布了新的 AI 小模型 Mistral NeMo，具有 120 亿参数，支持 128K 上下文，在多项基准测试中击败了同类模型 Gemma 2 9B 和 Llama 3 8B。Mistral NeMo 旨在服务于企业用户，可以轻松定制和部署支持聊天机器人、多语言任务、编码和摘要的企业应用程序。

Mistral NeMo 模型性能优异，兼容性强，易于使用，并且可以直接替代任何使用 Mistral 7B 的系统。模型使用 FP8 数据格式进行推理，减少了内存大小并加快了部署速度，同时保持了准确性。Mistral NeMo 还支持多语言应用，具有高效的分词器 Tekken，提升了对多种语言的处理效率。此外，Mistral NeMo 已经准备好在云、数据中心或 RTX 工作站等任何地方运行，开发者可以使用 mistral-inference 试用 Mistral NeMo。

2、微软技术故障造成全球损失或超 10 亿美元

7 月 22 日，据美国研究机构安德森经济集团首席执行官帕特里克·安德森估计，此次微软技术故障事件造成的经济损失很可能超过 10 亿美元。不过报道称，Crowdstrike 公司是否会为相关损失买单尚不好说。

Crowdstrike 公司虽已道歉，但没有回应美国媒体就是否会给予受影响客户赔偿的问询。有分析人士指出，Crowdstrike 公司与客户签订的合同中或许有免责条款，可使其躲过赔偿。（@ 央视新闻）

3、传英伟达将推出中国特供版「Blackwell」架构 B20 加速器

7 月 22 日，据路透社援引知情人士的消息报道称，英伟达正在开发面向中国市场的基于全新 Blackwell GPU 架构的 AI 芯片版本，型号暂定为「B20」，该版本将符合美国之前的出口管制政策。

根据美国 2022 年 10 月推出的出口管制的政策，英伟达对华出口的 GPU 的 TPP（总处理能力）需要低于 4800 分。最初的 A100/H100 就是超出了这个限制，因此也导致了英伟达被迫推出了经过「阉割」的 A800/H800。

今年 3 月，英伟达发布了其新一代的基于「Blackwell」架构的 B200 系列芯片，其晶体管数量达到了 2080 亿个，是 H100/H200 的 800 亿个晶体管两倍多，其 20 petaflops 性能达到了 H100（4 petaflops）的 5 倍。据了解，B200 将于今年晚些时候量产。

同样，英伟达也计划针对中国市场推出基于 B200 的「阉割版本」——B20，但是鉴于美国出口管制政策的限制，英伟达 B20 性能相对于 B200 也将会大幅削减，相对于 H20 来说，其性能可能也不会带来多大的提升，不过其 HBM 的容量有望进一步提升，这对于 AI 训练和推理来说有着很大的助力。预计也将于今年晚些时候投入生产。（@ 搜狐科技）

4、Flow Studio：将单一文本转换成高质量的短片

Flow Studio 是由 Flow GPT 团队开发的能将文本转换成高质量的短片的工具。该平台由 Lifan Wang、Sam Xu、Qianhua Ge、Jay Dang 和 Luke Pioneero 共同开发，于2024年7月18日在 Product Hunt 上发布。Flow Studio 的亮点是能够通过单一的文本提示，自动生成一个包含故事、配音、背景音乐和声效的完整视频，极大地简化了视频制作过程。Flow GPT 获得了用户的高度评价，平均得分为 4.9/5 星。

创始人 Jay Dang 大学在加州大学伯克利分校学习计算机科学，他是 FlowGPT、Markit AI 和 LUUM 的创始人，也在 C。Light Technologies, Inc. 和 Glaucomark 担任过数据科学家和独立研究员。（@AI 科技评论）

5、GitHub Trending 热榜，构建多智能体和 RAG 的框架 Langflow

Langflow 是一个视觉化的框架，旨在帮助开发者构建多智能体和 RAG 应用程序。项目基于 Python 开发，已开源，可以完全自定义，同时支持不同的语言模型和向量存储。用户可以通过 pip 安装 Langflow，并且需要确保系统中安装的 Python 版本至少为 3.10。项目提供了详细的文档和部署指南。（@AI 科技评论）

6、马斯克：特斯拉有望 2026 年大规模生产人形机器人，供其他公司使用

7 月 22 日，马斯克在 X（推特）上发文透露，特斯拉明年将生产出「真正有用」的机器人供公司内部使用，但仅仅是小规模生产。2026 年，特斯拉有望大规模生产人形机器人，供其他公司使用。

今年 7 月 4 日的 2024 世界人工智能大会期间，特斯拉二代人形机器人 Optimus 亮相。近期，二代 Optimus 已经在特斯拉工厂尝试「打工」。借助视觉神经网络和 FSD 芯片，二代 Optimus 可以模仿人类操作，进行电池的分拣训练。

马斯克在上月召开的股东大会上宣布，把特斯拉的未来押注在 Optimus 机器人计划上，当前拟人机器人市场年产 10 亿台，特斯拉未来至少要占据 10% 的份额。马斯克当时表示，特斯拉以每台约 1 万美元的价格批量制造机器人，并以 2 万美元（当前约 14.6 万元人民币）的价格出售，从而获得 1 万亿美元的利润。此外，马斯克相信到 2026 年，Optimus 将成为一个完全软件定制的机器人。（@IT 之家）

02 有态度的观点

1、大模型时代结束？大佬齐预测：AI 模型或需先缩小规模，才能再扩大规模

AI 领域出现新趋势，小模型因成本效益和易于部署受到关注。前 OpenAI 研究员 Andrej Karpathy 预测，未来 AI 模型将更小但更智能。大模型虽具数据吞吐和泛化能力，但面临高成本和资源消耗问题。小模型可从大模型中提炼优化，实现高效能。高质量数据集成为 AI 训练关键，小模型可能引领 AI 发展新方向。（@ 新智元）

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。

AI测试 英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

AI测试 英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

01 有话题的新闻

02 有态度的观点

AI测试英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

AI测试英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报