AI测试 全球首部 Sora 生成宣传片《玩具反斗城的起源》亮相;钉钉全新 AI 小时搜索对所有大模型开放丨 RTE 开发者日报

RTE开发者社区 · 2024年06月27日 · 2443 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY@JLT,@ 鲍勃

01 有话题的新闻

1、全球首款 Transformer 专用 AI 芯片 Sohu 发布:比英伟达 H100 快 20 倍

6 月 26 日消息,据媒体报道,美国新兴的芯片创业公司 Etched 发布其首款 AI 芯片——Sohu。

这款芯片在运行大型模型时展现出了惊人的性能,其速度超越了行业巨头英伟达的 H100 高达 20 倍,即便是与今年 3 月才面世的顶尖芯片 B200 相比,Sohu 也展现出超过 10 倍的优越性能。

Sohu 芯片的最大突破在于它直接将 Transformer 架构嵌入芯片内部。据 Etched 公司负责人 Uberti 透露,Sohu 采用了台积电的先进 4 纳米工艺制造,不仅在推理性能上远超 GPU 和其他通用人工智能芯片,更在能耗控制上达到了新的高度。(@ 快科技)

2、字节跳动发布「豆包 MarsCode」工具,具备代码补全等功能

字节跳动公司发布了全新的智能开发工具「豆包 MarsCode」,该工具基于强大的豆包大模型打造,旨在为广大国内开发者提供高效、智能的编程体验,并全面免费开放使用。据介绍,豆包 MarsCode 具有两种主要形态:编程助手和 Cloud IDE,为开发者提供了从项目问答、代码补全到单测生成、Bug Fix 等一系列强大的功能。

作为一款集成开发环境(IDE),MarsCode 不仅支持超过 100 种编程语言和主流 IDE 的扩展,还内置了先进的 AI 助手,让编程变得更加智能化和便捷化。( @CSDN)

3、钉钉发布全新 AI 搜索,宣布对所有大模型开放

6 月 26 日,Make 2024 钉钉生态大会在北京举办,会上钉钉宣布了 7.6 版本,全新 AI 搜索产品开启邀请测试。

据介绍,这个 AI 搜索产品基于 AI 大模型,智能化整合钉钉上的工作信息,可以帮助用户整理离散信息为结构化知识网络。钉钉还升级了 AI 助理的思考、感知、行动系统,上线多 Agent 协同、拟人操作等能力,并支持用户按需切换底层大模型。

大会上,钉钉宣布对所有大模型厂商开放。除了通义大模型外,MiniMax、月之暗面、智谱 AI、猎户星空、零一万物、百川智能六家大模型厂商已经与钉钉达成合作。钉钉总裁叶军表示,随着行业从模型创新走向应用创新,探索大模型的应用场景是钉钉的责任所在。

大会上钉钉还宣布了一则数据:钉钉上创建的 AI 助理总数约 50 万个。(@ 爱范儿)

4、视频大模型能制片了,全球首部 Sora 生成宣传片《玩具反斗城的起源》亮相

IT 之家 6 月 26 日消息,当地时间 6 月 24 日,全球知名的玩具店「玩具反斗城」发布了全球首部利用 OpenAI 视频生成大模型 Sora 制作的宣传片《玩具反斗城的起源》。

Sora 可以生成长达一分钟的视频,这次生成的视频包含逼真的场景和多个角色,所有内容均基于用户输入的指令。这部品牌宣传片讲述了玩具反斗城创始人 Charles Lazarus 的故事,以及他「彻底改变玩具店行业」的理念。影片中,该店吉祥物 —— 长颈鹿杰弗里(Geoffrey the Giraffe)在梦中向主人公走来,令一代又一代的孩子感到无比欣喜。

据 IT 之家此前报道,Sora 能够根据文本快速生成相对高质量的视频,但业内人士认为,目前这类 AI 工具仍存在局限性,无法完全取代人类创作者的工作。

Sora 核心团队成员曾表示,其工作原理是分析大量视频数据、学习生成逼真的视频,工作方法融合了 GPT 等大语言模型及 DALL-E 等扩散模型的技术,架构类似于「介于两者之间」—— 架构上更像 GPT,训练方式类似于 DALL-E。(@IT 之家)

5、OpenAI 推迟发布 ChatGPT 语音问答功能,检测及拒绝部分内容的能力仍待加强

6 月 26 日凌晨,OpenAI 在 X 上发文宣布,备受期待的 ChatGPT 语音助手功能将被推迟发布,因为公司需要确保它能「安全有效地」处理来自数百万用户的请求。OpenAI 表示,该公司原本打算在 6 月底向一小部分付费 ChatGPT plus 用户推出语音功能,但后来认为还需要一个月的时间才能「达到我们的标准」。

这意味着,用户想要与 ChatGPT 语音助手「共叙」还得再等一段时间。今年 5 月 14 日,OpenAI 发布了新的 GPT-4o 模型,GPT-4o 可以理解用户的语音提问并用语音进行回答。(@IT 之家)

02 有态度的观点

1、朱啸虎:在中国,API 以后肯定是免费的,在中国卖软件卖不出价格,但要交服务

6 月 26 日下午,在 Make 2024 钉钉生态大会上,金沙江创投主管合伙人朱啸虎表示,「在中国,我觉得 API 以后肯定是免费的」。朱啸虎谈到,此前自己曾预言 5 年以后就没有独立大模型公司,只有前面的云应用公司和后面的云公司。

在他看来,在中国卖软件是卖不出价格的,但是我们要交服务,所以不管这是 AI 做的还是人工做的,只要我们交付了,就能获得一些回报,这反而是最适合中国创业者的。「今天大模型解决不了准确性的问题,我觉得人工对齐,这是最适合中国创业者,美国的投资人和创业者都不喜欢这种靠人工补齐的工作,这可能跟美国人工太贵,没法用人工补齐或根本看不上这种方式,这反而是中国创业的机会。」朱啸虎表示。(@ 新浪科技)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册