AI测试 OpenAI 创始成员创办「AI+ 教育」公司;谷歌发布 Magic Insert:让人物完美融入新背景丨 RTE 开发者日报

RTE开发者社区 · 2024年07月17日 · 1700 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@ 鲍勃

01 有话题的新闻

1、Andrej Karpathy 官宣创业:是自己热爱的 AI+ 教育

Andrej Karpathy,前特斯拉 AI 高级总监和 OpenAI 创始成员,宣布创立 Eureka Labs,一家专注于人工智能与教育结合的公司。Karpathy 表示,他将致力于创建 AI 原生的新型学校,利用生成式 AI 技术提供理想化的学习体验。Eureka Labs 的首个产品是 LLM101n,一门旨在教授学生如何训练自己的 AI 模型的本科课程。这门课程将从基础的语言建模和机器学习知识开始,逐步深入到多模态、RLHF、模型部署等领域,最终目标是构建一个能够使用 AI 创作、完善和解释小故事的 Storyteller AI 大模型。

Karpathy 对教育的热情由来已久,从斯坦福大学的 CS231n 课程到 YouTube 教育视频,再到开源项目,他一直致力于分享知识。Eureka Labs 的成立标志着 Karpathy 将全职投身于他热爱的教育事业,为 AI 领域带来新的教育模式和资源。

Karpathy 的这一决定得到了业界的广泛关注和支持。谷歌首席科学家 Jeff Dean 对他的新公司表示祝福。Eureka Labs 的课程和项目已在 GitHub 上获得高度关注,LLM101n 项目自上传以来已收获 17k Star。Karpathy 希望通过 Eureka Labs 激发更多人对学习的热情,实现教育的广泛覆盖和深度。同时,他也在探索公司的商业化途径,包括付费使用和与大型 AI 模型的合作。Eureka Labs 的成立不仅是 Karpathy 个人职业生涯的一个新起点,也为 AI 教育领域带来了新的可能性和期待。(@ 机器之心)

2、苹果、英伟达陷入和博主们的 AI 数据版权之争

据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。据悉,超过 17.3 万个来自 4.8 万个频道的 YouTube 视频字幕文件被用来训练人工智能模型,其中就包括苹果、英伟达、Salesforce 等硅谷巨头。

据报道,下载这些字幕文件的是一个名为 EleutherAI 的非盈利组织,他们声称其目的是帮助开发者训练 AI 模型,但该数据集也被苹果等科技巨头使用。

苹果、英伟达和 Salesforce 等巨头曾经在他们的研究论文和帖子中提到了他们如何使用 EleutherAI 的数据集来训练 AI 模型。(@IT 之家)

3、谷歌发布 Magic Insert:一键拖放让人物完美融入新背景

Magic Insert 首使用 LoRA 和学习到的文本标记对预训练的文本到图像扩散模型进行微调,并将其与目标风格的 CLIP 表示融合。使用 Bootstrapped Domain Adaptation 技术,将特定领域的照片级真实对象插入模型适应到多样化的艺术风格领域。该方法允许在风格化程度和原始主题细节的忠实度之间进行选择,甚至可以在生成中引入更多新颖性。(@AI 科技评论)

4、消息称字节跳动将于本周公布 AI 模型技术进展

钛媒体 AGI 独家报道,字节跳动团队将在 7 月 19 日本周五首次大范围公布文生图、类 Sora 新视频等全新人工智能模型技术进展,特别会在长视频、高动态方向上提出创新技术,或将直接对标 Sora 文生视频模型。

有消息人士透露,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向,还有消息称抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计也将于近期公布。

作为对比,另一家短视频巨头快手在 AI 视频大模型领域进展迅速,旗下有可灵视频大模型应用、可图文生图大模型等产品。快手透露,视频生成大模型可灵平台申请用户数超过 50 万,开通用户数超过 30 万,生成视频数达 700 万以上。(@ 爱范儿)

5、SmartCrawl:利用 AI 技术将任何网站数据转为 API

Mendable.ai 与 Firecrawl 社区联手推出 mendableai/firecrawl 的开源工具,为 AI 开发者提供了强大的网站内容处理能力。该工具能够将整个网站转换为适合大型语言模型使用的 Markdown 格式或结构化数据,通过单一 API 实现网页抓取、爬虫和数据提取功能。尽管仍处于早期开发阶段,但已经提供了多种 SDK 和与主流 AI 工具的集成支持。开发者可以使用 Python 或 Node SDK 轻松实现网站爬取、数据提取和内容搜索等功能。(@AI 科技评论)

6、AI 办公也疯狂,微软为 Excel 研发新 AI 模型

根据微软最新公布的研究论文,计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新 AI 大语言模型--SpreadsheetLLM。

SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合,大大提高了电子表格表检测任务的性能,在 GPT4 情境学习设置中,比普通方法高出 25.6%;使用词元(token)成本降低了 96%,并能提供更好的处理结果。(@ 元力社)

02 有态度的观点

1、何小鹏系统谈大模型改造智驾:造车像血海游泳,但我更有信心了

小鹏汽车的董事长兼 CEO 何小鹏,在访谈中分享了他对大模型技术改造汽车行业的看法,以及小鹏汽车在自动驾驶领域的进展和挑战。

何小鹏认为大模型技术将深刻影响汽车行业,尤其是在自动驾驶的落地应用上。他坦言,尽管目前全球还没有企业在大模型上真正盈利,但自动驾驶提供了让大模型在另一维度盈利的可能。何小鹏分享了自己的创业经历,从小鹏汽车创办到今天 10 年的感悟,包括对造车难度的描述和对未来的乐观预期。他强调了智能化在汽车销量中的重要性,并预计未来 18 个月内自动驾驶性能将有显著提升。此外,何小鹏还讨论了小鹏汽车的全球化战略、公司管理以及未来的发展规划,展现了他对小鹏汽车未来发展的信心和对汽车行业变革的深刻洞察。(@ 腾讯科技)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册