AI测试 马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148

RTE开发者社区 · 2024年02月21日 · 2119 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement)领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY

01 有话题的新闻

1、马斯克表示第一位 Neuralink 患者可以通过思维控制电脑鼠标

2 月 20 日消息,伊隆·马斯克在社交媒体平台 X 上的 Spaces 活动中透露,脑机接口公司 Neuralink 的首位人类受试者「似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标」。

Neuralink 是这位亿万富翁的初创公司,该公司表示已开发出一种大脑植入物,旨在帮助人类利用神经信号来控制外部技术。该公司的目标是恢复视力、运动功能和言语等丧失的能力。

据一篇博客文章称,Neuralink 在 5 月份获得美国食品和药物管理局批准开展这项研究后,于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标志着 Neuralink 在商业化道路上迈出了一步。医疗器械公司必须经过多轮密集的数据安全收集和测试,才能获得 FDA 的最终批准。(@CNBC)

2、字节跳动低调推出视频模型 Boximator,尚无法作为完善产品落地

2 月 20 日消息,在 OpenAI 发布 Sora 之前,字节跳动低调推出了一款视频模型产品 Boximator。Boximator 可以通过文本控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

字节跳动从去年开始布局 AI,并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。一位接近字节跳动的知情人士对界面新闻表示,去年一年,字节跳动创始人张一鸣的全部时间都花在 AI 上了,从其精力分配上也可以看到字节跳动对 AI 业务的重视程度。(@ 界面新闻)

3、苹果 AirPods 团队大洗牌:Gary Geaves 卸任,苹果 AirPods 团队换帅

根据外媒报道,长期担任声学副总裁的 Gary Geaves 离职,苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中表示使用了 “shuffles”(洗牌)来形容,表明苹果公司的音频产品团队管理层出现了较大规模的调整。

据了解,苹果公司的声学小组拥有约 300 名成员,为 AirPods、HomePods 和其他苹果设备开发音频技术。该团队负责创建空间音频,即 AirPods、Vision Pro 和其他设备内置的 3D 音效功能。据去年 12 月报道,当月苹果产品设计副总裁 Tang Tan 离职,而他还负责监督配件设计和开发 AirPods 的声学团队,因此他的离职牵动了苹果硬件业务的连锁反应。(@IT 之家)

4、传言称苹果 Vision Pro 主要人员已被调往可折叠 iPhone 开发团队工作

2 月 20 日消息,早前有传言称,苹果已经停止了可折叠 iPhone 的研发工作,因为显示屏的耐用性存在问题。现在,有最新消息称,这家科技巨头依然正在积极开发这款设备,而且实际上已经重新指派了苹果 Vision Pro 团队的一些关键人员来开发这种新的外形。

一位接近苹果内部计划的人士向 Alpha Biz 透露,该公司正在积极努力推出可折叠 iPhone。这位不愿透露姓名的人士还提供了该产品的预计上市时间表,同时提到苹果 Vision Pro 的主要成员已被指定参与该设备的开发。

「据我所知,大量 Vision Pro 核心人员已经被调往可折叠手机开发团队,用于开发可折叠手机。除非情况有变,否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)

5、谷歌 Gemini Advanced 更新,可直接在线编辑和运行 Python 代码

2 月 20 日消息,根据谷歌官方更新公告,Gemini Advanced 订阅用户可直接在 Gemini 界面中编辑和运行 Python 代码,从而帮助开发者快速验证实验代码,确保代码可预期运行,而且可以立即查看代码修改后的结果。

谷歌于 2 月 8 日宣布将 Bard AI 聊天机器人更名为 Gemini,并推出专门的安卓 App,其中搭载 Gemini Ultra 1.0 模型的版本需要注册 Gemini Advanced 订阅,其在逻辑推理、执行指令、编程和创意协作等方面更胜一筹。此次新功能目前仅适用于 Gemini Advanced 高级用户,Gemini 免费版本不可用。

根据谷歌的说法,这项功能可主要用于以下两方面:一是学习,有志于成为程序员的人可以使用 Gemini 试验代码片段,观察修改的影响,并更深入地理解编码原理。二是验证,开发人员可以使用 Gemini 快速验证 AI 生成的 Python 代码的功能,然后再将其集成到他们的项目中。(@IT 之家)

6、微软发布 Visual Studio 2022 17.10 首个预览版更新:改进 GitHub Copilot、自动安装推荐组件

据微软官方新闻稿,微软目前发布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改进了 GitHub Copilot,并对设置、扩展组件等方面进行了一系列更新。微软宣称,GitHub Copilot 在 Visual Studio 2022 17.10 中从 “聊天机器人” 升级到了 “开发伙伴”,在该版本中,Copilot 能够 “更好地从项目中收集信息”,进一步为开发者当前的开发环境提供更有意义的答案,同时开发者还能够直接在项目中与 Copilot 互动并获取建议,并 “轻松获取生成式 AI 应用开发建议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言:已实现 4 个

2 月 20 日,在接受采访时被问到现在怎么看年初提出的 AI 十大预言时,周鸿祎回应称已经实现 4 个了。分别是开源大模型爆发、大模型运行在终端、文生图和文生视频取得突破性进展、多模态成为大模型标配。周鸿祎认为,特别是 Sora 的出现让他感到很意外,发展得很快。

十大预测分别是:大模型无处不在,成为数字系统标配;开源大模型爆发;"小模型"涌现,运行在更多终端;大模型企业级市场崛起,向产业化、垂直化方向发展;Agent 智能体激发大模型潜能,成为超级生产力工具;2024 年是大模型应用场景之年,To C 出现杀手级应用;多模态成为大模型标配;文生图、文生视频等 AIGC 功能突破性增长;具身智能赋能人形机器人产业蓬勃发展;大模型推动基础科学取得突破。(@ 中国企业家杂志)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册