AI测试 最强国产 Sora 大模型 Vidu 发布,长度可达 16 秒;微信文件 3 小时内可撤回丨 RTE 开发者日报 Vol.194

RTE开发者社区 · 2024年04月28日 · 2543 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY@JLT,@ 鲍勃

01 有话题的新闻

1、清华团队国产「Sora」火了!画面效果对标 OpenAI,长度可达 16 秒

生数科技和清华大学联合发布了新的 AI 视频生成模型「Vidu」,该模型可以一键生成长达 16 秒、分辨率达 1080p 的高清视频内容。Vidu 在多镜头语言、时间和空间一致性、遵循物理规律等方面表现出色,能够产生非常逼真的超现实主义画面。

同时,Vidu 还具有丰富的想象力,能生成现实世界中不存在的画面,为创作超现实主义内容提供了新的可能。全新技术突破仅用了两个月时间,迅速实现。(@ 量子位)

2、首个纯电驱拟人奔跑机器人「天工」发布

4 月 27 日,北京人形机器人创新中心在北京亦庄举办了「天工发布会」,发布了自主研发的通用人形机器人母平台「天工」。

据介绍,「天工」身高 163 cm,轻量化体重达 43kg。同时,机器人配备多个视觉感知传感器,配备每秒 550 万亿次操作算力,并配备高精度的惯性测量单元( IMU )和 3D 视觉传感器。

在发布会上,「天工」还展示出对复杂环境更强的适应性,在行走及奔跑时更快速、更拟人,已实现 6km/h 的稳定奔跑。并且,在盲视情况下「天工」能够平稳通过斜坡和楼梯,对磕绊、踏空等情况也可以做到步态的敏捷调整。(@ 爱范儿)

3、中国自研脑机接口「北脑二号」问世:已植入猕猴大脑 达世界领先水平

4 月 27 日消息,近日,「北脑二号」智能脑机接口系统正式发布,填补了国内高性能侵入式脑机接口技术的空白。

在动物实验中,在颅内植入一片牵着柔软细丝的小小薄膜,绑住双手的猴子就能仅用「意念」控制机械臂,抓住「草莓」。

据介绍,与半侵入式采集脑皮层电信号的「北脑一号」系统不同,此次发布的「北脑二号」采用侵入式采集单神经元电信号,将电极植入猕猴大脑,大幅提升信号采集与解码的精准性。

「北脑二号」的高性能,归功于我国自研的 3 个核心组件:高通量柔性微丝电极、千通道高速神经电信号采集设备两个硬件,以及基于前馈控制策略的生成式神经解码算法。

「北脑二号」应用的算法也是国内自研,能在大脑皮层神经活动与运动参数之间建立精确映射。(@ 快科技)

4、 rabbit r1 AI 产品首批交付,表现好过 AI Pin

rabbit r1 AI 产品首批交付,得到了一致性评价,其表现好过 AI Pin,却同样无法符合 AI 硬件的救世主期待。

r1 凭借良好的用户体验和唯美的设计引人关注,它以 AI 操作系统替代手机用户与手机 app 的交互方式,适合在各种场景下使用。

但是,它仅支持云端服务,且只支持四个外部服务:Spotify、Uber、DoorDash 和 Midjourney,对于用户的隐私问题也存在疑虑。创始人吕骋表示 r1 并非取代手机,而是与手机形成互补。(@ 爱范儿)

5、阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。(@ CSDN)

6、微信官方回应消息撤回时限:常规消息 2 分钟、文件 3 小时

4 月 27 日消息,网络上关于微信撤回的传闻很多,有人说 2 分钟可撤回、有人说 5 分钟可撤回,甚至还有人说 3 小时可撤回。微信官方对此进行了详细的回应,其实上述说法从各自的角度来说都是正确的。

微信派最新发布视频介绍,常规消息 2 分钟内可以撤回,如文字、语音、表情包、图片等。其中,文字消息撤回后 5 分钟内可重新编辑,无需重新输入,让用户修改更方便。而文件内容则支持 3 小时撤回,如 Word、Excel、PPT 等。所有消息撤回之后,对方都会看到相关提醒,提示对方撤回一条消息。

对于为何撤回之后要提醒对方,腾讯此前曾表示,如果在一些商务谈判或借贷等特定场合,撤回信息无文字提示,可能会导致一方出现利益受损的情况。(@ 快科技)

02 有态度的观点

1、印度塔塔咨询:AI 将取代客服岗位

印度 IT 公司塔塔咨询服务公司的负责人 K Krithivasan ,在接受英国《金融时报》采访时表示,人工智能有可能会在一年内影响到客服岗位。

他认为,跨国客户更广泛地采用生成式 AI ,将会彻底改变在印度和菲律宾等国家创造大量就业机会的客户服务中心。

同时, K Krithivasan 在采访中还称,在理想情况下, AI 可以预测来电,主动解决客户的痛点。(@ 爱范儿)

2、OpenAI CEO 最新演讲:GPT-5 性能远超 GPT-4,保持迭代部署很重要

近日,OpenAI 联合创始人兼首席执行官萨姆·奥尔特曼(Sam Altman)在斯坦福大学发表演讲,提及 AGI(通用人工智能)发展、OpenAI 的迭代节奏等。有消息称,这场演讲在英伟达礼堂进行,超一千人在门口排队,热度颇高。“GPT-5 会更加智能,这将是历史上最令人瞩目的事件之一。”

在一段流出的视频中,奥尔特曼表示,以高度的科学确定性来说,GPT-5 将比 GPT-4 智能很多,GPT-6 将比 GPT-5 智能很多,而我们远未触及极限。此前 OpenAI 已推出 GPT-3.5 和 GPT-4。对于 OpenAI 的产品迭代,奥尔特曼认为尽早且频繁推出 AI 产品,保持迭代部署非常重要,即便现在看来 ChatGPT 还有点令人尴尬,GPT-4 还显得愚蠢。要让社会为技术进步做好准备,依赖于迭代部署。(@ 第一财经)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册