AI测试 WWDC 苹果发布 AI 全家桶;三星宣布「实时翻译」将兼容第三方 App 丨 RTE 开发者日报 Vol.222

RTE开发者社区 · 2024年06月11日 · 2510 次阅读

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY@JLT,@ 鲍勃

01 有话题的新闻

1、苹果 Apple Intelligence 登场:提智 Siri,帮你管理通知等

6 月 11 日消息,苹果公司在今天召开的 2024 年度 WWDC 全球开发者大会上,正式宣布「苹果智能」(Apple Intelligence),将会为 iPhone、Mac 等设备提供一系列 AI 功能。

  • 帮你操作应用

苹果公司表示,其人工智能功能将能在应用程序中为你做一些事情。它将能够管理你的通知,自动为你写东西,或总结邮件和其他应用程序中的文本。

苹果还表示,它还能做一些事情,比如引用一个应用程序来执行另一个应用程序中的操作,比如让 Apple Intelligence 播放你女友发给你的播客。

  • Siri 变得更加智能

苹果公司表示,在 iOS 18 中,用户将能更自然地与 Siri 对话。新 Siri 可以理解上下文,因此你在随后的请求中不必重复信息。

App Intents 可以让 Siri 与第一方、第三方应用程序深度合作,在屏幕上感知你当前正在查看的内容,并能采取应用内操作。苹果演示了让照片应用编辑你正在查看的图片,Siri 会代表你执行调整。

  • 隐私

该公司表示,其人工智能功能将在设备上处理,以保证信息的私密性。不过,你需要 A17 Pro 或 M 系列芯片才能利用这些功能。此外,「语义索引」(semantic index)也是其中的一部分,它会在需要时获取个人信息,并在各个应用程序中显示出来。

对于需要调用云端的 AI 功能,苹果公司表示会使用「私有云」的,数据永远不会存储在服务器上,苹果公司也表示永远无法访问这些数据。该公司表示,将邀请独立专家来验证苹果的说法是否属实。(@IT 之家)

2、OpenAI 对 AI 语音引擎非常谨慎:可能永远不会被广泛使用

6 月 10 日消息,据外媒报道,几个月内,OpenAI 第二次解释其文本转音频工具,提醒大家该工具尚未广泛使用,也可能永远不会被广泛使用。该公司周五在其网站上发表的声明中表示:无论我们最终是否会广泛部署这项技术,让世界各地的人们了解其发展方向都很重要。这就是为什么我们要解释该模型的工作原理、我们如何将其用于研究和教育,以及我们如何围绕它实施安全措施。

去年年底,OpenAI 与公司外部的一小群用户分享了其语音引擎,该引擎依靠文本输入和 15 秒的人类声音片段来生成听起来与原始说话者非常相似的自然语音。该工具可以用多种语言创建听起来令人信服的人类声音。当时,该公司表示,它选择预览该技术但不会广泛发布,以增强社会韧性,以抵御越来越令人信服的生成模型的威胁。(@ 鞭牛士)

3、本地 AI 运行、支持简中,三星宣布「实时翻译」将兼容第三方 App

三星公司近日发布新闻稿,最新 Galaxy AI 套件中实时翻译(Live Translate)功能将兼容第三方应用程序,意味着用户可以在喜欢的应用中使用基于 AI 的翻译功能了。

实时翻译功能向第三方应用开放,无论是对于普通用户,还是专业用户来说都是好事,可以让用户更好地和外国朋友或商业伙伴保持联系,消除语言障碍。

三星尚未透露有关支持应用程序的更多具体细节。实时翻译功能不需要借助云服务,完全在本地设备上运行,因此用户始终掌控自己共享的数据。(@IT 之家)

4、EOS R7 + 双摄相机镜头可拍 3D 视频,苹果佳能合作共建「空间视频」生态

IT 之家 6 月 11 日消息,在目前正在进行的苹果 WWDC 2024 中,苹果公司宣布与佳能合作,将推出能拍摄 Apple 空间视频格式的「全新空间镜头」,该镜头为「RF-S 7.8mm F4 STM」,号称搭配佳能 EOS R7 相机效果更佳。

IT 之家获悉,佳能此前已经推出 RF5.2mm F2.8 L DUAL FISHEYE 鱼眼镜头,这款镜头国行售价 14399 元,主要用于拍摄 VR 视频,不过目前不得而知该镜头是否兼容相关空间视频模式。(@IT 之家)

02 有态度的观点

1、傅盛评阿里云「最强开源模型」:长远看来,开源大模型能力会超越闭源

近日,阿里云发布开源模型 Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型 Llama3-70B,也超过众多国内闭源大模型。对此,猎豹移动董事长兼 CEO、猎户星空董事长傅盛发视频表示,正当国内某大厂 CEO 说闭源模型的能力将持续超越开源模型时,阿里巴巴刚发布的 Qwen2-72B 开源模型能力已经超越了国内绝大多数闭源模型。

「我们之前一直认为开源大模型和闭源大模型会并驾齐驱,而且长远看来,我认为开源社区的大模型能力会超越闭源,这背后的原因就是开源并不是简单的做雷锋,而是结合自己的商业模式,结合能够形成社区的反馈能力的一套战略部署。」(@ 新浪科技)

2、Pika 团队:打败 Sora 不难,我们的算法能够以小胜大

即使 Sora 已经强势「炸」过场,Pika 还是再次带着硅谷一众明星资方的投票回到了舆论中心。6 月 5 日,Pika 宣布已完成 8000 万美元(约合人民币 5.8 亿元)的 B 轮融资,总融资额达到 1.35 亿美元,较 2023 年末,公司投后估值实现翻倍至 4.7 亿美元。

「我们会更 aggressive 地做视频大模型」,这家刚刚度过一周年生日的视频生成创业公司,计划在这轮融资之后快速扩张研究和工程师团队。(@ 机器之心)

3、马斯克怒喷苹果与 OpenAI 的合作:考虑禁止苹果设备进入我的公司

苹果宣布与 OpenAI 合作,将 GPT-4o 功能集成到苹果设备中。对此,马斯克表示强烈不满,认为这将构成安全风险,考虑禁止苹果设备进入他的公司,并要求使用苹果设备的人员在入口处接受检查,存放设备于法拉第笼中。

他还批评苹果无法自主开发 AI,却声称能确保 OpenAI 保护用户安全和隐私,认为这是出卖用户的行为。(@ 腾讯科技)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册