AI测试 OpenAI 展示音频模型 Voice Engine;清明节前 AI 复活亲人成热门生意丨 RTE 开发者日报 Vol.175

RTE开发者社区 · 2024年04月01日 · 1457 次阅读

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY@JLT,@ 鲍勃

01 有话题的新闻

1、OpenAI 首次展示音频模型 Voice Engine,15 秒即可复制原音

3 月 30 日凌晨,OpenAI 在官网首次展示了全新自定义音频模型「Voice Engine」。用户只需要提供 15 秒左右的参考声音,通过 Voice Engine 就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外,OpenAI 还展示了 Voice Engine 很多其他商业用途,例如,一位失去声音表达能力的女孩,在 Voice Engine 帮助下能像以前一样正常发音说话。(@ 财联社)

2、不止去中国化,戴尔彻底离开俄罗斯,中企顶上

3 月 31 日消息,俄乌冲突之后,美国科技企业基本都退出了俄罗斯、白俄罗斯市场,但现在,不少企业连仅存的服务支持都切断了。据悉,惠普正式关闭了俄罗斯官网。目前,俄罗斯用户打开惠普官网,会被跳转到哈萨克斯坦官网,因为两国语言相通。

俄罗斯用户已经无法得到惠普的官方在线支持,不过仍旧可以从哈萨克斯坦官网下载惠普打印机、笔记本等产品的驱动。在此之前,惠普已经关闭了白俄罗斯官网,同样会被跳转到哈萨克斯坦官网。惠普已于 2022 年彻底结束了在俄罗斯、白俄罗斯的业务,也放弃了 10 亿美元的年收入。

外媒指出,惠普退出俄罗斯市场之后,中国企业填补了大量空白,比如打印机,中国奔图的份额已经从 2022 年前的 16%暴涨到如今的 53%。有趣的是,爱普生的份额也增加了 22.1%,其还保留着俄罗斯官网和支持服务。(@ 快科技)

3、马斯克发布 Grok 1.5,上下文处理长度比肩 GPT-4

伊隆·马斯克旗下的人工智能初创公司 xAI 宣布正式推出 Grok-1.5。

根据官方介绍,对于上下文窗口,Grok-1.5 直接提升到了之前的 16 倍,增长到 128k,和 GPT-4 齐平。这意味着 Grok-1.5 可以处理更长和更复杂的提示,同时保持其遵循指令的能力。

Grok-1.5 最大的改进之一是处理编程和数学相关任务的能力大幅提升,全面超越 Grok-1、Mistral Large、Claude 2。(@ 快科技)

4、微软和 OpenAI 计划投资 1000 亿美元打造星际之门超级计算机

据科技媒体《The Information》援引消息人士信息称,微软和 OpenAI 正密切规划一个雄心勃勃的数据中心项目,旨在建造一台名为「星际门」(Stargate)的 AI 超级计算机。该计算机将配备数百万个专用服务器芯片,旨在为 OpenAI 的 AI 技术提供强大动力。

据悉,该项目预计耗资高达 1000 亿美元,这是目前一些最大数据中心成本的 100 倍。微软将承担项目的资金投入,展现了其对推动 AI 技术发展的坚定信心。「星际门」将是未来六年内公司计划建造的最大项目之一。(@ 华尔街见闻)

5、清明节前 AI 复活亲人成热门生意:几十元到上百元不等

随着清明节的脚步日益临近,思念亲人的情感愈发浓烈,而近日,一项名为「AI 复活」的服务在市面上引起了热烈讨论。这一创新业务,通过利用人工智能技术,让逝去的亲人仿佛再次回到我们身边,成为了市场的热门话题。

据悉,目前「AI 复活」业务已经形成了完整的产业链。有专门的代理机构负责发布相关视频,吸引潜在客户的关注;而制作团队则负责根据客户的需求,制作高度逼真的数字人形象。据业内人士透露,仅一个月的时间,他们便能接到多达 70 余单的订单,市场需求之大令人咋舌。这也反映出人们对于逝去亲人的思念之情,以及对于新技术应用的渴望。

在各大电商平台上,已有不少商家推出了「AI 复活」服务。他们承诺,只需提供一张亲人的照片和一段录音,便能制作出高度相似的数字人形象。服务价格因不同商家的定价策略而有所差异,从几十元到上百元不等。更令人惊讶的是,有些高端服务甚至声称能够实现声音和外貌的 95% 以上相似度,但相应的价格也较为昂贵,从数千元到数万元不等。(@ 站长之家)

02 有态度的观点

1、Mistral CEO:五年后,任何人都能创建 AI 自主代理,开发者与用户界限变得模糊

Mistral 创始人 Arthur Mensch 表示,未来 5 年,AI 将向更加自主的智能体 Agent 和助手发展,能完成越来越多复杂任务,制作这样的智能体将变得越来越容易。AI 技术将通过自然语言交互得以广泛控制和使用,到一定程度时,开发者与用户的界限将变得模糊,普通用户也能创建定制的 AI 助手工具。

另外,AI 部署将趋向于更多状态化的形式,与数据和上下文紧密关联,而非当前的无状态 API 调用模式,状态数据可能存储在数据云平台中。未来几年,LLM 领域可能还将出现一些协调和整合,尤其是在开源模型方面,以利于全行业发展。

从当前到未来,LLM 将呈现从小型模型到超大型模型的全尺寸覆盖,以平衡不同场景下的延迟和能力需求。评估 LLM 表现、持续改进模型,以及自动化提示工程将是亟待解决的痛点,需要 AI 技术自身来帮助解决。(@ 有新 Newin)

2、周鸿祎自称开源信徒:宣布将开源 360 智脑 7B 模型,支持 50 万字长文本输入

360 创始人 @ 周鸿祎近日透露即将开源 360 智脑 7B(70 亿参数模型),支持 360k(50 万字)长文本输入。周鸿祎表示,前段时间大模型行业卷文本长度,100 万字「很快将是标配」。「我们打算将这个能力开源,定为 360k 主要是为了讨个口彩。」他还自称「开源的信徒」,信奉开源的力量。

据介绍,360 智脑长文本能力已入驻大模型产品「360AI 浏览器」。周鸿祎还谈到了小模型的优势:其认为小模型速度快、用户体验也好,单机单卡就能跑,具备更高的性价比。(@IT 之家)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册