AI测试 Hume.ai 升级:自研情感模型集成 Claude 和 Fal;数字嗅觉公司 Osmo 用 AI 实现气味「传送」

RTE开发者社区 · 2024年11月05日 · 102 次阅读

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@SSN,@ 鲍勃

01 有话题的新闻

1、消息称马斯克正与英伟达就 xAI 投资事宜进行谈判

据 New York Post 报道,知情人士称,芯片巨头英伟达正在与埃隆・马斯克就对 xAI 的潜在投资进行谈判。

xAI 是马斯克创立的人工智能公司,其开发的大语言模型 Grok 目前已部署在社交媒体平台 X 上。虽然 Grok 的推出时间晚于 OpenAI 的 ChatGPT 等竞争对手,但其增长和发展速度非常快。

尽管英伟达尚未就潜在投资 xAI 一事置评,但其首席执行官黄仁勋一直非常支持马斯克的人工智能初创公司。在 10 月份的一次采访中,黄仁勋指出,xAI 团队仅用 19 天就建立了一个拥有 10 万个 H200 Blackwell GPU 的超级计算机集群。黄仁勋表示,这样的项目通常从概念阶段到最终产出需要四年的时间。「据我所知,世界上只有一个人能做到这一点;埃隆对工程、建设、大型系统和资源调配的理解是独一无二的,这简直令人难以置信。」黄仁勋指出。(@IT 之家)

2、远程「闻」香,数字嗅觉公司 Osmo 用 AI 技术实现气味「传送」

一家名为 Osmo 的「数字嗅觉」公司宣布,已成功利用 AI 技术分析一个位置的气味,并在无需人工干预的情况下在其他地方复制它。

气味隐形传态使用传感器收集气味,并通过气相色谱质谱仪(GC / MS)进行分析。然后,数据被传输到专门的分子打印机,它可以合成和组合精确再现气味所需的化学物质。Osmo 之前曾进行过气味隐形传送,不过需要人工帮助,如今利用 AI 实现了自动化。

据介绍,Osmo 已成功利用 AI 将处理后的气味映射到其主要气味图(POM)上,该数据库可预测分子的特定组合如何与特定气味相对应。然后,AI 模型可以将气味的分子特征传达给机器人系统,以创建和混合香气的复制品。
该公司已成功利用 AI 合成了「新鲜的夏季李子」气味,Osmo 首席执行官 Alex Wiltschko 在 10 月 30 日宣布了这一消息。(@IT 之家)

3、字节跳动内测新款 AI 模型分享社区——「炉米 Lumi」亮相

字节跳动近日悄然上线了一款名为「炉米 Lumi」的 AI 模型交流社区,该社区集模型分享、Workflow 构建及 LoRA 训练等多元化功能于一身。在这个平台上,用户不仅可以展示自己研发的 AI 模型,还能与其他同好进行深入交流,共同搭建完善的 AI 工作流程。

尽管「炉米 Lumi」当前仍处于内测阶段,并未在主流搜索引擎中公开露面,但已有部分用户通过特定网址「artistrylab.net」探寻到了这个神秘社区的踪迹。不过,尝试访问的用户可能会遇到扫码登录后提示无权限的情况,显示该平台仍在严谨地控制访问权限。

据悉,「炉米 Lumi」社区为 AI 爱好者们提供了一个全新的互动空间。在这里,他们可以自由地分享自己的 AI 创作,探索模型的无限可能,并借助社区的力量不断优化和完善自己的作品。同时,该平台还提供了丰富的工具和资源,帮助用户更高效地进行 AI 模型的开发和训练。(@ 极客公园)

4、颠覆视频编辑!开源神器 ComfyUI-MochiEdit 支持视频转视频,局部编辑

像操控文字一样编辑视频的情景一般都出现在人们的想象里,现在这个想法已经成为现实。

ComfyUI-MochiEdit 是一款基于 ComfyUI 和 Genmo Mochi 的开源视频编辑工具,它提供了一种全新的视频编辑思路:将视频转换为噪声,再通过目标提示重新采样噪声,生成全新视频。这种方法实现了局部编辑和视频转视频功能,让用户可以轻松修改视频的部分而无需处理整个视频。(@AIbase 基地)

5、Hume App 全新升级:EVI 2 语音技术引领 AI 助手新体验

多功能 AI 助手平台, 提供个性化的语音交互体验, 覆盖从快速问答到深度咨询的全方位服务

技术亮点

  • A. 自研核心 - EVI 2 语音语言模型

-可独立生成语言内容

-为 AI 助手提供独特声音和个性

-具备情感化表达能力

-能将其他 LLM 的文本响应转化为富有表现力的对话

  • B. 技术集成

-Anthropic Claude 系列模型(3.5 Haiku 和 Sonnet 版本)

-网络搜索能力

-fal 的图像生成技术

功能场景划分

- A. 快速问答

-技术组合:EVI 2 + Claude 3.5 Haiku + 网络搜索

-特点:实时性强, 响应快速准确

  • B. 故事讲述

-技术组合:纯 EVI 2 + fal 图像生成

-特点:注重情感表达和戏剧化效果

-配合图像增强叙事体验

  • C. 深度对话与生活建议

-技术组合:EVI 2 + Claude 3.5 Sonnet + 网络搜索

-特点:提供更深度的思考和建议

  • D. 情感支持

-贯穿各个场景的基础功能

-通过 EVI 2 的表达能力提供情感共鸣

Hume App:
http://app.hume.ai

Developer:
https://platform.hume.ai@( Mengshao@X)

02 有态度的观点

1、微软 AI 负责人:情商对 AI 来说也很重要

微软 AI 部门的首席执行官 Mustafa Suleyman 在最近的一场对谈活动中,谈到了他对于 AI 技术的不少见解。

Suleyman 曾经也是 AI 初创公司 Pi 的联合创始人,这家公司强调「人性化」的 AI 产品。主持人就此向 Suleyman 提问,对于 AI 技术来说,情商意味着什么?

Suleyman 回答称,研究人员在不断推进 AI 的「智商」进步,却往往忽略了同样重要的信息传达方式。Suleyman 认为仅仅只是把事实列出是一个非常「书呆子」的事情。

AI 模型的语气、风格、情商,以及对特定语气的特别反馈,在 Suleyman 眼中,比维基百科式单纯罗列客观事实,对消费者来说更重要。

Suleyman 对未来如何设计 AI 的个性非常感兴趣,认为这才是人们真正会发现价值的东西。(@ APPSO)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册