大家好~这是 Voice Agent 学习笔记系列的第二十八篇。我是课代表十三👩‍💻。

在刚刚过去的 Google I/O 开发者大会上,Google 展示了其在人工智能领域的最新进展。从升级搜索引擎到推出生成式内容工具,再到硬件的更新,Google 正以惊人的速度将 AI 全面融入其生态体系。

大会上,Google 发布了多个实时多模态新品,包括支持音视频输入的多模态模型 Gemma 3n 、升级主动音视频功能的 Gemini Live API 、支持实时双语翻译配音的 Google Meet 、最新版 Project Astra ……这些都预示着未来交互体验的巨大变革。

早在今年 4 月,Google 就已发布了 601 个世界领先企业的生成式 AI 案例。这些案例覆盖了 11 个行业以及 6 种 AI 智能体类型。

我们从这 601 个案例中,邀请 Gemini 为我们挑出 39 个涉及实时互动的项目,并分析了其未来在 RTE 与 AI 融合发展方面的潜在可能性 ,希望可以给你带来一些新的视野和思考。Enjoy~

一、汽车与物流 Automotive & Logistics

大陆集团携手 Google Cloud 为汽车提供车载语音指令系统

1.大陆集团:车载语音指令系统

大陆集团(Continental) 正借助 Google 的数据和 AI 技术,致力于开发更安全、高效且以用户体验为中心的汽车解决方案。 这次合作的首批成果之一,是将 Google Cloud 的对话式 AI 技术集成到 Continental 的车载语音指令系统 Smart Cockpit HPC 中。

RTE+AI 潜在场景:

2.大众汽车:myVW 应用虚拟助手

大众汽车(Volkswagen of America) 在 myVW 应用中集成了一款虚拟助手,方便驾驶员查阅车主手册并解答疑问,例如「如何更换轮胎?」或「数字仪表盘上的这个指示灯代表什么?」此外,用户还可以利用 Gemini 的多模态能力,通过智能手机摄像头对准仪表盘,即可获取关于指示灯的详细信息和相关背景知识。

RTE+AI 潜在场景:

3.704 Apps:守护乘车出行安全的情绪检测 APP

704 Apps 公司 致力于为最后一公里运输领域开发应用程序,每天连接着成千上万的司机和乘客。在行程期间,车内人员对话的音频内容会被发送到 Gemini AI 模型,以测量乘客的情绪「温度」。该工具能够将「抢劫」、「袭击」、「绑架」等特定词语归类为具有敌意,从而生成警报,以便在危险情况发生之前预先采取措施。

RTE+AI 潜在场景:

4.Nuro:AlloyDB 加持的自动驾驶解决方案

Nuro: 一家自动驾驶公司,利用 AlloyDB 的向量搜索功能,提升其自动驾驶车辆对道路上各类物体的识别和分类精度。

RTE+AI 潜在场景:

二、商业和专业服务 Business & Professional Services

Nowports 正利用 AI 技术革新物流行业

1.埃森哲:AI 赋能的零售虚拟助手

埃森哲(Accenture) 正致力于改造一家大型零售商的客户支持体系,通过部署虚拟助手,提供便捷的自助服务选项,从而提升整体客户体验。

2.Quom:AI 驱动的金融普惠解决方案

Quom 是墨西哥一家专注于金融普惠的公司,他们开发了基于 AI 的对话式智能客服,旨在优化用户和客户支持体验,并提供个性化服务。

RTE+AI 潜在场景:

3.Juganu:智慧城市/商店 SaaS 服务

Juganu 是一家专为智慧城市和智慧商店提供 SaaS 服务的公司,致力于使用 Google Cloud 实现实体店自动化和数字化。该公司已着手开发数字孪生技术,使零售商能够通过虚拟视角管理门店,从而助力自动完成日常任务,提升运营效率,并为顾客带来更优质的体验。

RTE+AI 潜在场景:

4.Nowports:智慧物流解决方案

Nowports 正利用 AI 技术革新物流行业,力求在竞争中脱颖而出。他们通过分析关键运营数据,旨在精准预测市场动态,从而优化整个供应链流程。

RTE+AI 潜在场景:

三、金融服务 Financial Services

Nowports 正利用 AI 技术革新物流行业

1. Contabilizei:金融服务 AI 解决方案 The Concierge

Contabilizei 正利用基于 Vertex AI 平台的 AI 解决方案「The Concierge」,提升巴西金融服务行业的客户服务水平。该平台借助 Vertex AI Search 和 Model Garden 等工具,能够提供快速且个性化的客户响应。

RTE+AI 潜在场景:

2.Albo :利用 AI 技术革新客户服务和金融教育模式

Albo 正在利用 AI 技术,革新墨西哥的客户服务和金融教育模式。这家新兴数字银行通过优化流程,实现了更快捷高效的客户响应,并为传统金融服务覆盖不足的用户群体,提供金融知识普及工具。

RTE+AI 潜在场景:

3.Discover Financial :AI 虚拟助手

Discover Financial 开发了由生成式 AI 驱动的 Discover 虚拟助手。该助手不仅能直接为客户提供帮助,还能向 Discover 的客服人员提供补充信息,从而在客户偏好的任何渠道上,提供更流畅、高效且更令人满意的互动体验。

RTE+AI 潜在场景:

四、医疗保健与生命科学 Healthcare & Life Sciences

墨西哥健康初创公司 Clivi 与 Google 合作构建个性化健康监测平台

1.Clivi :个性化健康监测平台

Clivi 是一家墨西哥健康科技初创公司。他们与 Google Cloud 合作,构建了一个 Gen AI 平台,该平台能够对患者进行个性化和持续监测,从而提供定制化的响应方案、提升医疗服务的质量和覆盖范围,并减少并发症的发生。

RTE+AI 潜在场景:

2.Amigo Tech:智慧医疗平台 Amigo Intelligence

Amigo Tech 推出了基于 Google AI 技术的 Amigo Intelligence 平台,旨在自动化医疗流程、降低运营成本,并提升诊所和医疗机构的效率。 该解决方案集成了病史自动采集、高级检查分析、以及医疗 AI 聊天机器人等工具,从而变革了医疗管理模式。

RTE+AI 潜在场景:

3.拜耳:流感疫情预警与响应解决方案

拜耳(Bayer) 利用 BigQuery 中的生成式 A 构建了一个数据代理,用于预测流感疫情爆发。该代理结合了 Google 搜索趋势数据和拜耳的内部数据,从而实现基于实时数据和特定地理位置的医疗保健规划。

RTE+AI 潜在场景:

4.Probrain :个性化听觉训练解决方案

Probrain 提供个性化的听觉刺激训练服务。通过部署基于云端的 Gen AI 解决方案,该公司实现了服务模式的现代化升级,并大幅降低了约 89% 的运营成本。最终用户也因此受益,享受了近 50% 的费用节省。

RTE+AI 潜在场景:

五、酒店与旅游 Hospitality & Travel

BrushBuck Wildlife Tours 与 Google 合作追踪季节性动物的迁徙路线

1.Hotelplan Suisse:智能旅行 AI 聊天机器人

Hotelplan Suisse 构建了一款聊天机器人,并基于公司深厚的旅行专业经验对其进行了训练,使得该机器人能够实时回应客户问询。继此举取得成功后,该公司计划使用生成式 AI 打造旅行相关内容。

RTE+AI 潜在场景:

2.棒约翰:披萨界的智能需求预测工具

棒约翰(Papa John’s) 披萨连锁店正在利用 BigQuery、Vertex AI 以及 Gemini 模型,构建预测工具,以更准确地预测顾客在应用程序中的订单需求。该公司还计划优化会员忠诚度计划,并提供更具个性化的营销活动。 同时,棒约翰还计划开发一款 AI 驱动的聊天机器人,以辅助处理顾客订单。

RTE+AI 潜在场景:

3.六旗主题公园:智能游园助手

六旗主题公园 打造了一个行业领先的数字化助手,能够解答游客的疑问,并协助他们规划行程。六旗还将借助 Google Cloud 在人工智能、数据分析和基础设施方面的强大能力,在旗下各主题公园中优化运营管理,提升个性化服务水平,从而全面改善游客体验。

RTE+AI 潜在场景:

4.BrushBuck Wildlife Tours:智能观光方案

BrushBuck Wildlife Tours 公司利用 Google Sheets 中的 Gemini 模型追踪季节性动物的迁徙路线,确保每一位游客都有机会在怀俄明州欣赏到令人惊叹的野生动物景观。

RTC 潜在性:

六、工业制造和电子 Manufacturing, Industrial & Electronics

三星 Ballie 球形机器人标志着 AI 从工具向「生活伴侣」的范式转变

1.三星:家庭伴侣机器人 Ballie

三星(Samsung) 在其备受瞩目的全新家庭伴侣机器人 Ballie 中应用了 Google 的生成式 AI 技术。Ballie 将能够通过自然流畅的对话方式与用户互动,协助管理家庭环境,包括调节灯光、迎接访客、定制个性化日程安排、设置提醒事项等等。

RTE+AI 潜在场景:

2.Copel:电力公司 AI 智能体

巴西大型电力公司 Copel 基于 Gemini Pro 1.5 开发了一款 AI 智能体。该智能体能够与公司内部部署的 SAP ERP 系统进行交互,员工可以使用自然语言提出各种问题,从而简化信息查询流程。

RTE+AI 潜在场景:

3.拜耳作物科学公司:智能农业监控平台 Climate FieldView

拜耳作物科学公司(Bayer Crop Science) 开发了 Climate FieldView,这是一个全面的农业平台。它整合了超过 250 层数据以及数十亿个数据点,并利用人工智能提供建议,帮助农民优化田地设计和监控,从而提高产量和施肥效率。此外,该平台还有助于减少碳排放。

RTE+AI 潜在场景:

七、传媒和游戏 Media, Marketing & Gaming

AI 视频平台 Synthesia 正在利用 Google Cloud 构建下一代先进的 AI 模型,更逼真地复制人类形象和声音

1.金州勇士队:个性化球赛观赛解决方案

金州勇士队(The Golden State Warriors) 将其所有数据整合到 BigQuery 统一数据平台中,以便该球队能够利用 Vertex AI 构建内容推荐引擎,为球迷提供相关且个性化的内容,包括实时比赛精彩片段、比分和统计数据,以及关于最新门票销售或其他娱乐活动的提醒。

RTE+AI 潜在场景:

2.彭博社:智能博物馆语音导览

彭博社(Bloomberg) 利用 Gemini 技术创建沉浸式语音导览,从而提升博物馆对视障人士的无障碍体验。

RTE+AI 潜在场景:

3.Synthesia:个性化形象定制的 AI 视频平台

Synthesia 是一家运营 AI 视频平台的初创公司,该公司正在利用 Google Cloud 构建下一代先进的 AI 模型,这些模型能够逼真地复制人类形象和声音。此外,Synthesia 还在使用 Gemini 模型,以高速和高精度处理复杂的视觉和语言任务。

RTE+AI 潜在场景:

4.Formula E:赛车数据监测智能体

赋能车手的实时决策平台

Formula E 开发了其车手智能体(Driver Agent),这是一个由 Vertex AI 和 Gemini 驱动的 AI 工具。Driver Agent 旨在分析比赛期间产生的大量多模态数据,并为车手提供可操作的见解。

RTE+AI 潜在场景:

八、公共服务与非盈利组织 Public Sector & Nonprofits

Bower 将 AI 集成于服务中鼓励用户进行回收

1.Beyond 12:大学生对话式 AI 辅导工具

Beyond 12 公司在 Gemini 1.0 Pro 的帮助下开发了一款 AI 驱动的对话式辅导工具。该工具旨在服务于来自资源匮乏社区的首代大学生(指家中第一代上大学的学生)。这款 AI 工具能够与学生互动,了解他们的背景和目标,解答疑问,并以个性化的方式评估他们的进展,且不会将他们与他人进行比较。

RTE+AI 潜在场景:

2.Bower:智能回收 APP

瑞典初创公司 Bower 开发了一款应用程序,通过游戏化的方式鼓励用户进行回收,并在北欧和英国地区为用户提供奖励。该公司已将生成式 AI 技术集成到该服务中,以便用户更轻松地识别可回收物品,并将其输入到应用程序中。

RTE+AI 潜在场景:

3.明尼苏达州车辆管理局:智能实时翻译方案

明尼苏达州车辆管理局(Division of Driver and Vehicle Services) 利用双向实时翻译技术,帮助非英语使用者获得驾照和其他相关服务。(客户智能体)

RTE+AI 潜在场景:

九、零售 Retail

美国快餐巨头 Wendy’s 推出 Wendy’s FreshAI 来优化点餐服务

1.BrainLogic:智能购物 AI 助手 Zapia

BrainLogic 在 Vertex AI 平台上使用 Anthropic 的 Claude 模型推出了 Zapia。Zapia 是一款个人 AI 助手,旨在满足拉丁美洲市场对会话式商务的偏好。Zapia 为数百万用户提供产品发现、本地商家搜索和购买辅助等功能,并获得了超过 90% 的积极用户反馈。

RTE+AI 潜在场景:

2.台湾家乐福:AI 侍酒师

台湾家乐福 的 AI 侍酒师是一项集成在其应用程序中的对话式 AI 服务,旨在帮助顾客根据个人喜好选择葡萄酒。该服务由 Gemini 模型驱动,利用庞大的葡萄酒数据库提供个性化的推荐,从而无缝衔接线上和线下购物体验。

RTE+AI 潜在场景:

3.家得宝:家庭装修智能体 Magic Apron

家得宝(The Home Depot) 构建了 Magic Apron,这是一个 AI Agent,可以全天候提供专业指导,包括详细的操作指南、产品推荐和评价摘要,从而简化家庭装修流程。

RTE+AI 潜在场景:

4.Wendy’s:智能点餐解决方案

Wendy’s Fresh AI 将 Gemini 的对话式 AI 能力与音频和视觉元素相结合,为 Wendy’s 的顾客打造高度个性化和定制化的体验,确保体验的一致性和愉悦性。同时,它也让员工能够专注于提供卓越的服务和餐食准备,标志着快餐餐厅的下一个发展阶段。

RTE+AI 潜在场景:

十、技术 Technology

Flockx 致力于通过 AI 技术帮助用户建立真实世界的社交联系

1.Abstrakt:支持情绪识别的智能联络中心解决方案

Abstrakt 公司利用 Vertex AI 技术,通过实时转录通话内容和评估用户情绪,来提升联络中心客户的体验。这使得呼叫中心工作人员能够进行更高效的对话,更快地解决问题,并提供更优质的客户服务。

RTE+AI 潜在场景:

2.Flockx:智能社交解决方案

Flockx 致力于消除人们的孤独感。他们利用基于 Google Cloud 和 Elastic 构建的协作式 AI 代理技术,将个人与各种活动、社群以及志同道合的人联系起来。

RTE+AI 潜在场景:

3.Gojek:智能支付语音助手

Gojek ,总部位于印度尼西亚的超级应用,推出了「Dira by GoTo AI」,这是一款印尼语 AI 语音助手,集成在其 GoPay 服务中。用户可以通过语音指令操作,无需打字和滚动,即可用更少的步骤完成账单支付和转账等任务。

RTE+AI 潜在场景:

十一、电信 Telecommunications

加拿大贝尔公司为其商业客户构建可定制的联系中心解决方案

1.加拿大贝尔公司:可定制的联络中心解决方案

加拿大贝尔公司(Bell Canada) 为其商业客户构建了可定制的联络中心解决方案。该方案提供由 AI 驱动的智能客服,用于接听来电。同时还提供「智能助手」(Agent Assist)功能,该功能在人工客服上线时进行监听,并提供建议和情绪分析。AI 的应用已经为客户运营节省了 2000 万美元的成本。

RTE+AI 潜在场景:

2.意大利电信:AI 语音助手

意大利电信(TIM) 部署了一款由 Google 提供技术支持的语音助手,用于处理大量客户来电,效率提高了 20%。

RTE+AI 潜在场景:

3.巴西电信:客户服务质量优化方案

巴西电信(TIM Brasil) 利用 Google Cloud 的生成式 AI 技术,将客户服务通话录音转录成文本,然后以越来越高的精度对客户需求进行分类、总结和评估。该解决方案可以协助客服人员的工作,并为团队提供关于最佳实践的反馈。

RTE+AI 潜在场景:

原文链接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

课代表留言:感谢 Gemini 对本文脑洞的大力支持🫰期待早日见到 Gemini 老师预判的未来 👀

更多 Voice Agent 学习笔记:

级联 vs 端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨 Voice Agent 学习笔记

a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场丨 Voice Agent 学习笔记

a16z 合伙人:语音交互将成为 AI 应用公司最强大的突破口之一,巨头们在 B2C 市场已落后太多丨 Voice Agent 学习笔记

ElevenLabs 33 亿美元估值的秘密:技术驱动 + 用户导向的「小熊软糖」团队丨 Voice Agent 学习笔记

端侧 AI 时代,每台家居设备都可以是一个 AI Agent 丨 Voice Agent 学习笔记

世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)


↙↙↙阅读原文可查看相关链接,并与作者交流