AI测试 引爆 AI 会议工具潮流,Granola 打造 2.5 亿美元估值产品的秘密丨 Voice Agent 学习笔记

RTE开发者社区 · 2025年07月31日 · 215 次阅读

以下文章来源于 yikai 的摸鱼笔记,作者 yikai

大家好~这是 Voice Agent 学习笔记系列的第 36 篇。我是课代表十三👩🏻‍💻。

本期学习笔记的内容来自小宇宙播客节目《跨国串门儿计划》。这是一档使用 AI 技术将英文播客翻译成中文播客,并保留嘉宾原有声线的节目。用中文听英文播客,扫码感受神奇体验!

Granola 是一款利用 AI 整理和总结会议纪要的工具,凭借其新颖的交互方式在短时间内迅速成为科技、销售、招聘等多个领域专业人士的必备应用。今年 5 月,Granola 宣布完成 4300 万美元的 B 轮融资,估值达 2.5 亿美元。

近期,Granola 的两位联合创始人 Chris Pedregal 和 Sam Stephenson 作为嘉宾参与了播客光速创投(Lightspeed Venture Partners)的录制。在访谈中,他们分享了他们从线上论坛相识到共同创业的经历,并阐述了 Granola 成功的核心秘诀:为高压工作状态下的用户设计极致简洁的「蜥蜴脑」产品。

所谓「蜥蜴脑」,是指人在高压、疲惫或分心状态下,大脑只能进行最基本、最直接的反应。Granola 正是聚焦于这一用户痛点,在产品设计上专注于满足用户最基本的需求。

他们还详细阐述了在技术飞速迭代时「有所为,有所不为」的战略智慧,以及 Granola 如何从一个会议工具,逐步演变为整合所有工作信息的「超级工作空间」的宏大蓝图。

期待这篇文章能对你有所启发!Enjoy~

使用 Granola 打造高效的会议体验

Making Meetings More Effective with Granola

主持人:Michael Mignano,Lightspeed 合伙人嘉宾: Chris Pedregal & Sam Stephenson, Granola 联合创始人

创业源起:从「思维工具」到解决真实痛点

Michael Mignano: 能否请你们先介绍一下 Granola 这款产品和公司?你们俩是如何开始合作,并走到今天这一步的?

**Chris Pedregal:** 故事要从三年前说起。我刚从 Google 辞职,一心想在伦敦创业。当时 GPT-3 的指令微调版刚推出,我立刻被它的能力震撼到了。我一边研究,一边寻找合伙人。我明确了两点:第一,我需要一个懂模型训练的技术合伙人;第二,我需要一个对 AI 原生产品用户界面有深度思考的设计合伙人。

于是我开始逛一些「思维工具」(Tools for Thought)论坛。所谓思维工具,是指那些能扩展人类思考能力的工具,从语言、书写到数学符号。每一次工具的进步都极大地扩展了人类的能力,而 我认为 AI 就是思维工具的终极加速器 。就在一个线上交流会中,我发现了 Sam 的资料,给他发了邮件,我们就这样联系上了。

Sam Stephenson: 我们都认为,要想在这个赛道成功,关键在于能否打造出真正优秀的产品体验 。而要做到这一点,就 必须围绕一个非常具体、非常痛的用户问题来设计 。所以我们花了很多时间与各行各业的人交流,了解他们的日常工作和痛点。

我们发现,有一个问题被反复提及,就是那些工作离不开开会和沟通的人。每次会议后都会产生大量后续工作,从简单的整理纪要、发送邮件,到复杂的在 CRM 系统里更新多个字段、触发工作流等等。这正是我们想要解决的问题。

有所为,有所不为:Granola 的 AI 应用层生存法则

Michael Mignano: 大约一年半前,很多人认为在 AI 应用层创业只是给 GPT-4 套个壳。现在大家的热情却空前高涨。你们觉得是什么改变了大家的看法?

Chris Pedregal: 首先,模型本身变得越来越好、越来越快。大家很快意识到,直接使用最前沿的模型远比自己训练更明智。其次,当你的应用场景是专业的生产力工具时,性能和针对特定场景的优化至关重要,这时定制化的工具就比通用工具更有优势。我们现在做的就是有持久价值的事,因为专业的生产力工具永远有其存在的价值。

**Sam Stephenson:我们必须非常谨慎地选择要解决的挑战,清楚在哪些地方该下功夫创新,又在哪些地方只需要等着技术自己变好就行。** 比如 AI 输出的质量、速度和成本,这些我们不做任何事,它自己也会改善。但有些东西,比如用户体验,如果我们不努力,它就永远不会变好。

Michael Mignano: 能举些例子吗?哪些是你们刻意决定不做的,又有哪些是你们认为必须由 Granola 来解决的?

Sam Stephenson: 最典型的例子是多语言支持。产品上线后这是用户呼声最高的需求。但当时的技术现状意味着,做一个好的多语言切换界面需要投入数周甚至一个月。我们判断,市面上有几十家公司都在全力解决多语言实时转录模型的问题。我们选择等待,因为未来的解决方案会比我们当时能做的任何临时方案都好得多。

Chris Pedregal: 另一个例子是上下文窗口的长度。早期产品只能处理三十分钟的会议。我们本可以花大力气做切分处理,但我们选择了等待,结果上下文窗口很快就变大了。还有一个是 RAG(检索增强生成)。

RAG 的基本概念是,当你的信息库(比如所有会议记录)远超模型单次能处理的上下文容量时,你需要通过搜索来挑选一部分信息喂给模型。做一个基础版的 RAG 很容易,但做好很难。然而,随着上下文窗口不断变大,一个反直觉但有效的方法是:把所有相关信息都塞进去。这在工程上似乎很「粗暴」,但 AI 模型比我们想象的要聪明得多,它能发现我们用 RAG 无法捕捉到的深层关联。

商业模式与产品发布:在「跑马圈地」时代实现 PMF

Michael Mignano: 你们是如何考虑 Granola 的商业模式的?在模型之上,应用层有多大机会建立起一个庞大的商业帝国?

Sam Stephenson: 我们思考这个问题的方式和 AI 出现前没有太大区别。归根结底,我们是想做一个有价值的工具,让公司愿意为它付费 。如果我们能在 Granola 里实现网络效应,让团队里用的人越多,产品就越好用,那它本身就会成为一个有价值的信息库。公司愿意为此付费,这和 AI 本身是两码事。

Chris Pedregal: 我们正处在一个「跑马圈地」的时代。很多新产品成为可能,但运营成本高昂。我们清楚,两年后运营这些产品的成本会便宜得多。所以,你必须为未来而构建,然后想办法让公司能撑到那个时候。 如果只为今天优化,那你做的所有决策都会是错的。

Michael Mignano: 你们的发布非常成功,几乎是瞬间就实现了产品市场契合(PMF)。为了那个完美的发布日,你们是如何打造第一个版本的?

Sam Stephenson: 我们花了六到九个月的时间不断实验,寻找一种自然、毫不费力的方式,让用户从会议中提取信息。最终,我们聚焦到一个核心交互上:会议结束时,你输入笔记要点,Granola 会在同一界面上帮你扩充成完整的纪要。找到这个点后,我们砍掉了所有其他功能,只保留这一个核心特性去发布。

在内测阶段,我们用一个叫「点阵图」(dot plot)的图表来观察每个用户每天的使用情况,这帮助我们坦诚地面对现实,确保用户是真的在稳定地使用产品,而不是偶尔尝鲜。

Chris Pedregal: 我们封闭内测了一年,发布时大约有 150 个用户。有趣的是,发布时我其实没觉得产品准备好了,眼里看到的都是问题。但一旦推向世界,它确实触动了很多人的心弦,直到那时我们才真正意识到它的价值深度。

Granola 的「蜥蜴脑」设计:关注用户真正需求,打造极致简洁的产品体验

Michael Mignano: Sam,我听你提到过「蜥蜴脑」这个概念,你能否详细解释一下,你们是如何在产品设计中,关注用户真正需要的功能,而非仅仅是他们认为自己需要的功能?

Sam Stephenson: 在软件开发过程中,很容易陷入纸上谈兵的误区。特别是当会议安排密集时,压力会非常大。刚结束一个会议,又要匆忙赶往下一个,在这种高压状态下,你分给一个软件的脑力空间是极其有限的。

我们能支配的,可能只有你大脑的百分之一的空间。这是我们作为产品设计者需要记住的。 我们把那个「压力山大、连续开会」的瞬间牢记在脑中进行设计,这帮助我们保持清醒。很多人称赞 Granola 的简洁易用,正是因为我们深知,在这种情境下,用户根本没有足够的精力去应对一个布满复杂按钮的界面。我们称之为「为蜥蜴脑设计」。

Chris Pedregal: 我们努力判断什么是「单向门」决策,什么是「双向门」决策。如果是双向门,我们可以快速发布,观察反应。但我们必须保持产品的灵魂。大家喜欢 Granola 就是因为它简洁、克制。如果你为了加功能而破坏了这一点,就等于杀鸡取卵了。

全球化野心:在伦敦打造「硅谷式」公司

Michael Mignano: 你们在伦敦建立团队,但产品在美国非常受欢迎。感觉像是在伦敦打造一家硅谷式的创业公司,这是刻意为之的吗?

Chris Pedregal: 是的,这是刻意为之的。我们团队的每个人都渴望那种雄心勃勃的经典创业经历。我们的基因确实来自硅谷,但伦敦有非常优秀和多元的人才。我们有一个巨大的机会,就是用这里的人才,在伦敦建立一家「硅谷式」的创业公司。

在应用层,伦敦的热门 AI 公司不像硅谷那么多,我们算是「小池塘里的大鱼」,这对吸引特定类型的人才非常有优势。当然,任何事都有取舍,我们需要时刻保持与硅谷的同步。

在 AI 这个竞争如此激烈的领域,你必须在美国市场有竞争力。 否则,别人会赢下美国市场,然后你迟早要在欧洲和他们对抗。所以我们从一开始就抱着全球化的视野。大多数用户并不知道 Granola 在哪,他们也不在乎。

Granola 的未来:从会议纪要到智能工作空间

Sam Stephenson: 工程师有像 VS Code 这样的集成开发环境,设计师有 Figma。但直到现在,那些从事与人打交道工作的人,比如销售、管理或投资,一直没有属于自己的这类工作空间。因为他们工作的基本单位是自然语言和对话,这对传统软件来说太「软」了。

现在,计算机终于能够理解和组织自然语言了。我们认为,我们有机会为这些「与人打交道的人」创造出那样一个工作空间,让他们能沉浸其中,放大他们的能力,让他们工作得更好、更快。

Chris Pedregal: 我完全同意。AI 就像是给思想装上了一个喷气背包。会议只是一个开始,因为它蕴含了惊人的数据量。未来,我们必须加入邮件、Slack 等所有上下文信息,才能让你做真正有用的事情。

我希望世界上每一个风险投资人都在 Granola 里撰写他们投资备忘录的初稿,因为我们拥有所有的信息,理应是做这件事最好的工具。我们内部已经做了一个能自我编写的内部维基,它可以根据所有会议记录自动生成和更新内容,比如回答「我们公司的居家办公政策是什么?」.这是一个疯狂的新世界。

观众问答:早期迭代与数据隐私

观众提问: 在创业早期,你们是如何处理反馈循环和早期迭代的?如何知道何时收集到了足够的数据可以继续前进?

Chris Pedregal: 我的看法是,在早期,这完全 是定性的,要靠你的直觉 。当然,你需要每天和用户交流,观察他们,但这并不是问他们想要什么。而是通过观察,为你的大脑提供所有相关的背景信息,这样你的直觉就会被打磨得更敏锐。如果你自己从内心深处感受不到这个产品或需求,那问题就大了。

观众提问: 我们发现有些客户不希望会议被录音。你们在与用户互动中,对于信息存储和转录的偏好有什么发现?

Chris Pedregal: 像 Granola 这样的工具未来会成为工作场合的标配。Granola 从一开始就从不存储音频,只存储转录稿,这降低了侵入性。未来的讨论焦点会从「是否转录」,转移到「谁有权访问这份转录稿」。 是只有我自己?我的团队?还是整个公司?公司在设计这些默认设置时,会产生很多下游影响。我们必须以一种深思熟虑的方式,建立良好的规范来使用这些强大的工具,在最小化风险的同时最大化其益处。

原播客链接:https://www.youtube.com/watch?v=2eajeT9WU4k

更多 Voice Agent 学习笔记:

GPT-4o 之后,Voice 从 Assistant 到 Agent,新机会藏在哪些场景里?|Voice Agent 学习笔记

对话 Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验

Notion 创始人 Ivan Zhao:传统软件开发是造桥,AI 开发更像酿酒,提供环境让 AI 自行发展

ElevenLabs 语音智能体提示词指南 —— 解锁 AI 语音交互的「灵魂秘籍」丨 Voice Agent 学习笔记

11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨 Voice Agent 学习笔记

实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨 Voice Agent 学习笔记

级联 vs 端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?

视频丨 Google 最新 AI 眼镜原型曝光:轻量 XR+ 情境感知 AI 打造下一代计算平台

a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场

a16z 合伙人:语音交互将成为 AI 应用公司最强大的突破口之一,巨头们在 B2C 市场已落后太多丨 Voice Agent 学习笔记

暫無回覆。
需要 登录 後方可回應,如果你還沒有帳號按這裡 注册