继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

最近这段时间又一匹AI coding黑马正在快速崛起,感兴趣的朋友可以先看下这个视频,在Every最新一期播客里,他们对当前所有AI coding产品做了一个评级分类,而跟Claude code共同排在S级的就是最近Sourcegraph刚推出的Ampcode,而爆火的Cursor也只排在了第二档次的A级。

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

这其实代表的是一个未来的趋势,从同步的Coding工具转向异步的Agentic Coding,这一转变也完美符合了Andrej Karpathy前几天在YC创业营上演讲提到的LLM OS和Software 3.0的概念。这里再分享一个Claude code负责人的演讲视频,详细讲述了Agentic coding的进化。

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

作为代码搜索和智能工具领域的资深玩家,Sourcegraph 已经深耕企业级开发者工具市场多年。这家成立于 2013 年的公司以其强大的代码搜索平台而闻名,帮助众多大型企业管理和理解复杂的代码库。然而,当 AI 编程工具的浪潮来临时,Sourcegraph 并没有止步于现有的成功,而是选择了一条更加激进的道路。他们的 CEO Quinn 和工程师 Torsten 开始了一场前所未有的实验:能否用短短几周时间,构建出一个完全不同的 AI 编程工具?这个实验的结果,就是现在让整个行业为之震惊的 Amp。

很有意思的是,他们把整个做产品的过程都以播客系列《Raising an Agent》的形式开源了出来,从中我听到了一个 AI 编程工具从构思到成形的完整过程,更重要的是,我看到了一群工程师如何通过深度思考和大胆实验,创造出了一款与众不同的产品。

这不是一个典型的产品发布故事。没有华丽的 PPT,没有精心策划的营销活动,甚至连正式的产品规划都没有。Quinn 和 Torsten 几乎是在”边做边学”的状态下,用两三周时间就搭建出了一个让他们自己都感到震惊的原型。但正是这种看似随意的开发过程,却蕴含着对 AI 编程工具本质的深刻理解。

从他们长达数小时的播客对话中,我提取出了几个关键的思考维度,这些思考不仅塑造了 Amp 的产品形态,也可能预示着整个 AI 编程工具行业的发展方向。更让我感兴趣的是,这些洞察都是从实战中总结出来的,不是纸上谈兵的理论推演,而是每天使用、每天发现、每天调整的真实经验积累。

我看到了 Amp 团队的一个重要特质:他们愿意尝试那些看起来不太可能成功的想法。这种实验精神让他们能够发现其他人错过的可能性。更重要的是,他们没有被传统的产品开发流程束缚,而是让技术的可能性来引导产品的方向。这种”技术先行”的方法虽然看起来风险很高,但在 AI 这个快速发展的领域里,可能是最有效的探索方式。Quinn 总结得很好:”这就是为什么我们在这里,因为每天都有这样的时刻。”

我特别注意到他们反复强调的一点:每天都有让人兴奋的发现。这不是偶然的,而是因为他们选择了正确的工作方式。他们没有试图预测 AI 模型的所有可能性,而是通过持续的实验和观察来发现模型的真正能力。这种方法让他们能够”与模型共舞”,而不是强迫模型按照预设的方式工作。正如他们在播客中多次提到的,很多时候最好的答案就是”让模型去做”,而不是试图通过复杂的逻辑去控制它。

于是就有了这篇文章,希望给大家一些思考和启发。我对AI coding这块很感兴趣,也做了非常多的研究,有想在这方面创业的朋友欢迎找我聊聊。

颠覆性的产品哲学:少即是多

在当前的 AI 工具市场中,大多数产品都在追求功能的广度:模型选择器、复杂的配置选项、数百种工具集成。但 Amp 团队选择了完全相反的方向。他们的产品哲学可以用一句话概括:做减法而不是加法。这种哲学贯穿了他们所有的设计决策,从界面设计到功能选择,从定价策略到用户体验。

这种哲学最明显的体现就是他们拒绝提供模型选择器。Quinn 在播客中多次强调这一点:”我们有字面意思上的文本区域,这么多其他 AI agent 都有那些丰富的文本区域,比如 lexical 或 prose mirror 之类的,我们已经做过了,知道那会增加复杂度1000倍。”他们的目标是为用户提供最好的体验,而不是最多的选择。他们认为,如果你知道哪个模型最好,为什么还要让用户选择一个更差的模型?

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

这种逻辑听起来很简单,但背后体现的是对产品价值的深刻理解。Torsten 解释说:”现在很多过时的东西看起来怎么样?选择器和不同的模式,还有再多一个按钮就可以配置一切。我不知道这是不是只有我这么想,但这只是我现在习惯了 Amp,但这似乎就是为什么你会让用户切换到一个明显更糟糕的模型,比如为什么把 Mini 或 Haiku 放在那里?”

更激进的是他们对 token 使用的态度。在其他工具都在想方设法节省 token 成本时,Amp 团队选择了完全不限制 token 使用。他们的环境变量甚至包含了一个带有脏话的变量名,大意是”我是个低志向的白痴,更关心成本而不是构建令人敬畏的东西,所以告诉我价格”。这种近乎极端的态度背后,是他们对于什么才是真正重要的清晰认识。

Quinn 对此有深刻的分析:”我认为这种无 token 限制的魔力,因为如果你优化请求或者说低请求数量或者说低 token 数量,你最终会得到一个完全不同的产品。如果你说让它尽情发挥,你取消所有限制,你把工具给模型,然后你把它放在一个循环中,这就是所有魔力的来源。魔力不是……很多魔力在于工具,很多魔力在于它如何集成,很大一部分是没有限制。”

从他们的讨论中,我理解了这种哲学的深层逻辑。当你试图同时满足所有人的需求时,最终可能谁都满足不了。相反,如果你专注于为特定用户群体提供最佳体验,你可能会创造出真正有价值的产品。这种”opinionated”的产品设计虽然会失去一些用户,但会赢得那些真正需要高质量工具的用户的忠诚。

这种哲学还体现在他们对工具集成的态度上。虽然市面上有数百种 MCP 工具可以集成,但他们选择只提供经过精心调优的少数工具。Torsten 的观点很明确:”我不认为在这里’更多就是更好’……我不认为如果你有一千个可用的工具,你会得到好的体验。”他们的理由很简单:给 AI 太多选择可能会导致选择瘫痪,就像给人太多选择会导致决策困难一样。

他们甚至对用户反馈采取了选择性响应的策略。Quinn 说:”我们得到了很多用户反馈,这真的很有趣,用户说’嘿,我不想看到它做的所有事情’,我们已经非常谨慎……我们喜欢人们这样说,但我们一直很谨慎,因为我们不想设置错误的期望,这是魔术。”这种”固执”的态度虽然可能会让一些用户不满,但却能确保产品保持清晰的方向。

深度模型理解:与模型共舞而非对抗

在听 Amp 团队的讨论时,我发现了一个有趣的现象:他们对不同 AI 模型的理解已经到了近乎人格化的程度。他们会说”Claude 喜欢委派任务”、”Gemini 更愿意一次性生成完整方案”、”这个模型被训练得更激进”。这种拟人化的描述背后,是对模型行为模式的深度理解,而这种理解是通过大量的实际使用和细致观察积累起来的。

这种理解不是来自于阅读技术文档,而是来自于数千小时的实际使用和观察。Torsten 提到了一个很有趣的发现:”一旦我们有了 Claude Sonnet 4 的访问权限,我们很快就把子代理重新添加到 Amp 中,看看这个新模型是否有所不同,确实,事情是不同的。事实证明,Sonnet 4 真的很喜欢将工作委派给子代理,只要它能发现一个明确定义的任务,它就会调用它们。”

这种观察让他们能够快速适应新模型的特点,并据此调整产品策略。更重要的是,他们认识到模型的这些特性不是偶然的,而是训练过程中有意为之的结果。Quinn 解释说:”第一个被广泛认知的 agent 框架是 AutoGPT,它实际上早在 2023 年初就出现了,就在 ChatGPT 发布后不久……这些模型都是在很久以前训练的,我不知道确切的时间框架,模型公司不会公布,但让我们说六个月或九个月前……在那个时候,他们调查了环境,他们查看了人们在内部和世界各地正在做什么,他们说人们六到九个月后会如何进行工具调用,他们训练模型以在这方面做得很好。”

我特别感兴趣的是他们对“模型训练数据”的思考。他们认识到,不同模型在训练时见过的工具和使用模式是不同的,这直接影响了模型的工具使用偏好。Torsten 提到:”模型在很大程度上是经过训练的,我们看到的是它们对我们认为它们训练过的工具有很高的亲和力,比如编辑文件这样的东西……甚至我们看到 Gemini 似乎更不愿意运行 shell 命令。”

这种认识让他们明白,与其强行改变模型的行为,不如顺应模型的偏好来设计工具。这种”与模型共舞”的哲学,我认为是 Amp 成功的关键因素之一。很多其他工具试图通过复杂的 prompt engineering 来”驯服”模型,但 Amp 团队选择了理解和适应模型

从他们的讨论中,我还看到了对模型演进趋势的深刻洞察。他们注意到不同模型厂商在 agent 能力方面有不同的发展方向。Torsten 有一个很精彩的分析:”对我来说,似乎这些公司对 agent 应该是什么有不同的哲学……Anthropic 到目前为止似乎最接近这种实用的编码 agent 的道路,它可以去找出东西,不仅仅是构建应用程序。”他进一步解释说,Anthropic 的模型更注重环境交互和反馈循环,能够根据遇到的错误尝试不同的解决方案,而其他模型可能更专注于一次性生成完整的解决方案。

这种差异不是技术实现的偶然结果,而是不同公司对 AI agent 未来的不同理解。理解这些差异,让 Amp 团队能够做出更明智的技术选择。正如 Quinn 所说:”如果你有模型选择器和任意工具,你不会得到与使用针对一个模型优化的工具相同的结果,而该模型就是它训练的对象,但是大实验室有动机使他们的模型与许多不同的工具实现一起工作,并使它们尽可能通用。”

反馈循环的艺术:让 AI 像人一样学习

在所有的技术讨论中,我觉得最有价值的洞察是关于反馈循环的思考。Amp 团队发现,AI agent 和人类程序员其实有很多相似之处,都需要通过反馈来改进工作质量。这个看似简单的观察,却颠覆了很多人对 AI 工具的期望。

Quinn 在播客中提到了一个很有说服力的类比:”如果你要求人类在一个非常好的日子里一次性输出300行文件,他们可以为你写300行,但不会是正确的……但我们经常需要的是编译器反馈、解释器反馈、测试、linter、波浪线,所有这些来指导我们,并帮助我们理解我正在编写的代码是否有效。事实证明,如果你给模型同样的反馈,它在编写代码方面会变得更好。”

这个洞察让他们重新思考了工具设计。他们不再试图让 agent 一次性完成所有任务,而是为它创建了丰富的反馈循环。包括编译器诊断、测试运行、静态分析,甚至浏览器自动化来获取视觉反馈。Torsten 分享了一个令人印象深刻的例子:”我们有一些工具来编辑文件,我们有一些工具来查看文件,我们有一个工具来运行终端命令……它尝试了两次,你可以看到它在实时进行,就像让我尝试编辑这个文件,然后也许那是它的声音,我想让我尝试编辑这个文件,它失败了,我们发回了一个错误消息,我们说这不是一个有效的参数,然后它再次尝试,参数有所改变,它仍然失败,然后它决定并写道让我以另一种方式尝试这个,它所做的是创建一个新文件,将它想要的其他文件的内容完全放入新文件中,然后运行终端命令将新文件移动到旧文件上。”

这种自适应的问题解决能力,正是通过良好的反馈循环实现的。更令人兴奋的是他们在前端开发中的应用。他们集成了浏览器自动化工具,让 agent 能够直接看到网页的运行效果。我印象最深的是他们提到的太空侵略者游戏例子:agent 不仅能编写游戏代码,还能自动打开浏览器、按下空格键开始游戏、射击外星人来验证游戏是否正常工作。

但构建好的反馈循环并不容易。Torsten 指出了一个重要问题:”理想情况下,它总是知道验证其工作的最佳方式,但这通常很困难,甚至作为人类你也不知道……我发现有效的是,当我知道它会遇到问题时,我会事先告诉它,我说在每一个小事情之后确保你运行这个命令,然后它是类型检查器或任何 linter 或什么的。”

这种反馈循环的设计哲学,我认为是 Amp 区别于其他工具的关键优势。很多工具把 AI 当作一个黑盒子,输入提示词,输出代码,然后就结束了。但 Amp 把 AI 当作一个需要持续学习和改进的”工程师”,为它提供丰富的环境反馈。这种方法不仅提高了代码质量,还让 agent 能够处理更复杂的任务。

Quinn 对此有一个深刻的观察:”我想说的最重要的一点是,我希望有更多的设计师能够走上创业这条路……对于那些已经是创始人的人,我也希望你们能培养’设计思维’,因为在打造下一代伟大公司的过程中,这将成为最关键的能力之一。”这种将反馈循环视为”设计问题”的观点,我觉得非常有启发性。

从技术实现的角度来看,构建好的反馈循环需要大量的工程投入。你需要确保构建系统能够快速给出清晰的错误信息,测试能够细粒度地运行,开发环境配置正确等等。Torsten 提到了一个有趣的观察:”事实证明,这对 agent 不好,对人类也不好,比如如果你有一些构建工具,它们会输出很多警告,你知道超级详细的结果,这对 agent 不好,如果我雇用一个新的初级工程师并说构建这个 Web 应用程序,它显示了八个警告,那么我必须过去说你可以忽略这八个警告,它们是无害的,但他们不会知道,agent 也有同样的问题。”

子代理革命:从单兵作战到团队协作

在 Amp 的技术演进中,子代理功能的引入可能是最具革命性的变化。这不仅仅是一个新功能,而是对 AI agent 工作模式的根本性重新思考。从他们的讨论中,我看到了这个功能是如何从技术实验演变为产品核心的,以及它背后蕴含的深刻技术洞察。

子代理的概念很简单:主 agent 可以创建其他 agent 来处理特定任务。但这个简单的概念背后,蕴含着对 AI 能力边界的深刻理解。传统的 agent 系统受限于单一的上下文窗口,当处理复杂任务时很容易”耗尽”token。Torsten 解释了这个问题:”每个人都面临的一个问题是,你只有有限的上下文窗口,对吧?我们现在有168k输入 token,因为我们有32k输出 token 用于 claude,在某个时候你会达到这个限制,特别是当 agent 偏离轨道并做了一些坏事之后,这并不好,你知道比如当它18次未能编辑文件或当它创建一个新的测试文件并花费一堆 token 等等。”

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

子代理系统通过任务分解和并行处理,突破了这个限制。更重要的是,它还带来了容错性的提升:”有趣的是,使用这些代理和 claude 4 更愿意调用代理的是,每个子代理都有自己的上下文窗口,对吧?所以如果你说嘿子代理,拿这八篇博客文章并删除 YAML 东西,他们得到他们那个代理得到自己的K token,对吧?如果它未能编辑该文件,当然它可能会填满该上下文窗口,但在该任务完成后,您的主代理仍然只使用了大约20%的 token 或类似的东西,它不是很多。”

我特别感兴趣的是他们对 Claude Sonnet 4 行为变化的观察。之前的模型版本很少主动使用子代理功能,更愿意自己处理所有任务。但 Sonnet 4 显然被训练得更善于委派任务。Torsten 描述了这种变化:”事实证明,Sonnet 4 真的很喜欢将工作委派给子代理,只要它能发现一个明确定义的任务,它就会调用它们。”

这种变化不是偶然的,而是 Anthropic 对 agent 工作模式理解的体现。Quinn 提供了更深层的解释:”这些模型提前很好地训练……当新模型出现时,很多其他公司都说’哦,现在我们的基准测试做到了这个’……但这种未调整的评估,因为我们刚才说的,比如 claude 有使用某些工具的某种方式,Gemini 有使用其他工具的某种方式,为了从每个模型中获得最大收益,你必须为该特定模型诚实地调整你的提示和工具。”

从他们分享的使用案例中,我看到了子代理带来的质的变化。处理博客文章的例子很能说明问题:”我测试了它,我说拿这里的所有博客文章并从 YAML 前言中删除评论真实的东西,因为我不再有评论,它所做的是它做了一个rip,我认为rip grab或glob,所以它知道有36篇博客文章,然后它把它们分成了四组,产生了四个不同的代理,并告诉每个代理你去从博客文章中删除评论的东西,他们就走了。”

这种工作模式的变化,我认为可能会重新定义我们与 AI 工具的交互方式。以前我们需要仔细管理对话的复杂度,避免给 agent 过于复杂的任务。现在我们可以更大胆地提出复杂需求,让 agent 自己决定如何分解和分配任务。

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

更有趣的是,子代理还支持并行处理。Torsten 提到:”不,不,不,它只是产生四个不同的,因为它可以使用并行工具调用,对吧?这是另一件事,clot 4似乎更急于使用并行工具调用,似乎比37更快。”这种并行处理能力大大提高了任务执行效率。

Geoff Huntley 的评论很好地总结了子代理的意义:”阻止我这样做的事情之一是上下文窗口管理,因为它需要高级技能。但由于子代理,该技能水平现在已商品化并使任何人都可以轻松做到,这意味着现在可能有各种初始类别。”

从技术架构的角度来看,子代理系统也带来了新的挑战。如何管理多个 agent 之间的协调?如何避免子代理之间的冲突?如何确保整体任务的一致性?这些问题的解决方案,可能会成为未来 AI 工具竞争的关键差异化因素。Torsten 正在持续优化这个系统:”现在我正在再次处理任务或子代理,以使其在 UI 中看起来更好,为其提供更多工具,以简化整个事情。”

成本与价值的重新定义

在整个播客系列中,成本话题的讨论让我看到了 Amp 团队对价值创造的独特理解。他们的态度很明确:与其为了节省成本而限制功能,不如专注于创造价值。这种价值观的转变,我认为可能会重新定义整个 AI 工具市场的竞争格局。

他们提到的一个数据很有说服力:重度使用 Amp 的用户每月可能产生数百美元的 AI 成本。Torsten 分享了他的体验:”昨天我给某人展示了一个小演示,我认为我们烧了15美元,我不知道,比如10美元,10美元,我认为……我们还没有显示价格,但是……只是你的时间和他们看着它的时间就超过了这个价值。”但如果考虑到软件工程师的薪资水平,这个成本就变得合理了。

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

更深层的思考是关于定价模式的变化。Quinn 对此有深刻的分析:”我认为这整个每月10美元、20美元的订阅统一费率模式在现在我们有这些工具时看起来有点过时了,我认为我们将在未来看到很多基于使用的定价或其他形式的定价。这样做的主要原因是……有人问为什么claud code感觉如此不同于其他工具……这是因为它没有针对节省成本、节省 token 进行优化。”

这种”不优化成本”的策略背后有深刻的逻辑。Quinn 解释说:”如果你优化请求或者说低请求数量或者说低 token 数量,你最终会得到一个完全不同的产品,如果你说让它尽情发挥,你取消所有限制,你把工具给模型,然后你把它放在一个循环中,这就是所有魔力的来源。”

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

从他们的经验来看,用户对 AI 工具成本的接受度比预期要高。Torsten 观察到:”我对有多少人,甚至我会说在线不喜欢AI的仇恨者,当人们说’我周末花了50美元在这上面,我只是让它撕裂或什么的。’然后它做了这个,即使是那些说’哦,这是第一次我使用代理,我只是投入了我认为有人投入70美元的代币,它修复了这个旧代码库。’而不是说’哇,70美元,那很多钱。’……他们会说’嗯,与我的工资相比,与初级开发人员的工资相比,这并不疯狂。'”

这种成本观念的变化背后,还有一个重要的商业逻辑。Quinn 提到了一个有趣的类比:”这就像如果你是苹果,你也想拥有19美元的华为手机。”他指出,如果你试图同时满足周末构建表情符号游戏的人和世界上最高效的专业软件开发人员,这会非常困难。

我认为这种成本观念的变化,可能会推动整个软件行业的生产力革命。当成本不再是主要限制因素时,我们就能够更大胆地探索 AI 的可能性。这可能会带来软件开发效率的显著提升,也可能会改变整个行业的人才需求结构。

更有意思的是,他们发现团队使用模式下的成本接受度更高。Quinn 提到了一个客户的问题:”有一个客户今天提出的问题,你知道如果他们有20,000或40,000名工程师或其他什么,他们都会获得可以运行工具的完整代理,还是会有成本角度的一些限制或安全性?”他的回答很明确:”对我来说,这是程序员使用的工具……它是一个让他们更有效率的东西,如果它给他们更多的杠杆,所以我会说是的,比如给每个程序员访问这个工具,比如为什么要阻止它?”

这种企业级思维的转变,可能会成为 AI 工具普及的重要推动力。当企业开始把 AI 工具成本看作是必要的基础设施投入时,整个市场的发展速度可能会大大加快。

用户教育与产品演进的平衡

从 Amp 团队的讨论中,我看到了一个有趣的挑战:如何在保持产品简洁性的同时,教育用户发挥工具的最大潜力。这不是一个简单的产品设计问题,而是关于如何引导用户行为改变的深层思考。这种挑战在 AI 工具领域尤其突出,因为用户往往带着对传统工具的预期来使用 AI 工具。

他们发现,很多用户在初次使用 AI 编程工具时,往往带着错误的期望。有些人期望 AI 能够完美地”读懂”他们的意图,有些人则把 AI 当作传统的代码生成器。Torsten 提到了一个典型的误解:”我认为在工具调用之前或代理之前,代码编辑代理,我有不同的期望,我认为很多人仍然有这些期望,那就是你与模型交谈,你要求它生成一些代码,你知道它来了,你写一行两行提示,它回来300行代码,然后你就像拇指向下它没有做我想要的,然后你调整提示并再次这样做,现在我的心态是,现在为什么我会期望这能很好地工作。”

这种期望的错位会导致糟糕的使用体验。Quinn 分析了原因:”我认为很多人没有意识到如何使用这些东西,或者他们没有使用这些东西,但当我说他们不知道如何使用这些东西时,这很困难,因为感觉像是在指责用户,我明白这很难,这些是细致入微的,但就是有些人,如果它不起作用,他们会尝试别的东西,他们已经进化出了这种直觉,知道如何让它正确,他们实际上认为这很有趣,而其他人则不认为这很有趣。”

为了解决这个问题,Amp 团队采用了一种很巧妙的方法:通过线程分享功能让用户学习最佳实践。用户可以看到其他人如何与 agent 交互,学习如何更有效地表达需求,了解什么样的任务适合交给 agent 处理。Quinn 解释了这个功能的价值:”我认为线程分享还有一个意想不到的价值:它能够帮助团队成员学习如何更好地与 agent 协作。很多人在初次使用 AI agent 时不知道如何有效地表达需求,或者不知道什么样的任务适合交给 agent 处理。通过观察那些善于使用 agent 的同事的操作模式,新手能够快速掌握最佳实践。”

这种”同伴学习”的方式比传统的文档更加有效,因为它展示的是真实的使用场景。Torsten 提到了一些最佳实践的演进:”我想说有不同的元阶段,对吧,人们采取的第一步是他们开始写东西,然后他们看着代理去弄清楚东西,然后他们意识到我没有得到它,所以下一个明显的步骤是我对这个问题了解的一切我将把它放在这个中,你知道我提到的所有文件我将把它放在这个或…那是第一步,然后我会说第二步是人们优化反馈循环。”

我特别欣赏他们对用户反馈的处理方式。他们不是简单地响应所有用户需求,而是有选择地响应那些符合产品哲学的反馈。这种”固执”的态度虽然可能会让一些用户不满,但却能确保产品保持清晰的方向。Quinn 明确表示:”我们真的很想为想要使用 AI 作为强大工具的人构建……我不想构建或我什至不感兴趣的是这个一行提示的工具,就像为我建一个婚礼网站……然后它就去做事情,我不想要那个。”

他们还观察到了不同用户群体的使用模式差异。Torsten 提到了一个有趣的现象:”我昨天想知道这是否……我们一直看到的那个著名曲线,哦,初级工程师喜欢 AI 工具,超级高级……高级工程师喜欢它,但中间的人,他们对此不那么热情。”他的分析是,这可能与不同经验水平的工程师对架构和局部变更的理解程度有关。

从长期来看,这种用户教育策略可能会创造出一个更加成熟的用户群体。这些用户不仅能够更好地使用 Amp,还能够成为 AI 编程工具的布道者,推动整个行业的发展。这种用户群体的形成,可能会成为 Amp 的重要竞争优势。

这种平衡策略也体现在他们的产品迭代方式上。他们不是根据用户反馈被动地调整产品,而是主动地探索技术可能性,然后引导用户适应新的能力。这种”技术引导”的产品开发方式,虽然风险更高,但也更容易创造出真正的创新。Quinn 总结得很好:”所以我们想建造我们用的东西,专注于我们想用的东西,然后从那里扩建它,但真的钉住像核心命题这样的,它对我们来说效果如何。”

背景代理:重新定义编程的时空边界

除了子代理,Amp 团队还在探索另一个有趣的方向:背景代理。这个概念的核心是让 agent 能够在你不直接参与的情况下执行任务。用他们经常提到的例子来说,就是”在孩子踢足球比赛时用手机启动一个编程任务,等比赛结束后回来查看结果”。虽然这个例子已经被他们重复了无数次,但背后的技术思考却很深刻。

我觉得这个想法背后反映的是对 agent 能力边界的重新思考。传统的编程工具需要程序员全程参与,从分析问题到编写代码到测试调试,每个环节都需要人类的直接介入。但如果 agent 足够可靠,我们就可以把一些相对独立的任务完全委托给它们处理。Quinn 描述了这种需求的普遍性:”每个开始使用代理编辑的人都会遇到这个问题,我是否要现在观看这个,比如我是否观看它做这些事情,然后每个人都像我有注意力问题现在就像代理正在运行的东西,它是命令标签,我走了,然后叮声来了,我回去了,它是哦,你做了正确的事情吗。”

但是,背景代理的实现面临着一个关键的技术选择:是构建完整的云端开发环境,还是利用现有的 CI/CD 系统作为反馈机制。这个选择背后的技术哲学非常有趣。大多数现有的背景代理产品,比如 OpenAI 的 Codex 和 Google 的 Jules,都选择了第一种方案:构建完整的构建环境。

但 Amp 团队倾向于后者,他们的理由很有说服力。Quinn 对云端开发环境有深刻的批评:”云端 IDE 是如此好的想法,谁不想能够在他们的网络浏览器中生成一些东西,拥有与他们在本地桌面编辑器上相同的构建环境,做出改变,甚至不触及他们的本地状态,它是如此美丽和干净,然而基本上世界上也许有两家公司真正做到了这一点,那就是 Meta 和 Google,他们投入了令人难以置信的投资来制作一个完美工作的云 IDE。”

他进一步解释了云端 IDE 的问题:”对于其他所有人,云 ID 采用是如此不存在,我的意思是,即使你有 VS Code,它字面上使用网络技术并且可以在浏览器中运行,它是相同的体验,它是所有这些小长尾的东西,只是不能很好地工作,没有一个扩展真的在那个场景中工作,没有一个语言服务器工作,你知道你所有的小工具,它们不工作。”

相比之下,利用 CI/CD 系统作为反馈机制虽然功能有限,但更现实可行。大多数公司都已经有了 CI/CD 流程,agent 可以通过提交代码、触发构建、获取测试结果的方式来获得反馈。Quinn 的观点是:”假设是,如果你想要背景代理,那么它们应该使用 CI 进行反馈,以查看测试是否通过,如果linter工作,如果你知道所有这些事情都是正确的,而不是拥有构建环境,现在构建环境并不坏,但这是一种优化,首先构建它以使用 CI,为 CI 足够好的整个问题类别构建它。”

这种方式的延迟虽然比本地反馈循环更高,但对于那些不需要频繁迭代的任务来说完全可以接受。而且,这种方式还有一个隐含的好处:它迫使团队优化 CI/CD 流程,这对人类开发者也是有益的。

Torsten 补充了一个重要观点:”对于我想要的后台代理用例,比如我不想让它去做我知道它需要大量编译器反馈的事情,因为我知道你有点通过这一层删除,你不能真正触摸它,这与云 ID 相同,我宁愿让它做我知道它可以只是单次拍摄的东西……一些疯狂的东西,它不需要构建环境。”

这种技术路线选择背后,体现的是对实用主义的坚持。与其追求技术上的完美,不如选择能够实际落地并带来价值的方案。这种思维方式,我认为是 Amp 团队能够快速迭代和创新的重要原因。

未来的编程工作流:从工具到伙伴

在听完整个播客系列后,我对未来编程工作流的变化有了更清晰的认识。Amp 团队的探索不仅仅是在构建一个工具,更是在探索人与 AI 协作的新模式。这种模式的变化,可能会重新定义程序员这个职业的内涵。从他们分享的使用体验来看,这种转变已经在悄然发生。

从他们的使用体验来看,AI agent 已经不再是简单的代码生成器,而是更像一个有能力的初级程序员。它能够理解复杂的需求,制定执行计划,处理各种异常情况,甚至能够主动提出改进建议。Quinn 描述了自己的体验:”我从让 AI 写我大约40%的代码但我仍然参与其中,到 AI 成为第一个起草者并写我可能85%左右的代码,我还没有处理永远的变化,对这个我从小就有的爱好。”

这种能力的提升,让人与 AI 的协作变得更加自然和高效。我特别注意到他们提到的一个变化:程序员的工作重心从”编写代码”转向”指导 AI 编写代码”。这不仅仅是工作方式的改变,更是思维模式的转变。Torsten 有一个很生动的比喻:”我想到的心理模型是……你知道数字绘画和那个短语一直在被抛出很多,但你知道我知道的数字绘画方式是你有一张空白或没有颜色的图片,有小区域,每个区域都有一个颜色,我对代理的看法是,作为一个知道自己在做什么的人,画那些线是我的工作,然后指示代理填写那个数字,但我需要确定线是什么。”

这个比喻很好地说明了新的协作模式:程序员负责架构设计和边界定义,AI 负责具体的实现细节。这种分工不仅能够提高开发效率,还能让程序员专注于更有创造性的工作。

从技术发展的趋势来看,背景代理功能的探索特别值得关注。虽然目前还在早期阶段,但这种”异步协作”的模式可能会成为未来编程工作流的重要组成部分。有用户已经开始尝试这种工作方式,比如有人”在周末旅行前为代理准备了一份独立任务清单,这样他们回来后就会有所有的差异准备好等待他们”。

继Cursor、Devin和Claude Code之后,又一匹AI coding黑马正在快速崛起

Jeff Huntley 等重度用户的实践更是推开了这种协作模式的边界。他们运行多个代理,24/7不间断工作,甚至在睡觉时也有代理在后台处理任务。这种使用模式虽然看起来极端,但可能预示着未来的主流趋势。

我认为,Amp 团队的探索预示着编程工作流的一个重要转变:从”人使用工具”到”人与 AI 协作”。在这种新的协作模式中,程序员更像是项目的架构师和质量把控者,而 AI 负责具体的实现细节。Torsten 对此有深刻的思考:”我认为这种转变对整个软件行业可能是有益的。如果 agent 能够处理大部分重复性的编程工作,程序员就能将更多时间投入到创新性的问题解决和用户体验优化上。”

当然,这种转变也带来了新的挑战。如何确保 AI 生成的代码质量?如何维护复杂系统的一致性?如何处理 AI 的错误和局限性?Quinn 对此很坦诚:”我就是想要一个真的很好的记录器和时光倒流调试器,在所有代码中有100毫秒的完整 CI 时间……所有这些东西,这是一个犯罪情况,只有软件工程而不是基础模型研究站在我们今天所在的地方和那个世界之间。”

从 Amp 团队的经验来看,这些挑战并非不可克服,关键是要有正确的方法和足够的耐心。他们的经验表明,通过良好的工具设计、合理的反馈循环和持续的用户教育,AI 编程工具能够真正提升开发效率和代码质量。更重要的是,他们证明了技术的快速发展不一定需要复杂的产品,有时候简单而专注的设计反而能够释放更大的潜力。

正如 Quinn 在播客末尾所说:”我们正在上线……如果你想找出这一切要去哪里——和我们一起来。”这不仅是对用户的邀请,更是对整个行业的号召:在这个快速变化的时代,最好的预测未来的方式就是参与创造未来。

我的思考:黑马背后的底层逻辑

听完 Amp 团队几个小时的播客对谈后,我有一个很深的感触:真正的产品创新往往不是来自于精巧的商业计划,而是来自于对技术本质的深刻理解和对用户真实需求的敏锐洞察。Amp 的成功不是偶然的,它背后有几个值得所有产品创造者深思的底层逻辑。

第一个逻辑是”技术驱动胜过需求驱动”。在大多数产品开发中,我们被教育要先调研用户需求,然后设计解决方案。但在快速变化的 AI 领域,这种传统方法可能会让你错过最重要的机会窗口。Amp 团队的做法恰恰相反:他们先深度理解技术能力的边界,然后让技术可能性来引导产品方向。这种”技术先行”的方法虽然看起来风险更高,但在技术快速演进的时代可能是更有效的策略。关键在于,你必须有足够的技术敏感度来识别哪些技术突破真正具有变革性意义。

第二个逻辑是”深度胜过广度”。在一个功能竞赛盛行的市场环境中,Amp 选择了做减法而不是加法。他们拒绝模型选择器,限制工具数量,不迎合所有用户需求。这种看似”固执”的产品策略,实际上体现了对价值创造本质的深刻理解:与其试图满足所有人的所有需求,不如为特定用户群体创造极致的价值体验。这让我想起乔布斯的一句话:”创新就是对一千件事情说不。”在 AI 工具这个新兴领域,这种专注和取舍的能力可能比功能的丰富性更重要。

第三个逻辑是”与趋势共舞胜过对抗趋势”。Amp 团队对不同 AI 模型行为特性的深度理解,让他们能够”顺应模型的偏好”而不是强行改变模型行为。这种哲学不仅适用于技术层面,也适用于商业层面。他们观察到用户对 AI 成本接受度的变化,及时调整了定价策略;他们发现子代理的价值,立即投入资源深度开发。这种敏捷适应的能力,我认为是在快速变化环境中保持竞争优势的关键。

第四个逻辑是”实用主义胜过完美主义”。无论是背景代理的技术路线选择,还是反馈循环的设计,Amp 团队都展现出强烈的实用主义倾向。他们不追求技术上的完美,而是选择能够实际落地并带来价值的方案。这种务实的态度让他们能够在有限的资源下快速迭代和创新,避免了很多初创公司常见的”过度工程化”陷阱。

最后一个逻辑,也是我觉得最重要的,是”长期主义胜过短期机会主义”。Amp 团队的很多决策在短期内看起来是”不理性”的:拒绝功能请求会失去用户,不限制成本会降低利润率,固执的产品理念会引起争议。但从长期来看,这些决策为他们构建了独特的竞争优势和用户忠诚度。他们不是在追逐当下的热点,而是在为未来五年、十年的技术趋势做布局。

这些底层逻辑的背后,我看到的是一种新的产品开发范式:在技术快速演进的时代,最成功的产品可能不是那些功能最丰富的,而是那些最深刻理解技术本质、最专注于核心价值创造的。Amp 的故事告诉我们,有时候”做得少但做得深”比”做得多但做得浅”更有价值。这不仅是一个产品策略问题,更是一个关于如何在不确定性中做出正确判断的认知问题。

回到 AI 编程工具这个赛道,我相信我们正在见证一个新时代的开始。传统的软件开发模式正在被重新定义,程序员的工作内容正在发生根本性变化。在这个变革过程中,那些能够深刻理解变化本质、勇于做出艰难取舍的产品,将会成为新时代的引领者。Amp 可能只是这个故事的开始,但它已经为我们展示了一条可能的道路:通过深度的技术理解、专注的产品策略和务实的执行方式,在快速变化的世界中创造持久的价值。

结尾

最后交个朋友,我自己是一个连续创业者,CS技术背景出身,做过教育和SaaS的创业,并在过去两年担任了25+公司的海外产品与增长顾问,对产品和运营增长都很擅长。现在准备全职All-In入场创业,我目前特别看好AI coding领域,有明确方向和验证了PMF,在寻找CTO,感兴趣一块合作的朋友欢迎加我微信(公众号后台回复【微信】)一块交流!

文章来自于“深思圈”,作者“Leo”。

LEAVE A REPLY

Please enter your comment!
Please enter your name here