这篇文章探讨了人工智能如何提高开发效率,从而导致对软件质量保证(QA)测试需求的爆炸性增长。文章指出,Ranger等公司正利用AI自动化QA测试以解决这一问题,并通过“杰文斯悖论”解释了AI将如何促使更多QA工作的产生,而非减少。
关于技术、金融和经济的思考
通过订阅,你同意 Substack 的使用条款,并确认其信息收集通知和隐私政策。
披露:我是 Ranger 的一位小型天使投资人。
AI 革命不仅将改变我们编写代码的方式——它还将引发软件测试的爆发式增长。像 Cursor 和 Devin 这样的 AI 工具将使开发人员的生产力大大提高,但它们也将极大地增加所需的 质量保证 (QA) 测试量,以确保所有这些 AI 驱动的代码实际运行正常。
QA 需求的巨大增长是 Ranger 试图解决的问题。Ranger 是一款 AI 产品,它编写、运行和维护 QA 测试以防止 bug。他们今天公开推出,并获得了由 General Catalyst 和 XYZ Venture Capital 领投的 890 万美元融资。
当我的朋友,Ranger 的 CEO Josh Ip 找到我,希望我为公司发布撰写文章时,他告诉我他不想写一篇吹捧文章。所以我不会谈论他跑的 100 英里比赛或他的其他成就(呃……哎呀)。Ranger 也仍处于早期阶段,Josh 并没有假装对 QA 或 AI 的未来拥有所有答案。
但我也发现 Josh 过于谦逊:Ranger 的早期表现令人难以置信。OpenAI 用他们进行 o1 安全测试(参见 OpenAI 的简报这里),其他快速增长的初创公司如 Suno 和 Clay 也在使用他们。他们的产品能够将耗时数小时的 QA 测试在 5 分钟内完成。一些客户表示,该产品每周为每位工程师节省 5 小时,这相当于每年为每位工程师节省数万美元。
截取自 Ranger 官网
但作为一个从未担任过软件工程师或不特别懂技术的人,Ranger 最吸引我的是他们的方法如何为软件工程的未来、AI 原生产品的构建以及 AI 将如何颠覆初创公司传统上难以解决的服务行业提供了一个有趣的窗口。
今天的现实是,许多公司只做最基本的 QA 测试。对于初创公司来说尤其如此,但对于资金充足的上市公司也是如此(参见最近的 Sonos 溃败)。为什么?正如 Josh 最近向我指出的,QA 常常被软件工程师视为一项必要但不受欢迎的苦差事。“这有点像让厨师洗碗,而他们本应专注于做饭。”
像 Playwright 这样的开源软件让软件工程师更容易自动化他们的网页 QA(而不是人工点击按钮和填写表格)。然而,它们仍然要求工程师编写复杂的测试代码,这些代码可能会因网站的微小更改而轻易失效。1
因此,对于一些团队来说,将 QA 外包给(更便宜的)QA 工程师,无论是直接雇佣还是外包给另一家公司,比让你的工程师采用复杂的新软件更简单。Ranger 估计,仅在美国每年就花费约 350 亿美元用于 QA 工程师。但由于它仍然昂贵且缓慢,很少有人对这种体验感到满意。因此,在试图省钱或更快地发布产品时,QA 往往是第一个被削减的。
AI 通过提供比以往好 10 倍的产品体验来改变这一点。2 你不必让昂贵的工程师编写代码,而是可以用简单的英语告诉 Ranger 的 AI 代理你想要运行的测试,它就会为你生成代码。代码的维护也将变得显著更容易——因为 AI 在语义上“知道”测试的目标,所以当产品发生变化时,它也可以更新测试代码。
这是一个要求 Ranger 预订优胜美地露营地的例子。Ranger 专有的网页浏览 AI 代理只需自然语言提示即可完成网页任务。同时,它正在屏幕右侧编写代码,这些代码将用于未来的测试。3
随着 AI 提高软件工程效率,是否存在这样的风险:它变得如此擅长编写代码,以至于我们实际上不再需要做很多 QA 了?QA 工程师会像银行柜员一样消失吗?
这并非不可能,但正如我之前所写,我认为相反的情况会发生,因为杰文斯悖论 (Jevons Paradox) 将会胜出。它描述了当技术提高资源效率时,反而会导致总消费量增加而不是减少的现象。4 这在软件工程史上已经发生过,尽管今天的每位软件工程师的生产力比 30 年前提高了许多倍,但我们雇佣的软件工程师比以往任何时候都多。
在此示例中,需求量从 1000 (100*10) 上升到 1120 (80*14),这意味着即使价格下降,燃油消耗量也增加了。
这也可能适用于 QA。
因此,即使软件工程师在 AI 的帮助下编写代码效率更高,综合效应也可能是 QA 工作量增加,而不是减少。随着 AI 的普及,小型初创公司也将能够进行目前只有大型企业才能负担和管理的全面测试。
Ranger 拥有引人注目的产品,但他们并非唯一一家试图利用 AI 进军 QA 市场的公司。像 Tricentis 这样的老牌企业正在竞相整合 AI,许多其他 AI 原生初创公司也正在以不同的方法涌现。
Ranger 的策略有些独特。他们没有直接销售软件,而是其内部团队目前使用它为初创公司提供 QA 即服务。并非所有内容都由 AI 自动化,人工员工仍会在必要时双重检查代码并进行编辑。随着公司遭遇“工具疲劳”,Ranger 正在采取端到端解决客户问题的方法(参见 Nikunj Kothari 关于这一趋势的精彩文章)。我敢打赌,这种模式比今天的纯 SaaS 能为客户带来更好的结果,但毫无疑问,它的扩展速度会更慢。

无论 Ranger 的模式是否会胜出,我越来越相信 AI 将既导致 QA 需求的爆发式增长,又会使像 Ranger 这样的 AI 原生产品满足这一需求,并从根本上改变 QA 的完成方式。
一些初创公司试图通过构建无代码工具来解决这个问题,以便技术背景较弱的用户也能构建和维护 QA 测试。但这些改进大多是渐进式的,影响力不足以值得学习新工具。
正如我所写,这也发生在许多服务行业。例如,传统的法律科技解决方案(如 E-Discovery 工具)只有渐进式的改进,因此许多律师事务所没有采用它们,而是继续使用传统的劳动密集型流程。但生成式 AI 比以前的产品好 10 倍,因此对于法律事务所集成新的 AI 驱动软件解决方案来说,这现在是显而易见的。
Ranger 目前只提供 Web QA 服务,因为他们的系统使用 HTML/DOM 来执行网页操作。
用经济学 101 的术语来说,当商品/服务的需求弹性很大时,价格的降低会导致需求量大幅增加,从而使总消费量增加。
- 原文链接: charlesrubenfeld.substac...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!