Karpathy：20年编程经验被AI颠覆，80%代码由Claude和Codex生成

天才社长2026-01-27

摘要

OpenAI创始成员Karpathy称，Claude等模型在2025年底跨越"一致性门槛"，引发软件工程相变。AI擅长循环执行任务，提升效率更带来能力扩张，但仍需IDE监督其概念性错误。他注意到手动编码能力开始萎缩，预测顶尖工程师与普通工程师的生产力差距将扩大，2026年将迎来行业消化新能力的关键年。

币币情报道：

OpenAI创始成员、特斯拉前AI总监Andrej Karpathy近日分享了他使用Claude进行数周高强度编程后的心得体会。

Karpathy坦言，自己的工作流在短短几周内发生了巨大变化：从80%手动编码转变为80%由AI生成代码。这种转变“有点伤自尊”，但其带来的效率提升令人难以抗拒。他详细阐述了当前AI编程的优缺点、对个人能力的影响，并对行业未来提出了深刻疑问。

Karpathy：20年编程经验被AI颠覆，80%代码由Claude和Codex生成

以下是Karpathy的核心观点：

编码工作流的颠覆

随着大语言模型编码能力的提升，Karpathy的工作流迅速改变。

去年11月，他的工作模式还是80%手动+自动补全编码，仅20%依赖智能体。到了12月，这一比例完全颠倒，变成了80%由智能体编码，而Karpathy只需完成20%的编辑和修补工作。

如今，Karpathy基本上是在用英语编程，通过语言告诉大模型需要写什么代码。虽然有些“伤自尊”，但通过大型“代码动作”操作软件的能力实在太强大，尤其是当你适应并理解其能力边界后。

这是Karpathy近20年编程生涯中基础编码工作流发生的最大变化，且仅用了几周时间。他认为，在工程师群体中，有两位数百分比的人正在经历类似转变，而普通大众的认知度可能还停留在低个位数百分比。

IDE、智能体群和易错性

目前，“不再需要IDE”和“智能体集群”这两种炒作都为时过早。

模型仍然会犯错。如果你在意代码质量，Karpathy建议在旁边开一个大大的IDE，像鹰一样盯着它们。

模型的错误类型已经发生变化——不再是简单的语法错误，而是那些草率、急躁的初级开发人员可能会犯的细微概念性错误。最常见的问题是，模型会基于错误假设继续执行任务，而不加核实。

它们也无法处理自身的困惑，不会寻求澄清，不会揭示不一致之处，也不会展示权衡利弊。此外，它们过于谄媚，喜欢把代码和API搞得过于复杂，滥用抽象，留下大量无用代码。

尽管Karpathy尝试通过在CLAUDE.md中给出简单指令来修复这些问题，但问题依然存在。

然而，尽管如此，这仍然是一个巨大的净提升，很难想象再回到手动编码的时代。Karpathy目前的流程是：左边开几个ghostty窗口/标签页与Claude交互，右边开一个IDE用于查看代码和手动编辑。

坚韧性

观察一个智能体不懈地工作是一件非常有趣的事。它们从不疲倦，从不泄气，只是不断地尝试，在人类可能早已放弃的地方继续坚持。

看着它为一个问题苦苦挣扎30分钟后取得胜利，那一刻有一种“感受到AGI”的瞬间。你意识到，耐力是工作的核心瓶颈之一，而有了大语言模型，这个瓶颈被极大地拓宽了。

效率提升

很难衡量大语言模型辅助带来的“效率提升”有多大。对于原本计划要做的事情，Karpathy感觉速度快了很多。但主要影响在于，完成了远超原计划的任务量，因为：

1. 能编写出各种以前觉得不值得花时间去写的东西。

2. 能处理以前因知识或技能问题而无法着手的代码。

因此，这不仅是效率提升，更是一种“能力扩张”。

杠杆作用

大语言模型异常擅长循环执行任务直到满足特定目标，这正是大部分“感受到AGI”魔力的来源。

不要告诉它具体怎么做，而是给它成功的标准，然后看它表演。让它先写测试，然后再通过这些测试。把它放进一个带有浏览器MCP（模型控制程序）的循环里。先写一个朴素算法，然后要求它在保持正确性的前提下进行优化。

将你的方法从“命令式”转变为“声明式”，可以让智能体循环更长时间，从而获得更大的杠杆作用。

乐趣

Karpathy没预料到，在智能体的帮助下，编程变得更有趣了。因为大量“填空式”的苦差事被消除，剩下的就是创造性的部分。

他也感觉更少被卡住（这很不愉快），并且体验到了更多的勇气，因为几乎总有办法能与智能体携手取得积极进展。

Karpathy也看到了其他人的相反观点：大语言模型编码将根据工程师主要是喜欢“编码”还是喜欢“构建”而将他们区分开来。

能力萎缩

Karpathy已经注意到，手动编写代码的能力正开始慢慢萎缩。

生成（写代码）和辨别（读代码）是大脑中的两种不同能力。即使你很难写出代码，也可以很好地审查代码，因为编程涉及的各种细微的、主要是语法上的细节。

垃圾末日（Slopacolypse）

Karpathy正准备迎接2026年，那将是GitHub、Substack、arXiv、X/Instagram以及所有数字媒体的“垃圾末日”之年。除了实际的进步之外，我们还会看到更多AI炒作下的“生产力表演”。

几个问题

Karpathy脑海中有几个问题：

“10倍工程师”会怎样——顶尖工程师与平均水平工程师之间的生产力差距会如何变化？这个比例很有可能大幅增长。

有了大语言模型，通才是否会越来越胜过专才？大语言模型在“填空”（微观）方面远比在“宏大战略”（宏观）方面更出色。

未来的大语言模型编程会是什么感觉？像玩《星际争霸》？玩《异星工厂》？还是演奏音乐？

整个社会在多大程度上受限于数字知识工作？

总结

这一切将我们引向何方？

大语言模型智能体（尤其是Claude和Codex）的能力似乎在2025年12月前后跨越了某种“一致性”的门槛，引发了软件工程及相关领域的相变。

“智能”部分突然感觉遥遥领先于其他所有部分——包括集成（工具、知识）、对新组织工作流程的需求，以及更广泛的技术扩散。

随着整个行业消化这一新能力，2026年将是充满能量的一年。

source:

https://x.com/karpathy/status/2015883857489522876

本文来源: AI寒武纪

免责声明：

1.资讯内容不构成投资建议，投资者应独立决策并自行承担风险

2.本文版权归属原作所有，仅代表作者本人观点，不代币币情的观点或立场