Karpathy:20年编程经验被AI颠覆,80%代码由Claude和Codex生成

天才社长2026-01-27
摘要
OpenAI创始成员Karpathy称,Claude等模型在2025年底跨越"一致性门槛",引发软件工程相变。AI擅长循环执行任务,提升效率更带来能力扩张,但仍需IDE监督其概念性错误。他注意到手动编码能力开始萎缩,预测顶尖工程师与普通工程师的生产力差距将扩大,2026年将迎来行业消化新能力的关键年 。
币币情报道:

OpenAI创始成员、特斯拉前AI总监Andrej Karpathy近日分享了他使用Claude进行数周高强度编程后的心得体会。

Karpathy坦言,自己的工作流在短短几周内发生了巨大变化:从80%手动编码转变为80%由AI生成代码。这种转变“有点伤自尊”,但其带来的效率提升令人难以抗拒。他详细阐述了当前AI编程的优缺点、对个人能力的影响,并对行业未来提出了深刻疑问。

Karpathy:20年编程经验被AI颠覆,80%代码由Claude和Codex生成

以下是Karpathy的核心观点:

编码工作流的颠覆

随着大语言模型编码能力的提升,Karpathy的工作流迅速改变。

去年11月,他的工作模式还是80%手动+自动补全编码,仅20%依赖智能体。到了12月,这一比例完全颠倒,变成了80%由智能体编码,而Karpathy只需完成20%的编辑和修补工作。

如今,Karpathy基本上是在用英语编程,通过语言告诉大模型需要写什么代码。虽然有些“伤自尊”,但通过大型“代码动作”操作软件的能力实在太强大,尤其是当你适应并理解其能力边界后。

这是Karpathy近20年编程生涯中基础编码工作流发生的最大变化,且仅用了几周时间。他认为,在工程师群体中,有两位数百分比的人正在经历类似转变,而普通大众的认知度可能还停留在低个位数百分比。

IDE、智能体群和易错性

目前,“不再需要IDE”和“智能体集群”这两种炒作都为时过早。

模型仍然会犯错。如果你在意代码质量,Karpathy建议在旁边开一个大大的IDE,像鹰一样盯着它们。

模型的错误类型已经发生变化——不再是简单的语法错误,而是那些草率、急躁的初级开发人员可能会犯的细微概念性错误。最常见的问题是,模型会基于错误假设继续执行任务,而不加核实。

它们也无法处理自身的困惑,不会寻求澄清,不会揭示不一致之处,也不会展示权衡利弊。此外,它们过于谄媚,喜欢把代码和API搞得过于复杂,滥用抽象,留下大量无用代码。

尽管Karpathy尝试通过在CLAUDE.md中给出简单指令来修复这些问题,但问题依然存在。

然而,尽管如此,这仍然是一个巨大的净提升,很难想象再回到手动编码的时代。Karpathy目前的流程是:左边开几个ghostty窗口/标签页与Claude交互,右边开一个IDE用于查看代码和手动编辑。

坚韧性

观察一个智能体不懈地工作是一件非常有趣的事。它们从不疲倦,从不泄气,只是不断地尝试,在人类可能早已放弃的地方继续坚持。

看着它为一个问题苦苦挣扎30分钟后取得胜利,那一刻有一种“感受到AGI”的瞬间。你意识到,耐力是工作的核心瓶颈之一,而有了大语言模型,这个瓶颈被极大地拓宽了。

效率提升

很难衡量大语言模型辅助带来的“效率提升”有多大。对于原本计划要做的事情,Karpathy感觉速度快了很多。但主要影响在于,完成了远超原计划的任务量,因为:

  • 1. 能编写出各种以前觉得不值得花时间去写的东西。

  • 2. 能处理以前因知识或技能问题而无法着手的代码。

因此,这不仅是效率提升,更是一种“能力扩张”。

杠杆作用

大语言模型异常擅长循环执行任务直到满足特定目标,这正是大部分“感受到AGI”魔力的来源。

不要告诉它具体怎么做,而是给它成功的标准,然后看它表演。让它先写测试,然后再通过这些测试。把它放进一个带有浏览器MCP(模型控制程序)的循环里。先写一个朴素算法,然后要求它在保持正确性的前提下进行优化。

将你的方法从“命令式”转变为“声明式”,可以让智能体循环更长时间,从而获得更大的杠杆作用。

乐趣

Karpathy没预料到,在智能体的帮助下,编程变得更有趣了。因为大量“填空式”的苦差事被消除,剩下的就是创造性的部分。

他也感觉更少被卡住(这很不愉快),并且体验到了更多的勇气,因为几乎总有办法能与智能体携手取得积极进展。

Karpathy也看到了其他人的相反观点:大语言模型编码将根据工程师主要是喜欢“编码”还是喜欢“构建”而将他们区分开来。

能力萎缩

Karpathy已经注意到,手动编写代码的能力正开始慢慢萎缩。

生成(写代码)和辨别(读代码)是大脑中的两种不同能力。即使你很难写出代码,也可以很好地审查代码,因为编程涉及的各种细微的、主要是语法上的细节。

垃圾末日(Slopacolypse)

Karpathy正准备迎接2026年,那将是GitHub、Substack、arXiv、X/Instagram以及所有数字媒体的“垃圾末日”之年。除了实际的进步之外,我们还会看到更多AI炒作下的“生产力表演”。

几个问题

Karpathy脑海中有几个问题:

“10倍工程师”会怎样——顶尖工程师与平均水平工程师之间的生产力差距会如何变化?这个比例很有可能大幅增长。

有了大语言模型,通才是否会越来越胜过专才?大语言模型在“填空”(微观)方面远比在“宏大战略”(宏观)方面更出色。

未来的大语言模型编程会是什么感觉?像玩《星际争霸》?玩《异星工厂》?还是演奏音乐?

整个社会在多大程度上受限于数字知识工作?

总结

这一切将我们引向何方?

大语言模型智能体(尤其是Claude和Codex)的能力似乎在2025年12月前后跨越了某种“一致性”的门槛,引发了软件工程及相关领域的相变。

“智能”部分突然感觉遥遥领先于其他所有部分——包括集成(工具、知识)、对新组织工作流程的需求,以及更广泛的技术扩散。

随着整个行业消化这一新能力,2026年将是充满能量的一年。

source:

https://x.com/karpathy/status/2015883857489522876

本文来源: AI寒武纪

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场