Anthropic警告：AI系统或很快具备“递归式自我改进”能力，自主构建下一代模型

打印派 2026-06-05 08:53:51

人工智能公司Anthropic近日发布最新研究报告，向业界与政策制定者发出警示：AI系统可能很快就能在极少人类干预的情况下，自主设计和改进下一代AI模型。该公司表示，这一趋势正比许多政府和机构预期的来得更快，可能引发“递归式自我改进”（recursive self-improvement）时代的加速到来。

从“辅助编码”到“自我进化”
Anthropic在其研究机构Anthropic Institute的博客文章中详细阐述了这一观点。目前，研究人员仍在引导AI模型的开发流程，但AI已承担起公司内部越来越多的编码、调试和技术研究工作。据Anthropic披露，截至2026年5月，由Claude生成的代码已占其系统合并代码总量的80%以上。而在2025年初Claude Code发布之前，这一比例仅处于个位数。

伴随这一变化，工程生产力大幅提升。Anthropic工程师目前每日合并的代码量约为2024年的8倍。公司联合创始人兼政策负责人Jack Clark表示，立法者和机构需要了解接下来可能发生的变化。“我们一贯认为，最好的做法就是让这个概念社会化，让人们大致了解即将到来的情况。”

性能基准快速攀升
Anthropic还引用了多个公开基准测试来证明AI能力的高速迭代。在软件工程测试SWE-bench中，前沿模型在两年内从低分跃升至接近饱和水平。在衡量AI能否复现已发表科学研究成果的CORE-Bench上，AI系统从2024年约20%的复现成功率，在大约15个月后提升至近乎完美。

此外，AI模型能够可靠处理的连续任务时长大约每四个月翻一番。Anthropic数据显示：Claude Opus 3在2024年初只能完成持续几分钟的编码任务；一年后Claude Sonnet 3.7可处理约90分钟的工作；而Claude Opus 4.6已能应对长达12小时的任务。

风险与监管呼吁
尽管Anthropic强调，当前系统距离完全自主的AI开发仍有较大差距——人类仍负责定义目标、评判结果、决定研究方向——但公司警告称，如果监督工具无法跟上发展步伐，更强大的自主系统可能带来新的风险。

“无论是作为组织，还是最终作为社会，我们都需要找出验证和核实AI生成工作的工具。”Clark表示，未来的系统必须始终与人类目标和公共利益保持一致。Anthropic计划在未来数月与美国立法者讨论该议题，并建议政府应为“AI系统或在极少人类参与下帮助创造更强大后继者”的可能性做好准备。

业内观察人士指出，递归式自我改进一旦实现，将彻底改变AI发展范式，但也可能带来失控风险。如何在加速创新与建立有效监管之间取得平衡，将是政策界与技术界共同面临的紧迫课题。

677 0

发表评论

登陆后参与评论