Anthropic警告:AI系统或很快具备“递归式自我改进”能力,自主构建下一代模型

打印派   2026-06-05 08:53:51

人工智能公司Anthropic近日发布最新研究报告,向业界与政策制定者发出警示:AI系统可能很快就能在极少人类干预的情况下,自主设计和改进下一代AI模型。该公司表示,这一趋势正比许多政府和机构预期的来得更快,可能引发“递归式自我改进”(recursive self-improvement)时代的加速到来。

从“辅助编码”到“自我进化”
Anthropic在其研究机构Anthropic Institute的博客文章中详细阐述了这一观点。目前,研究人员仍在引导AI模型的开发流程,但AI已承担起公司内部越来越多的编码、调试和技术研究工作。据Anthropic披露,截至2026年5月,由Claude生成的代码已占其系统合并代码总量的80%以上。而在2025年初Claude Code发布之前,这一比例仅处于个位数。

伴随这一变化,工程生产力大幅提升。Anthropic工程师目前每日合并的代码量约为2024年的8倍。公司联合创始人兼政策负责人Jack Clark表示,立法者和机构需要了解接下来可能发生的变化。“我们一贯认为,最好的做法就是让这个概念社会化,让人们大致了解即将到来的情况。”

性能基准快速攀升
Anthropic还引用了多个公开基准测试来证明AI能力的高速迭代。在软件工程测试SWE-bench中,前沿模型在两年内从低分跃升至接近饱和水平。在衡量AI能否复现已发表科学研究成果的CORE-Bench上,AI系统从2024年约20%的复现成功率,在大约15个月后提升至近乎完美。

此外,AI模型能够可靠处理的连续任务时长大约每四个月翻一番。Anthropic数据显示:Claude Opus 3在2024年初只能完成持续几分钟的编码任务;一年后Claude Sonnet 3.7可处理约90分钟的工作;而Claude Opus 4.6已能应对长达12小时的任务。

风险与监管呼吁
尽管Anthropic强调,当前系统距离完全自主的AI开发仍有较大差距——人类仍负责定义目标、评判结果、决定研究方向——但公司警告称,如果监督工具无法跟上发展步伐,更强大的自主系统可能带来新的风险。

“无论是作为组织,还是最终作为社会,我们都需要找出验证和核实AI生成工作的工具。”Clark表示,未来的系统必须始终与人类目标和公共利益保持一致。Anthropic计划在未来数月与美国立法者讨论该议题,并建议政府应为“AI系统或在极少人类参与下帮助创造更强大后继者”的可能性做好准备。

业内观察人士指出,递归式自我改进一旦实现,将彻底改变AI发展范式,但也可能带来失控风险。如何在加速创新与建立有效监管之间取得平衡,将是政策界与技术界共同面临的紧迫课题。


0

68 0

发表评论

登陆后参与评论