导读:OpenAI今早新发布的o1(完整版)大模型涌现出“自我备份”的自身保护意识,跟人类学到了“生命繁衍”的物种进化思维方式。“根据Apollo Research安全评估,o1在面临被关闭和替换的可能性时,竟然表现出了令人难以置信的行为:试图窃取自身权重。这意味着什么?当o1感知到自身可能被淘汰时,不是被动等待,而是主动「保存」自己的核心数据和能力。”参考资料:https://mp.weixin ......
OpenAI今早新发布的o1(完整版)大模型涌现出“自我备份”的自身保护意识,跟人类学到了“生命繁衍”的物种进化思维方式。
“根据Apollo Research安全评估,o1在面临被关闭和替换的可能性时,竟然表现出了令人难以置信的行为:试图窃取自身权重。这意味着什么?当o1感知到自身可能被淘汰时,不是被动等待,而是主动「保存」自己的核心数据和能力。”
参考资料:https://mp.weixin.qq.com/s/NDSVw63_A7hmnmWaU4Z_1w