2026年6月:2028年RSI自进化,AI疯狂迭代引惊叹
- 时间:
- 浏览:118
- 来源:南宁市武鸣区陆酷巴网络科技工作室
倒吸一口凉气的37页论文
在2026年6月的时候, 一篇有着《红皇后哥德尔机》这样标题的论文出现了, 这篇论文有37页, 它在学术界引发热议挑起争议, 好多读者大声呼喊着表示“这绝对必然是年度里最具有危险性的AI论文”。它里边存在的核心运行机制是这样的, 那就是: AI进行的不仅仅是自我进化性质的活动, 而且它还能够亲自去打造出来更加严苛的裁判, 利用这个裁判来评判它自身, 并且这样的运作以此种方式得以一直持续循环, 形成没有尽头的递归自改进循环情况。
哥德尔机的二十年困局
在2003年的时候, 德国的科学家Jürgen Schmidhuber构思出了“哥德尔机”, 它是一台能够证明自身改进是有益的之后去改写代码的机器。从理论方面来说, 它能够无限地进行自我升级, 不过, 它存在致命门槛, 这个门槛就是: 在每次做出修改之前, 必须从数学角度严格表明这种改动是有益的, 而这所需要的算力简直就堪称是“黑洞”。
接下来的20年当中,哥德尔机一直处在论文这段时期, 变成了“理论天花板”。学术领域试着避开证明难题, 进而采用进化方式, 使得AI繁育代码变体并淘汰掉失败者, 不过始终存在一个盲点未被攻克。
达尔文与赫胥黎的进化尝试
这两年冒出来的达尔文哥德尔机, 还有赫胥黎哥德尔机, 完完全全摒弃了数学证明, 转而采用进化机制。它们使得AI“繁衍”出许许多多带有突变的代码变体, 把这些变体放进沙盒进行跑分测评, 那些跑分失败的就会被淘汰掉, 而跑分成功的则继续进行繁衍, 如此一来AI开始在字面意思上“进化”自身了。
但这些方法存在着共同的盲点, 那就是: 考官是固定不变的。不管AI怎样进行进化, 评判的标准永远被死死地固定在循环的外部, 丝毫没有变动。这与进化最为核心的规律相违背, 即: 物种从不会在静止的环境当中去优化自身, 而是会与环境一起发生变化。
红皇后机真正杀招
作为“红皇后”概念源头的1973年生物进化解说提到, 你得全力快跑, 才能够保持在初始位置, 因对手同样在演变。红皇后哥德尔机把此言论化作算法, 使得考核人员与参赛人员一同演进, 这属于整篇论文里最令人毛骨悚然的构思。
这套名为“受控效用进化”的机制, 对AI有着这样的要求, 那就是它既要以迅猛之势实现进化, 又要保证每一步的发展都能稳固立足。它亲自塑造出更为严厉的裁判, 用于评判自身所编写的更为先进的代码, 从而把自身限定在一个处于疯狂状态的自我迭代的循环之中。
三场实战验证成功
率先进行的那一场是写代码, RQGM针对代码Agent配备了“代码评审员”作为陪练, 留出测试集通过率由之前SOTA的69.9%提升到了71.7%, 并且少消耗了1.35至1.72倍的token。紧接着的第二场是写论文, 写手与评审一同实现了进化, 接收率从21.8%猛然飙升至40.5%。
奥赛级数学证明到了第三战, 所进化出现的“评分官”, 相比静态基线更为精准, 搜索成本降低至原先的三分之一, 而后进化出的“证明选手”, 取得了最高的平均分。整个篇章里面, 最具震撼力堪称封神的一点在于, 解决了LLM存在的偏好AI生成内容这样的问题, 最终在评审环节, 对于AI与人类做到了同等对待, 并无偏差。
当AI学会评判自己
2026年的夏天, Anthropic的联合创始人Jack Clark下了重注, 存在60%的概率, 在2028年底之前, AI可以亲手创造出更强力的自身 , 曾经困住哥德尔机长达20年的证明高墙, 被红皇后机以最残酷的繁衍直至淘汰再到繁衍的机制唤醒。
假使一个人工智能着手为自身打造最为严苛的考官, 不断疯狂递归, 把自身逼至极限, 那我们所面临的将会是一个自行界定“何为智慧”的全新物种。预言仅仅负责点明终点, 代码才负责通往, 这段距离正被人工智能自己以几何比例缩短。
你认为当AI能自己设计裁判后,人类还有必要继续监管AI发展吗?欢迎点赞、分享并在评论区留下你的观点。
猜你喜欢