更新时间:2026-01-18 19:21 来源:牛马见闻
ICML2026的这波操作但在Bengio看来ICML已经用算法告诉我们
<p class="f_center"><br></p> <p id="48HKQP05"><strong>新智?元报道</strong></p> <p id="48HKQP08">编]辑:倾倾</p> <p id="48HKQP0A"><strong>【新智元导读】ICML祭出一套疯狂的评审机制,竟成了学术界的救命稻草。连AI教父Bengio都站台支持:在信息过载的时代,我们必须学会利用「偏见」来降噪。</strong></p> <p id="48HKQP0C">2025年,NeurIPS的投稿洪峰冲破3万大关——这比一年前直接翻了近乎一倍。</p> <p id="48HKQP0D">这3万篇论文构成的认知过载,足以让现存的任何人类评审系统当场宕机。</p> <p id="48HKQP0E">学术界的「同行评审」系统,名存实亡。</p> <p class="f_center"><br></p> <p id="48HKQP0G">面对这场审稿危机,ICML 2026终于坐不住了。他们推出了一项极具颠覆性、甚至带有博弈论色彩的新政——作者自评级。</p> <p class="f_center"><br></p> <p id="48HKQP0I">我们审不动了。你们自己招吧:手里这几张牌,哪张是凑数的废纸,哪张是真正的王炸?</p> <p id="48HKQP0J">这听起来像是「让嫌疑人给自己判案」。如此疯狂的政策为什么能落地?因为它背后站着一位真正的神——Yoshua Bengio。</p> <p id="48HKQP0K"><strong>机制突变:从「猫鼠游戏」到「带枪投案」</strong></p> <p id="48HKQP0L">ICML2026的这波操作,表面上是在向作者索要权力,实际上是给了一块「免死金牌」。</p> <p id="48HKQP0M">在过去,同行评审是一场「猫鼠游戏」。</p> <p id="48HKQP0N">作者是「嫌疑人」,竭尽全力把垃圾包装成金子;评审员是「侦探」,拿着显微镜找破绽。大家互不信任,且互相伤害。</p> <p id="48HKQP0O">但现在,ICML摊牌了:「侦探不够用了,请嫌疑人协助破案。」</p> <p id="48HKQP0P">你可能会问:</p> <p id="48HKQP0Q">让作者自评?那还不全员满分?谁会承认自己写的是垃圾?</p> <p id="48HKQP0R">这正是博弈论最精彩的杀招:保序回归。系统不看你打的分数,它只看你的出牌顺序。</p> <p id="48HKQP0S">你不需要告诉系统这篇论文是9分还是3分,你只需要告诉系统:在我投的这3篇里,A>B>C</p> <p id="48HKQP0T">以前,你可以把3篇平庸的5分论文全吹成9分神作,赌评审员眼瞎放水。</p> <p id="48HKQP0U">现在,如果你为了捞3分的烂文,硬把它排在9分神作之前,结果烂文没救成,神作的分数还被强行拉低。</p> <p id="48HKQP0V">为什么ICML敢这么做?因为他们手里有数据。</p> <p id="48HKQP10">ICML 2023的秘密实验结果显示,作者对自己论文的排序,更能精准预测论文未来的生死。</p> <p class="f_center"><br></p> <p id="48HKQP12">ICML2023实验数据分析:在不同投稿数量下,蓝色柱状图(自评级校准分)的误差显著低于红色柱状图(评审员原始分)</p> <p class="f_center"><br></p> <p id="48HKQP14">数据显示,作者自评排在第一位的论文,其16个月后的引用量,是末位论文的200%。</p> <p id="48HKQP15">很多时候,评审员因为看不懂,把真正的神作杀掉了;而作者心里门儿清——「这篇是灌水的,那篇才是改变世界的」。</p> <p id="48HKQP16">这不只是一次规则调整,这是对「同行评审神圣性」的祛魅。</p> <p id="48HKQP17">官方终于承认:在这个信息过载的时代,与其相信一个只读了你论文20分钟的陌生人,不如利用作者想「赢」的野心,引导他说出真话。</p> <p id="48HKQP18"><strong>图灵奖得主「叛变」:客观已死,偏见万岁</strong></p> <p id="48HKQP19">这张牌之所以能打出来,是因为桌子对面坐着一位真正的「神」——Yoshua Bengio</p> <p class="f_center"><br></p> <p id="48HKQP1B">在JASA的官方讨论稿中,Bengio并没有把这看作一次简单的规则修补,他将其定义为:</p> <p id="48HKQP1C">机器学习与统计学的一次强力协同(PowerfulSynergy)。</p> <p class="f_center"><br></p> <p id="48HKQP1E">不同博弈策略下的误差缩减。通过「保序机制」,均方误差的改善幅度最高达23.48%。</p> <p id="48HKQP1F">为什么连AI教父都「叛变」了?</p> <p id="48HKQP1G">在传统的科学理想国里,我们迷信「客观」。我们认为评审员是公正的法官,作者是狡猾的辩护人。</p> <p id="48HKQP1H">但在Bengio看来,这种洁癖在30000篇投稿的噪音面前,不仅幼稚,而且低效。</p> <p id="48HKQP1I">Bengio及其合作者DinghuaiZhang在评论中指出了一个极其深刻的哲学转变:</p> <p></p> <ul> <p id="48HKQP1J">承认「噪音」统治:当评审系统因过载已退化为「随机数生成器」,盲目追求绝对客观,本质上是一种由于傲慢导致的低效。</p> <p></p> <p id="48HKQP1K">拥抱「主观」信号:既然作者是最了解论文的人,为什么要把这个「信噪比」最高的信息源屏蔽掉?</p> <p></p> </ul> <p id="48HKQP1L">因此,所谓的「偏见」,只要经过统计学修正,就是最珍贵的「特征」。这不仅仅是分数的博弈,更是「慢科学」的回归。</p> <p class="f_center"><br></p> <p id="48HKQP1N">你以为Bengio只是支持一种打分算法吗?不。</p> <p id="48HKQP1O">作为长期呼吁抵制「PublishorPerish(不发表就出局)」的领军人物,Bengio看重的是这个机制背后的「自省」功能。</p> <p id="48HKQP1P">他甚至在评论中提出了更激进的「多维降维」构想:</p> <p id="48HKQP1R">未来的作者不应该只排「好坏」,而应该被要求在多个维度上自首:</p> <p></p> <ul> <p id="48HKQP1S">这篇论文是新颖但粗糙的吗?</p> <p></p> <p id="48HKQP1T">还是严谨但老套的?</p> <p></p> </ul> <p id="48HKQP1V">这是一种对学术浮躁风气的技术性矫正。</p> <p id="48HKQP20">当作者被迫对自己的三篇论文进行排序时,他必须在深夜里扪心自问:「难道我真的在灌水?」</p> <p id="48HKQP21">这种「强制性内省」,或许才是Bengio眼中,比筛选论文更重要的价值。</p> <p id="48HKQP22"><strong>算法折叠:豪门疯狂套利,散户只配「裸奔」</strong></p> <p><strong>如果你看到这里觉得:「太好了,终于有人来整治乱打分的评审了!」</strong></p> <p id="48HKQP23">先别急着庆祝。请先看一眼你手中的筹码。</p> <p id="48HKQP24">这项看似完美的「博弈论神技」,其实隐藏着一个被默许的「贫富准入门槛」。</p> <p id="48HKQP25">「自评级机制」生效的前提,是你必须至少投两篇论文。</p> <p id="48HKQP26">你得先有PaperA和PaperB,系统才能通过A>B的逻辑来校准分数。</p> <p id="48HKQP27">如果你只投了一篇呢?对不起,系统救不了你。</p> <p id="48HKQP28">你依然只能在那个充满了AI垃圾评论、随机打分的旧系统里裸奔。</p> <p id="48HKQP29">这是一场针对「学术散户」的精准降维打击。</p> <p class="f_center"><br></p> <p id="48HKQP2B">根据ICML2023的官方统计数据显示,75.5%的作者,只投了一篇论文。</p> <p id="48HKQP2C">这意味着那25%的「大户」,手里的多篇论文不再只是成果,而是变成了可以相互对冲、用来校准分数的「套利筹码」。</p> <p id="48HKQP2D">他们可以通过精妙的排序,利用统计学算法为自己的神作穿上「防弹衣」,挡住瞎眼评审的子弹。</p> <p class="f_center"><br></p> <p id="48HKQP2F">MSE缩减的置信区间。在99%的置信水平下,误差缩减依然保持在极高区间,</p> <p id="48HKQP2G">而75%的「普通玩家」面对的,依然是「俄罗斯轮盘」。</p> <p id="48HKQP2H">如果遇到一个心情不好的评审员给了你3分,你没有任何数学工具可以反抗。</p> <p class="f_center"><br></p> <p id="48HKQP2J">筹码越多,护甲越厚。观察红蓝柱对比可见,作者投出的论文越多(横轴),利用自评级机制缩减误差(蓝色柱状图下降幅度)的空间往往越稳定。</p> <p id="48HKQP2K">香港大学的WeichenWang和LSE的ChengchunShi认为,这种机制实际上是在奖励「灌水」。</p> <p id="48HKQP2L">为了获得「被校准」的资格,为了获得那层算法保护壳,实验室会被迫把一项成果拆成三项(SalamiSlicing),凑足「自评级」的入场券。</p> <p id="48HKQP2M">以前的强者靠质量通吃;以后的强者,恐将靠「堆量」和「排序策略」进行收割。</p> <p id="48HKQP2N">ICML2026的新政,或许确实解决了「评审准确度」的问题,但它解决的方式是——优先保护那些拥有更多资源的人。</p> <p id="48HKQP2O">这是一次赤裸裸的「算法折叠」。</p> <p id="48HKQP2P">ICML2026砸碎的不仅是评审规则,还有我们对「学术乌托邦」的最后一点幻想。</p> <p id="48HKQP2Q">当人类评审员在30000篇论文的洪流中彻底窒息,机器和算法接管裁判权,已是历史的必然。</p> <p id="48HKQP2R">这不再是一个比拼谁更「客观」的时代,这是一个比拼谁更懂「博弈」。</p> <p id="48HKQP2S">ICML已经用算法告诉我们,在算力爆炸的今天,「诚实」不再是一种高尚的道德自律,而是一条被博弈论强制执行的、冷冰冰的「生存策略」。</p> <p id="48HKQP2T">醒醒吧,旧世界已经塌了。</p> <p id="48HKQP2U">参考资料:</p> <p class="f_center"><br></p>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901