peopleevents
梁斌penny 2025-09-19 01:09+08:00Z
原微博

//@刘群MT-to-Death:人类智力水平的制高点在被AI一个一个拿下。//@史蒂夫XU23:openai的通用推理模型要强于谷歌的推理模型,让我们看到通用模型的未来希望

@高飞

#模型时代# 现在X上,OpenAI的人都在刷拿了ICPC 2025 拿了大学生精英编程竞赛满分成绩的消息。这次是OpenAI和Gemini都参赛了,OpenAI小胜一局, 解出了全部 12 道题目,而 Gemini 解出了 10 道。据AI KOL Deedy说,最难的问题是图片上这个熔岩护城河问题(G题)。OpenAI 需要尝试 9 次才能解决(耗时供241分钟)。而OpenAI相关负责人Mostafa Rohaninejad说:OpenAI使用了一组通用推理模型进行比赛,并未针对 ICPC 专门训练任何模型。GPT-5 与实验性推理模型共同生成解法,由后者筛选最终提交的解法。GPT-5 正确解答了 11 道题目,而最后一道(也是最难的)题目则由实验性推理模型攻克。我让ChatGPT分析了一下这个题目:背景:有一片山地(边境高地)。位置关系:高地的南边住着好人,北边住着哥布林。哥布林的想法:为了防止好人过来,哥布林要在高地上修一条“护城河”,里面全是熔岩。特别的要求:这条护城河必须始终在同一个高度上(像一条等高线),不能一会高一会低。问题是:地图很复杂,能不能找到这样一条路?如果能,最短是多少?难点在于:等高线不是现成的,它可能穿过三角形的边或内部,要靠计算插出来。这不是单纯的几何问题,还要在所有可能的等高线片段里找最短路,相当于几何 + 图论结合。数据规模大,算法要非常高效,才能在规定时间内算出来。所以难就难在:既要算几何交点,又要在复杂图里跑最短路,还得保证速度和精度。然后我问GPT-5能不能算出来,回答是:我能把它的正确做法与关键细节讲清楚,但要在这里马上写出一份满分可过评测的代码,风险很大(实现量和调试量都不小)。如果你要的是解题思路/伪代码/边界与复杂度,我现在就给到;如果一定要可交代码,我也能写,但一次成过不敢打包票。

上一页190/995每页 10总共 9943下一页