之后阿尔特曼梳理了 OpenAI 在推理模型上取得的一系列进展,按网友总结下来就是: 编程能力上,o1 排名为 9800;仅过去几个月,o3 将排名拉到第 175 位;如今一个内部模型在基准测试中排名约为 TOP50,而且年底就能直接登顶。