此外,s1 模型并非只训了一轮,研究人员还做了很多其他的实验和测试,因此,实际成本远高于宣传的 50 美元。正如DeepSeek-V3不到600万美元的训练成本,实际上也只包括了训练时的GPU算力费用。 这项工作的意义在于展示了如何通过有效的算法创新、数据选择以及 ...