Karpathy详细讲解了DeepSeek-R1如何在多维度利用RL技术提升学习效率。在具体的数学问题上,模型通过成千上万的学习步骤进行自我优化,不断探索解决方法。相较于传统的AI模型,DeepSeek-R1显示出更强的解决复杂问题的能力,有效提高了准确率。研发团队通过大量实验发现,该模型在面对问题时使用了更长的回应,使得解法更加全面与深入。
继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 ...
近日,AI领域再度掀起波澜,一场关于大模型进化的深度探讨在YouTube上引发广泛关注。这场长达3小时的视频讲座,由李飞飞的学生、OpenAI早期成员及前特斯拉AI总监亲自录制,内容涵盖从神经网络的起源到GPT-2、ChatGPT,再到最新的Deep ...
近期,神经网络领域的重磅人物Andrej ...
西风 发自 凹非寺量子位 | 公众号 QbitAI 宣布全职搞教育的AI大神Andrej Karpathy(卡帕西),新年第一课来了—— ...
传统的大语言模型遵循一个相对简单的扩展逻辑:每一代模型的计算能力大约是前一代的 100 倍。正如 Altman 所说:“在过去的范式中,我们只做预训练,从 GPT-1 到 GPT-4,每个版本都大约是前一个版本的 100 ...
前OpenAI联合创始人、AKA赛博活佛卡帕西(Andrej Karpathy)又给大家发福利了:三个半小时讲透大模型,涵盖了开发过程、工作机制和实际应用,其中还拿DeepSeek ...
什么是“斯普特尼克时刻”?通俗理解,其描述的是前苏联于1957年成功发射第一颗人造卫星“斯普特尼克1号”,壮举震惊全球。如今的DeepSeek,也开始让美西方怀疑自己的科技封锁多么失败。
前特斯拉AI总监盛赞DeepSeek。如果只是模仿人类玩家,AI无法超越人类,但纯强化学习算法却能突破这种限制。
这支由工程师们隔着电子屏幕构筑的数字长城,打赢了一场价值数十亿、足以写进教科书的网络攻防战,也彰显了中国AI时代的一身正气。 今天就让我们一起走进当前大热的DeepSeek,看看它到底掀翻了谁的桌,又将给我们带来怎样的变化?
春节期间最火爆的事件,就是DeepSeek掀起的AI滔天巨浪。DeepSeek的开源AI大模型DeepSeek ...
这支由工程师们隔着电子屏幕构筑的数字长城,打赢了一场价值数十亿、足以写进教科书的网络攻防战,也彰显了中国AI时代的一身正气。 今天就让我们一起走进当前大热的DeepSeek,看看它到底掀翻了谁的桌,又将给我们带来怎样的变化?