搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
5 小时
成本不到150元!26分钟训出个推理模型 媲美o1和R1
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元 (约145.844元) 就能租到 。
至顶头条 on MSN
3 小时
研发成本不足 50 美元的新型大语言模型性能超越 OpenAI 的 o1-preview
斯坦福和华盛顿大学的研究人员开发出一种新的大语言模型s1-32B,在某些任务上表现优于OpenAI的o1-preview,但成本仅为后者的一小部分。该模型采用测试时计算技术,通过增加生成答案的时间和硬件资源来提升输出质量。s1-32B在数学基准测试中 ...
1 天
科学家开发快速近场动力学算法,比现有算法加速800倍
与串行程序(Serial)和 OpenMP 并行程序相比,本次算法可以分别实现高达 800 倍和 100 倍的加速。 (注:串行程序,指的是按照指令顺序一个一个地执行的程序,前一个任务完成后下一个任务才会开始;OpenMP(Open ...
8 小时
FPGA技术为什么越来越牛,这是有原因的
由于很多人打算把 FPGA 当作计算加速卡来用,两大 FPGA 厂商推出的高层次编程模型也是基于 OpenCL,模仿 GPU 基于共享内存的批处理模式。CPU 要交给 FPGA 做一件事,需要先放进 FPGA 板上的 DRAM,然后告诉 FPGA ...
腾讯网
11 小时
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀 ...
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示,训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到。
11 小时
成本不到150元!李飞飞等26分钟训出推理模型媲美R1,秘诀:蒸馏
据 TechCrunch ,这个训练过程消耗了不到50美元的 云计算 成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到 。
存储在线
18 天
AI激发MRAM的新动能!Vertical Compute融资2000万欧元
近期,CEO Sylvain Dubois(前谷歌员工)和CTO Sebastien Couet(前比利时微电子研究所专家)创立的 初创公司Vertical Compute 宣布已成功完成 2000 万欧元的种子轮融资。此轮融资由 ...
2 天
DeepSeek积极筹备适配国产GPU,绕开英伟达CUDA
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
腾讯网
1 天
DeepSeek绕过CUDA!为适配中国国产GPU做准备
2月5日消息,DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。众所周知,英伟达的CUDA(Compute Unified ...
腾讯网
1 天
黑马崛起!DeepSeek最新渠道汇总与使用攻略
「春节期间,一匹黑马悄然崛起——AI模型公司DeepSeek一跃成为国内外科技圈的焦点。不同于娱乐性质的扭秧歌机器人,这家公司凭借其强大的AI模型能力,正在为企业和个人用户带来实质性的价值。本文将为您详细介绍DeepSeek模型的企业应用现状,并提供 ...
Taiwan News
9 天
Expanding Needs of AI Data Centers Have Profound Effects on Server Vendor's Roles
The rise in compute density and larger clusters, along with more powerful cooling systems, stretches current infrastructure limits and complicates new deployments NEW YORK, Jan. 28, 2025 /PRNewswire/ ...
来自MSN
2 天
DeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能,英伟 ...
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈