tuning - 搜索 News

北京时间2025年1月30日凌晨，上海交通大学林尤舜研究团队与中国科学院分子植物科学卓越创新中心林鸿宣研究团队合作在国际顶级学术期刊《自然》 (Nature)上发表题为?“Fine-tuning gibberellin improves rice ...

腾讯网4 小时

【新车速递】凯旋发布2025 Speed Triple 1200 RS：性能与科技再攀新高

近日凯旋发布2025款Speed Triple 1200 RS。这款被誉为“大青蛙”的英伦暴力美学代表，凭借更强劲的动力、更精确的操控以及更先进的电子技术，再次刷新了人们对高性能街车的认知。在外观设计上，2025款Speed Triple 1200 ...

21 小时

DeepSeek掀翻“AI牌桌”，三大拐点决定大模型未来

幻方量化旗下AI初创公司DeepSeek成功“破圈”，凭借基于深度学习的量化交易模型“掀翻”了全球人工智能市场的牌桌。这也成为美国、日本进一步加紧对中国半导体产业实施出口管制的诱因之一。

2 小时

多模态DeepSeek来了！杨耀东团队联合港科发布Align-DS-V，助力灵初DS-VLA ...

在当前AI领域的快速发展中，“强推理慢思考”已经成为主要的发展动向之一，它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景，并且确保和人类的价值意图相一致，已成为一个极具前瞻性且至关重要的挑战。

腾讯网17 小时

7天2篇！C9，连发Nature

2025年2月6日，国际顶级学术期刊Nature发表了上海交通大学崔勇教授团队及其合作伙伴的研究成果“金属-卤化物多孔框架超晶格”(Metal-halide porous framework ...

Nanyang Siang Pau11 小时

美国议员拟提案政府装置禁用DeepSeek

这项立法是由美国伊利诺州共和党籍众议员拉胡德（Darin LaHood）、纽泽西州民主党籍众议员高特海默（Josh ...

1 天

震惊！不到50美元训练出媲美OpenAI的推理模型，你绝对想不到！

在人工智能技术飞速发展的今天，斯坦福大学和华盛顿大学的研究团队再一次诠释了什么叫做‘低成本高效率’。最近，他们的研究报告震撼发布，仅用不到50美元的云计算费用，就成功训练出一款名为s1的推理模型，其推理能力已与OpenAI的o1和DeepSeek的r1相媲美。那么，这一突破性成果究竟意味着什么？

21 小时

刘知远详解DeepSeek出圈背后的逻辑：自身算法的创新以及OpenAI的傲慢

“DeepSeek R1的开源，让全球的人能够意识到深度思考的能力。这相当于让整个人工智能领域再次迎来了类似于2023年初ChatGPT的时刻，让每个人感受到大模型的能力又往前迈进了一大步。但同时，我们也需要合理地评估DeepSeek本身的重要意义。”清华大学长聘副教授刘知远日前在参与由中国计算机学会青年计算机科技论坛（CCF Young Computer Scientists & ...

来自MSN2 天

RL崛起，SFT已死？仅用1/140成本，批判微调CFT媲美DeepSeek-R1复现模型

DeepSeek R1/R1-Zero让RL大火，SFT就无用了吗？滑铁卢与卡内基梅隆大学带来一种全新范式批判微调（CFT：Critique Fine-Tuning，已开源），即让模型学习对有噪声的回答进行批判，而不是简单地模仿正确的回答。

1 天

面壁智能联创谈 DeepSeek 出圈：与 OpenAI o1 不开源有关，R1 模型创造了 ...

2 月 5 日下午消息，近日，面壁智能联合创始人兼首席科学家刘知远在谈及 DeepSeek 近期引发的热潮时指出，“DeepSeek 最近发布 R1 模型的重要价值在于它能够完美复现 OpenAI o1 的深度推理能力，并且他通过开源的方式发布了相对详细的介绍，为行业作出了重要贡献。” ...

1 天

超越DeepSeek V3，Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

当我们在欢呼Deepseek超越ChatGPT时，来自美国的艾伦人工智能研究所（Ai2）推出了基于强化学习的新一代开源模型Tülu 3 405B，不仅能够媲美GPT-4o，更在多项关键基准测试中超越了DeepSeek v3。

腾讯网4 天

开门红！C9高校，发Nature

北京时间2025年1月30日凌晨，上海交通大学林尤舜研究团队与中国科学院分子植物科学卓越创新中心林鸿宣研究团队合作在国际顶级学术期刊《自然》(Nature)上发表题为 “Fine-tuning gibberellin improves rice ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果