qwen - 搜索 News

19 小时

阿里通义千问(Qwen)引领全球开源大模型时代：Huggingface最新榜单出炉

近年来，人工智能（AI）技术飞速发展，开源大模型已经成为这一领域中的重要力量。近日，全球最大的人工智能开源社区Huggingface发布了最新的开源大模型榜单（OpenLLMLeaderboard），这一榜单揭示了AI行业的一项显著趋势：排名前十的开源大模型均为基于阿里通义千问（Qwen）开源模型经过二次训练的衍生模型。这不仅足以体现Qwen在技术和应用上的深远影响力，也标志着中国在全球AI领域的 ...

3 天

李飞飞、DeepSeek为何青睐国产大模型Qwen？深度解读AI开源新势力

在当今人工智能领域，依靠优异的性能和开源模式，阿里云的通义千问Qwen模型正逐渐崭露头角。最近，斯坦福大学的李飞飞教授团队发布了一项惊人的研究，他们在仅用26分钟内，利用仅仅1000个样本，在通义千问Qwen模型基础上微调出一款名为s1-32B的新模型，展现出超越OpenAI的o1、DeepSeek的R1等尖端推理模型的能力。这一突破性的成果引发了广泛关注。

华尔街见闻 on MSN41 分钟

阿里巴巴的Qwen大模型使得斯坦福、伯克利能够开发低成本的DeepSeek ...

阿里巴巴的开源Qwen2.5模型助力低成本AI训练，近期斯坦福大学与伯克利大学的研究人员利用这一技术成功开发出低于50美元的AI推理模型。斯坦福的S1推理模型和伯克利的TinyZero模型，均通过阿里巴巴的Qwen2.5-32b-Instruct模型训练而成。

腾讯网1 天

DeepSeek外国内还有全球屠榜的Qwen 2.5 Max，看下它和o3-mini 的 PK

作者｜子川来源｜AI先锋官最近大家的目光是不是都集中在Deepseek R1这款模型上，以至于连关于Deepseek ...

3 天on MSN

Qwen模型：AI大模型领域的“幕后英雄”，实力引领开源新潮流

近期，AI大模型领域掀起了一股新的技术热潮。在国内，李飞飞团队提出了一种创新的模型训练方式，再次点燃了行业内的讨论之火。这一新方法以阿里云的通义千问Qwen2.5-32B-Instruct开源模型为基础，借助16块H100 ...

腾讯网4 天

Google三大模型齐发，均进Lmarena前十，实测对比Deepseek、Qwen推理能力大增

作者｜子川来源｜AI先锋官疯狂，Google连发三款模型！面对Deepseek的爆火出圈，OpenAI忍不住上线全新模型o3-mini，这不，Google也开始按耐不住了，就在今天，三款模型齐上线——Google目前最强大的模型：Gemini 2.0 ...

3 天on MSN

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

李飞飞团队与 DeepSeek 纷纷选择 Qwen 作为基座模型，已经足以引发业界的关注和广泛讨论，而这一现象背后，不仅是 Qwen 模型自身强大的性能与独特优势的体现，更是开源理念推动技术进步的生动案例。

爱范儿3 天

李飞飞团队新作，爆火的DeepSeek，为什么都选择 Qwen 作为基座模型？

更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏 6 个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了 ...

4 天

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

美国之音12 天

阿里巴巴发布AI模型声称超越DeepSeek

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...

新浪网4 天

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct ...

不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问（Qwen）模型”。对此，新浪科技向阿里云方面求证，阿里云方面确认 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果