qwen - 搜索 News

金融界科技 on MSN4 小时

斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家（包括著名的华裔“AI教母”李飞飞）利用阿里巴巴的开源Qwen2.5模型，以不到50美元的成本训练出一种新的推理模型，在中国De ...

3 天

李飞飞、DeepSeek为何青睐国产大模型Qwen？深度解读AI开源新势力

在当今人工智能领域，依靠优异的性能和开源模式，阿里云的通义千问Qwen模型正逐渐崭露头角。最近，斯坦福大学的李飞飞教授团队发布了一项惊人的研究，他们在仅用26分钟内，利用仅仅1000个样本，在通义千问Qwen模型基础上微调出一款名为s1-32B的新模型，展现出超越OpenAI的o1、DeepSeek的R1等尖端推理模型的能力。这一突破性的成果引发了广泛关注。

1 天

阿里通义千问(Qwen)引领全球开源大模型时代：Huggingface最新榜单出炉

近年来，人工智能（AI）技术飞速发展，开源大模型已经成为这一领域中的重要力量。近日，全球最大的人工智能开源社区Huggingface发布了最新的开源大模型榜单（OpenLLMLeaderboard），这一榜单揭示了AI行业的一项显著趋势：排名前十的开源大模型均为基于阿里通义千问（Qwen）开源模型经过二次训练的衍生模型。这不仅足以体现Qwen在技术和应用上的深远影响力，也标志着中国在全球AI领域的 ...

4 天on MSN

Qwen模型：AI大模型领域的“幕后英雄”，实力引领开源新潮流

近期，AI大模型领域掀起了一股新的技术热潮。在国内，李飞飞团队提出了一种创新的模型训练方式，再次点燃了行业内的讨论之火。这一新方法以阿里云的通义千问Qwen2.5-32B-Instruct开源模型为基础，借助16块H100 ...

腾讯网5 天

Google三大模型齐发，均进Lmarena前十，实测对比Deepseek、Qwen推理能力大增

作者｜子川来源｜AI先锋官疯狂，Google连发三款模型！面对Deepseek的爆火出圈，OpenAI忍不住上线全新模型o3-mini，这不，Google也开始按耐不住了，就在今天，三款模型齐上线——Google目前最强大的模型：Gemini 2.0 ...

腾讯网14 天

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B ...

官方放出的测试结果，Qwen系列视觉旗舰中的旗舰——Qwen2.5-VL-72B-Instruct，在一系列涵盖多个领域和任务的基准测试中表现如下。据官方信息，Qwen2.5-VL可以采用矩形框和点的多样化方式，对通用物体定位，并实现层级化定位和规范的 JSON格式输出。

4 天on MSN

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

李飞飞团队与 DeepSeek 纷纷选择 Qwen 作为基座模型，已经足以引发业界的关注和广泛讨论，而这一现象背后，不仅是 Qwen 模型自身强大的性能与独特优势的体现，更是开源理念推动技术进步的生动案例。

4 天

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

爱范儿4 天

李飞飞团队新作，爆火的DeepSeek，为什么都选择 Qwen 作为基座模型？

更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏 6 个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了 ...

美国之音12 天

阿里巴巴发布AI模型声称超越DeepSeek

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...

8 天

阿里巴巴高开近5% 阿里云百炼qwen-max系列模型官宣降价

近期，阿里云发布百炼qwen-max系列模型价格调整通知，qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型输入输出价格调整，qwen-max batch和cache同步降价。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果