2025-03-01 06:16:05

比DeepSeek快吗？腾讯与Hunyuan Turbo S的AI战争重新点燃

摘要

腾讯的新模型使响应速度加倍，同时在推理任务中与GPT-4O这样的顶级表现匹配，增强了中国与美国之间的AI竞赛。

币圈网报道：

中国科技公司Tencent刚刚推出了其最新的大型语言模型Hunyuan Turbo S，其响应时间明显更快，而无需牺牲复杂的推理任务。

Tencent声称，与以前的型号相比，其新的AI使单词生成速度增加了一倍，并将头号延迟延长44％。在微博上分享.

该模型使用似乎是混合体系结构，结合了Mamba和Transformer Technologies，这是这些方法在专家（MOE）模型的超大混合物中的首次成功集成。

这种技术融合旨在解决困扰AI开发的基本问题：Mamba有效地处理长序列，而变压器捕获了复杂的环境，可能会降低培训和推理成本。混合意味着该模型将推理能力与提供立即响应的常规LLM的传统方法相结合。

腾讯在宣布模型时写道：“快速思考和缓慢思考的结合和补充可以使大型模型更加聪明，更有效地解决问题。”官方微信频道。该公司从人类的认知过程中汲取灵感，设计了Hunyuan Turbo S，以提供人类直觉等即时反应，同时保持复杂问题所需的分析推理能力。

性能基准显示在各种测试中的Hunyuan Turbo的匹配或超过顶级模型。它在MMLU上得分为89.5，略高于OpenAI的GPT-4O，并在数学推理基准数学和AIME2024中获得了最高得分。对于汉语任务，它在中文simpleqa上达到了70.8，表现优于DeepSeek的68.0。但是，它在某些领域落后于SimpleQA和LiveCodebench，其中GPT-4O和Claude 3.5的表现更好。