2025-02-06 00:22:56
loading...

DeepSeek:不仅改变AI游戏规则,更引领技术平民化浪潮

摘要
来源:FT中文网 一年前的春节假期期间,OpenAI在2024年2月15日发布了文生视频大模型Sora。Sora生成的几段视频中,丝滑的运镜和逼真的效果令当时仍处于模仿和跟随阶段的国产大模型

来源:FT中文网

一年前的春节假期期间,OpenAI在2024年2月15日发布了文生视频大模型Sora。Sora生成的几段视频中,丝滑的运镜和逼真的效果令当时仍处于模仿和跟随阶段的国产大模型界陷入震惊与悲观情绪之中。“投降论”一度甚嚣尘上,投资人和大厂纷纷劝说创业者放弃幻想,转攻应用,甚至认为大模型创业是“死路一条”。

然而,仅仅一年后的这个春节,一款名为DeepSeek的国产大模型成为人们热议的焦点。除了在科技圈引发刷屏讨论外,其应用已深入千家万户,越来越多的普通人开始用DeepSeek定制减肥食谱、编辑节日祝福、写藏头诗,甚至算命。

截至目前,DeepSeek已推出了三代模型。去年5月,幻方量化旗下的DeepSeek发布了DeepSeek-V2,性能号称对标GPT-4,但价格仅为GPT-4的近1%。低廉的价格引发了国产大模型长达一年的价格战。到了12月,DeepSeek发布了新大模型DeepSeek-V3,将训练成本降至几百万美元,被誉为“价格屠夫”。而此次发布的DeepSeek-R1,则直接对标OpenAI o1。“深度思考”和“联网搜索”功能的上线,使DeepSeek成功登顶中美两区免费榜第一。

可以看出,DeepSeek三代模型的技术演进节奏非常明确:V2以低价打开市场,但性能优势尚不明显;V3在超低成本的前提下,性能逐渐追平;到R1时,性能已对齐国际最先进的大模型,同时价格依然低廉,真正实现了破圈效应。此外,其技术更新周期也越来越短,从V2到V3用了大半年,而从V3到R1仅隔了一个月。

在今年年初的展望中,我曾提到这家于去年五月崭露头角的初创公司。当时我预测,DeepSeek将成为新的一年大模型市场的破局者。其低廉的成本和价格证明,即便在算力和芯片受限的情况下,国产大模型也并非无路可走。作为一家创业公司,DeepSeek“单挑”众多财大气粗的大厂,驳斥了此前的AI“投降论”,为其他创业者继续深耕大模型领域注入了信心。

更重要的是,DeepSeek不仅价格低廉,还完全开源开放,这打破了科技和资本巨头在模型训练中的马太效应。这是过去两年围绕人工智能的深层忧虑之一:芯片越来越贵,训练成本越来越高,全球少数几个大模型逐渐变得封闭甚至“寡头化”,算力和数据被少数公司垄断,AI的入场券变得愈发昂贵,绝大多数人可能只能在这场技术革命中充当旁观者。

不久前,特朗普上台后宣布的Stargate(星际之门)计划进一步强化了这一趋势。这项规模高达5000亿美元的AI基建计划由软银、甲骨文和OpenAI主导,美国政府为其提供支持。该项目通过资本、芯片和算力的军备竞赛,旨在确保美国在这场AI技术革命中永远独占鳌头。

DeepSeek的出现,至少消解了星际之门计划给中国AI界带来的焦虑。当资本和算力的叠加不再是技术进步的唯一途径时,这对创业者和开发者们意味着什么,科技圈的每个人都能预见到。

正因如此,DeepSeek如今在舆论场中被誉为“国运级别的创新”。然而,将“国运”与一家创业公司挂钩是否是一种捧杀,值得深思。在华为和TikTok的经历之后,将一家公司推上政治高度,置于大国博弈的前线,对中国科技界的未来发展并无益处。

既然DeepSeek通过开源让AI入场券“平民化”,那么未来随着AI成本迅速降低,AI在各行业的应用和创新将进一步爆发。当前的讨论和思考应更多回归市场和技术本身的意义:如何营造一个良好的市场环境,让技术革新得到正向反馈;创业者和普通人又如何利用AI改变自己周围的世界。

声明:文章不代表币圈网观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部