创始人梁文锋曾是“高考状元”
版次:003 2025年02月07日
苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
梁文锋
一夜“重创”美国科技股、人气赶超ChatGPT。2025年新年伊始,一股来自东方的“神秘力量”——国产AI大模型DeepSeek引发硅谷震动,并迅速走红全球,令许多海外网友直呼“实力惊人”。
1月27日,中国人工智能公司深度求索(DeepSeek)发布的DeepSeek-R1模型轰动科技界,双双登顶苹果中、美应用商店免费App下载排行榜榜首,超越行业老大哥Chat GPT。
DeepSeek爆火后,美国总统特朗普、ChatGPT美国开放人工智能研究中心(OpenAI)首席执行官纷纷发声,承认其给AI行业带来的“震撼”。
让各方人士如此忌惮的DeepSeek,到底动了谁的奶酪?
1
“AI界拼多多”上线 全世界都在关注
在硅谷,DeepSeek被称作“来自东方的神秘力量”。
DeepSeek成立于2023年7月,至今也不过一年半时间。虽然成立时间短,DeepSeek却以黑马之姿在全球引起关注。
2025年1月20日,DeepSeek发布大模型DeepSeek-R1。DeepSeek-R1一经发布,便在多个国家热度居高不下。
1月27日,DeepSeek在苹果App Store中国区、美国区免费应用下载榜上双双登顶,超越Chat GPT。截至1月29日,DeepSeek移动应用的下载量已达160万次,在澳大利亚、加拿大、中国、新加坡、美国和英国的苹果应用商店皆排名第一。
不仅受到用户关注,DeepSeek也成为行业人士的热议话题。近日,多家科技巨头相继发布财报,微软、Meta、阿斯麦的高管均对DeepSeek发表看法。
Meta创始人兼CEO马克·扎克伯格表示,Meta将DeepSeek视为新的竞争对手并正在学习,但现在判断AI基建、资本支出等方面还为时尚早。微软CEO萨提亚·纳德拉则认为,DeepSeek“有一些真正的创新”。AI成本下降是趋势。
事实上,AI成本的下降是让DeepSeek能够从诸多大模型中脱颖而出的重要原因。DeepSeek官网显示,API的定价每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费相当于Open AI o1运行成本的约1/30。DeepSeek也因此被迅速冠以“AI界拼多多”之称。
“在成本方面,DeepSeek以较低的成本实现了高性能的AI模型,这使得其在市场竞争中具备了显著的优势。据相关报道,DeepSeek仅用OpenAI o1模型3%~5%的成本就达到了同等性能,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。”北京社科院副研究员王鹏表示。
“DeepSeek-V3训练成本低,主要是因为它用了一些聪明的方法,比如只激活模型里需要的那部分,还有用更少的计算精度但不影响结果。具体策略包括,减少数据量,降低内存;精选数据,高效训练;知识蒸馏,加速学习。这样,它就可以用更少的电脑和时间来训练。在实际中,DeepSeek-V3可以用于聊天机器人、教育辅导、自动化工作等很多场景。”深度科技研究院院长张孝荣表示。
除了成本方面外,性能方面DeepSeek同样表现优异。有网友用DeepSeek写了一篇以其祖母为原型的故事,故事写完后,DeepSeek还给其安慰表示,“记住,所有让你战栗的文字,本质上都是你灵魂深处早已存在的回声。我不过是偶尔经过的山谷,让你听见了自己声音的重量。”
网友直言:“我没有想到,有一天我会为AI流泪。”
2
创始人曾是“高考状元”
现管理着数百亿基金
DeepSeek从未进行外部融资,其最大“金主”为幻方量化基金。而在幻方量化基金背后,正是DeepSeek的创始人梁文锋。
梁文锋,1985年出生于广东湛江吴川市,从小成绩优异,在初中时期就学完了高中数学,自学大学数学。2002年,梁文锋以吴川一中“高考第一名”的成绩考上浙江大学电子信息工程专业,于2006年考取浙江大学信息与通信工程专业研究生。
毕业后,2013年,梁文锋与大学同学徐进共同创立了杭州雅克比投资管理有限公司,并在2015年成立了杭州幻方科技有限公司,主要致力于通过数学和AI进行量化投资。所谓量化投资,就是用设定的数学模型和AI进行自动投资,由机器和AI做决策。
2017年,幻方量化宣称实现投资策略全面AI化。2018年幻方量化首次获得私募金牛奖。直到2021年,幻方量化的管理规模突破千亿。巅峰时期,私募行业还有“北九坤,南幻方”之称。
不过,也是在这一年,幻方量化业绩出现波动,低风险对冲产品出现亏损,其中有些年内跌幅超8%。
2021年12月28日,幻方量化在官微发布说明,向投资者致歉,解释称“长周期持股波动和量化策略同质化严重,是其近期表现不佳的主要原因,公司正在调整策略以适应市场环境变化。”
2022年,幻方量化整体收益率仅0.38%。到2023年10月,幻方量化市场人士回应称,“幻方量化当前的基金管理规模是400多亿元,这个规模目前来看是策略比较合适的规模。”
企查查显示,幻方量化的机构主体为浙江九章资产管理有限公司,由梁文锋持股85%,郑达韡、徐进分别持股7.5%。
“我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”梁文锋在接受记者采访时表示。
3
刚爆火就被美国调查
周鸿祎声援
坚持要做“创新者”,不做“跟随者”的DeepSeek-R1,随着其迅速走红,DeepSeek也遭遇了前所未有的挑战。
1月28日凌晨,DeepSeek官网连续发布两条公告称,DeepSeek线上服务受到大规模恶意攻击,导致平台注册繁忙。为了应对平台遭遇大规模攻击的情况,DeepSeek暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录。
1月30日,DeepSeek遭遇的攻击再度升级。据“奇安信XLab实验室”监测发现,针对DeepSeek线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。
除了被攻击外,DeepSeek还遭遇了禁用、调查。据报道,美国海军向职员发送警告信,要求其工作人员不得使用DeepSeek模型。同时,美国众议院首席行政事务官向国会办公室发出通知,警告国会办公室不要使用中国的人工智能应用DeepSeek的服务。同时,美国多名官员回应DeepSeek对美国的影响,表示正对其影响开展国家安全调查。
360创始人周鸿祎连发多条微博声援DeepSeek:“一觉醒来看到美国政府对DeepSeek痛下杀手,什么手段都用了,一会要制裁,一会要起诉,一会要调查。OpenAI 等几家公司还起劲的在旁边敲锣打鼓,然后网上铺天盖地的都是对DeepSeek污名化的文章,说它是造谣、说假话、偷窃数据、模型的能力都是偷Open AI的。美国的一些像海军、国防部等单位要求禁止使用DeepSeek。美国这次反应,比当年对付华为还过激。”
美国对于DeepSeek如此紧张,业内人士分析道:“美国通过限制GPU出口、限制AI算力等方式,不遗余力地打压咱们的算力。可是这套逻辑,一下子被DeepSeek戳破了。DeepSeek通过在算法和数据上的持续改进,以不到美国AI大厂7%的算力成本达到了同样的效果。这一成就打破了美方一直宣扬的‘算力领先=AI领先’的逻辑,并且也使‘美国例外论’破产。”
更关键的是,DeepSeek的技术实力让美国一众同行感到威胁。“DeepSeek R1在多个权威AI基准测试中表现出色,如在AIME 2024数学基准测试中,成功率达到79.8%,超越了Open AI的o1推理模型;在Codeforces上获得了2029 Elo评级,超越了96.3%的人类竞争对手。此外,在MMLU、MMLU-Pro和GPQA Diamond等基准测试中,DeepSeek R1也取得了优异成绩,显著优于其他闭源模型。”中国企业资本联盟中国区首席经济学家柏文喜表示。
相关
DeepSeek强在哪?
DeepSeek的核心技术是什么?强在哪?
DeepSeek给出了这样的回答:其核心技术优势包括自然语言处理(NLP)、机器学习与深度学习、大数据分析、个性化推荐、智能交互、跨平台整合以及安全性与隐私保护,并在以下八大领域展现出强大能力。
○推理能力:具备强大的逻辑推理和问题解决能力,能处理复杂的查询和任务,提供准确的答案和解决方案。
○自然语言理解与生成:能进行高质量的文本分析、翻译、摘要生成等任务。
○图像与视频分析:在图像识别、视频内容分析等领域具有高精度,能实现物体检测、场景理解、面部识别等功能。
○语音识别与合成:能准确识别和合成语音,支持多语言和方言,适用于语音助手、语音输入等应用。
○个性化推荐:能根据用户行为和偏好,提供个性化内容推荐,提升用户满意度和参与度。
○大数据处理与分析:能高效处理和分析大规模数据,挖掘数据中的模式和趋势,支持数据驱动的决策。
○跨模态学习:支持文本、图像、语音等多种模态的数据融合和学习,能实现更丰富和全面的理解和推理。
○实时交互与响应:智能助手和聊天机器人实现实时的自然语言交互,快速响应用户需求。
据中新网、澎湃新闻等