DeepSeek老板登上新闻联播！参加总理座谈会

admin 财经 (7) 2025-01-27 08:37:36

　　国产AI大模型领域，非常热闹！

　　1月20日下午，总理主持召开专家、企业家和教科文卫体等领域代表座谈会。

　　此前，非常少露面的DeepSeek老板梁文锋，受邀参加并发言。

　　中国AI界的传奇大佬，真人比想象中还年轻啊，皮肤保养好，看着还以为是学生代表。

　　这是见证历史性一刻，AI大佬上新闻联播了。

　　在参加总理会议的同一天，DeepSeek在官微上，发布了DeepSeek-R1 发布，性能对标 OpenAI o1 正式版。

　　DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

　　在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

　　R1的32B和70B版本，性能远远超过了OpenAI的GPT-4o，并逼近 o1-mini。

　　现在，DeepSeek已经全面上线了 R1，大家可以直接体验。

　　美国建筑设计工作室 Workshop-APD 的创始人Matthew Berman 表示：DeepSeek R1 拥有我所见过的最像人类的内心独白。

　　现在本地运行的 14b DeepSeek R1 蒸馏模型，能够把问题回答成这样，咱还要啥自行车呢？

　　17岁考入浙大

　　30岁创办幻方

　　如此厉害的DeepSeek大模型，背后并是不什么互联网科技大厂，而是炒股的。

　　DeepSeek深度求索，来自金融领域的头部量化：幻方量化。

　　梁文锋是幻方量化的实际控制人，他在DeepSeek最终受益的股份比例超80%。

　　1985年，梁文锋出生于广东湛江，那里盛产生蚝。他本硕就读于浙江大学，攻读人工智能，年轻读书时就笃定“AI定会改变世界”。

　　2008年，在浙大读书期间，23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。

　　梁文锋开始使用机器学习等技术，探索量化交易。

　　他的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

　　梁文锋表示：自己是八十年代在广东一个五线城市长大的。

我的父亲是小学老师，九十年代，广东赚钱机会很多，当时有不少家长到我家里来，基本就是家长觉得读书没用。

但现在回去看，观念都变了。因为钱不好赚了，连开出租车的机会可能都没了。一代人的时间就变了。

　　毕业后，梁文锋没去做程序员，而是下场做量化投资，成立幻方量化。

　　他主导的幻方量化在2016年首次上线AI策略，并于2017年实现投资策略全面AI化，成为量化投资领域的创新先锋‌。

　　幻方量化成立仅6年管理规模即曾达到千亿，被称为‘量化四大天王’之一。

　　也是国内唯一公开宣称有拥有万张英伟达A100显卡的企业，其算力储备量就算是在一众互联网公司科技公司里，也豪不逊色。

　　2023年，梁文锋创立了深度求索（DeepSeek）。

　　有消息称，DeepSeek团队不招聘高级技术专业人员。

　　员工的工作年限约为3到5年，而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。

　　梁文锋曾对36氪暗涌说：

　　“如果追求短期目标，找现成有经验的人是对的。但如果看长远，经验就没那么重要，基础能力、创造性、热爱等更重要。”

　　就像大家不可能猜到，做游戏显卡的英伟达，最后会成为AI界最重要的公司。

　　大家也不可能猜到，中国AI大模型的希望，可能就在炒股的公司身上。

　　背靠幻方量化的DeepSeek还不差钱。

　　梁文锋在2024年表示，短期内没有融资计划，面临的问题从来不是钱，而是高端芯片被禁运。

　　不参与融资，也很少对外发声，闷声去做AI。

　　外界都觉得DeepSeek很神秘。

　　近期“雷军千万年薪挖95后天才AI少女”的热门话题也间接地与梁文锋有关，因为雷军尝试挖走的这位90后少女罗福莉，此前正是梁文锋旗下深度求索（DeepSeek）团队的研发成员。

　　2024年12月26日，DeepSeek发布了DeepSeek-V3，并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。

　　AI界拼多多

　　此前DeepSeek一直被冠以“AI界拼多多”。

　　它开启了中国大模型价格战。

　　2024年5月，DeepSeek发布的一款名为DeepSeek V2的开源模型，提供了史无前例的性价比：

推理成本被降到每百万token仅 1块钱，在当时约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

　　随后，字节、腾讯、百度、阿里、kimi等AI公司跟随降价。

　　梁文锋表示，自己不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼。没想到价格让大家这么敏感。只是按照自己的步调来做事，然后核算成本定价。

　　这次新发布的DeepSeek-R1 API 价格，一样给力。

　　DeepSeek-R1 API定价为：每百万输入 tokens 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 tokens 16 元。

　　对比OpenAI o1 的 API 定价：每百万输入 tokens 15 美元、每百万输出 tokens 60 美元。

　　每百万输出定价，大概仅为OpenAI的3.65%。

　　DeepSeek极高的性价比，简直是AI大模型界的拼多多。

　　DeepSeek还继续开源到底，放出了背后的研究论文。

　　DeepSeek-R1的推理能力蒸馏到较小的密集模型中，展示了较小模型也可以拥有强大的推理能力。

　　使用Qwen和Llama系列模型进行蒸馏，结果表明蒸馏后的模型在基准测试上表现优异，例如DeepSeek-R1-Distill-Qwen-14B在AIME 2024上的通过率为69.7%。

　　Deepseek不会闭源，他们认为先有一个强大的技术生态更重要。MIT 授权：自由提炼和商业化！

　　英伟达的高级研究科学家Jim Fan（范麟熙）对DeepSeek-R1的评价是：

　　我们生活在这样一个时代：一家非美国公司正在让 OpenAI 的初衷得以延续——真正开放、为所有人赋能的前沿研究。这毫无意义。最有趣的结果才是最有可能的。

　　DeepSeek-R1 不仅开源了一系列模型，还公开了所有训练秘诀。它们可能是第一个展示 RL 飞轮重大、持续增长的 OSS 项目。

　　梁文锋曾总结过，中国AI和美国AI的差距。

我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距，但真实的gap是原创和模仿之差。如果这个不改变，中国永远只能是追随者，所以有些探索也是逃不掉的。

　　真正的差距不是一年或两年，而是原创和模仿之差。

　　转自：财经会议圈

　　（转自：中国地产基金百人会）

THE END

多因素共振春节后A股市场值得期待

又一家公司，　*ST美讯告别A股！

DeepSeek老板登上新闻联播！参加总理座谈会

相关文章阅读

民生策略：市场热度继续回升，北上与机构ETF是阶段主要买入力量

央行最新出手！呵护春节流动性

12家股份行理财子“集齐”：浙银理财获批开业已于去年“招兵买马”

商务部等6部门办公厅关于做好2025年家装厨卫“焕新”工作的通知

栏目最新文章

五台地方春晚提前开播：辽宁、安徽、湾区、川渝、山东特色纷呈

最热文章

民生策略：市场热度继续回升，北上与机构ETF是阶段主要买入力量

央行最新出手！呵护春节流动性

12家股份行理财子“集齐”：浙银理财获批开业已于去年“招兵买马”

商务部等6部门办公厅关于做好2025年家装厨卫“焕新”工作的通知

收评：龙年收官日沪指收绿三市成交额维持万亿水平

午评：创业板半日跌1.55% 算力硬件方向集体重挫

*ST恒立能否保壳成功？两大雷区待解突增并购增厚业绩营收“踩线”达成

飞荣达3.8亿收购实控人新能源资产标的无形资产评估增值335倍净利率3倍于行业龙头

钉钉上线“小礼物”功能：打通淘宝，将在大年初一全量开放

天风策略：春节归来攻坚，等待消费“看涨期权”

DeepSeek老板登上新闻联播！参加总理座谈会

相关文章阅读

民生策略：市场热度继续回升，北上与机构ETF是阶段主要买入力量

央行最新出手！呵护春节流动性

12家股份行理财子“集齐”：浙银理财获批开业 已于去年“招兵买马”

商务部等6部门办公厅关于做好2025年家装厨卫“焕新”工作的通知

栏目最新文章

五台地方春晚提前开播：辽宁、安徽、湾区、川渝、山东特色纷呈

最热文章

民生策略：市场热度继续回升，北上与机构ETF是阶段主要买入力量

央行最新出手！呵护春节流动性

12家股份行理财子“集齐”：浙银理财获批开业 已于去年“招兵买马”

商务部等6部门办公厅关于做好2025年家装厨卫“焕新”工作的通知

收评：龙年收官日沪指收绿 三市成交额维持万亿水平

午评：创业板半日跌1.55% 算力硬件方向集体重挫

*ST恒立能否保壳成功？两大雷区待解 突增并购增厚业绩营收“踩线”达成

飞荣达3.8亿收购实控人新能源资产 标的无形资产评估增值335倍净利率3倍于行业龙头

钉钉上线“小礼物”功能：打通淘宝，将在大年初一全量开放

天风策略：春节归来攻坚，等待消费“看涨期权”

12家股份行理财子“集齐”：浙银理财获批开业已于去年“招兵买马”

12家股份行理财子“集齐”：浙银理财获批开业已于去年“招兵买马”

收评：龙年收官日沪指收绿三市成交额维持万亿水平

*ST恒立能否保壳成功？两大雷区待解突增并购增厚业绩营收“踩线”达成

飞荣达3.8亿收购实控人新能源资产标的无形资产评估增值335倍净利率3倍于行业龙头