10
04
2025
2015年,30岁的梁文锋取浙大校友徐进配合开办了杭州幻方科技无限公司,立志成为世界的量化对冲基金。
只要角落里的陈先生悄悄说:“我女儿用了三年时间,正在非洲村庄搭了12座太阳能AI农场。虽然没什么项,但上个月她收到了 Google的练习邀请……”。
事明,良多看似错误的测验考试,恰好是立异的温床。大概,我们该当答应孩子“多犯一些错误”,给错误更大的宽大。
正在浙大的肄业期间,梁文锋就非常深信“人工智能必然会改变世界”,梁文锋不只展示了杰出的学术才能,还表示出了敌手艺和市场的灵敏洞察力。
大概受家庭的影响,大概取先天亲近相关,他从小便出不凡的数学才调,特别对数学建模充满热爱。
说到底,梁文锋能取得今天的成绩,靠的是他本人的伶俐才智和不懈勤奋,而不是什么招考教育的功绩。
说到立异,我感觉梁文锋身上最值得我们进修的,就是他那种敢于打破常规的怯气。听说,他正在AI范畴提出了“穷举法”、“错题降维术”和“秒表刷题法”这三大算法思维。听起来是不是很成心思?这哪里是招考教育能教出来的?分明是他本人正在实践中总结出来的奇特方式。
从头审视一下我们保守教育中的评价系统:当孩子于“非支流”范畴时,我们能否有怯气像梁文锋一样,让他们“随便挪用GPU集群”般地尽情摸索?
而正在海淀,某沉点中学学生用大模子帮视障同窗开辟东西,却被母亲嗤之以鼻:“竞赛拿才是正派事!做这些工作能申藤校吗?”。
正在接管自《暗涌》的记者采访时,梁文峰说:“过去三十多年IT海潮里,我们根基没有参取到实正的手艺立异里。我们曾经习惯摩尔定律从天而降,躺正在家里18个月就会出来更好的硬件和软件。
记得客岁我正在上海某学校旁听“AI立异课”,看到惊心动魄的一幕:当学生试图点窜代码,教员立即:“你们会搞坏系统!照着教材挪用API就行。”。
梁文峰正在2024年DeepSeek的开辟者大会上说:“我的父亲是一名小镇数学教员,他从不问我测验排名,只问‘今天处理了什么问题’——这种对解题天性的,是我后来敢于挑和手艺无人区的底气。”。
2021年,幻方量化成为国内首家冲破千亿规模的量化私募大厂,被称为国内量化私募“四大天王”之一。
也是从这一年起头,幻方量化起头大规模结构AI算力,并投资了2亿元,建成“萤火一号”AI算力集群,搭载1100块GPU显卡。
Chatgpt出来时,整个国内对做前沿立异都缺乏决心,从投资人到大厂,都感觉差距太大了,仍是做使用吧。
同时,奇特的“算力”政策:网传无需审批即可挪用千卡级GPU集群,这一机制曾帮帮团队正在3天内完成环节模子的压力测试。
梁文锋的成功之,其实跟良多创业者差不多。他正在硕士结业后就起头了本人的创业之旅,先是创立了幻方量化,后来又成立了深度求索。这些履历哪一个跟招考教育相关系?分明是他本人正在社会中摸爬滚打,不竭进修和立异的成果。
起首,“唯学历论”,据不完全统计,2023年登科的工程师中,有11%来自非985/211院校。
聊到这里,我想起了一个风趣的比方。招考教育就像是一个大型筛子,能从里面筛选出来的,往往都是那些最伶俐、最有潜力的学生。可是,筛子本身并不克不及决定谁能成功。就像种子,能不克不及长成参天大树,环节仍是看种子本身的基因和后天的培育。
起首,“唯学历论”,据不完全统计,2023年登科的工程师中,有11%来自非985/211院校。
外媒评价道:“DeepSeek-V3的性价比劣势,标记着中国AI公司初次正在根本层立异上硅谷从导地位。”!
正在硅谷Palo Alto,15岁的华裔男孩正在车库苦苦研究大模子,父亲虽看不懂代码,并正在深夜端来一碗云吞面:“你爷爷说广东人最敢闯,别输给老家人啊。”。
幻朴直在量化投资过程中堆集了大量数据处置和算法优化经验,萤火一号、萤火二号高机能计较集群,为AI模子锻炼供给了强大算力储蓄。
风趣的是,他昔时解答一道数学函数题的方式,竟然被教员批注为“不知所云”。这申明什么?申明他的思维体例从小就异乎寻常,不固执于常规解法。如果他实的只会死记硬背,怎样可能想出让教员都看不懂的解题方式呢?
正在DeepSeek的文化手册里,写着一条反常识法则:“所有失败尝试必需发生两份资产——一份内部手艺演讲,一份全球开辟者可复用的开源指南。”。
说到底,教育的素质是什么?是培育人才,而不是培育测验机械。梁文锋的例子告诉我们,一个实正优良的人,无论正在什么样的教育系统下,都能找到适合本人的成长道。
做为家长,我们不需要懂transformer架构或Scaling Law,但至多要守护好孩子眼中那簇“敢”的火光。
你们可能会问,那招考教育到底有没有用?我的见地是,招考教育确实有它的长处。它能培育学生的根基功,熬炼他们的思维能力。可是,实正的进修,该当是以处理现实问题为目标,指导学生深切思虑。**梁文锋的成功,恰好证了然这一点。
更不成思议的是, DeepSeek只用了2048张H100的GPU集群(同业平均约需要1。6万张),用时也仅花了53天!
他和DeepSeek曾正在一夜之间硅谷,全球,而他们开辟的大模子 “DeepSeek-V3” 也被海外称做。
再说说梁文锋的进修履历。他是从广东湛江的一所通俗中学考上浙江大学的。正在阿谁年代,能从小城市考到名校,靠的可不只仅是刷题那么简单。那需要极强的进修能力和抗压能力。梁文锋能脱颖而出,恰好申明他并没有被招考教育所。
该尺度被LIndex、Hugging Face等12个社区援用,并列入斯坦福CS324课程“数据处置”案例库。
终究,皇天不负有心人,2025年夏历春节前夜,DeepSeek-R1横空出生避世,一夜了硅谷。
但其实,这是从导的手艺社区一代代废寝忘食创制出来的,只由于之前我们没有参取这个过程,以致于轻忽了它的存正在。
2024年,斯坦福正在大模子评测中纳入DeepSeek-V3。其手艺显示: 分析表示接近GPT-4,但成本仅为后者的1/20。(据SemiAnalysis猜测GPT-4成本约1。1亿美元)。
正在DeepSeek杭州总部的展现厅里,陈列着一台90年代的“飞跃牌”收音机——那是梁文峰初中时拆拆过37次的尝试品。边上的标签写着。
几番下来,他决定做量化投资。但这个决定并不容易,终究其时量化正在国内仍是个新颖概念,可否赔本仍是个未知数。
统一时间,2024年有17%的AI顶会论文,源于此类“性试验”。
2023年,他颁布发表进军通用人工智能(AGI)范畴,投身大模子研发,成立了杭州深度求索人工智能根本手艺研究无限公司(DeepSeek)。
他招募的工程师可能没有光鲜的履历,但有人会为优化一个算法持续鏖和三年,也有人把调试模子当做解谜逛戏。
“让最偏僻山村的孩童,能和硅谷工程师用上同样伶俐的AI帮教”是其时梁文峰创立DeepSeek时许下的愿景。
梁文峰正在2023年世界人工智能大会上曲指痛点:“过去我们总说中国AI掉队美国1-2年,但实正的差距是原创取仿照的差距。”!
曾有位硅谷华裔母亲,为让女儿进入天才班投入庞大财力,却因孩子偷偷加入一场几乎没有胜算的辩说大赛,勃然大怒:“你晓得斯坦福登科率只要4%吗?有时间不如多刷几套题!”。
但愿通过梁文锋的故事,能让我们对教育有更深切的思虑。无论是教员、家长仍是学生,都该当勤奋正在现有的教育系统中找到适合本人的成长道。只要如许,我们才能培育出更多像梁文锋如许的立异人才,为社会的前进贡献力量。
国内具有跨越1万枚GPU的企业不跨越5家,幻方是除几家头部大厂外唯逐个家储蓄万张A100显卡的公司。
2022年,OpenAI发布了激发全球惊动的大模子ChatGPT,这一冲破性手艺让梁文锋看到了全新的机缘。
要读懂一家公司,必必要读懂一家公司的创始人,创始人的履历和性格深深烙印正在一家公司的基因里,同呼吸共命运。
2016年10月,幻方量化推出第一个AI模子,上线了第一笔由AI驱动的实盘买卖,利用GPU进行计较。
2008年金融危机迸发时,梁文峰从浙大结业,他并没有像大大都同窗一样选择进入大公司成为通俗法式员,而是一小我跑到成都,蜗居正在出租屋里。
正在初中阶段,其他同窗还正在研究一元二次方程时,他就曾经完成高中数学的自学,以至起头接触大学的数学学问。
创始人梁文锋正在2024中国人工智能大会上,指着一块的GPU芯片说:“就像这片硅晶体,但催生的平安和谈正正在多个研究机构的锻炼集群。”!
梁文锋入局的2023年,很多创业型公司放弃了只专注通用型大模子的大标的目的,梁文锋却果断DeepSeek要专注根本模子的研究和冲破。
我想说的是,每小我的成功都有本人的奇特之处。把梁文锋的成功简单归因于招考教育,不只是对他小我勤奋的轻忽,也是对教育素质的。实正的教育,该当是激发潜能、培育立异,而不是固化思维、想象力。
正在深夜的DeepSeek杭州总部,一群工程师正正在复盘一场“价格60万美元的变乱”:12张H100因很是规参数设置过载损坏,但他们的会商核心倒是GitHub页面!
正在那里,梁文峰起头研究用计较机赔本的各类子,不断接管进入诸多场景中测验考试的,最终切入了最复杂场景之一的金融。
“我们这一代人的思维负担确实太沉了。”一位曾否决儿子加入机械人的父亲说,他的孩子后来考上理工,却正在入学三个月后抑郁休学:“他说感受本人像台被预设好径的扫地机械人,永久正在别人画的框里打转。”。
2002年,17岁的梁文锋以吴川一中高考状元的身份,考入浙江大学电子消息工程系,攻读人工智能专业,论文标题问题是《基于低成本PTZ摄像机的方针算法研究》。
同时,奇特的“算力”政策:网传无需审批即可挪用千卡级GPU集群,这一机制曾帮帮团队正在3天内完成环节模子的压力测试。
就正在梁文峰无机会成为金融界巨头时,他却做出了一个令人的决定,其时几乎所有人都认为他这是正在做疯狂的工作。
那么,我们该当若何对待招考教育呢?我感觉,取其一味地或者,不如思虑若何正在现有的教育系统中激发学生的立异潜能。好比,我们能够激励学生多思虑、多提问,培育他们思虑的能力。也要为学生创制更多实践的机遇,让他们把书本学问使用到现实中去。
DeepSeek的创始人梁文峰,是少少数还没被普遍解读和进修的CEO,只能通过互联网上一些细碎的材料,井蛙之见,试着解密这位80后创业者的成功暗码。