当前位置:首页 > Deepseek最新资讯 > 正文内容

公元:DeepSeek只打开一扇门,大模型远没到终局

2个月前 (05-12)Deepseek最新资讯181
谁会先迈出下一只脚?

DeepSeek如何改变中国AI投资?具身智能距离清晰商业化还要多久?这些热门话题吸引了众多资深投资人热烈讨论。在 “第19届中国投资年会·年度峰会”上,投中网主编曹玮钰红杉中国合伙人公元等嘉宾就当下AI与具身智能等话题举行了一场别开生面的对谈。

公元从商业化的角度分析,今天的创业模式与互联网时代很大的不同在于,明确的商业化路线的重要性已经让位于技术的颠覆创新。因为一个新模型能力的突破,用户可以瞬间转移。而现在具身领域很有可能处在AI赛道2018年的阶段,市场还没有看到GPT时刻。但只要创业者和投资人相信AGI的未来,行业就一定能做出来。

以下为现场实录整理:

Q

大家好,这个环节叫DeepChat,我们主要想聊一下人工智能和具身的话题。我先来问一个问题,人工智能和具身这两个赛道是不是足够大,或者说仍有非常大的非共识?

公元

一方面确实在新时代的开端,像互联网、移动互联网刚刚开始的时候,真的是百花齐放,遍地都是机会。我好久没有这种遍地都是机会的感觉。我们去年在更底层更硬的地方花了很多时间,在应用上面像刚才讲的像content generation,像AI For Science,其实vertical还有很多的细分,我觉得是忙不过来。

Q

春节期间出现一个变量DeepSeek,打破了美国AGI的叙事,也打破了国内大模型的行业格局、技术路径甚至估值体系。由此衍生出来了一个说法,有人预测未来国内一流的大模型只有三家,DeepSeek、千问和豆包。你怎么看这一观点?

公元

DeepSeek干了一个最有价值和意义的事情,是它的R1模型把o1秘而不宣的方法论,用一个非常简洁和优美的方式开源给了大众,把全世界在后训练又拉到同一起跑线,实现了“技术平权”。

但这一步我感觉只是开始,远没有说去给赛道一个结论,或者让赛道进入到所谓的终局战争。DeepSeek只是打开了一扇门,把所谓的后训练优势展现出来了。春节期间大家觉得后训练很重要,预训练到头了;但是今天大家又觉得预训练很重要,这其实才过了两个月。

AI还是在快速变化的时候,大家说AI一天,人间一年。现在很难预测未来会是哪几家在线上,后训练和预训练像两只脚一样,可能是个需要双轮前进的事情,所有的公司都在这两条线上做努力,谁会先迈出下一只脚,更进一步,是大厂,还是创业公司,我觉得大家都不知道,我们刚刚开始。

Q

预测不好做,但是投资要干。最近有一些声音,比如今年是AI应用元年,尤其美元基金都在投AI应用,最近AI Agent也很火热。大家目前是怎么样的布局思路?

公元

确实,当下在认知层面受到的挑战越来越陡峭,每天需要学习非常快,去赶上模型迭代。很多朋友问我,最近忙到飞起,在忙啥?我说在忙着迎接AI的到来,每天在理解模型的边界,模型进化的速度,这可能是现在和往常非常不一样的点。

原来大家理解商业模式,去看一下DAU、MAU数据,去做一些商业价值的判断。但今天我们已经屡次看到,随着不同模型能力的一次次新突破,用户可能会瞬间转移,不再像原来一样有明显的用户领先优势。对于投资人来讲,去追随或者去建立对AGI能力的感知,我觉得变得非常重要。

Q

现代科技的迭代非常快,具身智能也是如此,现在圈内大家开玩笑,除了投AI就是具身智能。但也有完全不同的声音出现。你更认可哪一方的观点?这种长期短期之间的摇摆,怎么去平衡?

公元

我觉得具身跟大模型是非常相似的。现在具身领域很有可能处在2018年的LLM,还没有看到GPT时刻。

现在创业,不论AI创业或者具身,范式有一点变化在于创业者出发的时候很难讲清楚应用。这跟原来我们看公司是非常不一样,原来的公司BP上写得清清楚楚,我能做什么。但今天可能写不出来,只能写这个技术路线是什么。这个时候就需要相信AGI,只要我们相信AGI的到来,就一定能做出这些东西,只是出发时候的具体目标可能并不是去做这些东西。

今天具身还在很早期,可能国外刚刚有一些foundation model出来,大家还没有看到一个所谓的通用模型的原型,这个还需要一些时间。对于投资人来讲,我们投的其实是谁能先做出来一个物理世界AGI的概率,这背后是我们做选择的逻辑。

Q

NOVA年轻投资人榜单我们已经做了三年,每一年看到榜单,我们都会惊讶,可见行业变化之快。作为已上榜超过两次的投资人,如果客观概括你自身的竞争力,不用谦虚,你会怎么总结?

公元

我觉得还是足够的热爱和好奇心,曹老师好像每年都会问这个问题,我每年的答案都是热爱和好奇心,确实是这样。

比如我们每天学习大模型,不要把它当成学习,也不要把它当成工作,如果把它当成工作可能很难无时无刻的坚持,但当你足够热爱和足够想知道其中的原理,想要知道世界的真相,想要知道到底要往哪个方向走,有充分的好奇心驱动的时候,就不再是一份工作,而变成生活的一部分,其实就没有所谓的坚不坚持了。

本文来自微信公众号“红杉汇”(ID:Sequoiacap),作者:洪杉,36氪经授权发布。


“公元:DeepSeek只打开一扇门,大模型远没到终局” 的相关文章

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

2月19日,江苏镇江举行新闻发布会,正式宣布国产大模型DeepSeek在镇江进行本地化部署。镇江市数据局党组书记、局长周飞在会上表示,“镇江已经建成600台国产算力服务器集群,单日数据处理能力相当于全...

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

【新智元导读】DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不...

中国电信丽水分公司完成Deepseek本地化部署

中国电信丽水分公司完成Deepseek本地化部署

近日,丽水政务云成功部署DeepSeek-R1多版本模型,本次部署的DeepSeek-R1模型在政务外网内,具备14B、32B等多版本模型能力。丽水政府首个DeepSeek大模型应用落地上线,丽水分公...

山东移动DeepSeek高教共创沙龙成功举办

山东移动DeepSeek高教共创沙龙成功举办

在科技飞速发展的当下,人工智能技术正以前所未有的速度重塑高等教育发展格局。为深入探索人工智能与高等教育的融合创新路径,3月27日,山东移动携手华为在青岛举办以“创新驱动 智领未来”为主题的DeepSe...

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

近日,中国航天科技集团有限公司四院精心组织开展人工智能与数字思维名家讲堂。讲堂特邀中国大数据应用联盟人工智能专家委员会主任以“人工智能三次飞跃与DeepSeek”为主题,用通俗易懂的语言拆解复杂的机器...

DeepSeek7小时攻克缅甸救灾语言关

DeepSeek7小时攻克缅甸救灾语言关

缅甸发生中部地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队,利用DeepSeek在仅...