169: 访谈Cerebras早期投资人周楠:英伟达挑战者?Scaling Law的萌芽、被遗忘的百度美研
晚点聊 LateTalk · 小宇宙 · · 原文 ↗
TL;DR
这是一场横跨10年、串联Cerebras IPO、百度美研兴衰与Scaling Law起源的深度对话。核心洞察有三:(1)Cerebras的WSE架构是推理时代英伟达最有力的「特定场景挑战者」,但英伟达的CUDA生态护城河短期内无法撼动;(2)Scaling Law的实践萌芽不在OpenAI而在百度美研2015年的DeepSpeech论文——地缘政治让百度「起了大早赶了晚集」;(3)AI投资的非共识窗口正从数年压缩到数月,VC从「发现价值」转向「追认价值」,真正的早期投资越来越依赖垂直领域的个人天使。
全文总结
核心论点
- ▶ 5:00 原文证据
Cerebras的WSE晶圆级架构在AI推理场景对英伟达GPU形成结构性优势——低延迟、高吞吐,但受限于CUDA生态锁定,仅能作为「特定workload补充」而非全面替代
◆ 高WSE架构将84个芯片无缝互联在同一晶圆上,计算和存储靠近以消除通信瓶颈;实测推理速度远快于传统GPU方案;OpenAI签200亿美元订单是强验证信号
- ▶ 11:25 原文证据
最具颠覆性的AI投资在共识形成前几乎不可能通过传统VC投决流程——个人天使的conviction比机构决策更适配极端不确定性
◆ 高Sam Altman 2016年个人投资Cerebras;Anthropic早期靠Eric Schmidt个人天使;2020年周楠判断主流VC不会投Anthropic且事实证明正确
- ▶ 29:24 原文证据
Scaling Law的实践萌芽可追溯到2015年百度美研的DeepSpeech 2论文,比OpenAI GPT-3论文(2020)早5年——这意味着中国AI团队在Scaling Law认知上并非后来者,而是先行者
◆ 高DeepSpeech 2论文(2015)已揭示模型规模、数据量、训练时长、算力与模型表现的单调递增关系;百度美研内部已形成经验性共识,但未学术化表述
- ▶ 35:00 原文证据
硬科技早期投资的核心筛选变量是团队质量而非技术方案——Cerebras胜出的关键不是WSE架构本身,而是Andrew Feldman的创业经验和团队的PhD密度
◆ 高80人团队近70个PhD;创始人前公司被AMD收购;Feldman能逐一拆解复杂技术风险;Graphcore/Wave Computing因团队或架构缺陷被淘汰
- ▶ 51:23 原文证据
半导体创业遵循10年周期律——物理验证无法加速,创始人经验和行业人脉是穿越至暗时刻的核心资产。年轻创始人做芯片的成功概率极低
◆ 高流片延迟1-2年;尽调识别风险全部兑现;计算芯片成功需10年以上;创始人40+岁;技术负责人当时已60岁
- ▶ 1:12:46 原文证据
百度AI「起大早赶晚集」的根本原因不是技术判断失误或管理问题,而是地缘政治结构性力量——它同时摧毁了人才留存和资本布局两条路径
◆ 高百度美研训练3亿参数语言模型需3个多月;地缘政治导致独立AI基金(含OpenAI/Anthropic/Databricks)募资失败;硅谷研究员因地缘压力离开
- ▶ 6:39 原文证据
10年前百度美研研究员预测的「英伟达垄断」已成为现实——不考虑Google TPU的话,英伟达在公共云AI算力市场形成事实垄断。这验证了早期多元化布局的战略远见,也揭示了打破垄断的难度
◆ 中吴恩达与英伟达的背书关系;2016年AI researcher已形成「不能只依赖一家」的判断;10年后英伟达确实形成事实垄断
- ▶ 39:56 原文证据
「研究员+投资人」联合尽调是AI硬科技投资的理想模式——研究员的算力痛点体感使其成为最敏锐的技术验证者,这种能力是纯财务VC无法复制的
◆ 中百度美研是全球唯一能在Cerebras模拟器上跑语言模型验证架构的机构;研究员参与尽调是出于自身训练痛点的真实需求