Lao Bai

观点

Lao Bai

Lao Bai

05-13 19:30

记得Defi Summer 20年到22年这三年时间,大家经常感慨的一句话就是“币圈一天,人间一年” 因为技术迭代太快了,每天都有数不行的新东西出来,几天不看就跟不上节奏 现在这个感觉在币圈彻底消失,在AI那边出现了,每天的新东西就看不完,真的看不完 正好这几天看到圈里讨论Cerebras的帖子多了起来,昨天还看到不少路演信息,毕竟14号要挂牌交易。之前在Amber做分享的时候也单独讲过这个公司(当时用的那页PPT放在文末),所以简单说下我对Cerebras的判断 先说结论:这家公司很有意思,但核心变量不一定是他们造的芯片本身,而是未来AI的workload形态会是成什么样。 先简单说下它是干嘛的,防止有老铁还没看Cerebras 它最核心的技术,就是wafer-scale chip(晶圆级芯片),简单理解就是别人还在用“邮票大小”的芯片,它直接把整片晶圆做成一颗超大处理器,再配上超大 SRAM,把大量数据尽量留在本地高速处理,减少传统GPU最头疼的memory bottleneck。现在海力士美光涨上天就是因为HBM这东西太抢手,Cerebras是直接绕开了对HBM的依赖 很多人看到 Cerebras最牛逼的benchmark:推理速度比GPU快10-15倍,第一反应就是下一个英伟达?! 先别急。 这个benchmark最大的问题,是默认AI的核心需求永远是“更快吐token”。 如果只是人类盯着ChatGPT聊天,这故事其实没那么性感。你每秒吐 30 个 token,我已经快读不过来了。再翻10倍,边际体验提升几乎为零。 真正有意思的是 Agent。 Agent不读字,Agent消费Token。速度直接等于生产力。 一个OpenClaw/Hermes agent,如果要读网页、写计划、调 API、跑代码、报错重试、继续执行,一个任务可能要几十次 inference call。 每次 2 秒,任务就是分钟级体验。 每次 200ms,就是另一个世界。 所以 Cerebras更值得关注的地方,是 AI worker 这条线,而不是单纯的chatbot加速。 但问题来了 - 它的magic来自 wafer-scale + 超大SRAM,本地访问极快。但SRAM这东西有天然 tradeoff,速度快,容量贵,大模型塞不下就必须拆分。 而一旦拆分,chip-to-chip communication 就上来了。 LLM inference里最怕通信的恰恰是 decode 阶段。token 是一个一个往外吐的,每多一次 hop,延迟就是硬加上去,没法隐藏。 所以 Cerebras能不能成,关键根本不在“比 GPU 快几倍”,而是未来 AI 的主流计算形态到底是什么。 1. 时间线一 - 未来几年还是 前沿超大模型一统天下,动不动几千亿甚至万亿参数,所有请求都让超大模型自己处理,那 Nvidia的distributed infra 依然最舒服,Cerebras的速度优势会被通信损耗吃掉很多。 2. 时间线二 - MoE、蒸馏、量化这些技术如果继续快速进步,未来两年70B左右的模型做到今天700B模型 80%-90% 的效果,我一点都不意外。(这里要强烈感谢Deepseek一大波!) 如果世界往这个方向走,故事就变了。 大模型负责 planning / judgement / orchestration。 真正执行任务的大量 worker model 落在 30B-70B 这个区间。 这些模型足够聪明,又刚好能吃到高速本地推理带来的红利。 Agent 世界里,大部分token根本不需要最聪明的大脑。很多工作本质就是执行层体力活:浏览网页、改代码、调工具、retry、继续跑流程。 这个 topology一旦成立,Cerebras就直接进入自己的甜区 3. 时间线三 - 未来推理是端侧为主,用的都是8B,14B的这些小模型,那GPU也能跑的很好,甚至专用的ASIC芯片效率更高,这个场景下Cerebras的优势和护城河也就不高了 换句话说,超大模型云端推理或者超小模型的端侧推理这两个平行宇宙,Cerebras的优势都不够明显,只有主流推理落在32B-70B中等模型这个Size,正好“Big enough to stress GPU memory, Small enough to fit locally” 才是Cerebras最能大展身手的世界 所以我对Cerebras的判断是,300多亿的市值,短期看订单,财务报表这些数据,长期赌的则是未来Agent时代的计算范式到底落在哪个平行宇宙的时间线上
Lao Bai

Lao Bai

05-05 16:16

说说我跟 @tmel0211 相同与不同的标的 1. BTC (一致)- 大饼无需解释 2. ETH & SOL - 暂时没考虑,ETH可以看到上面的几大生态代表性标的,AAVE,LDO,Uni这些在BTC这一波涨幅中都几乎不动,显示的整体生态的疲软。SOL也类似,感觉Meme之后SOL有些找不到方向的既视感, 目前值得期待的似乎只有Alpenglow的技术升级,但生态方向依旧模糊 3. Hype (一致) - 在列表里一直想加,可惜20-30那一段因为解锁和熊市的情绪错过了,目前40的价格觉得又真的有些贵,虽然项目是真的好。HIP-3这几个月大出风头,HIP-4的预测市场也上了,可以观察一段时间看表现,但有个预感可能我会一直上不了车,Hype的共识太强了 4. TAO (换Gensyn) - 我之前最后一版钻石手的标的,可惜每次买入之后的持仓体验都极差,感觉这东西跟我八字不合,所以打算弃掉了。在0.03-0.04之间买入了Gensyn。当年一级市场绝对的龙头明星项目,现在换了叙事,有些拉垮,但3亿多的Gensyn和60亿的TAO,总还是觉得前者性价比高一些 5. ZEC (换Pepe) - 我始终保持不变的观点就是“隐私应该是一个Feature,且没那么重要的Feature”,单独做一个币没必要,所以ZEC在我这里是一个隐私Meme,但上下波动太大,持仓体验也不好,所以我自己前段时间Meme买入的标的是Pepe,一是觉得狗跟青蛙才是最广为人知的纯Meme,二是看周线又个圆弧底的Feel,所以买了Pepe 6. Ondo (个人新加)- 这一波RWA的龙头标的之一,一是我自己买美股确实喜欢用Ondo和StableStock,二是近几个月我身边越来越多的小伙伴开始买Ondo的代币化股票,三是0.25上下磨了三个多月了,最近感觉有筑底突破的趋势,所以0.26-0.3之间买了些 年底或者明年看看跟Haotian谁的组合收益高,哈哈
Lao Bai

Lao Bai

03-02 21:39

今儿看了Dune这篇有个点还是很让我惊讶的 “By token, USDC dominated with $8.3T — nearly 5x USDT's $1.7T — despite being 2.7x smaller in supply.” 在转账额上,USDC是USDT的5倍 - 作为一个比USDT规模小2.7倍的稳定币 换句话说,现在USDC 更像“工作中的钱”,偏交易型稳定币;USDT 更像“存在钱包里的钱”,偏储值型稳定币 忽然让我想到费雪公式 MV = PT。即使M更小,只要V足够高,就能支撑更大的交易总量T Circle最近股价飙涨,感觉除了财报的数据超出预期,这个“夸张”的USDC的转账额/流通速度,可能也是一个市场非常买单的点🤔