专用芯片 - AI话题 - AI快开门

2026-02-23

AI硬件去GPU化浪潮

多伦多初创Taalas把大模型直接固化进芯片，17000 tokens/秒无需HBM与液冷；NanoClaw等极简开源模型仅4000行代码，挑战英伟达中心范式，预示AI算力向专用、低成本、极客化迁移。

Taalas 模型固化 NanoClaw 去GPU 专用芯片

2024-02-20

大模型推理优化与硬件竞速

LLM进入“毫秒级”交互时代，推理成本成为落地瓶颈。UC伯克利开源百万token上下文视频模型LWM，RWKV推出1%成本比肩7B的Eagle RNN，谷歌TPU系创业团队发布10倍于GPU的专用芯片，国内框架分享“榨干算力”实践，显示算法-芯片-系统协同优化正成为新战场。

LLM推理上下文窗口专用芯片 RWKV 算力优化