AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
专用芯片
相关话题
2024-02-20
大模型推理优化与硬件竞速
LLM进入“毫秒级”交互时代,推理成本成为落地瓶颈。UC伯克利开源百万token上下文视频模型LWM,RWKV推出1%成本比肩7B的Eagle RNN,谷歌TPU系创业团队发布10倍于GPU的专用芯片,国内框架分享“榨干算力”实践,显示算法-芯片-系统协同优化正成为新战场。
LLM推理
上下文窗口
专用芯片
RWKV
算力优化