AI快开门

发现最好的AI工具

2024-08-04

大模型压缩与高效推理

Llama 3.1 405B被压缩至单卡80 GB可跑,GitHub向1亿开发者开放顶级模型API,显示“大模型瘦身”与“普惠化”同步加速,将显著降低算力门槛、刺激应用爆发。
2024-03-23

算力门槛重塑行业格局

沈向洋指出大模型将横扫垂直行业,但万卡级算力成为硬性门票,中小公司被迫转向模型微调、应用创新或投靠云巨头,行业将快速分化为“算力寡头+场景生态”两极,芯片、云服务和绿色能源成为隐形战场。