2024-07-30
巨头模型训练与硬件瓶颈
Llama 3.1 405B用1.6万块H100平均3小时故障一次,GPU与HBM3显存成最大元凶;英伟达联手Hugging Face推推理服务Token效率提升5倍,揭示万卡集群稳定性与算力利用率仍是行业天花板。
2024-07-27
开源大模型生态升级
Meta推出迄今最强开源模型Llama 3.1 405B,性能对标闭源旗舰;SGLang、vLLM等推理框架同步优化,实现3K Star级加速;OpenAI则限时免费微调GPT-4o mini。开源与闭源同时放大招,降低开发者门槛,加速应用层创新。
2024-07-24
Llama 3.1开源里程碑
Meta发布4050亿参数Llama 3.1系列,性能比肩GPT-4o,开源协议升级,国内外云厂商同步上线,被视为开源AI的“Linux时刻”,引爆社区二次创新与商业落地。