2024-09-26
开源多模态模型爆发
Molmo、Llama 3.2 等新一代开源多模态模型在图像理解、生成速度及端侧部署上全面逼近甚至超越 GPT-4o、Claude 3.5 等闭源标杆,显著降低开发者门槛,加速 AI 应用落地,并倒逼闭源厂商升级迭代。
2024-07-30
巨头模型训练与硬件瓶颈
Llama 3.1 405B用1.6万块H100平均3小时故障一次,GPU与HBM3显存成最大元凶;英伟达联手Hugging Face推推理服务Token效率提升5倍,揭示万卡集群稳定性与算力利用率仍是行业天花板。
2024-07-27
开源大模型生态升级
Meta推出迄今最强开源模型Llama 3.1 405B,性能对标闭源旗舰;SGLang、vLLM等推理框架同步优化,实现3K Star级加速;OpenAI则限时免费微调GPT-4o mini。开源与闭源同时放大招,降低开发者门槛,加速应用层创新。
2024-07-24
Llama 3.1开源里程碑
Meta发布4050亿参数Llama 3.1系列,性能比肩GPT-4o,开源协议升级,国内外云厂商同步上线,被视为开源AI的“Linux时刻”,引爆社区二次创新与商业落地。
2024-07-23
开源大模型井喷
Llama 3.1 405B参数完整泄露、苹果一次性开源7B模型及训练全流程,标志开源阵营首次在参数规模与透明度上同时对标闭源顶尖模型,将显著降低大模型研发门槛并重塑生态竞争格局。
2024-07-11
开源新旗舰与性能对标
Falcon 2宣称超越Llama 3成开源新标杆,Llama分子嵌入击败GPT-4o显示Meta在科学理解上的领先,同时上海交大发布首个大模型“诚实性”评测基准,暴露Llama3比GPT-4o更爱说谎,引发对开源模型可信竞争的新一轮关注。
2024-05-03
Llama 3开源生态升级
Meta公布Llama 3全周期训练细节并同步放大开源工具链,引发全球微调与测评热潮,降低行业进入门槛,加速中小团队大模型应用落地,进一步巩固开源阵营对闭源模型的竞争壁垒。
2024-04-23
大模型评测与竞技
75万轮一对一PK显示GPT-4仍居榜首,Llama 3位列第五;国内首次48小时大模型极限挑战赛落幕,为模型能力评估提供对抗式新基准,推动评测体系从静态榜单向动态竞技演进。
2024-04-22
Llama 3开源冲击波
Meta发布第三代开源大模型Llama 3,性能逼近GPT-4,输出速度高达800 token/s,催化开源生态爆发。云厂商、芯片侧、开发者社区迅速跟进,形成“免费算力+一键部署”闭环,被视为OpenAI闭源路线最大挑战,可能重塑大模型商业格局。
2024-04-20
Llama 3开源发布
Meta发布新一代开源大模型Llama 3,提供8B/70B参数版本,训练数据达15T,多项基准测试领先,并预告400B+超大模型,开源社区迎来GPT-4级自由访问时代,将重塑大模型生态与商业格局。