2025-01-07
中国大模型落地与生态提速
百度文库AI月活破9000万全球第二,天工4.0 o1/4o版免费开放,清华7B模型用强化学习在数学上击败GPT-4o,国产CPU“香山”成最强开源RISC-V核心,中国AI应用与底层硬件同步进入全球第一梯队。
2024-12-14
小模型逆袭与大模型效率战
微软 Phi-4(14B)数学击败 GPT-4o,Cohere 推出可跑低端设备的 Command R7B,显示“小模型+数据/训练算法创新”正在挑战“唯参数论”。效率竞赛降低算力门槛,利好端侧部署与中小企业,可能重塑云端订阅商业模式。
2024-07-23
开源大模型井喷
Llama 3.1 405B参数完整泄露、苹果一次性开源7B模型及训练全流程,标志开源阵营首次在参数规模与透明度上同时对标闭源顶尖模型,将显著降低大模型研发门槛并重塑生态竞争格局。
2024-07-22
小模型开源潮
苹果DCLM、Mistral-Nemo、Arcee-Nova等7B-12B参数级小模型密集开源,性能逼近GPT-4,单卡可跑,标志“轻量大模型”成为新战场,降低落地门槛并重塑生态格局。
2024-02-01
大模型推理与多模态突破
NVIDIA TensorRT-LLM、无注意力Eagle7B、LLaVA-1.6、MM-Interleaved等框架与模型相继发布,在推理速度、多模态理解、OCR等方向刷新SOTA;蚂蚁开源AI Infra实现大模型训练“自动驾驶”,降低行业门槛。