Stable LM 2 12B、Mistral 8×22B、谷歌大模型全家桶、GPT-4 Turbo视觉版连发,参数与上下文纪录被刷新;多模态综述升级、开源模型首胜GPT-4,显示“文本+视觉+音频”融合正成为巨头必争高地。
Karpathy用1000行C语言复现GPT-2、Meta反向训练破解“逆转诅咒”、北大aiXcoder-7B开源,显示社区正用极简代码、新训练策略和领域专用模型挑战Transformer霸权,推动高效、低成本大模型落地。
英特尔新AI加速卡训练比H100快70%、推理快50%,能耗散热方案同步更新;英伟达竞品涌现,标志着后摩尔时代AI算力竞赛进入“性能+能效”双轨较量,直接影响大模型落地成本。
RS-Mamba刷新遥感图像分割SOTA,中山大学AI验血筛查卵巢癌,5′UTR语言模型优化蛋白表达,显示大模型正深入医疗、生物、遥感等细分场景,带来可量化的产业价值。
腾讯TACO-LLM推理引擎、PyTorch量化工具包Quanto、calm极限速度实现接连发布,聚焦降低延迟与显存占用,解决大模型“最后一公里”部署难题,助力企业私有环境高效上线。
Suno V3音乐生成破圈、“音乐版Sora”演示泄露,谷歌免费开放长音频理解大模型,标志着生成式AI正从文本、图像扩展到音乐与长音频,创作门槛降至消费级,内容产业或迎重构。
兰德、斯坦福相继发布AI时代隐私保护报告,强调政府与企业在国土安全、默认数据收集中的透明度与合规风险;GPT-4 95%准确率预测论文撤稿,也引发对AI监督学术诚信的伦理讨论。