2024-04-10 AI话题 - AI快开门

多模态大模型激战

Stable LM 2 12B、Mistral 8×22B、谷歌大模型全家桶、GPT-4 Turbo视觉版连发，参数与上下文纪录被刷新；多模态综述升级、开源模型首胜GPT-4，显示“文本+视觉+音频”融合正成为巨头必争高地。

Karpathy用1000行C语言复现GPT-2、Meta反向训练破解“逆转诅咒”、北大aiXcoder-7B开源，显示社区正用极简代码、新训练策略和领域专用模型挑战Transformer霸权，推动高效、低成本大模型落地。

英特尔新AI加速卡训练比H100快70%、推理快50%，能耗散热方案同步更新；英伟达竞品涌现，标志着后摩尔时代AI算力竞赛进入“性能+能效”双轨较量，直接影响大模型落地成本。

RS-Mamba刷新遥感图像分割SOTA，中山大学AI验血筛查卵巢癌，5′UTR语言模型优化蛋白表达，显示大模型正深入医疗、生物、遥感等细分场景，带来可量化的产业价值。

腾讯TACO-LLM推理引擎、PyTorch量化工具包Quanto、calm极限速度实现接连发布，聚焦降低延迟与显存占用，解决大模型“最后一公里”部署难题，助力企业私有环境高效上线。

Suno V3音乐生成破圈、“音乐版Sora”演示泄露，谷歌免费开放长音频理解大模型，标志着生成式AI正从文本、图像扩展到音乐与长音频，创作门槛降至消费级，内容产业或迎重构。

兰德、斯坦福相继发布AI时代隐私保护报告，强调政府与企业在国土安全、默认数据收集中的透明度与合规风险；GPT-4 95%准确率预测论文撤稿，也引发对AI监督学术诚信的伦理讨论。

特斯联获20亿元融资深耕AI+IoT，Illumina因AI并购失利拟分拆Grail，显示资本对AI场景落地既热情又谨慎；94岁“上帝粒子”预言者希格斯去世，提醒基础科学与AI融合仍需长期视角。