← 返回列表

2025-01-24 AI 话题

📊 6 个话题 📰 35 条新闻

DeepSeek R1、百川Baichuan-M1、联通元景思维链等国产模型密集上线,在推理、多模态、长上下文等基准上对标甚至超越GPT-4o,引发Meta等海外巨头“紧急拆解”。小参数、MoE、稀疏注意力与低成本训练成为关键词,显示国产模型正从“可用”走向“好用”,重塑全球竞争格局。



Hugging Face推出SmolVLM、MiniRAG等1-2B级小模型,在手机、车载、玩具等终端实现300倍体积压缩、75%存储节省,仍保持90%以上性能;JetBrains Junie、跃问App等原生IDE/创意工具集成,显示“小模型+端侧”正成为AI普惠新路径,降低云成本与隐私风险。


HeyGen、元象、剪映、商汤等发布数字人跳舞、医疗循证、剪纸文旅、齐白石画作鉴伪等多模态应用,结合语音、视觉、运动控制,实现“一句话生成视频、一张图识别真伪”。多模态大模型正从实验室走向创意、文旅、电商直播,加速内容产业降本增效。


OpenAI“星际之门”计划牵手甲骨文、信实集团拟建世界最大AI数据中心,印度、美国争夺万卡集群;同时Pipeshift推理引擎、FlashInfer、OpenVINO-vLLM等优化方案将GPU利用率提升75%,显存接近零浪费。算力军备赛与效率革命同步升级,为大模型普及提供底层支撑。