2025-12-15
国产多模态大模型突破
商汤Seko2.0、阿里“百聆”等国产模型在视频、语音、多剧集生成等方向实现全链路打通,并首次完成与寒武纪等国产AI芯片的深度适配,标志着国产算力+多模态AIGC进入可用、好用阶段,对降低行业成本、保障供应链安全具有里程碑意义。
2025-07-18
中美芯片与模型博弈
黄仁勋年内三度访华点赞DeepSeek、Qwen、Kimi;苹果MLX框架主动兼容CUDA;特斯拉Dojo2即将量产,性能直指英伟达,中美在算力、框架、模型三条线全面竞速。
2025-04-26
小参数高效数学推理突破
英伟达1.5B模型在AIMO2奥赛击败14B级对手,验证“小模型+强数据”路线可行,开源OpenMath-Nemotron系列,为端侧数学推理、教育普惠与科研降本树立新标杆,陶哲轩公开点赞。
2025-04-16
多模态生成技术突破
Google Veo 2、字节Seaweed、Seedream 3.0及北大VARGPT等模型在视频、图像、3D场景生成上实现秒级、1080P、任意宽高比输出,开源与商用同步推进,显著降低创作门槛,预示“AI原生内容”即将规模化落地。
2025-03-11
AI for Science再突破
David Baker团队RFdiffusion实现原子级抗体设计,最大开源生物学模型Evo 2携400亿参数登场,可跨物种设计遗传密码;3DMolFormer双通道加速药物发现,显示AI正重塑生命科学研发范式。
2025-02-20
生物AI大模型崛起
NVIDIA与Arc研究所发布迄今最大生物学模型Evo2,参数达400亿,可预测DNA、RNA、蛋白质结构与功能;谷歌DeepMind推出新一代生物AI模型Evo 2助力疾病研究,AI正从“读”生物升级为“写”生命。
2025-02-14
多模态视频生成爆发
Adobe Firefly、谷歌Veo 2、YouTube新功能及昆仑万维Matrix-Zero等集中发布,支持文本/图像一键生成可交互短视频或3D场景,标志多模态生成从实验室走向大众创作,内容生产门槛大幅降低。
2024-12-30
AI生成内容AIGC再升级
爱诗PixVerse V3.5最快5秒生成视频,腾讯StereoCrafter一键2D转3D,谷歌Veo2冲击Vlog界,国产可灵AI领跑视频生成赛道,速度、画质、可控性全面刷新。
2024-12-17
多模态生成模型进入4K时代
谷歌Veo2、Meta Apollo、图森Ruyi-Mini-7B等开源或升级模型相继登场,支持4K高清、一小时长视频、一键P图及语音指令编辑,人类偏好评测普遍优于Sora。技术突破显著降低专业视频与图像内容制作门槛,预示2025年广告、影视、短视频等行业将迎来“零门槛”AI创作工具链爆发。
2024-10-02
OpenAI生态更新与开发者日
OpenAI在第二届开发者大会发布实时API语音合作名单(Agora、Twilio等),奥特曼暗示下一代模型o2将比o1更强大;同时EMOVA推出类GPT-4o多模态助手,显示OpenAI生态持续扩张但热度不及预期。
2024-06-12
国产大模型与架构创新突破
清华&蚂蚁TimeMixer纯MLP架构刷新时序预测SOTA,商汤Piccolo2中文Embedding登顶SuperCLUE,讯飞星火V4.0即将发布,国产大模型在架构、基准与多模态能力上连续突破,缩小与GPT-4差距。
2024-02-06
Vision Pro生态初现
苹果Vision Pro正式发售,引发从街头“赛博遛狗”到“摧毁房价”的全民讨论;同时Meta/UC伯克利推出Audio2Photoreal,用音频驱动全身虚拟人,为MR社交与内容生产提供AI基础设施,空间计算时代拉开序幕。