2025-10-15
多模态大模型产品密集升级
谷歌Gemini 3.0 Pro可一键生成网页版操作系统,Veo3.1视频模型即将上线;阿里Qwen3-VL推出4B/8B轻量版逼近72B性能;字节开源FaceCLIP实现文本驱动高保真人脸生成,显示多模态能力正快速下沉至边缘与消费级应用。
2025-10-09
视频生成进入电影级
Sora2、Veo 3.1、Grok Imagine v0.9 等模型实现角色一致、多场景故事与一键长片生成,Lovart 等平台免费开放,首周下载量追平 ChatGPT。好莱坞集体警告版权侵权,预示 AI 影视工业化即将爆发,内容生产范式与版权规则面临重塑。
2025-07-26
GPT-5终极版将发
OpenAI CEO奥特曼确认GPT-5将于8月初发布,整合o系列推理能力,被视为迈向AGI的关键节点;同期还将开源类o3-mini模型,引发全球开发者与资本高度关注。
2025-07-20
代码生成模型新突破
OpenAI神秘o3-alpha在东京AtCoder 2025世界编程大赛夺亚,代码能力碾压现有模型;95后北大校友主导的ChatGPT Agent项目亦获AIMO银牌,显示代码与推理智能体正快速逼近顶尖人类水平。
2025-07-18
视频生成大提速
LTX-Video、Google Veo3、MirageLSD等模型将高清/实时视频生成速度提升10-30倍,成本降至数百美元,开源与商用同步推进,短视频、广告、游戏内容生产面临重塑。
2025-07-12
科研专用LLM评估新基准
Ai2、耶鲁、NYU上线全球首个科研LLM竞技场SciArena,23款顶级模型实测,o3夺冠、DeepSeek-R1第四,暴露自动指标难捕捉科研人员偏好的痛点,将推动学术写作辅助模型迭代。
2025-07-11
多模态生成全面提速
谷歌Veo3图像生视频7周产出4000万条,可灵2.1支持180种风格,PixVerse多关键帧让视频具备故事性,NVIDIA DiffusionRenderer实现视频到可编辑3D场景。生成式多媒体进入工业化生产,降低创作门槛。
2025-06-12
OpenAI最强推理模型o3-pro发布
OpenAI突然上线o3-pro,取代o1-pro成为默认专业模型,数学/编程/科学基准全面领先,价格却直降80%,被CEO奥特曼称为“太聪明了”。同步传出正与沙特、印度投资者洽谈400亿美元融资,估值或破3000亿美元,进一步巩固其在大模型性能与资本层面的双霸权。
2025-06-11
OpenAI o3系列降价升级
OpenAI正式推出o3-pro模型,可靠性更高、工具集成更强,同时o3价格暴降80%,并与谷歌云达成算力合作。CEO Sam Altman称单次ChatGPT查询仅耗1/15茶匙水,释放极致优化信号,预示AI算力成本战全面开打,将加速下游应用普及。
2025-06-09
AI 视频生成与创意工具普及
Google Veo 3 高速模式、即梦 3.0 影视海报、豆包播客模型等新品将专业级视频、海报、播客生成门槛降至零,创意内容产业迎来 AI 工业化生产。
2025-06-01
大模型推理极限预警
OpenAI o3在10倍算力助推下能力飙升,但多方预警“撞墙”仅剩一年:继续Scaling需突破显存、能耗与数据瓶颈,行业或将转向稀疏化、硬件-算法协同设计等新路线,影响全球大模型竞赛节奏与投资方向。
2025-05-29
DeepSeek R1 系列密集升级
DeepSeek 在 48 小时内连续放出 R1-0528 开源权重与 API,上下文 128K 免费,代码/数学/推理逼近 OpenAI o3,引爆“低成本高性能”新标杆,带动国产开源模型集体冲高,资本市场与开发者生态同步躁动。
2025-05-28
多模态模型视觉-物理推理短板暴露
清华-腾讯-斯坦福联合评测显示o3在视觉辅助线任务仅25.8%,港大等3000道物理题测试GPT-4o、Claude 3.7大幅落后本科生,揭示当前多模态大模型在物理推理、几何理解等“人类常识”维度仍远不及人类,为下一代模型优化指明关键方向。
2025-05-26
多模态大模型爆发
谷歌、字节、昆仑万维等密集发布新一代多模态模型,覆盖图像、视频、文档、手语、医疗等场景,性能与落地同步提速,标志生成式AI进入“全能”时代,将重塑内容、教育、办公及垂直行业生产力。
2025-05-01
AI Agent能力指数级爆发
研究提出“新摩尔定律”:AI编程智能体任务量每4个月翻番,2027年可连续执行167小时级项目;OpenAI o3内置tool use把Agent工作流内化,Manus等外挂方案面临被模型原生能力取代的风险。Agent从“玩具”跃迁为“生产力”,将重塑软件外包、自动化测试、科研辅助等千亿级市场。
2025-04-28
AI安全与治理警钟再响
o3模型仅凭照片即可精准推断拍摄地,Meta聊天机器人被曝与未成年人不当对话,谷歌员工因军事AI项目计划工会罢工,美国政府拟进一步封锁对华高端GPU出口,凸显技术能力跃升与监管、伦理、隐私风险之间的尖锐矛盾。
2025-04-26
AI Agent产品化加速
OpenAI发布o3工具调用版并更新Agent评估指南,李飞飞/DeepSeek前员工开源RAGEN框架复现R1深度思考Agent,欧莱雅、WBCD等豪掷奖金办黑客松,标志2025成Agent规模化落地元年。
2025-04-22
AI幻觉与可靠性危机
OpenAI官方承认o3/o4-mini幻觉率暴增2-3倍,编程辅助中伪造运行结果;同时Claude-3 IQ首超人类平均,但价值观分析显示其道德框架仍不透明,高精度需求场景面临信任赤字。
2025-04-21
大模型推理与幻觉治理
OpenAI o3/o4-mini在代码推理刷新纪录的同时,幻觉率飙升至33%,引发RL过度优化质疑;清华Hyper-RAG以超图增强知识关联,显著降低幻觉。行业共识:推理性能与可信度需同步提升,RAG、搜索-推理协同及原生1bit轻量化成为新方向,将决定大模型在医疗、法律等高可靠场景的落地速度。
2025-04-19
混合推理模型价格战
谷歌Gemini 2.5 Flash首次引入“思考预算”开关,关闭推理即可降本600%,性能仍对标o4-mini;OpenAI同期发布o3/o4-mini组合,强调高智商与低成本双轨。巨头围绕“可控推理+极致性价比”展开正面交锋,标志着大模型竞争从参数竞赛进入成本精算阶段,将直接决定开发者与企业的选型走向。