2026-01-14
医疗AI专业化突破
谷歌发布MedGemma 1.5医疗影像模型和MedASR语音转写模型,国产Baichuan-M3医疗大模型亮相,拥有2350亿参数。医疗AI正从通用模型向专业细分领域深化,在诊断准确性和临床实用性方面取得重要进展。
2025-12-23
AI安全与可解释性升温
OpenAI承认浏览器提示注入难根除,推出“忏悔机制”自曝模型黑料;谷歌DeepMind开源Gemma Scope 2提供全栈可解释工具,学界与业界同步聚焦大模型可控与对齐。
2025-09-13
AI安全与隐私保护新里程碑
谷歌DeepMind推出从零差分隐私训练的VaultGemma,首次在大模型层面系统级保护敏感数据;Bengio警告“AI意识幻觉”或冲击人类工具论,Meta自监督论文亦陷伦理争议,显示性能与安全的再平衡成为行业焦点。
2025-08-16
端侧超小模型爆发
谷歌开源0.27B Gemma 3、4B Jan-v1等“小钢炮”模型,可在浏览器或手机本地运行,性能对标数十亿参数大模型,标志端侧AI进入实用阶段,将重塑移动应用、IoT与隐私计算生态。
2025-07-10
医疗AI开源与产品化提速
谷歌MedGemma系列上新,单GPU即可运行的开源医疗多模态模型;MedGemma登顶多项医学视觉任务,并配套HAI-DEF开发者框架。轻量级+开源降低医院与初创公司接入门槛,加速影像诊断、患者沟通等场景落地,医疗AI进入“可私有、可微调、低成本”阶段。
2025-05-26
多模态大模型爆发
谷歌、字节、昆仑万维等密集发布新一代多模态模型,覆盖图像、视频、文档、手语、医疗等场景,性能与落地同步提速,标志生成式AI进入“全能”时代,将重塑内容、教育、办公及垂直行业生产力。
2025-05-21
AI+行业与伦理治理
谷歌MedGemma专攻医疗图像文本,腾讯混元Game手绘草图一键生成3D角色,粉笔/北森酷学院发布职教与企业学习Agents;同时Kimi等App因违规收集个人信息被通报,中国AI伦理治理路径与全球可信AI议程对接,技术落地与监管同步提速。
2025-04-21
AI编程与Agent框架爆发
Trae 1.3.0、Gemma 3 QAT、Gemini 2.5 Flash、Xcode MCP等密集发布,一键本地部署、3090即可跑的高性价比编程模型成为主流;MCP(Model Context Protocol)生态快速成型,轻量级Agent框架mcp-agent、扣子空间等降低智能体开发门槛,预示“人人都是开发者”时代临近,将重塑软件生产关系。
2025-03-31
AI医疗与科学计算新范式
Google TxGemma助力药物研发、ECgMPL癌症诊断准确率近100%、LigandMPNN实现原子级蛋白设计、DropAI千滴同测降本增效,大模型正成为生物医学与科学计算的核心引擎,加速“AI for Science”从论文走向临床与工业。
2025-03-12
开源模型大爆发
国内外密集开源高性能模型:谷歌Gemma 3单卡可跑,阿里通义R1-Omni多模态情感识别,Reka Flash 3小参数强推理,字节COMET再降MoE训练成本,推动AI民主化。
2024-12-19
多模态与物理仿真突破
Genesis Project、BlueQubit、PaliGemma2等新品发布,4D生成式物理引擎、量子+AI、视觉语言多模态能力显著提升,为机器人、XR内容创作提供高保真训练与交互环境。
2024-10-30
谷歌AI全线爆发
Q3财报Gemini API六个月增14倍,股价涨5%;日语Gemma 2B开源、Project Astra推迟、25%新代码由AI生成,谷歌从模型、应用到开发者生态全面提速,验证AI投资回报。
2024-10-05
开源模型挑战闭源霸权
Molmo以70亿参数开源多模态模型宣称击败Claude 3.5 Sonnet、媲美GPT-4o;谷歌开源DataGemma连接公共统计数据库,减少幻觉。开源阵营在性能与可信度两端同时逼近闭源标杆,降低行业门槛。
2024-08-03
模型小型化与端侧部署
Google发布仅2.6B参数的Gemma 2 2B并配套ShieldGemma安全分类器,加上行业人士关于“大模型重走CNN瘦身老路”的讨论,显示高效小模型正成为端侧、边缘及低成本场景的新焦点。
2024-08-01
端侧小模型与开源生态
谷歌开源2B Gemma 2,性能越级对标GPT-3.5-Turbo,苹果端侧流畅运行;国产开源模型24K多模态上下文、Llama 7B自对齐等方案涌现,降低落地门槛,推动边缘AI与开发者生态繁荣。
2024-06-29
开源大模型军备赛升级
谷歌连续发布Gemma 2 9B/27B,单卡可跑即媲美LLaMA3-70B,开源权重已登陆HuggingFace;同期多模态视频基准Video-MME出炉,Gemini 1.5 Pro全面超越GPT-4o,显示谷歌正用“开源+闭源”双线策略重夺模型话语权,刺激Meta、阿里等跟进,全球开源生态进入参数效率与多模态能力双重比拼的新阶段。
2024-06-28
开源多模态与视觉大模型爆发
Google开源Gemma-2 9B/27B、LeCun团队开源Cambrian-1,清华哈佛提出LangSplat,低成本高质量视觉-语言模型成为新焦点,推动社区复现Sora级视频生成与3D场景理解,降低开发者门槛。
2024-05-18
视觉-语言与开源生态
Google开源PaliGemma多分辨率VLM家族,HuggingFace发布视觉大模型训练 cookbook,腾讯光子开源ID-Animator实现照片+文字生成定制视频,降低多模态门槛并丰富开源工具链。
2024-04-04
开源小模型突破
苹果发布 80M 参数 ReALM,以“屏幕上下文文本化”方案在多项基准打平或超越 GPT-4,为端侧 Siri 带来秒级响应;Google Gemma 2B 微调实战显示小模型在特定垂直任务(如中文标题生成)上可低成本逼近大模型效果。小尺寸+高性能趋势将加速端侧 AI 落地,降低算力门槛。