2025-12-25
AI制药与科学发现
德睿智药AI设计的小分子GLP-1药物进入III期临床,深势科技获8亿元C轮融资服务300万科学家,ChemOntology与PiFlow等框架将人类直觉编码到化学与信息论系统,AI4S正从工具升级为科学发现引擎。
2025-10-25
大模型训练效率革命
数据集蒸馏WMDD/GUARD用10%样本保持全量性能;斯坦福AgentFlow让7B模型在线强化学习超越GPT-4o;北大RiskPO针对低概率高信息路径优化后训练。三大研究齐指“降本增效”,缓解算力焦虑。
2025-03-30
医疗与科学大模型突破
讯飞医疗推出全球首个1型糖尿病专病大模型,号称超越GPT-4o;曼尼托巴大学提出GraphBAN框架,用知识蒸馏精准预测分子-蛋白互作,为药物发现提供新工具。两者均展示大模型在垂直科学场景中的领先潜力。
2025-03-08
小模型推理突破
Qwen-32B凭GRPO算法在复杂推理任务上击败DeepSeek-R1、o3-mini,训练成本降100倍;7B蒸馏模型在MIT积分题大赛获93分,显示小参数+强化学习即可达顶尖推理性能,为端侧和低成本部署打开空间。
2025-02-15
科研与产业落地场景深化
清华发布75页DeepSeek职场应用手册,覆盖创意、科研、管理全场景;苹果发现蒸馏Scaling Law,提示“教师模型非越强越好”;UCSF华人团队构建硅基大脑解码神经信号。AI正从通用能力下沉到垂直科研与专业应用,催生新的研究范式。
2025-02-08
数学推理模型突破
DeepMind AlphaGeometry2、谷歌AI在IMO几何题正确率84%,超越金牌选手;李飞飞团队26分钟150元蒸馏出s1推理模型,验证“小参数+蒸馏”可行,预示高性能推理正走向低成本平民化。
2025-02-07
低成本推理范式
李飞飞、上交等团队用不足1K样本+预算强制,在16张H100上26分钟蒸馏出媲美o1-preview的推理模型,挑战“数据越大越好”共识,为中小团队提供新范式。
2025-02-03
Scaling Law再讨论
业界热议“堆参数”边际收益递减,Cameron Wolfe长文指出大模型扩展面临数据与算力瓶颈,呼吁转向高效架构、数据精炼及跨学科方法;同期多项研究聚焦知识蒸馏、高质量数据集构建,预示后预训练时代“精炼+蒸馏”成新主线。
2025-02-01
DeepSeek冲击波
DeepSeek-R1以低成本高性能震撼全球,引发OpenAI融资反击、硅谷巨头“打不过就加入”、中美数据安全摩擦,标志中国大模型首次在技术、商业与地缘三线同时产生连锁冲击。
2025-02-01
模型蒸馏与护城河重构
多项研究指出顶级模型普遍依赖蒸馏,DeepSeek绕过CUDA直写PTX优化,谷歌、北大等提出新协作或概率框架,暗示“算力+CUDA”护城河松动,训练与推理成本有望再降一个量级。
2025-01-22
模型蒸馏与评测反思
中科院、北大等研究指出除Claude、Gemini、豆包外,多数主流模型存在“过度蒸馏”,性能反而下降;人大清华提出Search-o1框架,用自主搜索缓解推理模型知识幻觉,推动评测方法升级。
2025-01-11
模型效率与知识蒸馏新思路
大连理工提出Wasserstein距离替代KL散度进行知识蒸馏,更好保留样本几何结构,在NeurIPS 2024引发关注;北航等首次把扩散模型全量化至1bit,存储压缩28倍、推理加速52倍,为端侧部署提供极致效率方案。
2024-12-04
编程与科研自动化突破
Devin 6个月估值20亿美元,宣称编程效率提升8倍;阿里妈妈AIGB实现大规模商用并开源Benchmark;清华&厦大获NeurIPS最佳论文,知识蒸馏、基因组基础模型NT登上Nature子刊,AI for Science进入快速落地期。
2024-07-15
机器人“大脑”与具身智能
Skild AI获3亿美元融资打造通用机器人大脑,Gemini 1.5 Pro装进机器人即可现学现用做礼宾;Meta System 2蒸馏让Llama 2对话准确率近100%。基础模型正成为机器人与边缘设备的通用中枢。
2024-01-26
模型效率与成本之战
贾扬清公司发布推理成本榜、OpenAI大幅降价并修复GPT-4“偷懒”问题、轻量化蒸馏与CKA对齐技术集中出现,行业进入“低价高能”竞赛,直接决定大模型商业化速度。