LLM - AI话题 - AI快开门

2026-05-16

AI治理与商业机制创新

涵盖AI治理全球合作倡议、生成内容版权法律适用探讨及LLM-Auction营销机制创新。薛澜提出避免零和竞争，AI漫剧版权确权亟待厘清，同时AI委托长周期任务的可靠性研究揭示理论与实际应用的落差，为AI商业化落地提供治理框架与机制设计参考。

AI治理版权法律 LLM-Auction 商业机制全球合作

2026-05-12

芯片-模型协同优化提速

AMD发布vLLM-ATOM插件，国产DeepSeek-R1、Kimi-K2在Instinct GPU上推理显著提速；百度Ernie5.1以6%成本实现1223分Search榜全球第四。硬件适配与弹性训练框架双轮驱动，国产大模型进入“高性价比”窗口期。

vLLM-ATOM Ernie5.1 推理加速成本骤降

2026-05-10

多语言与数据高效模型新路径

南大团队提出ParamΔ+Upcycled MoE组合，仅用少量目标语言数据即可把单语LLM升级为多语大模型，低资源语言性能大幅提升；HiLight框架实现长文原文划重点，减少切片幻觉，共同指向“轻数据、重结构”的模型扩展新方向。

多语言LLM ParamΔ Upcycled MoE 数据高效 HiLight

2026-05-03

从Vibe Coding到Agentic Engineering

Karpathy再谈“氛围编程”一年进化：LLM已从辅助写代码升级为具备推理规划的Agent核心，开发者需转向多智能体架构设计，推动软件工程进入“智能体协同”时代。

Agentic Engineering Vibe Coding LLM 软件2.0

2026-04-26

模型血缘与治理工具

LLM DNA行为谱系分析在ICLR’26提出，可精准追溯微调源头、识别隐藏血缘，为快速膨胀的大模型生态提供溯源、评估与治理新工具，助力合规与可信AI发展。

LLM DNA 模型溯源微调血缘模型治理 ICLR

2026-03-26

大模型高效压缩突破

谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点，引发内存股大跌；苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧，蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军，显示“大模型小型化”正成为性能与成本的新战场。

TurboQuant 知识蒸馏模型压缩 F2LLM-v2 端侧AI

2026-03-25

AI 安全与供应链投毒

月下载近亿次的明星库 litellm 遭供应链投毒，Karpathy 与马斯克接连预警；同时上海出现 AI 伪造病历敲诈案，Spotify 测试防冒名机制，显示生成式能力普及后，数据、代码与内容安全已同步进入“对抗时代”。

供应链攻击 litellm投毒 AI伪造内容安全 AI滥用

2026-03-07

AI生成内容安全与伦理

arXiv创始人实测13款LLM皆可快速生成“水论文”；浙大&阿里安全因果框架Causal Analyst入选NDSS 2026，揭示越狱攻击因果链并给出可解释防御，学术与模型安全同步承压。

水论文 LLM安全越狱攻击 Causal Analyst

2026-01-23

AI推理效率革命：vLLM团队创业

全球主流开源推理引擎vLLM核心成员成立Inferact，获a16z与光速1.5亿美元种子轮、估值80亿美元，剑指AI推理成本压缩。同期北大团队发布模拟计算芯片，能效比提升228倍，显示“后训练”推理优化与硬件创新正成为AI实用化的新战场。

vLLM Inferact 推理成本模拟芯片能效

2025-11-29

AI重塑科研范式

AlphaFold计划融合大模型，AI智能体驱动药物发现闭环，LLM显著提升医生研究效率，显示AI正从工具升级为科研“副驾驶”，加速生命科学、医学等领域知识发现。

AlphaFold AI药物发现 LLM 科研效率生命科学

2025-11-09

多智能体协同与工具调用

UCSD发布首个多智能体“群体强化”框架PettingLLMs，使大模型工具调用能力暴升5.8倍；IEEE图智能体综述提出GLA统一蓝图，为复杂系统决策提供新架构。多体协同正成为提升LLM落地效率的核心路径，影响机器人、游戏、运维等场景。

多智能体强化学习工具调用图智能体 LLM Agent

2025-11-02

桌面Agent开启自然语言操作系统时代

阶跃星辰发布悬浮球Agent“小跃”，可直接用自然语言操控操作系统、执行任务与命令行，摆脱传统浏览器限制。这一产品把“LLM as OS”理念推向消费级桌面场景，预示未来PC交互或全面转向语言驱动，带动开发者生态与操作系统架构重塑。

桌面Agent 自然语言交互操作系统小跃 LLM as OS

2025-10-26

Transformer架构反思与后注意力时代

“Attention”作者公开呼吁告别Transformer，叠加NeurIPS高分论文用判别式监督重塑推理LLM，凸显社区对Scaling Law边际效应的担忧，后Transformer架构与训练策略成为下一波核心竞争点。

Transformer 架构创新推理LLM 判别式监督 Scaling Law

2025-10-14

AI安全与监管收紧

OpenAI、Anthropic、DeepMind联合发文称现有LLM安全防御“不堪一击”；加州通过新法要求聊天机器人明确标识AI身份并保护未成年人，最高罚款25万美元。顶级厂商罕见一致呼吁强化监管，预示全球立法将加速，合规成本成为模型落地新变量。

LLM安全监管加州法案 OpenAI 合规

2025-09-18

端侧小模型与推理优化潮

Meta发布MobileLLM-R1瞄准手机端小型推理，Groq融资7.5亿美元推超高速芯片，Ring-mini-2.0以1B参数超10B性能，显示“小而强”模型+专用硬件正成为边缘AI新趋势。

端侧模型 MobileLLM-R1 Groq 推理芯片小型化

2025-09-17

开源生态洗牌与模型迭代

阿里开源通义DeepResearch轻量代理性能超OpenAI旗舰，小红书彻底开源音频大模型，宇树开源机器人世界模型UnifoLM，LLM开源2.0榜单60款模型出局，开源正从“参数释放”转向“数据+工具链+标准”全方位竞争。

开源大模型通义DeepResearch 音频模型 UnifoLM LLM洗牌

2025-09-13

小模型长工具链与搜索Agent突破

MiniMax&港科大提出WebExplorer，用高质量数据让8B小模型完成100轮工具调用，复杂长搜索任务反超大模型；Meta开源MobileLLM-R1以<1B参数击败Qwen3，验证“数据>参数”的新范式，推动端侧Agent落地。

WebExplorer MobileLLM-R1 小模型工具调用搜索Agent

2025-09-12

AI for Science与科研新范式

AI共同科学家平台成功预测噬菌体跨菌种传播机制；清华MIT提出AI+规划师新范式，城市规划效果超越90%人类专家；Thinking Machines Lab首发长文攻克LLM推理不确定性，显示AI正从辅助工具升级为科研合作者。

AI4Science 科研范式城市规划推理确定性 LLM

2025-09-11

垂直行业Agent渗透

Thinking Machines Lab宣称实现LLM 100%一致输出，瞄准医疗、金融等高可靠场景；武大等机构发布Healthcare Agent，问诊表现超越GPT-4；法律科技Legora估值7亿美元，垂直Agent在医疗、法律、教育等专业领域率先商业化。

Healthcare Agent Legora 垂直Agent LLM一致性专业场景

2025-07-12

科研专用LLM评估新基准

Ai2、耶鲁、NYU上线全球首个科研LLM竞技场SciArena，23款顶级模型实测，o3夺冠、DeepSeek-R1第四，暴露自动指标难捕捉科研人员偏好的痛点，将推动学术写作辅助模型迭代。

SciArena 科研LLM 评估基准 o3 DeepSeek

# LLM