2026-05-16

AI治理与商业机制创新

涵盖AI治理全球合作倡议、生成内容版权法律适用探讨及LLM-Auction营销机制创新。薛澜提出避免零和竞争,AI漫剧版权确权亟待厘清,同时AI委托长周期任务的可靠性研究揭示理论与实际应用的落差,为AI商业化落地提供治理框架与机制设计参考。
2026-05-12

芯片-模型协同优化提速

AMD发布vLLM-ATOM插件,国产DeepSeek-R1、Kimi-K2在Instinct GPU上推理显著提速;百度Ernie5.1以6%成本实现1223分Search榜全球第四。硬件适配与弹性训练框架双轮驱动,国产大模型进入“高性价比”窗口期。
2026-05-10

多语言与数据高效模型新路径

南大团队提出ParamΔ+Upcycled MoE组合,仅用少量目标语言数据即可把单语LLM升级为多语大模型,低资源语言性能大幅提升;HiLight框架实现长文原文划重点,减少切片幻觉,共同指向“轻数据、重结构”的模型扩展新方向。
2026-05-03

从Vibe Coding到Agentic Engineering

Karpathy再谈“氛围编程”一年进化:LLM已从辅助写代码升级为具备推理规划的Agent核心,开发者需转向多智能体架构设计,推动软件工程进入“智能体协同”时代。
2026-04-26

模型血缘与治理工具

LLM DNA行为谱系分析在ICLR’26提出,可精准追溯微调源头、识别隐藏血缘,为快速膨胀的大模型生态提供溯源、评估与治理新工具,助力合规与可信AI发展。
2026-03-26

大模型高效压缩突破

谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点,引发内存股大跌;苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧,蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军,显示“大模型小型化”正成为性能与成本的新战场。
2026-03-25

AI 安全与供应链投毒

月下载近亿次的明星库 litellm 遭供应链投毒,Karpathy 与马斯克接连预警;同时上海出现 AI 伪造病历敲诈案,Spotify 测试防冒名机制,显示生成式能力普及后,数据、代码与内容安全已同步进入“对抗时代”。
2026-03-07

AI生成内容安全与伦理

arXiv创始人实测13款LLM皆可快速生成“水论文”;浙大&阿里安全因果框架Causal Analyst入选NDSS 2026,揭示越狱攻击因果链并给出可解释防御,学术与模型安全同步承压。
2026-01-23

AI推理效率革命:vLLM团队创业

全球主流开源推理引擎vLLM核心成员成立Inferact,获a16z与光速1.5亿美元种子轮、估值80亿美元,剑指AI推理成本压缩。同期北大团队发布模拟计算芯片,能效比提升228倍,显示“后训练”推理优化与硬件创新正成为AI实用化的新战场。
2025-11-29

AI重塑科研范式

AlphaFold计划融合大模型,AI智能体驱动药物发现闭环,LLM显著提升医生研究效率,显示AI正从工具升级为科研“副驾驶”,加速生命科学、医学等领域知识发现。
2025-11-09

多智能体协同与工具调用

UCSD发布首个多智能体“群体强化”框架PettingLLMs,使大模型工具调用能力暴升5.8倍;IEEE图智能体综述提出GLA统一蓝图,为复杂系统决策提供新架构。多体协同正成为提升LLM落地效率的核心路径,影响机器人、游戏、运维等场景。
2025-11-02

桌面Agent开启自然语言操作系统时代

阶跃星辰发布悬浮球Agent“小跃”,可直接用自然语言操控操作系统、执行任务与命令行,摆脱传统浏览器限制。这一产品把“LLM as OS”理念推向消费级桌面场景,预示未来PC交互或全面转向语言驱动,带动开发者生态与操作系统架构重塑。
2025-10-26

Transformer架构反思与后注意力时代

“Attention”作者公开呼吁告别Transformer,叠加NeurIPS高分论文用判别式监督重塑推理LLM,凸显社区对Scaling Law边际效应的担忧,后Transformer架构与训练策略成为下一波核心竞争点。
2025-10-14

AI安全与监管收紧

OpenAI、Anthropic、DeepMind联合发文称现有LLM安全防御“不堪一击”;加州通过新法要求聊天机器人明确标识AI身份并保护未成年人,最高罚款25万美元。顶级厂商罕见一致呼吁强化监管,预示全球立法将加速,合规成本成为模型落地新变量。
2025-09-18

端侧小模型与推理优化潮

Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-09-17

开源生态洗牌与模型迭代

阿里开源通义DeepResearch轻量代理性能超OpenAI旗舰,小红书彻底开源音频大模型,宇树开源机器人世界模型UnifoLM,LLM开源2.0榜单60款模型出局,开源正从“参数释放”转向“数据+工具链+标准”全方位竞争。
2025-09-13

小模型长工具链与搜索Agent突破

MiniMax&港科大提出WebExplorer,用高质量数据让8B小模型完成100轮工具调用,复杂长搜索任务反超大模型;Meta开源MobileLLM-R1以<1B参数击败Qwen3,验证“数据>参数”的新范式,推动端侧Agent落地。
2025-09-12

AI for Science与科研新范式

AI共同科学家平台成功预测噬菌体跨菌种传播机制;清华MIT提出AI+规划师新范式,城市规划效果超越90%人类专家;Thinking Machines Lab首发长文攻克LLM推理不确定性,显示AI正从辅助工具升级为科研合作者。
2025-09-11

垂直行业Agent渗透

Thinking Machines Lab宣称实现LLM 100%一致输出,瞄准医疗、金融等高可靠场景;武大等机构发布Healthcare Agent,问诊表现超越GPT-4;法律科技Legora估值7亿美元,垂直Agent在医疗、法律、教育等专业领域率先商业化。
2025-07-12

科研专用LLM评估新基准

Ai2、耶鲁、NYU上线全球首个科研LLM竞技场SciArena,23款顶级模型实测,o3夺冠、DeepSeek-R1第四,暴露自动指标难捕捉科研人员偏好的痛点,将推动学术写作辅助模型迭代。