2026-04-12

AI同质化风险

南加大研究实锤大模型输出导致人类语言、代码、设计趋同,流行句式与风格被AI统一,认知多样性被侵蚀,警示集体智慧与适应能力退化风险。
2024-11-16

大模型数学与推理能力瓶颈

FrontierMath新基准测试揭示主流大语言模型在复杂数学推理上正确率不足2%,凸显其逻辑推理短板;同时业界持续争论LLM是否具备真正“推理”能力,提示通往AGI仍有关键缺口,亟需新算法与评测体系突破。
2024-04-15

大模型说服能力与知识管理

Anthropic证实Claude 3说服力达人类水平,同期综述指出大模型知识生命周期管理仍是瓶颈,提示对齐能力与安全风险同步升级。