AI快开门

发现最好的AI工具

2024-08-17

大模型可解释性进展

MIT团队在ICML 2024发表论文,通过因果干预与表征探针首次揭示大模型对语言结构存在内部抽象与层级理解,为破解“黑箱”思维过程提供新证据。该研究有望推动更安全、可控的模型训练与对齐方法落地。