AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
语言理解
相关话题
2024-08-17
大模型可解释性进展
MIT团队在ICML 2024发表论文,通过因果干预与表征探针首次揭示大模型对语言结构存在内部抽象与层级理解,为破解“黑箱”思维过程提供新证据。该研究有望推动更安全、可控的模型训练与对齐方法落地。
可解释性
MIT
ICML
语言理解
黑箱