压力测试 - AI话题

2025-07-20

清华&上海AI Lab提出REST框架，通过多任务并发输入暴露DeepSeek等模型性能骤降近30%；谷歌DeepMind亦证实GPT-4o在遭遇反对意见时易放弃正确答案，凸显大模型鲁棒性与可信度短板。

AI快开门