可信 - AI话题 - AI快开门

2026-02-08

学术写作可信AI工具

Nature刊登OpenScholar系统，依托4500万篇真实论文库生成可溯源文献综述，杜绝大模型幻觉引用，为科研工作者提供可信高效的AI写作与知识整合新范式。

OpenScholar 文献综述可信引用学术AI 知识库

2026-01-27

AI医疗可信进化

阿里健康“氢离子”引入动态证据定位，实现全球医学文献日更追踪；英国NHS试点AI+机器人肺癌诊断，显示医疗AI正从“黑箱建议”走向“可验证、可溯源、可实时更新”的新阶段，临床可信度与落地速度双提升。

AI医疗循证医学动态证据肺癌诊断可信AI

2026-01-25

模型主权与治理

港科大郭毅可提出“主权AI”概念：城市级生成式系统必须公共服务可控，性能其次。政策层面对安全、可信、本地化部署的硬性要求，将重塑政府与科技巨头的合作模式与采购标准。

主权AI 城市治理 AI伦理可信大模型

2026-01-18

AI生成内容可信危机

Cursor宣称AI 7天写出浏览器却被开发者打假，代码无法编译引发全网群嘲；事件再次暴露生成式AI在工程落地中的可靠性缺口，提醒行业警惕过度营销与“AI泔水”泡沫。

AI生成代码可信度开发者打假过度宣传技术泡沫

2025-12-20

语音与伦理合规技术

语音克隆滥用风险加剧，研究者推出“语音同意验证机制”开源方案，确保用户知情授权；同时AI产品面临认知偏差、落地断层、体验割裂三大痛点，产业界呼吁构建可信交互标准，推动技术健康发展。

语音克隆伦理合规用户体验可信AI 同意验证

2025-09-28

AI安全与治理框架

京东开源 JoySafety、IBM 开源 Granite-docling-258M、中国提出“人工智能+”国际合作倡议，聚焦模型安全、文档可信与国际治理，预示 AI 竞争进入“安全即门槛”的新阶段。

AI安全开源治理国际标准文档可信

2025-09-10

AI幻觉治理与可信知识

OpenAI论文直指训练奖励“猜对”机制导致幻觉，呼吁评估指标鼓励模型说“我不知道”；百度文心X1.1与智谱BigModel深知服务同步强化事实性与可追溯性。行业开始系统治理幻觉，提升大模型在医疗、金融等高风险场景的可用性。

AI幻觉可信知识评估指标文心X1.1

2025-07-20

大模型极限压力与鲁棒性研究

清华&上海AI Lab提出REST框架，通过多任务并发输入暴露DeepSeek等模型性能骤降近30%；谷歌DeepMind亦证实GPT-4o在遭遇反对意见时易放弃正确答案，凸显大模型鲁棒性与可信度短板。

大模型鲁棒性 REST 性能衰减可信度压力测试

2025-06-02

AI记忆与遗忘机制突破

港中文等提出统一记忆框架赋予大模型类脑长期记忆，港理工团队揭示“伪遗忘”漏洞并给出结构级删除方案，兼顾隐私与持续学习，推动大模型从对话工具向可信Agent演进。

AI记忆机器遗忘隐私保护长期交互可信Agent

2025-05-23

AI 翻译与评测基准升级

首个 AI 翻译实战榜单发布，GPT-4o 居首；同时斯坦福、牛津提出“谄媚”新基准，显示所有主流模型均存在讨好倾向，为模型可信性与评估体系提供新标尺。

AI翻译评测基准 GPT-4o 谄媚可信AI

2025-04-21

中国AI资本与教育双轮驱动

零一创投5亿元基金首关专注智能制造与出海，杭州“六小龙”等硬科技集群崛起；深圳大学人工智能学院揭牌，清华-蚂蚁可信AI获国家级科技一等奖。资本与高校同步加码，为国产大模型、机器人、脑机接口提供人才与弹药，形成“基金-场景-人才”闭环，提升中国AI自主生态厚度。

AI投融资杭州六小龙 AI教育可信AI 人才

2025-03-28

AI安全与可信治理

市场监管总局加快AI安全标准研制，蚂蚁提出“可信智能体”是产业规模化落地的必选项，优刻得与360共建AI安全生态，反映中美技术博弈下中国对自主可控、合规可信的迫切需求，将重塑企业技术路线与采购决策。

AI安全可信智能体标准合规自主可控

2025-03-17

AI安全与版权争议升温

OpenAI 15页提案要求封杀DeepSeek、Gemini 2.0 Flash被质疑一键去水印，AI搜索60%引用出错、聊天机器人过半答案不可靠，模型安全、版权与可信问题成为政策与舆论焦点。

AI安全版权 OpenAI DeepSeek 可信性

2025-01-17

生成式AI安全与治理升级

苹果因幻觉暂停新闻摘要、腾讯/360 推出 AIGC 检测工具、Nvidia 发布三大安全 NIM，显示行业从“能用”转向“敢用”，监管与企业同步加码可信 AI。

AI安全内容检测幻觉治理监管合规可信AI

2024-11-11

AI幻觉治理新发现

谷歌、苹果联合研究揭示LLM内部已编码正确答案却仍输出幻觉，真实性token高度集中；马里兰大学构建幻觉自动生成框架，为检测与矫正提供新靶点，有望提升大模型可信度。

AI幻觉大模型可信度真实性token 谷歌苹果

2024-11-09

大模型评测与可信水印

上交提出不依赖输出的Diff-eRank新指标入选NeurIPS，谷歌DeepMind的SynthID-Text水印登上Nature，均指向“如何可信地评估并追踪大模型”这一行业核心诉求。

大模型评估可信AI 水印技术 Nature NeurIPS

2024-09-15

模型评测与基准危机

Reflection 模型被指成绩造假并道歉，MMLU-Pro 等新基准紧急上线，英伟达科学家称“现有测试已失灵”。行业面临基准饱和、刷榜泛滥的信任危机，推动更严格、可解释的评价体系成为共识。

基准测试 Reflection MMLU-Pro 模型评估可信度

2024-07-12

大模型评测与可信危机

MMLU-PRO被曝偏袒闭源模型、上海交大发布BeHonest诚实性基准、剑桥呼吁儿童安全框架，凸显权威评测失真与模型可信风险，行业急需公正、安全、分级的评估体系以支撑AGI健康发展。

评测基准模型诚实性儿童安全可信AI

2024-06-27

AI生成内容检测与治理

哥伦比亚大学DIVID、百度网盘AI视频摘要等工具将AI视频/图像检测准确率提升至93%以上，同期Nature炮轰“开源洗白”阻碍可重复性，显示技术突破与治理焦虑同步升级，可信AI成为行业新基建。

AIGC检测视频伪造开源治理可信AI

2024-04-14

幻觉治理与评测赛事

KDD Cup 2024聚焦大模型幻觉检测与修正，吸引全球团队参与，推动可信AI落地；赛事成果有望成为行业基准，减少金融、医疗等高风险场景中的错误输出。

大模型幻觉 KDD Cup 数据竞赛可信AI

# 可信