2025-11-05
AI 版权诉讼与合规升级
丹麦版权组织起诉 Suno、Getty 诉 Stability AI 在英国遇挫、上海首例 AI 著作权案美杜莎形象抄袭落槌,arXiv 对 CS 综述设置“前置评审”门槛。多国司法开始为生成式 AI 划清版权与学术红线,训练数据、输出内容、作者身份认定成为焦点。
2025-09-08
版权与数据合规风暴
Anthropic支付15亿美元创纪录和解,苹果被控用盗版书籍训练Apple Intelligence,训练数据合法性成为AI巨头共同雷区,高额赔偿与政策监管将重塑数据获取与模型发布流程。
2025-09-05
AI版权诉讼升级
华纳兄弟两度起诉Midjourney,指控其AI图像模型未经授权使用影视角色训练;判决结果将确立训练数据合理使用边界,影响整个生成式AI产业合规成本。
2025-08-22
数据版权与合规风暴
Meta被控非法使用2396部电影训练AI,面临3.59亿美元索赔,成为史上最大AI训练数据侵权案;同时AI爬虫流量激增,Fastly报告引发网站封禁潮。案件结果将直接决定“合理使用”边界,推高全球数据授权成本,倒逼训练数据透明化与合规采购。
2025-08-15
版权与数据合规风暴
AI大模型训练数据面临7500亿美元版权赔偿风险,arXiv年拒2%AI造假论文,Wayback Machine被曝成“偷数据”后门,显示数据合法性已成行业生死线。
2024-10-23
版权争议与创作者反弹
1.1万艺术家联名抵制AI盗用、凯文·贝肯等明星抗议未经授权训练,青少年自杀案牵连大模型诉讼,版权与伦理矛盾进入高发期,倒逼监管加速。
2024-08-30
AI生成内容版权争议
晋江文学城指控博主偷录小说训练AI,Runway疑似删库引发Stable Diffusion v1.5版权归属讨论,凸显生成式AI在训练数据合法性、模型权重归属上的法律空白,版权将成为AI产业下一枚“定时炸弹”。
2024-08-02
数据瓶颈与商业冷思考
研究警告2028年高质量训练数据或将耗尽,Gartner预测2025年30%生成式AI项目因成本过高被抛弃,行业开始从烧钱扩张转向理性评估ROI。
2024-08-01
数据合规与爬虫争议
Claude团队被曝24小时百万次爬取遭公开指责,Reddit与微软等就数据付费僵持,数据主权与合规获取成为大模型训练新焦点,行业呼吁透明、可追溯的数据治理框架。
2024-07-22
数据隐私争议
WPS与豆包相继被质疑使用用户私人文档训练AI,虽官方否认,但事件触发行业对办公场景数据合规、授权边界与监管细则的高度关注,隐私安全已成大模型落地前置条件。
2024-06-29
AI版权诉讼首案落地
调查报道中心(CIR)正式起诉微软与OpenAI,指控其抓取受版权内容训练模型,标志传统媒体对生成式AI的首次集体法律反击;微软AI CEO同期称“网上内容即免费软件”,进一步激化矛盾。案件结果将直接决定训练数据合理使用边界,可能迫使巨头重塑数据获取与授权模式,并推高模型训练成本。
2024-06-20
AI版权与合规风暴
全国首例AI绘画大模型训练侵权案开庭,AI短片因酷似《沙丘》被质疑,标志生成式AI进入“版权追责期”。司法判例将直接决定训练数据合法性、平台责任边界及创作者收益分配,成为行业能否持续高速扩张的生死线。
2024-04-08
数据荒与隐私争夺战
2026年高质量公开数据或将耗尽,硅谷巨头数十亿美元抢购用户照片、视频与聊天记录,引发隐私泄露与合规风险大讨论。数据成为AI“新石油”,谁掌握数据谁就拥有下一代模型的话语权。
2024-04-06
AI训练数据与评测新发现
“弱智吧”语料被中科院等验证为最佳中文训练数据,8项评测第一;中科大发现大模型无需看图即可答视觉题,提示数据与评测方法仍存巨大优化空间。数据质量与评测公平性成为模型性能提升的关键变量。
2024-04-05
训练数据与计算优化
弱智吧数据意外成为最佳中文语料,GPU批处理策略深度解析获关注,显示高质量数据筛选与推理效率优化仍是提升大模型实战表现的关键环节。