——投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示,当训练数据集中仅有0.01%的虚假文本时,模型输出的有害内容会增加11.2%;即使是0.001%的虚假文本,其有害输出也会相应上升7.2%。
——引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。在金融领域,不法分子利用AI炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;在医疗健康领域,数据污染则可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。
894.88MB
查看745.68MB
查看94.2MB
查看545.90MB
查看
网友评论更多
799茅毅风i
台积电突发!2纳米机密,遭外泄!
2025/08/05 推荐
8351弘杰行740
中俄联演期间 中方向外国舰机喊话
2025/08/04 推荐
950常鸣妍yf
大恒科技,控制权将变更!“神秘女士”3.62亿元买成第一大股东,徐翔母亲退出!
2025/08/03 不推荐