面向隐式毒性的多阶段多目标文本去毒
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家社会科学基金 (22BXW048)


Multi-stage Multi-objective Text Detoxification for Implicit Toxicity
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现有文本去毒方法未充分考虑隐式毒性以及去毒后文本质量较差的问题, 提出一种多阶段多目标优化的文本去毒框架MSMO-Detox (multi-stage multi-objective detoxification). 本方法采用3阶段级联处理实现精准去毒: 首先运用基于标记的毒性解释技术, 通过传播分解向量以精确识别毒性贡献度超阈值的词元并进行掩码处理; 随后采用专家乘积(product of experts, PoE)框架进行词元生成, 替换掉被掩码词元; 最后实施多目标重排序策略, 从隐式毒性、文本流畅度、语义保留这3个维度综合评估候选句子, 选取评分最优的候选句作为输出. 实验结果表明, 在MAgr、SBF、DynaHate、Jigsaw数据集上, MSMO-Detox相较于不同数据集上的最优基线方法, 毒性指标分别平均下降23.1%、23.9%、17.6%、5.6%, 此外, 文本流畅度与语义保留能力也得到改善. 可见, MSMO-Detox在文本去毒任务中具有显著优势, 特别是在网络生态优化中, 该方法可以作为网络生态优化中去除网络暴力的重要工具, 用于有毒文本的风格迁移.

    Abstract:

    Existing textual detoxification methods do not fully consider implicit toxicity, and detoxified text often has low quality. To address these problems, a multi-stage multi-objective detoxification framework, termed as MSMO-Detox, is proposed. MSMO-Detox uses a three-stage cascade for precise detoxification. First, a marker-based toxicity attribution technique propagates decomposition vectors to identify tokens whose toxicity contribution exceeds a threshold and performs masking on these tokens. Second, a product of experts (PoE) framework generates replacement tokens for masked positions. Third, a multi-objective reranking strategy conducts a comprehensive evaluation of candidate sentences across implicit toxicity, fluency, and semantic preservation, and selects the highest-scoring candidate as the output. Experimental results show that on MAgr, SBF, DynaHate, and Jigsaw datasets, MSMO-Detox reduces toxicity metrics by an average of 23.1%, 23.9%, 17.6%, and 5.6%, compared with the best baseline on each dataset. Fluency and semantic preservation also improve. MSMO-Detox demonstrates clear advantages in textual detoxification and can be applied to the task of toxic-text style transfer as an important tool for the elimination of cyber violence and optimizing online ecosystems.

    参考文献
    相似文献
    引证文献
引用本文

毛柯,安俊秀,王鑫,袁明坤.面向隐式毒性的多阶段多目标文本去毒.计算机系统应用,,():1-8

复制
分享
相关视频

文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2025-09-11
  • 最后修改日期:2025-10-10
  • 录用日期:
  • 在线发布日期: 2026-03-02
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62661041 传真: Email:csa@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号