摘要:讽刺是一种修辞手法, 通过言辞或行为表达出与字面意义相反或不同的含义, 常用于批评、讽刺、幽默或反讽, 通常包含对某种情况或观点的嘲笑或挖苦. 由于讽刺的复杂性, 导致讽刺检测很难只通过文本单个模态进行. 因此, 多模态讽刺检测得到了更多研究者的关注. 现有的方法通过注意力机制进行多模态讽刺检测, 然而它们在对齐和融合阶段有所不足, 无法筛选出对齐信息中的重要信息从而影响模型性能. 本文提出了一个基于注意力和图注意力的模型来进行多模态讽刺检测, 它通过多头跨模态注意力模块进行对齐, 通过自注意力增强两个模块输出中的重要信息的表达. 该模型的效果在一个基于Twitter的公开讽刺检测数据集上得到了验证.