摘要:随着软件项目规模的增大与复杂性的增加, 测试过程产生了大量的错误报告, 其中重复的错误报告广泛存在. 重复错误报告的存在, 降低了开发人员修复错误的效率. 重复错误报告预测可有效地避免重复错误报告的产生, 是近年来的热门研究方向之一, 但其效率及准确率有待提高. 为此, 提出一种基于语义扩展连续查询的重复错误报告预测方法, 通过构建基于主题模型的错误报告索引词库, 对查询词序列进行语义扩展, 采用基于连续查询的错误报告检索算法, 在缩小索引空间的同时, 提升了预测准确率与效率. 实验表明, 相较于传统重复错误报告预测方法, 该方法减小了50%以上的错误报告索引空间, 最高提升了33.6%的预测效果, 且缩短了41%–73%的检索时间.