翻译记忆是国内外专业领域计算机辅助翻译市场中使用最为广泛、有效的技术。记忆数据筛选(模糊匹配或语句相似度评价)决定了翻译记忆系统的有效性,这篇文章主要就其核心方法进行研究,介绍了使用编辑距离、向量余弦和Jaccard 系数进行文本相似度评价的方法,使用基于《知网》和《同义词词林》的本体论、基于统计以及语法驱动的语义相似度评价方法,以及四种改进的评价方法,最后通过实验数据对其中四种典型方法进行比较分析,表明融合多目标评价可以提高数据筛选结果的实际有效性。
赵善祥.翻译记忆中数据筛选方法的研究.计算机系统应用,2009,18(4):109-113
京公网安备 11040202500063号