基于机器学习的文学作品英译自动评价
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

商洛文化暨贾平凹研究中心开放课题 (17SLWH09); 商洛学院服务地方项目 (18SKY-FWDF009); 国家社会科学基金重大项目 (15ZDB099)


Automatic Evaluation for English Translation of Literary Works Based on Machine Learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了提高文学英译作品自动评价的水平, 引入基于机器学习的智能算法模型成为当前最有效的方法. 首先研究文学作品的翻译规则和特殊性, 建立基于变量特征的翻译评价指标体系; 然后利用Python语言平台, 英译文本经Stanford Parser、NLTK等工具包过滤预处理之后, 采取VSM向量空间模型获得特征编码和特征度, 再输入到Random-RF、Original-RF和AHP-RF算法模型中训练学习, 完成翻译质量评价与分析. 实验结果表明, 融合层次分析法、灰色关联法和随机森林算法的AHP-RF模型的分类效果优于其它2种, 同时人工译本相较于其它4种机器译本, 质量评分高、分类错误率小, 评价结果与实际翻译情况吻合.

    Abstract:

    The intelligent algorithm model based on machine learning has become the most effective method at present to improve the automatic evaluation for the English translation of literary works. First, the translation rules and particularity of literary works are studied, and the index system of translation evaluation based on the variable features is established. Then, with the aid of the Python language platform, after the English translation is filtered and preprocessed by tools such as Stanford Parser and NLTK, the feature codes and feature degree are obtained with the Vector Space Model (VSM). Furthermore, the results are input into the Random-RF, Original-RF, and AHP-RF algorithm models for training and learning. Thus, the evaluation and analysis of translation quality are completed. The experimental results show that the AHP-RF model combining the analytic hierarchy process, the grey correlation method, and the random forest algorithm has better classification than the other two. Meanwhile, compared with the other four machine translation versions, the manual translation has a high quality score and a low classification error, and the corresponding evaluation results are consistent with the actual translation.

    参考文献
    相似文献
    引证文献
引用本文

孙李丽,郭琳,张文诺,文旭.基于机器学习的文学作品英译自动评价.计算机系统应用,2021,30(3):196-201

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-07-09
  • 最后修改日期:2020-08-11
  • 录用日期:
  • 在线发布日期: 2021-03-06
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号