###

计算机系统应用英文版:2016,25(9):223-229

View/Add Comment 过刊浏览高级检索 HTML

←前一篇 | 后一篇→

码上扫一扫！

下载全文

汉英-泰互译有声语料的数据库研究

(1.云南民族大学云南省高校少数民族语言文字信息化处理工程研究中心, 昆明 650500;2.云南民族大学电气信息工程学院, 昆明 650500;3.云南民族大学国际教育学院, 昆明 650500)

Research on the Database of English Chinese-Thai Translation Audible Corpus

HU Gang^1,2,3, WANG Jia-Mei^1,2,3, LI Bing-Ze¹, LIN Rui^1,2,3, LIN Bi-Tong^1,4

(1.Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China;2.School of Electrical &3.Information Engineering, Yunnan Minzu University, Kunming 650500, China;4.School of International Education, Yunnan Minzu University, Kunming 650500, China)

摘要

图/表

参考文献

相似文献

本文已被：浏览 1885次下载 3921次
Received:November 17, 2015 Revised:December 25, 2015

中文摘要: “汉英-泰互译有声语料库”的开发，在泰文舆情分析领域，解决了词典分词算法中训练语料缺乏的问题. 本文采用计算机化信息处理技术，对大量的收集来的泰文语料进行整理、规范、加工与存储，统计出泰文词汇8000多个. 然后利用词典翻译和人工校对其进行语料对齐. 最后，结合泰文语言语法特征以及句法的语义特点，分类归纳和规范标注泰语语料，构建了5万条左右的的汉英-泰语料数据库.

中文关键词: 汉英-泰语料库互译有声舆情泰文分词

Abstract:The development of “English Chinese - Thai Translation Audible Corpus”, in the field of Thai public opinion analysis, it solves the problem of the lack of training corpus in dictionary segmentation algorithm. In this paper, the computerized information processing technology is used to organize, standardize, process and store large amounts of collected Thai corpus, and then more than 8000 of the Thai vocabularies are finished. And then it uses the dictionary translation and manual calibration to align corpus. Finally, Thai corpus are classified and marked normally, combined with syntax characteristics and syntactic semantic features of Thai language, and then the database of English Chinese - Thai corpus is constructed, which contains about 50 thousand of the query terms.

keywords: English Chinese - Thai corpus translation audible public opinion Thai segmentation

文章编号： 中图分类号： 文献标志码：

基金项目:国家自然科学基金（61363085）；国家语委重大科研项目（WT125-61）；云南省教育厅科学研究基金重大专项（ZD2013013）；云南民族大学高水平民族大学建设科研项目（ZZZC1501-JF12002）；云南民族大学研究生创新基金重点项目（2015YJCXZ17）

Author Name	Affiliation
HU Gang	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
WANG Jia-Mei	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
LI Bing-Ze	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China
LIN Rui	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
LIN Bi-Tong	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of International Education, Yunnan Minzu University, Kunming 650500, China

Author Name	Affiliation
HU Gang	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
WANG Jia-Mei	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
LI Bing-Ze	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China
LIN Rui	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of Electrical & Information Engineering, Yunnan Minzu University, Kunming 650500, China
LIN Bi-Tong	Yunnan Province for Minority Language Information Processing Engineering Research Center, Yunnan Minzu University, Kunming 650500, China School of International Education, Yunnan Minzu University, Kunming 650500, China

引用文本：
胡刚,王嘉梅,李炳泽,林睿,林碧彤.汉英-泰互译有声语料的数据库研究.计算机系统应用,2016,25(9):223-229
HU Gang,WANG Jia-Mei,LI Bing-Ze,LIN Rui,LIN Bi-Tong.Research on the Database of English Chinese-Thai Translation Audible Corpus.COMPUTER SYSTEMS APPLICATIONS,2016,25(9):223-229