Progress and Prospects of Tibetan Speech Recognition Research
CSTR:
Author:
  • Article
  • | |
  • Metrics
  • |
  • Reference [29]
  • |
  • Related [20]
  • | | |
  • Comments
    Abstract:

    With the continuous development of English and Chinese speech recognition technology, the research on minority language speech recognition technology has followed closely and achieved certain results. The Tibetan people are an indispensable member of the Chinese nation's family. The study of Tibetan speech recognition technology is an indispensable part of the research of speech recognition technology. Firstly, the paper presents the research process and research improvement of Tibetan speech recognition in China. Secondly, it introduces the template-based matching and statistical probability model and artificial neural network used in Tibetan speech recognition research from the characteristics of Tibetan language itself and its pronunciation features and elements, then summarizes the characteristics and application scope of the three methods. Finally, it discusses the research progress of Tibetan speech recognition and the characteristics of each recognition method, discusses the difficult problem and the direction of its future development.

    Reference
    [1] 拉龙东智.藏语语音识别技术研究[硕士学位论文].拉萨:西藏大学, 2015.
    [2] 高定国,珠杰.藏文信息处理的原理与应用.成都:西南交通大学出版社, 2014. 20-21.
    [3] 李洪波,于洪志.藏语语音识别的预处理研究.中文信息处理前沿进展——中国中文信息学会二十五周年学术会议.北京. 2006. 506-512.
    [4] 于洪志,李永宏,索南楞次,等.安多藏语单音节声学参数数据库研究探讨.第十一届全国民族语言文字信息学术研讨会论文集.西双版纳. 2007. 6-11.
    [5] 刘静萍,德熙嘉措.安多藏语辅音识别的设计.民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集.西双版纳. 2007.
    [6] 武光利,戴玉刚,马宁.基于短时平均幅度和短时平均过零率的藏语语音端点检测研究.福建电脑, 2007,(3):116-122.[doi:10.3969/j.issn.1673-2782.2007.03.067
    [7] 李洪波,于洪志.基于藏语语音学知识的语音端点检测研究.第七届中文信息处理国际会议.武汉. 2007. 644-649.
    [8] 李勇,于洪志,达哇彭措.基于关联规则的藏语语音韵律参数提取.微计算机信息, 2009, 25(6):255-257
    [9] 姚徐,李永宏,单广荣,等.藏语孤立词语音识别系统研究.西北民族大学学报(自然科学版), 2009, 30(1):29-36, 50
    [10] 德庆卓玛.基于特定人小词汇量藏语语音特征值提取的研究[硕士学位论文].拉萨:西藏大学, 2010.
    [11] 韩清华,于洪志.基于HMM的安多藏语非特定人孤立词语音识别研究.软件导刊, 2010, 9(7):173-175
    [12] 刘巧凤.基于快速沃尔什变换的藏语音识别技术[硕士学位论文].成都:西南交通大学, 2011.
    [13] 李冠宇,孟猛.藏语拉萨话大词表连续语音识别声学模型研究.计算机工程, 2012, 38(5):189-191.[doi:10.3969/j.issn.1000-3428.2012.05.058
    [14] 赵尔平,王聪华,党红恩,等.藏语孤立词语音识别技术研究.西北师范大学学报(自然科学版), 2015, 51(5):50-54
    [15] 许彦敏.藏语连续语音识别技术研究及系统实现[硕士学位论文].北京:中央民族大学, 2015.
    [16] 王辉,赵悦,刘晓凤,等.基于深度特征学习的藏语语音识别.东北师范大学报(自然科学版), 2015, 47(4):69-73
    [17] 刘晓凤.藏语语音深度特征提取及语音识别研究[硕士学位论文].北京:中央民族大学, 2016.
    [18] 张宇聪.基于深度学习的藏语拉萨方言语音识别的研究[硕士学位论文].兰州:西北师范大学, 2016.
    [19] 周楠,赵悦,李要嫱,等.基于瓶颈特征的藏语拉萨话连续语音识别研究.北京大学学报(自然科学版), 2018, 54(2):249-254
    [20] 赵悦,李要嫱,徐晓娜,等.临近最优主动学习的藏语语音识别方法研究.计算机工程与应用, 2018, 54(22):156-159, 215.[doi:10.3778/j.issn.1002-8331.1708-0052
    [21] 梁宁娜,邓彦松.基于DTW的藏语语音识别系统设计.电子技术与软件工程, 2018,(10):135
    [22] 黄晓辉,李京.基于循环神经网络的藏语语音识别声学模型.中文信息学报, 2018, 32(5):49-55.[doi:10.3969/j.issn.1003-0077.2018.05.007
    [23] 李涛.基于深度神经网络的语音信号特征学习研究[硕士学位论文].西安:陕西师范大学, 2018.
    [24] 周楠.基于深度学习的藏语非特定人连续语音识别研究[硕士学位论文].北京:中央民族大学, 2017.
    [25] 吴佳欣.基于TANDEM特征的藏语拉萨方言语音识别的研究[硕士学位论文].兰州:西北师范大学, 2018.
    [26] 代龙翔.面向藏语拉萨话语音识别的语音增强方法研究[硕士学位论文].兰州:西北民族大学, 2018.
    [27] 古典.语音识别中神经网络声学模型的说话人自适应研究[硕士学位论文].合肥:中国科学技术大学, 2018.
    [28] 梅俊杰.基于卷积神经网络的语音识别研究[硕士学位论文].北京:北京交通大学, 2017.
    [29] 李涛,曹辉,郭乐乐.深度神经网络的语音深度特征提取方法.声学技术, 2018, 37(4):367-370
    Cited by
    Comments
    Comments
    分享到微博
    Submit
Get Citation

王福钊,周雁.藏语语音识别研究进展和展望.计算机系统应用,2020,29(3):29-38

Copy
Share
Article Metrics
  • Abstract:2444
  • PDF: 7104
  • HTML: 5609
  • Cited by: 0
History
  • Received:July 27,2019
  • Revised:September 02,2019
  • Online: March 02,2020
  • Published: March 15,2020
Article QR Code
You are the first990994Visitors
Copyright: Institute of Software, Chinese Academy of Sciences Beijing ICP No. 05046678-3
Address:4# South Fourth Street, Zhongguancun,Haidian, Beijing,Postal Code:100190
Phone:010-62661041 Fax: Email:csa (a) iscas.ac.cn
Technical Support:Beijing Qinyun Technology Development Co., Ltd.

Beijing Public Network Security No. 11040202500063