面向LDA主题模型的文本分类研究进展与趋势
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家社科基金青年项目(17CTQ004)


Research Progress and Trend of Text Classification for LDA Topic Model
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    文本分类是自然语言处理领域的一个重要研究方向.综合分析发现,文本分类的研究和分析,有助于对信息进行有效的分类和管理,并为自然语言处理的应用提供有力的支持.然而,已有的研究在理论和方法层面虽然已经取得了一定的成就,但是文本分类研究涉及内容、领域和技术等多个方面,各学科研究错综复杂,因此还有很多缺陷和不足,需要进一步进行系统和深入的研究.本文针对文本分类这一研究内容,探讨了文本分类和LDA主题模型的相关理论;然后,从技术、方法和应用三个方面分析了面向LDA主题模型的文本分类的研究现状,总结了目前研究中存在的一些问题和研究策略;最后,归纳出文本分类未来的一些发展趋势.

    Abstract:

    Text classification is an important research direction in the field of natural language processing. It is found that the research and analysis of text classification can help to classify and manage the information effectively and provide strong support for the application of natural language processing. The existing research has made some achievements at the theoretical and methodological level. Nevertheless, the text classification research involves many aspects such as content, domain, and technology, while the research of each subject is complicated. Therefore, there are many defects and shortcomings, which need further systematic and in-depth research. In this paper, we discuss the related theories of text categorization and Latent Dirichlet Allocation (LDA) topic model for the research of text categorization. Then, we analyze the research status of text classification for LDA topic model from three aspects:technology, method, and application. Some problems and research strategies are presented as well. Finally, future trends of text categorization are summarized.

    参考文献
    相似文献
    引证文献
引用本文

赵乐,张兴旺.面向LDA主题模型的文本分类研究进展与趋势.计算机系统应用,2018,27(8):10-18

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-11-27
  • 最后修改日期:2017-12-21
  • 录用日期:
  • 在线发布日期: 2018-08-04
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号