###

DOI:

计算机系统应用英文版:2007,16(3):97-100

View/Add Comment 过刊浏览高级检索 HTML

←前一篇 | 后一篇→

码上扫一扫！

下载全文

基于组块的中文自动文摘系统研究

索红光¹, 曹淑英¹

(中国石油大学(华东)计算机与通信工程学院山东东营 257061)

Research on the Chinese Automatic Abstracting System Based on Chunk

摘要

图/表

参考文献

相似文献

本文已被：浏览 1666次下载 3355次

中文摘要: 传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.

中文关键词: 自然语言处理文本组块自动文摘统计方法向量空间模型

Abstract:

keywords:

文章编号： 中图分类号： 文献标志码：

基金项目:

Author Name	Affiliation
索红光	中国石油大学(华东)计算机与通信工程学院山东东营 257061
曹淑英	中国石油大学(华东)计算机与通信工程学院山东东营 257061

Author Name	Affiliation
索红光	中国石油大学(华东)计算机与通信工程学院山东东营 257061
曹淑英	中国石油大学(华东)计算机与通信工程学院山东东营 257061

引用文本：
索红光,曹淑英.基于组块的中文自动文摘系统研究.计算机系统应用,2007,16(3):97-100
.Research on the Chinese Automatic Abstracting System Based on Chunk.COMPUTER SYSTEMS APPLICATIONS,2007,16(3):97-100