本文已被:浏览 1926次 下载 3987次
中文摘要: 在分析当前多文档自动文摘方法中使用较多的特征基础上,提出了一种特征组合优化模型。该模型选用tf*idf,句子位置及与标题句相似度来判断句子包含信息的重要程度,并加入了句子长度特征解决由tf*idf特征引起的长度偏长的句子占优势的问题,采用这4个特征来判断句子的重要性,并给每个特征指定权重来解决优化问题,实验结果表明特征组合优化模型在多文档自动文摘中的可行性。
中文关键词: tf*idf 句子位置 标题句相似度 句子长度 组合优化
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
刘茂福 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
李淑君 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
金可佳 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
张晓龙 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
Author Name | Affiliation |
刘茂福 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
李淑君 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
金可佳 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
张晓龙 | 武汉科技大学 计算机科学与技术学院 湖北 武汉 430065 |
引用文本:
刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化.计算机系统应用,2008,17(8):59-63
.Combination Optimization of Features in Multi-documents Automatic Summarization.COMPUTER SYSTEMS APPLICATIONS,2008,17(8):59-63
刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化.计算机系统应用,2008,17(8):59-63
.Combination Optimization of Features in Multi-documents Automatic Summarization.COMPUTER SYSTEMS APPLICATIONS,2008,17(8):59-63