本文已被:浏览 1934次 下载 2428次
中文摘要: 无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节.其中歧义字段切分是中文自动分词研究中的一个"拦路虎",是影响分词系统切分精度的主要因素.能够正确切分某一类歧义字段的知识称为分词知识,所有分词知识的集合称为知识库或规则库.本文通过建立交集型歧义字段切分知识库,并采用知识学习的方法来丰富系统的知识,充分利用了知识库中积累的词的二元语法关系、语素构词、句法关系以及上下文等信息,提高了交集型歧义字段的切分精度.
中文关键词: 知识库 规则库 交集型歧义字段 知识学习
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
张培颖 | 中国石油大学计算机与通信工程学院 东营 257061 |
李村合 | 中国石油大学计算机与通信工程学院 东营 257061 |
Author Name | Affiliation |
张培颖 | 中国石油大学计算机与通信工程学院 东营 257061 |
李村合 | 中国石油大学计算机与通信工程学院 东营 257061 |
引用文本:
张培颖,李村合.基于知识库的交集型歧义字段切分系统.计算机系统应用,2006,15(8):42-43
.The System of Ambiguous Phrase Segmentation based on Knowledge Database.COMPUTER SYSTEMS APPLICATIONS,2006,15(8):42-43
张培颖,李村合.基于知识库的交集型歧义字段切分系统.计算机系统应用,2006,15(8):42-43
.The System of Ambiguous Phrase Segmentation based on Knowledge Database.COMPUTER SYSTEMS APPLICATIONS,2006,15(8):42-43