无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节.其中歧义字段切分是中文自动分词研究中的一个"拦路虎",是影响分词系统切分精度的主要因素.能够正确切分某一类歧义字段的知识称为分词知识,所有分词知识的集合称为知识库或规则库.本文通过建立交集型歧义字段切分知识库,并采用知识学习的方法来丰富系统的知识,充分利用了知识库中积累的词的二元语法关系、语素构词、句法关系以及上下文等信息,提高了交集型歧义字段的切分精度.
张培颖,李村合.基于知识库的交集型歧义字段切分系统.计算机系统应用,2006,15(8):42-43
京公网安备 11040202500063号