自然语言实时交通信息与位置信息的融合方法
一种词根语,主要特点有:①汉语缺乏形态变化,没有英语的性、数、格的变化标志,因此词本身不能显示与其他词的语法关系;②汉语结构松散;③虚词是主要的语法手段;④汉语词与词之间没有明显的形态间隔[9]。这些特点决定了汉语的自动分词是汉语自然语言理解的首要任务,分词是进行语义分析的基础。2.1.1 词库的建立词库是自然语言理解的核心部分,词库的建立直接影响着自然语言交通信息的正确理解。不同的语言理解系统对信息处理的目的和应用不同,词库的组成类型也不同。自然语言交通信息理解所涉及的词库包括地址词库,如道路名、机构名、POI等;空间关系词库,如拓扑关系、方向、偏移等;交通事件词库,如车流量、相撞等;基础词库,指在语言理解过程前预先加载的领域相关词汇,包括动词、量词、介词等。2.1.2 自动分词处理分词算法汉语自动分词是自然语言理解的关键因素。目前的自动分词算法主要有:一是机械匹配法,如正向最大匹配法(MM)、逆向最大匹配法等[10]
<<上一页 下一页>>
广州市越秀区图书馆版权所有。
联系电话:020-87673002
本站访问人数: