随着社会的信息化发展,农业信息化的应用普及范围也逐渐扩大,特别是对于偏远的以农业生产为主,而信息化程度较为落后的少数民族地区来说,农业信息技术处理平台的应用需求更显迫切。同时,也产生了
两个重要的技术问题:一是应用过程中民族语言即时翻译;二是“农业信息处理与开发平台(以下简称:平台)”对多民族语言的开放性结构设计。因此,本阶段研究针对多语言农业信息处理的需要,
在原来“平台”基础上,进行了结构性改造。
考虑到农业领域专业词汇的有限以及各民族语言的不同特点,采用了“有限翻译”和“人工智能”两个主要技术。以统计机器翻译为基础,对平台结构的改造主要分为
三部分:
一是将“有限”范围限制在3万词条的中文农业词典范围内,供不同民族语言的使用者进行对应翻译,作为语料对齐和训练的基础;
二是在知识获取阶段,增加语言模型构造部分,利用统计机器翻译思想,对不同民族农业语料库对齐训练以及语言翻译模型的构造;
三是在知识推理阶段,对每一个汉语语句通过中文分词和语言模型解码器进行对应民族语言翻译和显示。
这样的结构设计,可以在民族语言学家提供的民语对应语料库、部分规则以及字库的基础上,随时生成民族语言的“农业专家系统”,以便于在不同民族地区推广应用。 |