大正大正机器翻译
一、 概述
大正语言机器翻译系统是北京大正语言知识处理科技有限公司基于HNC技术与现有机器翻译系统相结合发展出来的技术应用之一。
这套建立在黄曾阳先生创立的HNC(Hierarchical NetWork of Concepts)理论之上的系统,模拟人脑对自然界的理解,提出了“概念”是人对客观事物的认知,将不同语言在“概念”上的进行转化,完成“概念”层面上的信息传递;在保证源语言准确理解的基础上,向目标语言生成的过程中,建立语言概念空间,进行过渡处理,能够解决目前发现的主要影响翻译效果的复杂句理解问题,有效避免以往机器翻译中未作语义块分析所造成的翻译错误和翻译质量差等方面的问题。
同时我们在处理常用语、特殊用法的翻译中的也融合了统计翻译技术;在处理重复翻译、相似翻译中,也融合了机器翻译记忆系统,从而大幅度提高机器翻译效果,增强可读性。
二、HNC翻译流程
该方案的突出特点就是以HNC的语义结构为中间语言,翻译的过程主要进行的是语义结构在不同语言中的转换,这种转换能最大程度地保证源文和译文之间语义的一致性,提高翻译的可读性。
二、 主要特点与优势
先理解后翻译
通过语义分析,可正确理解复杂句,即处理复杂句 “句蜕”
能够生成文章的“语境”,帮助理解内容
可处理歧义句,准确翻译内容
隐知识揭示,准确翻译内容
多种策略,综合运用
三种翻译策略相结合,扬长避短,综合运用,发挥最大优势
HNC翻译(句子结构翻译、保证语义框架正确性)
统计翻译(常用语、特殊用法的翻译、充分利用语料库的优势)
翻译记忆(重复翻译、相似翻译减少翻译人工 )
翻译记忆,自主学习
具有短时记忆和长时记忆功能,帮助理解上下文
进退有度,自知之明
力求不误译//不乱译。采取“能译则译之,不能译则不译之”或“宁可不译,不可误译”
对翻译的结果,那些是很有把握的,那些把握性不大,那些不会译,都给出明确的指示