首 页  | 公司简介 | 新闻报道 | 研发理论 | 产品中心 | 技术服务 | 招聘英才 | 联系我们
HNC理论(概念层次网络理论)
HNC理论介绍
     HNC是Hierarchical Network of Concepts(概念层次网络缩写), 是中国科学院声学研究所研究员黄曾阳先生潜心研究8年建立的一套较完备的关于自然语言理解处理的创新理论体系。本理论在深入挖掘汉语特点的基础上,以意义表达和语言理解为主线,建立了一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式。著名的语言学家、全国人大副委员长许嘉璐教授给予了高度重视和支持,认为该理论体现了语言学、认知科学和计算机学的结合,把它看作当今我国中文信息处理的三大流派之一,引起了学术界的认同。

所获荣誉
      得到了国家多项重大项目的支持,其中有中国科学院“八五”重大项目、国家“九五”重点科技攻关项目、国家重点基础研究发展规划(973)项目等。 2000年,句类分析通过信息产业部组织的专家鉴定,鉴定结果为:“在汉语语句理解方面达到国际领先水平。(见《科学技术成果鉴定证书》XD鉴定[2000]第05016号)。 已申请了国家专利,是中国人具有自主知识产权的技术。

HNC的历程:
1989~1993    创立
1994~1996    实验
1997~2000    技术实现
2001~    走向应用


HNC研究方法
*从结构到功能:
索绪尔--
      乔姆斯基--转换生成语法 结构语法
      结构语言学:字--词--词组--句子--语义--理解
      自然语言空间(语言形式)--概念空间(知识表示)
*从功能到结构:
黄曾阳先生探索语言所反映的认知结构和知识结构
      功能主义语言学:语义--语句--篇章--理解
      概念空间(知识表示)--自然语言空间(语言形式)

HNC金字塔



HNC知识库系统的构成


HNC金字塔HNC知识库介绍
      HNC知识库是HNC从理论到技术实现、再到应用系统开发的支柱,HNC知识库建设的目标是以HNC理论为指导,有系统地为自然语言理解处理积累知识资源。
      经过多年积累,HNC的知识库已初具规模。目前建成的基本句类知识库含有57个句类知识,汉语词语知识库收词59988条(《现代汉语词典》收录的词也只有4万多条),汉语单字知识库对3084个常用汉字进行描述,立场库描述了16498个词语的立场和褒贬属性、专名库收录5000余条专名。
      目前,HNC知识库无论从规模上还是从质量上,都已能满足应用系统的需要,其专业性、准确性、广泛性得到业界专家肯定。 目前国内外其他同类知识库在内容上主要描写词语之间的搭配知识、词语的语法知识及语言中蕴含的常识知识,在表示上较多地采用了自然语言的描述方式,但知识表示大都缺乏层次,提供给计算机使用时会带来诸多不便。在处理思路和策略上,主要是基于统计的n元语法和句法分析。由于统计方法是机械的,对统计的语料有很强的依赖性,不能让计算机很好地理解自然语言;而句法分析由于词性的模糊和汉语词性兼类现象严重、词间没有明确切分标志、不使用形态变化等问题,很难给出明确的结果。
      HNC知识库与其他知识库有所不同。HNC知识库是对知识的提纲挈领式表示,从概念和语言两个层面,对语法、语义、语用和世界知识进行综合、抽象、提炼,描述了自然语言理解处理当前所需要的关键知识。

HNC理论应用
      HNC的技术是建立在对语言的语义理解的基础上,其应用主要是应用在计算机对语言信息的智能化处理,可以运用在计算机智能领域的多个层面,并带动相关产业的发展,其中主要有以下三大领域:
1.智能信息分类领域:包括智能信息分类系统,智能信息搜索服务系统,行业信息咨询服务系统,电子校对系统,信息过滤系统等方面。
2.智能机器翻译领域:包括汉英双语双向文本/语音翻译系统,多语文本/语音翻译系统等。
3.计算机智能综合应用领域:包括文本/语音人机对话系统,计算机综合语言知识处理系统,机器人智能系统等。