文本分类系统
文本分类系统是建立在概念统计基础上的文本分类软件,在辨别文本中普遍存在的同义、多义等模糊语义的基础上,提取文本内容的共现信息。比采用关键词技术的传统分类系统准确率更高。 HNC分类系统支持多种数据格式。支持常用格式文件的入库和检索,如TEXT,HTML,RTF,MS WORD,PDF等格式。HNC分类系统支持单一文件多重分类 (同一份文件可被分类到不同分类法则的不同目录下)、虚拟目录多重归属(通过设定快捷方式将单一目录虚拟连接到多个合适目录之下),还支持特殊 规则自由定义,提供规则设定,可依据特殊需求定义规则,也可将规则做为 资料过滤条件。
功能特性
先进的体系结构
灵活的类别定制方案
智能和基于知识的学习引擎
高速的分类性能
反馈式的学习算法
提供对类别内部热点主题的挖掘与统计
提供数据聚类引擎,进行无学习指导的文本分类
多层次树状分类结构
应用领域