水利数据具有涉及面广、数据量大、管理分散、标准不一等特点,对构建水利知识图谱造成一定困难。“水利知识智能生产工具”通过web可视化建模,基于对水利数据的深度训练,能够高效对水利数据进行抽取、映射、清洗、融合,人机协同高效率构建水利知识图谱,深入挖掘水利数据价值。
暂无资料水利数据具有涉及面广、数据量大、管理分散、标准不一等特点,对构建水利知识图谱造成一定困难。“水利知识智能生产工具”通过web可视化建模,基于对水利数据的深度训练,能够高效对水利数据进行抽取、映射、清洗、融合,人机协同高效率构建水利知识图谱,深入挖掘水利数据价值。
根据水利知识图谱构建流程,包括知识建模、知识抽取、知识映射、知识清洗、知识融合、可视化展示六项功能。
1、知识建模
针对不同水利业务需求,封装类型各异的水利知识模板,形成覆盖流域防洪、水资源调配、水利工程管理等业务水利知识语义网络,协助用户快速构建水利知识模型。
2、知识抽取
基于对水利知识的深度训练,自动化抽取结构化、半结构化、非结构化的多源异构水利数据,形成实体、关系、属性组成的知识单元,实现水利人、事、物全方位关系网的构建。
3、知识映射
由于水利数据的表示标准不一,造成水利知识存在一词多义、一义多词等现象。按照规范将这些知识进行统一表示,消除冗余信息,实现相同属性知识的一致表达。
4、知识清洗
水利数据存在的重复、缺失、格式或类型不规范等问题,造成数据质量可信度低。根据水利行业标准规范,设计并封装通用性高、移植性强的水利数据清洗策略,保障水利知识质量。
5、知识融合
基于实体属性相似度框架,智能识别多源数据的同一实体,对齐合并知识单元,使不同来源的水利知识合并为一个整体,避免知识相互打架。同时,对新产生的水利数据自动整合、消歧,实现水利知识的持续扩展。
6、可视化展示
运用web可视化技术,在线直观化展示知识图谱,并进行拖动、缩放、延展等交互。针对任意节点,可折叠/展开、悬浮高亮、单击/双击、拖动拉拽等,实现信息的灵活查询浏览。
1、多源数据兼容化
针对水利数据多源异构特点,产品能够灵活便捷接入结构化、非结构化、半结构化的水利数据,丰富水利知识样本。
2、知识建模可视化
利用web可视化、图形化技术,通过拖拽编辑,即可灵活完成不同水利业务知识图谱本体的构建,大大提高建模工作效率。
3、任务执行模块化
将知识抽取、知识映射、知识清洗、知识融合等任务模块化,各模块等同于一个插件。通过流水线式的组合配置,有效降低知识图谱的构建难度,缩短开发周期。
4、知识生产精准化
基于海量的水利行业大数据训练水利知识模型,结合规范化的知识清洗和知识融合,使生产的水利知识具有更高的水利专业水准。
/