1.本发明属于本体模型构建技术领域,涉及一种配电物联网数据的本体模型构建方法及系统、存储介质,尤其是一种配电物联网低压设备巡检记录本体模型构建方法及系统、存储介质。
背景技术:
2.配电物联网是智能配电网由中压向低压的延伸发展,是提升终端用户用电体验的重要发展方向。配电物联网面临近1.5亿套二次设备的接入压力,对运维主体造成巨大压力。目前,供电企业多采用人工巡检的方式,通过登记设备铭牌信息,记录设备缺陷现象和消缺操作,完成配电物联网低压设备的运行维护操作。该方法存在记录效率低、占用空间大、管理难度高的缺点,需要耗费大量的人力进行手动核对、录入和分析。随着配电网智能化、数字化程度不断提高,对配电物联网低压设备的状态检测和运行诊断提出了新的要求,亟需提出一配电物联网低压设备巡检记录本体模型构建方法,将单人单设备的巡检模式改为智能化信息录入管理模式,以便于对运行日志、缺陷记录和消缺操作进行分析。
3.经检索,未发现与本发明相同或相似的已公开的专利文献。
技术实现要素:
4.本发明的目的在于克服现有技术的不足,提出一种配电物联网低压设备巡检记录本体模型构建方法及系统,能够解决配电物联网低压设备巡检记录处理效率低、占用空间大、管理难度高的缺点,实现运行日志、缺陷记录和消缺操作的智能化信息录入和管理。
5.本发明解决其现实问题是采取以下技术方案实现的:
6.一种配电物联网低压设备巡检记录本体模型构建方法,包括以下步骤:
7.步骤1、根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表;
8.步骤2、提取故障设备的铭牌信息,与步骤1的配电网运维记录领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇;
9.步骤3、计算步骤2的低压配电设备典型故障缺陷巡检文本记录中的领域词汇中每个词的词频、逆文档频率和词频-逆文档频率,得到配电物联网低压设备巡检记录中的高频词;
10.步骤4、将步骤3中计算得到的高频词作为本体单元,之后根据步骤2 的领域词汇中的关系标志词建立不同本体单元间的函数关系,构成配电物联网低压设备巡检记录本体模型。
11.而且,所述步骤1的根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表的具体方法为:对低压配电设备典型故障缺陷巡检文本记录进行预处理,参考运维领域术语,建立配电网运维记录领域词汇表。
12.而且,所述步骤2的具体方法为:
13.对故障设备的铭牌信息,包括线路、站房、类型、设备id、设备主人,以及运维人员的低压设备巡检记录文本,包括时间、缺陷现象、缺陷等级、缺陷成因和消缺方案的文本信息进行预处理,基于字符窗分词法对巡检记录文本进行分割,依次将字符窗修改为7、6、5、4、3、2、1个汉字对文本记录进行截断,与步骤1中的领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇。
14.而且,所述步骤3的词频的计算公式如下:
[0015][0016]
其中,n
ij
为该候选词i在第j个巡检记录文件中出现的次数,∑kn
kj
为第 j个巡检记录文件中的词汇总数。
[0017]
而且,所述步骤3的逆文档频率的计算公式如下:
[0018][0019]
其中,|d|为巡检记录文件总数,|{j:ti∈dj}|为包含候选词i的巡检记录文件数。当所有巡检记录文件中都不含该候选词时,|{j:ti∈dj}|=0,因此分母记为|{j:ti∈dj}| 1。
[0020]
而且,计算词频-逆文档频率,公式如下:
[0021]
tf-idfi=tf
ij
·
idfiꢀꢀ
(3)
[0022]
而且,所述步骤4的具体方法为:
[0023]
将步骤3中计算得到的高频词作为本体单元,之后将步骤2的领域词汇中的高频词删除,留下关系标志词,并建立不同本体单元间的函数关系f
and
、f
kind-of
、f
further
、f
either
、f
but
、f
while
、f
if
、f
cause
,构成配电物联网低压设备巡检记录本体模型。
[0024]
一种配电物联网低压设备巡检记录本体模型构建系统,包括:
[0025]
电网运维记录领域词汇表构建模块,根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表;
[0026]
低压配电设备典型故障缺陷巡检文本记录中的领域词汇获取模块,用于提取故障设备的铭牌信息,与配电网运维记录领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇;
[0027]
配电物联网低压设备巡检记录中的高频词获取模块,计算低压配电设备典型故障缺陷巡检文本记录中的领域词汇中每个词的词频、逆文档频率和词频-逆文档频率,得到配电物联网低压设备巡检记录中的高频词;
[0028]
基于本体语言的配电物联网运维本体模型构建模块,将计算得到的高频词作为本体单元,之后根据领域词汇中的关系标志词建立不同本体单元间的函数关系,构成配电物联网低压设备巡检记录本体模型。
[0029]
而且,所述电网运维记录领域词汇表构建模块,用于对低压配电设备典型故障缺陷巡检文本记录进行预处理,参考运维领域术语,建立配电网运维记录领域词汇表。
[0030]
一种计算机可读存储介质,该计算机可读存储介质存储计算机程序,该计算机程序在数据处理装置上执行时执行所述的一种配电物联网低压设备巡检记录本体模型构建
方法。
[0031]
本发明的优点和有益效果:
[0032]
1、本发明提供的一种配电物联网低压设备巡检记录本体模型构建方法,可以从低压配电设备典型故障缺陷巡检记录提取出领域词汇,并通过计算每个词语的词频-逆文档频率,将高频词和关系标志词区分开,根据关系标志词确定各高频词间的函数关系,实现非结构化数据的结构化展示。
[0033]
2、本发明针对现有技术中配电物联网低压设备巡检记录的信息关联性差,难以有效管理利用的缺陷提出了一种配电物联网低压设备巡检记录本体模型构建方法,通过对低压配电设备典型故障缺陷巡检记录进行预处理,采用基于“字符窗”的分词方法提取出包括线路、站房、类型、设备id、设备主人、时间、缺陷现象、等级、成因和消缺方案等关键信息,建立基于本体语言的配电物联网运维本体模型,实现运行日志、缺陷记录和消缺操作的智能化信息录入和管理。
[0034]
3、本发明提供的一种配电物联网低压设备巡检记录本体模型构建方法,可以根据领域术语及其关系函数,建立线路、站房、类型、设备id、设备主人、时间、缺陷现象、等级、成因和消缺方案间的联系,形成多维度的巡检记录本体模型,有力支撑数据共享,并通过巡检记录相关信息及缺陷描述快速判断故障,提升消缺效率。
附图说明
[0035]
图1为本发明的配电物联网低压设备运维巡检记录本体模型构建方法流程图;
[0036]
图2是本发明的根据关系标志词对原始运维巡检记录信息拆解提取所建立的本体单元;
[0037]
图3是本发明的根据各本体单元的关系函数所建立的基于本体语言的配电物联网运维本体模型实例。
具体实施方式
[0038]
以下结合附图对本发明实施例作进一步详述:
[0039]
一种配电物联网低压设备巡检记录本体模型构建方法,如图1所示,包括以下步骤:
[0040]
步骤1、根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表;
[0041]
所述步骤1的根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表的具体方法为:
[0042]
对低压配电设备典型故障缺陷巡检文本记录进行预处理,参考运维领域术语,建立配电网运维记录领域词汇表。
[0043]
在本实施例中,为实现低压配电设备典型故障缺陷巡检文本记录的名词、动词提取,参考《配电网运维与检修管理标准和工作标准》、《q/gdw 1519-2014配电网运维规程》和《q/gdw 10370-2016配电网技术导则》中规定的运维领域相关术语,并按照统计词汇的长度对领域词汇进行分类,进行分类建表,得到如表1所示的配电网运维记录领域词汇表,采用excel表形式存储;
[0044]
表1配电网运维记录领域词汇表
[0045][0046]
步骤2、基于字符窗的分词方法提取如图2所示巡检记录中故障设备的铭牌信息,与步骤1的配电网运维记录领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇;
[0047]
所述步骤2的具体方法为:
[0048]
对图2所示的故障设备铭牌信息,包括线路、站房、类型、设备id、设备主人,以及运维人员的巡检记录文本,包括时间、缺陷现象、缺陷等级、缺陷成因和消缺方案的文本信息进行预处理,基于字符窗分词法对巡检记录文本进行分割,依次将字符窗修改为7、6、5、4、3、2、1个汉字对文本记录进行截断,与步骤1中的领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇,作为术语候选词。
[0049]
在本实施例中,所述步骤2的具体方法为:参考步骤1建立的配电网运维记录领域词汇表,将故障设备的铭牌信息,包括线路、站房、类型、设备 id、设备主人,以及运维人员的巡检记录,包括时间、缺陷现象、缺陷等级、缺陷成因和消缺方案等文本信息进行关键词提取,具体采用基于字符窗的分词方法,首先将字符窗设定为8,从第一个汉字开始按照8个汉字对文本记录进行截断,与领域词汇表进行匹配,再从第二个汉字开始按照8个汉字对文本记录进行截断,与领域词汇表进行匹配,在与记录比对完后,依次将字符窗修改为7、6、5、4、3、2、1个汉字对文本记录进行截断,其中数字和英文字符串作为单独词汇进行提取,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇,作为术语候选词。
[0050]
步骤3、计算步骤2的低压配电设备典型故障缺陷巡检文本记录中的领域词汇中每个词的词频、逆文档频率和词频-逆文档频率,得到配电物联网低压设备巡检记录中的高频词;
[0051]
所述步骤3的词频的计算公式如下:
[0052][0053]
其中,n
ij
为该候选词i在第j个巡检记录文件中出现的次数,∑kn
kj
为第 j个巡检记录文件中的词汇总数;
[0054]
所述步骤3的逆文档频率的计算公式如下:
[0055]
计算对数坐标下总记录文件数目与包含该候选词记录文件总数目的比值,即逆文档频率,计算公式如下:
[0056]
[0057]
其中,|d|为巡检记录文件总数,|{j:ti∈dj}|为包含候选词i的巡检记录文件数。当所有巡检记录文件中都不含该候选词时,|{j:ti∈dj}|=0,因此分母记为|{j:ti∈dj
}
| 1。
[0058]
计算词频-逆文档频率,公式如下:
[0059]
tf-idfi=tf
ij
·
idfiꢀꢀ
(3)
[0060]
通过词频-逆文档频率排序选出在单次巡检记录文件的高频词,但在历史巡检记录文件集中出现频率较低的候选词,过滤常见词汇,保留巡检记录文件中的领域术语,提供有效设备信息、缺陷现象和消缺方法。
[0061]
步骤4、将步骤3中计算得到的高频词作为本体单元,即本体模型的最小组成部分,之后根据步骤2的领域词汇中的关系标志词建立不同本体单元间的函数关系,构成配电物联网低压设备巡检记录本体模型。
[0062]
所述步骤4的具体方法为:
[0063]
将步骤3中计算得到的高频词作为本体单元,之后将步骤2的领域词汇中的高频词删除,留下关系标志词,并建立不同本体单元间的函数关系fand、f
kind-of
、f
further
、f
either
、f
but
、f
while
、f
if
、f
cause
,构成配电物联网低压设备巡检记录本体模型。
[0064]
在本实施例中,根据步骤3提取到的高频词与表2中的关系标志词进行比较,判断领域术语间的关系,如表3所示,得到基于函数关系的本体单元,进而建立基于本体语言的配电物联网运维本体模型,如图3所示,将非结构化的设备典型故障缺陷巡检记录以结构化方式展现出来,清晰展示故障终端的相关信息、故障原因和消缺方案,提升修复效率。
[0065]
表2术语关系及对应标志词
[0066][0067]
表3术语关系及对应标志词
[0068][0069]
一种配电物联网低压设备巡检记录本体模型构建系统,包括:
[0070]
电网运维记录领域词汇表构建模块,根据低压配电设备典型故障缺陷巡检文本记录,建立配电网运维记录领域词汇表;
[0071]
低压配电设备典型故障缺陷巡检文本记录中的领域词汇获取模块,用于基于字符窗的分词方法提取故障设备的铭牌信息,与配电网运维记录领域词汇表进行匹配,得到低压配电设备典型故障缺陷巡检文本记录中的领域词汇;
[0072]
配电物联网低压设备巡检记录中的高频词获取模块,计算低压配电设备典型故障缺陷巡检文本记录中的领域词汇中每个词的词频、逆文档频率和词频-逆文档频率,得到配电物联网低压设备巡检记录中的高频词;
[0073]
基于本体语言的配电物联网运维本体模型构建模块,将计算得到的高频词作为本体单元,即本体模型的最小组成部分,之后根据领域词汇中的关系标志词建立不同本体单元间的函数关系,构成配电物联网低压设备巡检记录本体模型。
[0074]
所述电网运维记录领域词汇表构建模块,用于对低压配电设备典型故障缺陷巡检文本记录进行预处理,参考运维领域术语,建立配电网运维记录领域词汇表。
[0075]
一种计算机可读存储介质,该计算机可读存储介质存储计算机程序,该计算机程序在数据处理装置上执行时执行根据权利要求1至7中任一项所述的方法。
[0076]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0077]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0078]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0079]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。