一种信息处理方法及装置与流程

文档序号:12804746阅读:233来源:国知局
一种信息处理方法及装置与流程

本发明涉及信息处理技术,尤其涉及一种信息处理方法及装置。



背景技术:

虽然预报技术与通讯设备日益发达,但是天灾人祸还是时不时地影响着人们的正常生活。天津港的化学品爆炸事故再次证明了救援和物资需求分析及调配是人们在灾后必须立即面对和处理的事情。当灾难发生的时候,许多人居住的小区可能会停水停电,他们需要引用水的供给。也会有一些人家园被毁,需要更多生活用品,如帐篷、被褥以及食物等。因此如何快速估计出灾后物资的需求是亟待解决的问题。

目前,物资需求分析方法大多基于受灾区域内常驻人口的数目来粗略估计灾难救援物资的需求数目。所以这种方法存在分析不准确的问题。



技术实现要素:

为解决现有存在的技术问题,本发明实施例提供一种信息处理方法及装置。

为达到上述目的,本发明实施例的技术方案是这样实现的:

本发明实施例提供了一种信息处理方法,包括:

获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;

基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;

根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点。

上述方案中,所述方法还包括:

基于apriori算法,利用历史灾难救援数据,生成所述物资需求策略。

上述方案中,所述基于apriori算法,利用历史灾难救援数据,生成所述物资需求策略,包括:

利用所述历史灾难救援数据,基于第二关键词策略,提取关键词,生成第一集合;所述第一集合为多条灾难救援记录提取出的关键词所形成的集合;

在所述第一集合中,计算出现在记录中的每个关键词的频度;

基于递归的方法,利用每个关键词的频度,得到n个频度大于频度阈值的关键词集合;n为大于等于1的整数;

针对n个关键词集合中包含物资类关键词的每个关键词集合,生成非物资类关键词对应物资类关键词的规则,得到n个规则;

确定n个规则的可信度;

从n个规则中获取可信度大于可信度阈值的规则,形成所述物资需求策略。

上述方案中,所述基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资,包括:

基于所述通信数据中通信号码对应的全球定位系统(gps)数据,将所述通信数据以家庭为单位进行划分,得到每个家庭的通信数据;

针对每个家庭的通信数据,基于所述第一关键词策略,生成第二集合;所述第二集合为从每个家庭的通信数据中提取的关键词所形成的集合;

针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到受灾区域内每个家庭所需的物资。

上述方案中,所述通信数据包含音频数据;所述生成第二集合之前,所述方法还包括:

将所述音频数据转化成文本数据。

上述方案中,所述针对每个家庭的通信数据,基于所述第一关键词策略,生成第二集合,包括:

针对每个家庭的通信数据,进行文本分词处理,得到第三集合;

对第三集合中的关键词进行预处理,得到第四集合;

将第四集合中的关键词转化成至少一个第一三元组信息;所述第一三元组 信息包含人物、动作以及动作对象;

合并至少一个第一三元组信息,形成包含至少一个第二三元组信息的第五集合;所述第二三元组信息包含人物、人物属性以及属性状态;

所述第二集合包含所述第三集合及第五集合。

上述方案中,所述针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到受灾区域内每个家庭所需的物资,包括:

将所述第三集合中的关键词及所述第五集合中的第二三元组信息与所述物资需求策略中规则对应的非物资类关键词进行匹配,得到至少一个匹配的规则;

从所述至少一个匹配的规则中除去不满足预设条件的规则,得到满足预设条件的规则;

将满足预设条件的规则对应的物资类关键词进行统计,得到受灾区域内每个家庭所需的物资。

本发明实施例还提供了一种信息处理装置,包括:获取单元、确定单元以及分配单元;其中,

所述获取单元,用于获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;

所述确定单元,用于基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;

所述分配单元,用于根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点。

上述方案中,所述装置还包括:生成单元,用于基于apriori算法,利用历史灾难救援数据,生成所述物资需求策略。

上述方案中,所述分配单元包括:划分模块、集合生成模块及匹配模块;其中,

所述划分模块,用于基于所述通信数据中通信号码对应的gps数据,将所述通信数据以家庭为单位进行划分,得到每个家庭的通信数据;

所述集合生成模块,用于针对每个家庭的通信数据,基于所述第一关键词 策略,生成第二集合;所述第二集合为从每个家庭的通信数据中提取的关键词所形成的集合;

所述匹配模块,针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到受灾区域内每个家庭所需的物资。

上述方案中,所述通信数据包含音频数据;所述生成模块,还用于将所述音频数据转化成文本数据。

本发明实施例提供的信息处理方法及装置,本发明实施例提供的信息处理方法,获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点,以家庭为单位进行物资需求分析,如此,能准确为每个家庭提供所需的物资。

附图说明

在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。

图1为本发明实施例一信息处理方法流程示意图;

图2为本发明实施例形成物资需求策略的方法流程示意图;

图3为本发明实施例灾难物资需求分析平台工作流程示意图;

图4为本发明实施例二信息处理装置结构示意图。

具体实施方式

下面结合附图及实施例对本发明再作进一步详细的描述。

在描述本发明实施例之前,先了解一下目前灾难救援物资需求的分析方法。

需求分析的过程一般包括:

步骤1:查询登记在册的常驻人数;

步骤2:根据查询的结果,按照成人的物资需求配置进行数量估计;

步骤3:按照估计的数量,调配所需物资到安置点。

这里,物联网技术会通过估计受灾区域的各安置点缺少的物资数,以及存储仓库的物资数来定点调配灾难救援物资。

但是,现有的灾难救援物资需求分析方法有以下几个缺陷:

首先,受灾区域内的常驻人口数目并非等于受灾人口数目;

具体地,有些人可能在受灾区域内工作而受到灾难影响;有些人可能是在受灾区域内出差;还有些人可能常驻在受灾区域内,但是灾难发生时并不在灾难现场。

其次,每一位常驻人口都被按照成人的物资供应标准来估计需求,但是并非每一位常驻人口都是成人;

具体地,常驻人口还包括老人和小孩。他们对于物资有更多特殊的需求。比如孩子可能需要奶粉、玩具和文具。老人可能需要拐杖、老花镜和更多暖和的被褥。

第三,仅通过安置点的物资使用情况而推断出来的物资需求并不能反映实际的物资需求情况。

具体地,有些人可能在赶往安置点的路上,有些人可能从一个安置点退出,移居到亲戚或朋友家里。如果按照安置点的物资使用情况来推断物资的需求情况,然后按照此需求调配物资,有可能造成有些安置点物资过剩,而有些安置点的物资紧缺。

综上所述,采用现有的方法,容易出现物资需求分析不准确的问题。

基于此,在本发明的各种实施例中:本发明实施例提供的信息处理方法,获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点。

实施例一

本实施例信息处理的方法,如图1所示,包括以下步骤:

步骤101:获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;

这里,所述通信数据包含利用分组交换网络得到的通信数据,比如通话数据、短信数据等。所述通信数据还包含利用社交网络得到的数据,比如:通过微信、微博等得到的数据。

所述受灾状态可以是:受灾区域的气温、受伤人员的具体伤势、家庭成员情况(比如是否有老人、小孩等)等。

其中,当获取到通话数据时,需要将通话数据转化成可以处理的文本数据。

在执行本步骤之前,该方法还可以包括:

基于apriori算法,利用历史灾难救援数据,生成所述物资需求策略。

具体地,利用所述历史灾难救援数据,基于第二关键词策略,提取关键词,生成第一集合;所述第一集合为多条灾难救援记录提取出的关键词所形成的集合;

在所述第一集合中,计算出现在记录中的每个关键词的频度;

基于递归的方法,利用每个关键词的频度,得到n个频度大于频度阈值的关键词集合;n为大于等于1的整数;

针对n个关键词集合中包含物资类关键词的每个关键词集合,生成非物资类关键词对应物资类关键词的规则,得到n个规则;

确定n个规则的可信度;

从n个规则中获取可信度大于可信度阈值的规则,形成所述物资需求策略。

通俗点讲,如图2所示,该过程具体包括以下步骤:

步骤201:对每一份灾难救援记录进行分词,提取与灾难和人员相关的关键词,得到第一集合;

这里,假设所有提取出来的关键词总结成一个集合w’={w1,w2,…,wn}。

步骤202:在第一集合中,计算出现在每份记录中的每个关键词的频度;

步骤203:从第一集合中,筛选出频度大于频度阈值a的关键词,筛选出的关键词形成一个集合;

步骤204:在步骤203得到的集合中,计算出现在同一份记录中的两个关键词的集合,并计算每组二项关键词组的频度;

步骤205:从步骤203得到的集合中,筛选出频度大于频度阈值a的二项关键词组,筛选出的二项关键词组形成一个集合;

这里,频度阈值a可根据经验确定。

步骤206:在步骤205得到的集合中,计算出现在同一份记录中的三个关键词的集合,并计算每组三项关键词组的频度;

步骤207:从步骤205得到的集合中筛选出频度大于频度阈值a的三项关键词组,筛选出的三项关键词组形成一个集合;

步骤208:在步骤207得到的集合中,计算出现在同一份记录中的四个关键词的集合,并计算每组四项关键词组的频度;以此类推计算出现在同一份记录中的n项关键词组及其频度,直至没有任何n项关键词组的频度大于频度阈值a为止;

这里,步骤203~208是采用了得到了n个递归的方法,利用每个关键词的频度,得到n个频度大于频度阈值的关键词集合。

步骤209:计算所有筛选出的n项关键词组是否包括物资类的关键词,剔除不包括物资类关键词的词组;

步骤210:针对每一个n项关键词组,生成一个规则:a1∩a2∩…∩an→b1∩b2∩…∩bm;

换句话说,生成非物资类关键词对应物资类关键词的规则。

其中a1,a2,…,an为非物资类的关键词,而b1,b2,…,bm为物资类的关键词。

211:计算所有规则的可信度(apriori算法有自定义),如果规则的可信度大于可信度阈值b,则予以保留;小于可信度阈值b,则删除;

这里,可以采用apriori算法自定义的方法来计算所有规则的可信度。

可信度阈值b可根据经验来设置。

212:输出所有满足可信度阈值b的规则,形成所述物资需求策略。

按照上述步骤,实际应用时,则可以形成如下所示的物资需求策略:

如果需要迁至安置点→

如果当地最低温度>20→每位成年人派发一件薄被褥

如果当地最低温度<20→每位成年人派发一件厚被褥

如果老人腿脚不便→每位老人派发拐杖、老花镜等一份生活用品……;

如果不需要迁至安置点→根据家庭人数派发饮用水、食物和生活必需品……。

其中,→表示对应关系,用文字描述上述物资需求策略,则有:

如果需要至安置点,则有以下规则:

如果当地最低温度>20度,则对应的物资需求(物资类关键词)是每位成年人派发一件薄被褥;如果当地最低温度<20度,对应的物资需求(物资类关键词)是每位成年人派发一件厚被褥;如果老人腿脚不便,对应的物资需求(物资类关键词)是每位老人派发拐杖、老花镜等一份生活用品,……;

如果不需要迁至安置点,则对应的物资需求(物资类关键词)是根据家庭人数派发饮用水、食物和生活必需品;……。

实际应用时,灾难救援记录(历史灾难救援数据)可以是官方的卷宗,或者当地报纸的报道等等。

步骤102:基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;

具体地,基于所述通信数据中通信号码(比如手机号码)对应的gps数据,将所述通信数据以家庭为单位进行划分,得到每个家庭的通信数据;

针对每个家庭的通信数据,基于所述第一关键词策略,生成第二集合;所述第二集合为从每个家庭的通信数据中提取的关键词所形成的集合;

针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到 受灾区域内每个家庭所需的物资。

其中,由于进行分析的通信数据应当都是可以处理的文本数据,所以当获取的通信数据包含音频数据(比如:通话数据等)时,生成第二集合之前,需要将所述音频数据转化成文本数据。

实际应用时,所述通信数据中通信号码(比如手机号码)对应的gps数据可以有很多种实现方法,本发明实例不作限定,比如执行本发明实施例的信息处理装置自身就具有自动提取用户gps数据的功能。

所述针对每个家庭的通信数据,基于所述第一关键词策略,生成第二集合,具体包括:

针对每个家庭的通信数据,进行文本分词处理,得到第三集合;

对第三集合中的关键词进行预处理,得到第四集合;

将第四集合中的关键词转化成至少一个第一三元组信息;所述第一三元组信息包含人物、动作以及动作对象;

合并至少一个第一三元组信息,形成包含至少一个第二三元组信息的第五集合;所述第二三元组信息包含人物、人物属性以及属性状态;

所述第二集合包含所述第三集合及第五集合。

相应地,所述针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到受灾区域内每个家庭所需的物资,具体包括:

将所述第三集合中的关键词及所述第五集合中的第二三元组信息与所述物资需求策略中规则对应的非物资类关键词进行匹配,得到至少一个匹配的规则;

从所述至少一个匹配的规则中除去不满足预设条件的规则,得到满足预设条件的规则;

将满足预设条件的规则对应的物资类关键词进行统计,得到受灾区域内每个家庭所需的物资。

其中,假设第三集合为w={w1,w2,…,wn},则所述对第三集合中的关键词进行预处理,包括:

从w中删除叹词、非人称代词之外的代词;

依据词典,为删除叹词及代词后的w中的关键词标注在各文本中的词性;比如:名词、动词、人称代词等;

将人称代词替换为实际的人物名词,如“我们”可以替换为“业主”、“业主妻子”和“业主孩子”等;

将第四集合中的关键词转化成至少一个第一三元组信息,是指:将标注好词性的文本转化为三元组,比如,句子“我摔到了腿”转换为“业主”-“摔到”-“腿”。使得每个三元组的构成为“人物”-“动作”-“动作对象”。

合并至少一个第一三元组信息是指:将那些第一项元素为非人物名词的三元组信息与那些拥有相同的非人物名词为第三项元素的三元组信息合并,得到第二三元组信息。比如,将三元组信息“业主”-“摔到”-“腿”与三元组信息“腿”-“受伤”-“淤青”合并,得到“业主”-“腿”-“淤青”这样的变种三元组信息。此类变种的第二三元组信息的构成为“人物”-“人物的属性”-“属性状态”。这个第二三元组信息的作用就是为每一个受灾人员标注状态,为以后的物资需求分析做准备。

换句话说,生成的所述第五集合反应家庭人数、受灾状态以及家庭所处的位置。

这里,实际应用时,对于那些不构成三元组信息的人称名词,也放入第五集合中,这样,第五集合就是一个包含至少一个第二三元组信息及至少一个人称名词的关键词集合。

基于上述关键词的提取方法及生成的物资需求策略,计算每个家庭所需的物资。

具体地,将第三集合中的关键词以及第五集合中的变种三元组信息去匹配图2所示流程所生成的物资需求规则。

给定关键词集合中的每个关键词和变种三元组信息,寻找匹配的规则:寻找那些规则头(即,a1,a2,…,an)(非物资类关键词)含有这个关键词或者变种三元组中各关键词的规则;

从匹配出的规则中剔除那些仅包含部分关键词(即不满足预设条件)的规 则;

依据剔除后匹配的规则,将规则尾部的物资记录下来,即记录下b1,b2,…,bm;

将每个关键词或者变种三元组匹配出的物资统一汇总登记,得到每个家庭所需要的物资。

步骤103:根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点。

这里,可以按照所述通信数据中通信号码(比如手机号码)对应的gps数据,来确定每个家庭的位置。

实际应用时,可以通过短信的方式向每个家庭提供对应的安置点。

综上所述,实际应用时,本发明实施例的方法可以应用在基于文本数据的灾难物资需求分析平台中。该平台基于微信的朋友圈数据、微博、短信以及通话记录的音频数据对受灾区域做全方位的物资需求分析,从而得到图3所示的工作流程示意图。

具体地,灾难物资需求分析平台根据历史上的灾难救援记录,基于apriori算法的挖掘规则,生成物资需求规则。

当出现灾难时,首先,灾难物资需求分析平台收集受灾区域内所有手机号码对应的通话数据、微信、微博以及短信数据;

这里,由于平台是基于文本数据进行分析的,所以需要通话数据等音频数据转化成可以处理的文本数据。收集的这些数据形成一个大的文本库。

接着,本平台针对每个手机号的这四种文本数据收集与灾难相关的关键词,比如,“孩子受伤”、“老人摔倒”、某某小区的名称等等。通过关键词总结出每个手机号所在家庭受灾的人数、受灾的状态以及所处的位置;

其中,每个家庭被看作一个通信数据收集的单位。实际应用时,由于一个家庭中可能被收集的手机号码不止一个,因此可以通过提取的手机号码的gps数据,来确定把哪些手机号码发出的文本信息集结成一个单一的家庭信息,从而体统一进行关键词提取处理。

然后,平台利用以家庭为单位提取的关键词中的人数、受灾状态,与生成的物资需求规则进行匹配,从而确定每个家庭需求的物资;

再接着,平台根据确定的每个家庭所需的物资、家庭位置、以及各安置点数据库的物资库存情况,来判断是否存在符合物资需求的安置点,当存在符合物资需求的安置点时,以短信形式向家庭成员推荐符合物资需求的安置点;当不存在符合物资需求的安置点时,平台可以给最接近物资需求的安置点发送安置请求,并附上缺少物资的详细列表,申请调配,以便能给每个家庭推荐符合物资需求的安置点。

本发明实施例提供的方案,根据上述针对上述所形成的物资需求策略,则有:如果一个家庭中有两位腿脚不便的老人,那么根据物资需求策略中的规则,安置点就需要提供两套生活用品。根据受灾家庭目前的物资需求及位置信息,就可以筛选出可以为受灾家庭提供物资的安置点;进而,根据受灾家庭的gps定位以及行动计划(受灾家庭的位置信息,具体地,可以通过用户的短信及通话数据中提取计划信息,或者由用户不同时段的gps定位推测行动方向),可以进一步选择出距离受灾家庭最近的安置点,并推荐给受灾家庭。此救援信息(推荐安置点)可以以短信的形式发送给受灾家庭的成员。

这里,倘若家庭已经在某一安置点领取了物资,那么该安置点的数据库需要更新灾难救援物资的库存情况,以便能准确为各家庭确定所需的物资。

从上面的描述中可以看出,平台依据受灾区域内每个家庭的通话、短信、微信以及微博的文本信息,能精确分析出每个家庭的受灾人数以及受灾状态,从而能依据每个家庭的受灾情况评估出详细的灾后物资需求,并推送给受灾家庭可以领取物资的安置点位置。

另外,实际应用时,可以根据每个家庭所需的物资需求,精确地为各安置点提供物资需求的申请,方便各安置点及时调配和管理物资,如此,本发明实施例方案的时效性较高。

本发明实施例提供的信息处理方法,获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;基于第一关键词策略及物资需求策略,利用 所述通信数据确定受灾区域内每个家庭所需的物资;根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点,以家庭为单位进行物资需求分析,如此,能准确为每个家庭提供所需的物资,从而避免分配不均的问题。

实施例二

为实现本发明实施例的方案,本实施例提供一中信息处理装置,如图4所示,该装置包括:获取单元41、确定单元42以及分配单元43;其中,

所述获取单元41,用于获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;

所述确定单元42,用于基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;

所述分配单元43,用于根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点。

其中,所述通信数据包含利用分组交换网络得到的通信数据,比如通话数据、短信数据等。所述通信数据还包含利用社交网络得到的数据,比如:通过微信、微博等得到的数据。

所述受灾状态可以是:受灾区域的气温、受伤人员的具体伤势、家庭成员情况(比如是否有老人、小孩等)等。

其中,当获取到通话数据时,所述确定单元42需要将通话数据转化成可以处理的文本数据。

在一实施例中中,该装置还可以包括:生成单元,用于基于apriori算法,利用历史灾难救援数据,生成所述物资需求策略。

其中,所述生成单元包括:第一生成模块、计算模块、第二生成模块、第三生成模块、确定模块及形成模块;其中,

所述第一生成模块,用于利用所述历史灾难救援数据,基于第二关键词策略,提取关键词,生成第一集合;所述第一集合为多条灾难救援记录提取出的 关键词所形成的集合;

所述计算模块,用于在所述第一集合中,计算出现在记录中的每个关键词的频度;

所述第二生成模块,用于基于递归的方法,利用每个关键词的频度,得到n个频度大于频度阈值的关键词集合;n为大于等于1的整数;

所述第三生成模块,用于针对n个关键词集合中包含物资类关键词的每个关键词集合,生成非物资类关键词对应物资类关键词的规则,得到n个规则;

所述确定模块,用于确定n个规则的可信度;

所述形成模块,用于从n个规则中获取可信度大于可信度阈值的规则,形成所述物资需求策略。

通俗点讲,如图2所示,该过程具体包括以下步骤:

步骤201:所述第一生成模块对每一份灾难救援记录进行分词,提取与灾难和人员相关的关键词,得到第一集合;

这里,假设所有提取出来的关键词总结成一个集合w’={w1,w2,…,wn}。

步骤202:在第一集合中,所述计算模块计算出现在每份记录中的每个关键词的频度;

步骤203:从第一集合中,筛选出频度大于频度阈值a的关键词,筛选出的关键词形成一个集合;

步骤204:在步骤203得到的集合中,计算出现在同一份记录中的两个关键词的集合,并计算每组二项关键词组的频度;

步骤205:从步骤203得到的集合中,筛选出频度大于频度阈值a的二项关键词组,筛选出的二项关键词组形成一个集合;

这里,频度阈值a可根据经验确定。

步骤206:在步骤205得到的集合中,计算出现在同一份记录中的三个关键词的集合,并计算每组三项关键词组的频度;

步骤207:从步骤205得到的集合中筛选出频度大于频度阈值a的三项关键词组,筛选出的三项关键词组形成一个集合;

步骤208:在步骤207得到的集合中,计算出现在同一份记录中的四个关键词的集合,并计算每组四项关键词组的频度;以此类推计算出现在同一份记录中的n项关键词组及其频度,直至没有任何n项关键词组的频度大于频度阈值a为止;

这里,步骤203~208是所述第二生成模块采用了得到了n个递归的方法,利用每个关键词的频度,得到n个频度大于频度阈值的关键词集合。

步骤209:所述第三生成模块计算所有筛选出的n项关键词组是否包括物资类的关键词,剔除不包括物资类关键词的词组;

步骤210:所述第三生成模块针对每一个n项关键词组,生成一个规则:a1∩a2∩…∩an→b1∩b2∩…∩bm;

换句话说,生成非物资类关键词对应物资类关键词的规则。

其中a1,a2,…,an为非物资类的关键词,而b1,b2,…,bm为物资类的关键词。

211:所述确定模块计算所有规则的可信度,如果规则的可信度大于可信度阈值b,则予以保留;小于可信度阈值b,则删除;

这里,可以采用apriori算法自定义的方法来计算所有规则的可信度。

可信度阈值b可根据经验来设置。

212:所述形成模块输出所有满足可信度阈值b的规则,形成所述物资需求策略。

按照上述步骤,实际应用时,则可以形成如下所示的物资需求策略:

如果需要迁至安置点→

如果当地最低温度>20→每位成年人派发一件薄被褥

如果当地最低温度<20→每位成年人派发一件厚被褥

如果老人腿脚不便→每位老人派发拐杖、老花镜等一份生活用品……;

如果不需要迁至安置点→根据家庭人数派发饮用水、食物和生活必需品……。

其中,→表示对应关系,用文字描述上述物资需求策略,则有:

如果需要至安置点,则有以下规则:

如果当地最低温度>20度,则对应的物资需求(物资类关键词)是每位成年人派发一件薄被褥;如果当地最低温度<20度,对应的物资需求(物资类关键词)是每位成年人派发一件厚被褥;如果老人腿脚不便,对应的物资需求(物资类关键词)是每位老人派发拐杖、老花镜等一份生活用品,……;

如果不需要迁至安置点,则对应的物资需求(物资类关键词)是根据家庭人数派发饮用水、食物和生活必需品;……。

实际应用时,灾难救援记录(历史灾难救援数据)可以是官方的卷宗,或者当地报纸的报道等等。

在一实施例中,所述分配单元43可以包括:划分模块、集合生成模块及匹配模块;其中,

所述划分模块,用于基于所述通信数据中通信号码(比如手机号码)对应的gps数据,将所述通信数据以家庭为单位进行划分,得到每个家庭的通信数据;

所述集合生成模块,用于针对每个家庭的通信数据,基于所述第一关键词策略,生成第二集合;所述第二集合为从每个家庭的通信数据中提取的关键词所形成的集合;

所述匹配模块,针对每个家庭的第二集合,与所述物资需求策略中的规则进行匹配,得到受灾区域内每个家庭所需的物资。

其中,由于进行分析的通信数据应当都是可以处理的文本数据,所以当获取的通信数据包含音频数据(比如:通话数据等)时,生成第二集合之前,所述集合生成模块需要将所述音频数据转化成文本数据。

实际应用时,所述通信数据中通信号码(比如手机号码)对应的gps数据可以有很多种实现方法,本发明实例不作限定,比如执行信息处理装置中的划分模块自身就具有自动提取用户gps数据的功能。

所述集合生成模块,具体用于:

针对每个家庭的通信数据,进行文本分词处理,得到第三集合;

对第三集合中的关键词进行预处理,得到第四集合;

将第四集合中的关键词转化成至少一个第一三元组信息;所述第一三元组信息包含人物、动作以及动作对象;

合并至少一个第一三元组信息,形成包含至少一个第二三元组信息的第五集合;所述第二三元组信息包含人物、人物属性以及属性状态;

所述第二集合包含所述第三集合及第五集合。

相应地,所述匹配模块,用于:

将所述第三集合中的关键词及所述第五集合中的第二三元组信息与所述物资需求策略中规则对应的非物资类关键词进行匹配,得到至少一个匹配的规则;

从所述至少一个匹配的规则中除去不满足预设条件的规则,得到满足预设条件的规则;

将满足预设条件的规则对应的物资类关键词进行统计,得到受灾区域内每个家庭所需的物资。

其中,假设第三集合为w={w1,w2,…,wn},则所述对第三集合中的关键词进行预处理,包括:

所述集合生成模块从w中删除叹词、非人称代词之外的代词;

依据词典,所述集合生成模块为删除叹词及代词后的w中的关键词标注在各文本中的词性;比如:名词、动词、人称代词等;

所述集合生成模块将人称代词替换为实际的人物名词,如“我们”可以替换为“业主”、“业主妻子”和“业主孩子”等;

将第四集合中的关键词转化成至少一个第一三元组信息,是指:所述集合生成模块将标注好词性的文本转化为三元组,比如,句子“我摔到了腿”转换为“业主”-“摔到”-“腿”。使得每个三元组的构成为“人物”-“动作”-“动作对象”;

合并至少一个第一三元组信息是指:所述集合生成模块将那些第一项元素为非人物名词的三元组信息与那些拥有相同的非人物名词为第三项元素的三元 组信息合并,得到第二三元组信息。比如,将三元组信息“业主”-“摔到”-“腿”与三元组信息“腿”-“受伤”-“淤青”合并,得到“业主”-“腿”-“淤青”这样的变种三元组信息。此类变种的第二三元组信息的构成为“人物”-“人物的属性”-“属性状态”。这个第二三元组信息的作用就是为每一个受灾人员标注状态,为以后的物资需求分析做准备。

换句话说,生成的所述第五集合反应家庭人数、受灾状态以及家庭所处的位置。

这里,实际应用时,对于那些不构成三元组信息的人称名词,也放入第五集合中,这样,第五集合就是一个包含至少一个第二三元组信息及至少一个人称名词的关键词集合。

基于上述关键词的提取方法及生成的物资需求策略,计算每个家庭所需的物资。

具体地,所述匹配模块将第三集合中的关键词以及第五集合中的变种三元组信息去匹配图2所示流程所生成的物资需求规则。

给定关键词集合中的每个关键词和变种三元组信息,寻找匹配的规则:寻找那些规则头(即,a1,a2,…,an)(非物资类关键词)含有这个关键词或者变种三元组中各关键词的规则;

从匹配出的规则中剔除那些仅包含部分关键词(即不满足预设条件)的规则;

依据剔除后匹配的规则,将规则尾部的物资记录下来,即记录下b1,b2,…,bm;

将每个关键词或者变种三元组匹配出的物资统一汇总登记,得到每个家庭所需要的物资。

这里,可以按照所述通信数据中通信号码(比如手机号码)对应的gps数据,来确定每个家庭的位置。

实际应用时,可以通过短信的方式向每个家庭提供对应的安置点。

综上所述,实际应用时,本发明实施例的信息处理装置可以设置在基于文 本数据的灾难物资需求分析平台中。该平台基于微信的朋友圈数据、微博、短信以及通话记录的音频数据对受灾区域做全方位的物资需求分析,从而得到图3所示的工作流程示意图。

具体地,灾难物资需求分析平台根据历史上的灾难救援记录,基于apriori算法的挖掘规则,生成物资需求规则。

当出现灾难时,首先,灾难物资需求分析平台收集受灾区域内所有手机号码对应的通话数据、微信、微博以及短信数据;

这里,由于平台是基于文本数据进行分析的,所以需要通话数据等音频数据转化成可以处理的文本数据。收集的这些数据形成一个大的文本库。

接着,本平台针对每个手机号的这四种文本数据收集与灾难相关的关键词,比如,“孩子受伤”、“老人摔倒”、某某小区的名称等等。通过关键词总结出每个手机号所在家庭受灾的人数、受灾的状态以及所处的位置;

其中,每个家庭被看作一个通信数据收集的单位。实际应用时,由于一个家庭中可能被收集的手机号码不止一个,因此可以通过提取的手机号码的gps数据,来确定把哪些手机号码发出的文本信息集结成一个单一的家庭信息,从而体统一进行关键词提取处理。

然后,平台利用以家庭为单位提取的关键词中的人数、受灾状态,与生成的物资需求规则进行匹配,从而确定每个家庭需求的物资;

再接着,平台根据确定的每个家庭所需的物资、家庭位置、以及各安置点数据库的物资库存情况,来判断是否存在符合物资需求的安置点,当存在符合物资需求的安置点时,以短信形式向家庭成员推荐符合物资需求的安置点;当不存在符合物资需求的安置点时,平台可以给最接近物资需求的安置点发送安置请求,并附上缺少物资的详细列表,申请调配,以便能给每个家庭推荐符合物资需求的安置点。

本发明实施例提供的方案,根据上述针对上述所形成的物资需求策略,则有:如果一个家庭中有两位腿脚不便的老人,那么根据物资需求策略中的规则,安置点就需要提供两套生活用品。根据受灾家庭目前的物资需求及位置信息, 就可以筛选出可以为受灾家庭提供物资的安置点;进而,根据受灾家庭的gps定位以及行动计划(受灾家庭的位置信息,具体地,可以通过用户的短信及通话数据中提取计划信息,或者由用户不同时段的gps定位推测行动方向),可以进一步选择出距离受灾家庭最近的安置点,并推荐给受灾家庭。此救援信息(推荐安置点)可以以短信的形式发送给受灾家庭的成员。

这里,倘若家庭已经在某一安置点领取了物资,那么该安置点的数据库需要更新灾难救援物资的库存情况,以便能准确为各家庭确定所需的物资。

从上面的描述中可以看出,平台依据受灾区域内每个家庭的通话、短信、微信以及微博的文本信息,能精确分析出每个家庭的受灾人数以及受灾状态,从而能依据每个家庭的受灾情况评估出详细的灾后物资需求,并推送给受灾家庭可以领取物资的安置点位置。

另外,实际应用时,可以根据每个家庭所需的物资需求,精确地为各安置点提供物资需求的申请,方便各安置点及时调配和管理物资,如此,本发明实施例方案的时效性较高。

实际应用时,所述获取单元41可由信息处理装置中的收发机实现;所述确定单元42、第一生成模块、计算模块、第二生成模块、第三生成模块、确定模块、形成模块、划分模块、集合生成模块及匹配模块可由信息处理装置中的中央处理器(cpu,centralprocessingunit)、微处理器(mcu,microcontrolunit)、数字信号处理器(dsp,digitalsignalprocessor)或可编程逻辑阵列(fpga,field-programmablegatearray)实现;所述分配单元43及生成单元可由信息处理装置中的cpu、mcu、dsp或fpga结合收发机实现。

本发明实施例提供的信息处理方法,所述获取单元41获取受灾区域内的通信数据;所述通信数据反映受灾区域的受灾状况;所述确定单元42基于第一关键词策略及物资需求策略,利用所述通信数据确定受灾区域内每个家庭所需的物资;所述分配单元43根据确定的每个家庭所需的物资,并结合每个家庭的位置以及各安置点数据库的物资库存情况,为每个家庭提供对应的安置点,以家庭为单位进行物资需求分析,如此,能准确为每个家庭提供所需的物资,从而 避免分配不均的问题。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1