一种信息处理方法和装置与流程

文档序号:11621141阅读:198来源:国知局
一种信息处理方法和装置与流程

本发明涉及计算机技术,特别涉及一种信息处理方法和装置。



背景技术:

随着网络技术的快速发展,业务用户可以在自己的智能终端上安装业务的客户端,并通过该客户端方便的执行多种业务处理,比如,可以网上购物,可以生活缴费,可以手机充值等。并且,用户还可以通过客户端对业务处理进行便捷的问题反馈,例如,可以反馈“无法交电费”等存在的负面问题,或者也可以反馈“生活缴费太好用了”等正面评价。

上述的用户通过业务客户端或其他社交媒体反馈的信息可以称为舆情信息,该舆情信息可以是一种用户对业务使用的体验反馈。舆情智能平台可以采集舆情信息,并将舆情信息存储到平台数据库以供后续使用。技术人员可以根据舆情信息,分析和定位问题所在,例如,“无法交电费”的故障是哪些模块导致,并解决该问题;并且,产品人员可以根据舆情信息的反馈情况进行产品体验优化的提升,数据科学家也可以基于舆情信息分析用户行为。但是,有时用户提交的问题反馈比较简短,甚至表达的方式不符合正常语句结构,需要花费大量的精力分析推测用户反馈信息的含义,影响了对舆情信息有效利用的效率。



技术实现要素:

有鉴于此,本发明提供一种信息处理方法和装置,以提高信息处理效率。

具体地,本发明是通过如下技术方案实现的:

第一方面,提供一种信息处理方法,所述方法包括:

对获取的舆情信息进行分析,确定所述舆情信息存在待补全的缺失信息;

获取与所述舆情信息对应的业务链路日志;

根据所述业务链路日志得到所述缺失信息,并将所述缺失信息补全至所述舆情信息。

第二方面,提供一种信息处理装置,所述装置包括:

信息分析模块,用于对获取的舆情信息进行分析,确定所述舆情信息存在待补全的缺失信息;

日志获取模块,用于获取与所述舆情信息对应的业务链路日志;

日志分析模块,用于根据所述业务链路日志得到所述缺失信息,并将所述缺失信息补全至所述舆情信息。

本发明的信息处理方法和装置,通过在舆情信息不完整时,根据舆情信息对应的业务链路日志分析到缺失信息,可以实现对舆情信息的补全处理,从而提高信息处理效率,并提高对舆情信息有效利用的效率。

附图说明

图1是本发明实施例提供的一个舆情信息处理的系统;

图2是本发明实施例提供的一种信息处理方法的流程;

图3示例一个比较形象化的用户舆情画像;

图4是本发明实施例提供的另一个信息处理方法的流程;

图5是本发明实施例提供的一种信息处理装置的结构示意图;

图6是本发明实施例提供的另一种信息处理装置的结构示意图。

具体实施方式

图1示例了一个舆情信息处理的系统,如图1所示,用户11通过业务的客户端12反馈的舆情信息,可以被舆情智能平台13采集获取,并将舆情信息存储至平台数据库14。本申请实施例提供的信息处理装置15负责执行舆情智能分析,可以根据舆情智能平台13获取的舆情信息以及其他相关信息,一并根据舆情信息得到有价值的舆情分析结果。

在一个例子中,假设用户反馈的舆情信息过于简短,信息模糊,例如,用户反馈“缴不了费”,而无法得知所不能缴纳的费用是电费还是水费等具体信息。本申请实施例的信息处理装置15在进行舆情智能分析时,可以结合该模糊的舆情信息和用户行为日志、业务运行日志等信息,补全该舆情信息为完整语义的信息。可以结合参见图2所示,图2示例了一个信息处理方法的流程,可以包括:

在步骤201中,对获取的舆情信息进行分析,确定所述舆情信息存在待补全的缺失信息。

仍以上述的“缴不了费”的反馈为例,该舆情信息比较模糊,比如,无法得知所不能缴纳的费用是电费还是水费;又比如,如果用户反馈“杭州市电力局的电费交不了啦”,则是一个相对清楚的舆情信息。本例子中的信息处理装置所接收到的舆情信息的数量可能很多,其中包括语义完整清楚的信息(如,杭州市电力局的电费交不了啦),也包括语义不清楚的信息(如,缴不了费),本步骤中,信息处理装置则可以通过对各个舆情信息进行分析,来判断信息是否清楚完整,对于类似“缴不了费”这种不完整的信息,可以继续执行后续的步骤202和步骤203,以将信息补全。

本申请实施例提供了一种对舆情信息进行分析的例子,但是实际实施中并不局限于此。例如,可以对舆情信息进行分词处理,得到关键词;并结合所述关键词和业务关联规则,识别该舆情信息的业务场景,若无法识别到对应的业务场景,则确定该舆情信息待补全。

举例如下:以用户反馈舆情信息“杭州市电力局的电费交不了啦”为例,该信息经过分词可以得到关键词“杭州市电力局、电费、交不了”,并假设业务类型关联规则包括[只要出现“电费”,则表示该信息所属的业务类型是“电费缴纳业务”;出现“杭州市电力局”,则表示该信息所属的缴费机构是杭州市电力局”],则结合关键词、规则和用户历史信息,可以识别到该舆情信息的真实业务场景,例如,“户号为123456的杭州市电力局电费用户在2016年10月01日8时18分交不了电费”。在另一个例子中,如果用户反馈舆情信息“缴不了费”,那么分词得到的关键词可以包括“缴不了,费”,而根据业务类型关联规则,单独的“费”无法识别属于何种业务,则此时可以确定该舆情信息不清楚不完整。

此外,上述的业务类型关联规则,可以是用于识别舆情信息的业务类型的条件,比如,如果一条舆情信息中包含关键词“a+b”,则可以确定该信息属于业务类型y1,如果舆情信息包含关键词“c”,则可以确定该信息属于业务类型y2。业务类型关联规则可以是默认的规则,或者也可以是自定义的规则。本例子中,如果经过测试和实验发现,内置通用规则比如上述的默认规则对业务类型的识别不是太精确,存在误差,还可以加载用于对规则进行校正处理的自定义规则插件,以使得对业务类型的识别更加精准。例如,假设原业务类型关联规则可以是“如果舆情信息包含关键词c,则确定该信息属于业务类型y2”,经过校准后的新规则可以是“如果舆情信息包含关键词c和d,则确定该信息属于业务类型y2”,即采用同时具有c和d两个关键词的方法识别y2,将更加准确。

在步骤202中,获取与所述舆情信息对应的业务链路日志。

例如,假设某用户通过业务的客户端反馈的舆情信息是“缴不了费”,此时很可能是用户在通过业务客户端软件进行缴费时,发现出现缴费失败的情况,用户无法成功缴费,所以才反馈了“缴不了费””的问题。对应客户端的服务端,是业务操作的实际处理方,用户在客户端看到的缴费失败的问题,有可能是服务端某个功能模块运行异常或缴费机构出现异常。同时,用于监控业务运行状况的监控平台,将会分别记录业务运行异常时刻的日志与性能快照。根据上述,一个舆情信息反馈的问题在发生时,在客户端、服务端、监控端都有所表现,可以通过分析这几个方面的表现来反推发生的问题。

本例子中,可以根据所述舆情信息对应的舆情时间,获取:业务客户端的用户行为日志、业务服务端的业务流程日志和业务监控日志。上述的几种日志可以统称为业务链路日志。其中,所述舆情信息对应的舆情时间,可以是舆情信息采集到的时间,也是用户反馈问题的时间,通常发生问题的时间距离用户反馈问题的时间比较接近,例如数小时之内。因此,可以根据舆情时间的范围区间获取该用户在客户端、服务端和监控平台三方面的日志信息,通过这些信息分析用户发生问题的具体时刻以及所发生的具体问题。

此外,本步骤中的业务链路日志的获取方式,例如可以是,当用户在客户端反馈问题时,将触发客户端日志的自动上传,该客户端日志可以上传至日志平台,日志平台还可以收集服务端日志,这些日志以及监控系统的监控日志可以都归档到数据仓库。

在步骤203中,根据所述业务链路日志得到所述缺失信息,并将所述缺失信息补全至所述舆情信息。

本步骤将用于根据对业务链路日志的分析,来判断上述步骤201中不完整的舆情信息所缺失的信息。例如,可以根据所述业务链路日志进行用户行为分析、业务流程分析和系统性能分析,得到用户行为操作的业务、对应所述业务的流程处理结果以及对应所述流程处理的性能表现结果;并且,若所述操作业务、流程处理结果和性能表现结果存在与所述舆情信息对应的问题点,则根据所述问题点确定所述缺失信息。

举例来说:仍以舆情信息“缴不了费”为例,通过对客户端日志记录的用户行为分析,可知用户在客户端点击操作了“生活缴费-水费”等app侧的业务选项,在这些业务选项下进行了操作;并且,根据服务端的流程日志,可以看到服务端在处理水费这个流程步骤时出现了处理失败,而同时监控发现此时的系统性能出现了资源占用过高等问题。综合上述信息和用户反馈的舆情信息“缴不了费”,可以知道用户反馈的其实是杭州水务集团的水费缴纳失败。那么,可以将原舆情信息“缴不了费”进行补全,所补全的缺失信息可以包括“杭州水务集团、水费、交不了”等信息。

经过上述的步骤,信息处理装置已经自动根据日志分析,完成了对不清楚的舆情信息的语义补全,使得能够明确该舆情反馈的是何种问题,从而实现了快速定位问题,快速解决问题。

本实施例的信息处理方法,通过在舆情信息不完整时,根据舆情信息对应的业务链路日志分析到缺失信息,可以实现对舆情信息的补全处理,从而提高信息处理效率,并提高对舆情信息有效利用的效率,比如,技术人员可以快速根据舆情信息定位和解决存在的问题,产品人员和数据科学家也可以快速利用舆情信息进行产品体验提升和用户行为分析。

在另一个例子中,本申请实施例的信息处理方法,不仅能够根据业务链路日志分析补全不清楚的舆情信息,而且本例子还根据在补全舆情信息的过程中得到的相关信息,提供了用户维度的舆情画像。

用户舆情画像:是根据用户的自然属性(例如,性别,年龄)、舆情评论倾向(例如,是否是建议类的问题、吐槽等)、舆情发生时间、业务行为(例如,是否基于使用生活缴费业务的评价、是否因业务异常后的评价)等信息,抽象出的一个标签化的用户模型。

图3示例一个比较形象化的用户舆情画像,如图3所示,以某个用户为例,该用户可能反馈过很多舆情信息,通过采集到的该用户的舆情信息,可以由多个方面了解该用户。例如,可以了解到该用户的业务参与和反馈信息,比如,该用户经常参加生活缴费的营销活动,并频繁发表好评,在业务异常时能够准确的反馈问题等。此外,在图2示例的补全舆情信息的过程中,还获取到了该用户上传舆情信息的舆情时间、所属的业务类型、客户端和服务端等业务链路日志,等。这些都是与该用户有关的信息,是该用户的舆情画像的一部分,即用户舆情画像相当于用户业务使用与评价、业务营销参与度与反馈、评价/反馈频率、舆情信息相关的日志快照等多维度信息的集合。

用户舆情画像的获取,可以带来很多的方便性,比如,如图1的示例,当信息处理装置15通过对舆情的智能分析完善了用户的舆情画像后,可以将该舆情画像提供至舆情智能平台13。由于用户舆情画像已经包含了多方面信息,可以供不同角色的人员使用,不同角色的侧重关注点不同,可以选择舆情画像中的不同内容进行使用。例如,技术人员可以选择舆情画像中与问题有关的信息,如业务链路日志、舆情信息,分析定位问题所在,修复故障;产品专家可以根据业务模型和舆情信息,优化产品体验;数据科学家可以根据舆情时间、业务类型等信息,分析该用户的舆情习惯和忠诚度,以更精准的引导该用户进行产品的推广。可以看到,用户舆情画像的提供,可以使得信息的利用更有效率。

如下结合图4的流程,描述在采集到舆情信息后,如何在分析舆情信息的过程中对用户舆情画像进行完善。如图4所示,可以包括:

在步骤401中,接收到用户反馈的舆情信息。

本例子中,采集到的舆情信息可以有很多,例如,示例部分用户反馈如下:

用户a:生活缴费太好用了!

用户b:无法交电费。

用户c:缴不了费。

在接收到很多用户反馈的舆情信息后,可以进行舆情信息的预处理,该预处理例如可以包括,由用户反馈的舆情信息中提取关键的信息,将一些无用的不能体现实质问题的停止词(stopwords,相当于非关键词)去掉。

在步骤402中,判断该用户是否存在舆情画像。

如果用户存在舆情画像,那么通过本次对该用户反馈的舆情信息分析处理后,可以完善该用户的舆情画像,例如将本次对舆情信息分析得到的内容增加进该用户的画像中;如果用户不存在舆情画像,那么可以为该用户建立其舆情画像。因此,若判断结果为是,则执行步骤403,否则,执行步骤404。

如果采集到的舆情信息包括很多用户反馈的信息,那么对于其中任一舆情信息,都可以判断该舆情信息的反馈者即对应的用户是否存在舆情画像。

在步骤403中,提取该用户已有的舆情画像。

在步骤404中,构建用户的舆情画像,包括该用户的自然属性。

例如,用户在客户端反馈舆情信息时,可以携带用户的一些自然属性,包括性别、年龄、所在城市等信息。可以先根据这些已有的自然属性,构建用户的舆情画像,待后续分析舆情信息之后,再丰富和完善该舆情画像的内容。

在步骤405中,对舆情信息进行情感分析,并做情感标记。

本步骤可以分析各条舆情信息的情感倾向。比如,用户a反馈的“生活缴费太好用了!”是正向情感,是在表扬。而用户b和用户c反馈的无法缴费的问题,是一种负面情感,是说业务存在问题。例如,可以用“+”为舆情信息标记,表示该信息是正向情感,可以用“—”为舆情信息标记,表示该信息是负面情感。

舆情信息的情感标记,可以为后续的信息分析提供依据。例如,如果要查看所有反馈存在问题的舆情信息,可以选择情感标记为“—”的信息;或者,将情感标记为“—”的信息作为优先处理的信息。

在步骤406中,对舆情信息进行分词处理,识别所属的业务类型。

本步骤的处理可以参见图2实施例,不再详述。

在步骤407中,判断舆情信息是否满足聚类条件。

例如,如果舆情信息能够识别到归属的业务类型,则可以按照业务类型进行聚类。比如,如果几条信息都属于“生活缴费”业务,则可以将这些信息归为一类,都是关于生活缴费业务的舆情信息。即本步骤的聚类条件可以是看舆情信息是否已经准确的识别到业务类型。

如果满足聚类条件,可以执行步骤408;否则,执行步骤409。

在步骤408中,对舆情信息进行聚类标记。

本步骤可以将属于一个业务类型的舆情信息进行聚类,标记上这些信息属于一个业务类型。比如,用户b反馈的“无法交电费”可以标记上属于生活缴费业务,并将其与其他与生活缴费业务相关的舆情信息聚为一类。舆情信息的聚类有助于从整体上分析舆情信息,比如,海量的舆情信息中有多少信息是与某业务类型有关,从而有助于根据舆情对该业务的分析。

在步骤409中,对舆情信息进行补全标记。

例如,用户c反馈的“缴不了费”不清楚,可以标记该信息为待补全。

对于已经聚类的舆情信息,还可以继续执行步骤410和步骤411。

在步骤410中,进行舆情优先级的分级标记。

例如,如果是反馈“生活缴费太好用了”之类的信息,这种信息一般不需要紧急处理,优先级比较低;而如果反馈“无法交电费”之类的问题信息,则可以设置优先级较高,需要紧急处理。即可以根据舆情信息是否需要紧急处理,来区分舆情信息的优先级的高低。

此外,即使在步骤408中进行了舆情信息的聚类,本步骤中的处理可以单独对其中的每条舆情信息进行优先级的标记,比如,可以根据某一条舆情信息反馈的情感标记,将负面情感标记的信息设置优先级较高。又比如,也可以根据聚类标记,将对生活缴费类型业务相关的舆情信息,统一设置为较高优先级。

在步骤411中,业务模型分析。

本步骤中,可以根据每条舆情信息,分析该舆情信息对应用户的业务模型。比如,在步骤406中识别到舆情信息所属的业务类型是生活缴费,本步骤的业务模型分析,可以进一步得到更具体的信息,比如该舆情信息是生活缴费业务下的“电费”子类型,缴费机构是“杭州市电力局”等。业务模型是舆情信息相关的业务的更详细的业务信息。

接着,如图4所示,不论舆情信息是否需要补全,不论舆情信息是否已经参与聚类,都可以继续执行步骤412。

在步骤412中,获取舆情信息对应的业务链路日志。

本步骤的处理,可以结合参见图2所示的实施例,不再详述。即使舆情信息已经聚类,语义清楚,执行本步骤的日志获取,也可以作为该舆情信息对应的用户舆情画像的补充内容,因此,不论舆情信息是否需要补全都可以执行。

在步骤413中,判断舆情信息是否需要补全。

如果需要补全,则执行步骤414;否则,可以执行步骤415。由于在步骤409中已经对不完整的舆情信息做了待补全标记,因此本步骤可以根据上述标记容易得知是否需要进行补全。

在步骤414中,根据业务链路日志补全舆情信息,并提取业务模型。

例如,可以将用户c反馈的“缴不了费”补充为缴不了某城市某机构的水费。并且,本步骤还可以提取业务模型,即获取更详细的业务信息。

在步骤415中,对用户的舆情画像进行完善补全。

如图4所示,在流程开始的步骤402至404中,已经提取出了用户的舆情画像,经过上述各个步骤对于舆情信息的智能分析处理,又获取到了关于该用户的一些新的信息,比如,舆情信息的优先级、所属的业务类型、业务链路日志、业务模型、舆情信息的情感倾向等,这些都可以用于对用户舆情画像的补充完善,使得用户舆情画像更加丰富,更增加对该用户的了解。

此外,对于某一个用户来说,可能反馈了多条舆情信息,比如,该用户今天反馈了一条对于生活缴费业务使用体验的舆情信息,一星期之后又反馈了一条对于手机充值业务的使用问题。在用户舆情画像中,可以包括综合根据多条舆情信息得到的概括性数据,比如,该用户经常在晚上9点至10点的时间段反馈舆情信息,说明其在该时间段较为活跃;或者,用户经常使用生活缴费业务,并反馈业务的问题及改进建议。这种概括性的数据可以得到用户的舆情习惯、忠诚度之类的信息,有助于提高后续对用户舆情画像中信息的利用精准度和利用效率。

在步骤416中,对不同的舆情信息进行信息内容的相似度判断,关联相似舆情。例如,有些用户反馈的舆情内容可能是同一个问题,比如,多个用户均反馈电费无法缴纳,那么本步骤可以通过相似度算法,查找到属于同一个问题的舆情信息,并将这些信息进行标记和关联,表示这些信息同属于一类问题。

对于舆情信息的智能分析,还可以有其他方面的分析处理,不再详举。

本实施例的信息处理方法,可以根据对舆情信息的分析处理,将舆情信息对应用户的舆情画像进行了补充完善,使得舆情画像的内容更加丰富,从而为后续画像内容的利用也提供了更多的数据,比如,技术人员可以根据舆情画像中的业务链路日志发现高风险代码,产品人员可以根据舆情画像中的舆情信息优化产品体验,数据科学家可以根据舆情时间、业务类型等信息,分析该用户的舆情习惯和忠诚度,以更精准的引导该用户进行产品推广。

为了实现上述方法,本发明还提供了一种信息处理装置。如图5所示,该装置可以包括:信息分析模块51、日志获取模块52和日志分析模块53。

信息分析模块51,用于对获取的舆情信息进行分析,确定所述舆情信息存在待补全的缺失信息;

日志获取模块52,用于获取与所述舆情信息对应的业务链路日志;

日志分析模块53,用于根据所述业务链路日志得到所述缺失信息,并将所述缺失信息补全至所述舆情信息。

在一个例子中,所述业务链路日志包括:业务客户端的用户行为日志、业务服务端的业务流程日志和业务监控日志。

在一个例子中,信息分析模块51,具体用于:对所述舆情信息进行分词处理,得到关键词;结合所述关键词和业务关联规则,识别所述舆情信息的业务场景,若无法识别到对应的业务场景,则确定所述舆情信息待补全。

在一个例子中,日志分析模块53,具体用于:根据所述业务链路日志进行用户行为分析、业务流程分析和系统性能分析,得到用户行为的操作业务、对应所述业务的流程处理结果以及对应所述流程处理的性能表现结果;若所述操作业务、流程处理结果和性能表现结果存在与所述舆情信息对应的问题点,则根据所述问题点确定所述缺失信息。

在一个例子中,如图6所示,该装置还可以包括:信息提供模块54,用于提供所述舆情信息对应用户的用户舆情画像,所述用户舆情画像包括如下的全部或部分:所述用户的自然属性、根据所述舆情信息确定的舆情评论倾向和业务行为、舆情时间、所述业务链路日志、所述舆情信息归属的业务模型。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1