本发明涉及一种互联网钢材交易数据处理方法,尤其是涉及一种用户走访数据关键词提取方法、装置及存储介质。
背景技术:
互联网钢材交易市场的推广是钢材销售人员日常的主要工作之一。一个公司通常会配多个营销人员,每个营销人员对口多个用户,日常会进行走访、回访工作。走访结束后,会形成一份走访日志,用于记录走访结果与走访过程中收集的用户问题,这些收集到的问题与记录,经过处理分析后,可以成为日后市场推广方向的一个风向标。因为走访数据量大,记录通常以口语化表达,格式随意,目前通过人工一条条的识别的方式,存在工作量大、容易出现错判、遗漏等问题。从海量的钢材交易相关用户走访记录中提炼出有用的、关键有效的信息,是目前行业中碰到的一个技术难题。
技术实现要素:
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种快速、准确的用户走访数据关键词提取方法、装置及存储介质,应用于互联网钢材交易技术领域。
本发明的目的可以通过以下技术方案来实现:
一种用户走访数据关键词提取方法,该方法维护有一基于互联网钢材交易过程的关键词数组,包括以下步骤:
获取一系列用户走访记录;
对各所述走访记录进行文本拼接,形成待分析文本;
按词长顺序由大至小依次从所述关键词数组中调用关键词,将所调用的关键词与所述待分析文本进行比较匹配,依据匹配结果生成结果集,所述结果集包括匹配成功的关键词及该关键词在待分析文本中出现的次数。
进一步地,所述关键词数组基于预先存储的关键词词库获取,具体地:
计算所述关键词词库中的每个关键词的词长,基于所述词长对各关键词进行由大至小的排序,形成所述关键词数组。
进一步地,进行所述比较匹配时,若匹配到某一关键词,则在待分析文本删除该关键词后,进行一下关键词的比较匹配。
进一步地,该方法还包括:对所述结果集进行可视化显示。
进一步地,所述关键词词库为动态更新的数据库。
本发明还提供一种用户走访数据关键词提取装置,包括:
存储模块,用于生成并存储基于互联网钢材交易过程的关键词数组;
输入模块,用于获取一系列用户走访记录;
合并模块,用于对各所述走访记录进行文本拼接,形成待分析文本;
比较匹配模块,用于按词长顺序由大至小依次从所述关键词数组中调用关键词,将所调用的关键词与所述待分析文本进行比较匹配,依据匹配结果生成结果集,所述结果集包括匹配成功的关键词及该关键词在待分析文本中出现的次数。
进一步地,所述存储模块基于预先存储的关键词词库生成所述关键词数组,具体地:
计算所述关键词词库中的每个关键词的词长,基于所述词长对各关键词进行由大至小的排序,形成所述关键词数组。
进一步地,所述比较匹配模块中,若匹配到某一关键词,则在待分析文本删除该关键词后,进行一下关键词的比较匹配。
进一步地,该装置还包括:
显示模块,用于对所述结果集进行可视化显示。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上储存有计算机程序,所述计算机程序被处理器执行所述的用户走访数据关键词提取方法。
与现有技术相比,本发明具有如下有益效果:
1、本发明通过比较匹配方式对用户走访数据进行自动化的关键词提取,有效提高了信息提取效率,解决了海量文本信息的关键词快速提取问题。
2、本发明对走访记录进行拼接处理后再进行比较匹配,无需考虑各条记录的格式问题,适用范围广。
3、本发明在关键词数组的基础上进行比较匹配,并按词长由大至小的顺序实现,可有效减少产生无效结果的概率,提高了关键词提取的效率与准确性。
4、本发明采用局部剔除法,将已匹配到的文本从原始文本中剔除,进一步提高了关键词提取的效率与准确性。
5、本发明可对结果集进行可视化显示,直观性强,一目了然。
附图说明
图1为本发明方法的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
本实施例提供一种用户走访数据关键词提取方法,该方法维护有一基于互联网钢材交易过程的关键词数组,基于该关键词数组与走访数据的匹配关系进行关键词提取。
关键词数组基于预先存储的关键词词库获取,具体地:计算所述关键词词库中的每个关键词的词长,基于所述词长对各关键词进行由大至小的排序,形成所述关键词数组。所述关键词词库为动态更新的数据库,可根据不同关注点设置不同关键词并更新。
如图1所示,本实施例的关键词提取方法包括以下步骤:
获取一系列用户走访记录,本实施例以互联网钢材交易技术领域的钢材交易用户走访记录为例;
对各所述走访记录进行文本拼接,形成待分析文本;
按词长顺序由大至小依次从所述关键词数组中调用关键词,将所调用的关键词与所述待分析文本进行比较匹配,依据匹配结果生成结果集,所述结果集包括匹配成功的关键词及该关键词在待分析文本中出现的次数。在比较匹配过程中,若匹配到某一关键词,则在待分析文本删除该关键词后,进行一下关键词的比较匹配。
比较匹配的具体为:
1)从n=0开始,将关键字数组中的keyword[n]取出,通过比较函数将其与合并后的待分析文本进行比较;
2)如有命中结果,将此结果与此结果命中的数量放入结果集result=[{"keyword":"关键字","num":"命中数量"}]中,并从文本中剔除已匹配到的结果;
3)重复步骤1)与2),每次n+1,直到keyword[n]中的结果全部比对完毕。
在获得结果集后,该方法还可以对所述结果集进行可视化显示。
实施例2
本实施例提供一种用户走访数据关键词提取装置,包括存储模块、输入模块、合并模块和比较匹配模块,其中,存储模块用于生成并存储基于互联网钢材交易过程的关键词数组;输入模块用于获取一系列用户走访记录;合并模块用于对各所述走访记录进行文本拼接,形成待分析文本;比较匹配模块用于按词长顺序由大至小依次从所述关键词数组中调用关键词,将所调用的关键词与所述待分析文本进行比较匹配,依据匹配结果生成结果集,所述结果集包括匹配成功的关键词及该关键词在待分析文本中出现的次数。
在另一实施例中,该装置还包括有对所述结果集进行可视化显示的显示模块。
实施例3
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上储存有计算机程序,所述计算机程序被处理器执行所述的用户走访数据关键词提取方法。
本实施例中的存储介质可以是磁盘、光盘、计算机存储器、只读存储器、随机存取存储器、u盘、移动硬盘等介质。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。