领先用户识别、预测方法以及技术趋势预测方法与流程

文档序号:20354496发布日期:2020-04-10 23:15阅读:1236来源:国知局
领先用户识别、预测方法以及技术趋势预测方法与流程

本发明涉及技术趋势预测技术领域,特别涉及一种领先用户识别、预测方法、技术趋势预测方法及存储介质。



背景技术:

技术趋势预测是根据预测对象过去和现在的信息,通过科学的方法和逻辑推理,对事物未来的发展趋势和水平进行推测和判断,对技术趋势进行预测可以提高企业的竞争力,提高消费者的满意度。

领先用户是在一项创新的生命周期初期采用该创新的顾客。领先用户现有的强烈需求将在不远的未来成为市场普遍需求。领先用户具备两个基本特征:领先用户的需求领先于普通用户;领先用户具有强烈的创新动机和较高的期望收益。领先用户的动态是反映技术趋势的重要指标,而现有技术中,对于领先用户的识别和动态获取基本都采用人工调查、筛选的方式进行,不仅效率低,而且得到的结果也不具备代表性,难以实现对技术趋势的准确预测。



技术实现要素:

针对上述现有技术存在的问题,本发明旨在提出一种领先用户识别、预测方法、技术趋势预测方法及存储介质,能够高效准确的识别领先用户并根据领先用户的动态获取具有代表性的技术趋势预测结果。

一种领先用户识别方法,包括:

确认待预测的技术领域,并确认该技术领域的技术发展趋势历史信息;

选取属于所述技术领域的在线社区,并获取所述在线社区中的所有用户的评论信息;

通过自然语言分析的方式对所述评论信息和技术发展趋势历史信息进行文本相似度对比,以获得所述评论信息的准确度;

对比所述评论信息的评论时间与所述技术发展趋势历史信息中各发展阶段对应的发展时间,以获得所述评论信息的前瞻度;

根据所述准确度和所述前瞻度得到所述用户的领先度;确定所述领先度高于领先度阈值的所述用户为领先用户。

本发明还公开了一种领先用户预测方法,包括:

根据上述的领先用户识别方法确定领先用户;

获取所述领先用户的特征信息;

获取所述特征信息中的显著特征信息;

获取待预测用户的特征信息,并与所述显著特征信息进行相似度比对;

判断相似度达到预测阈值的用户为所述领先用户。

本发明还公开了一种技术趋势预测方法,包括:

获取领先用户;

获取所述领先用户的评论信息,并通过自然语言分析以获取技术发展趋势。

本发明还公开了一种计算机可读存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方法。

本发明至少具有以下有益效果:

本发明通过获取用户评论信息并与已发生的技术趋势比对,判断用户的准确度和前瞻度,进而识别划分出领先用户。对领先用户的最新动态进行挖掘和归纳,能够准确有效的得出技术发展趋势。

本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施方式及其说明用于解释本发明,并不构成对本发明的不当限定。

在附图中:

图1为本发明实施方式所述的领先用户识别方法的流程图;

图2为本发明实施方式所述的技术趋势预测的实施流程图。

具体实施方式

以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。

如图1和图2所示,本发明公开了一种领先用户识别方法,具体包括:

(1)确认待预测的技术领域,本发明可以采用可以方法/规则所划分的技术领域,例如,以国际专利分类表(ipc)所规定的技术领域作为待选领域,确认的带预测的技术领域都具有对应的分类号,便于管理。

(2)确认该领域的技术发展趋势历史信息。优选的,可以选取属于所述技术领域的领先企业,以及所述领先企业的各时间阶段产品的产品信息。相对于普通企业,领先企业所发布的产品能够在一定程度上反映技术发展的趋势,作为本发明优选的实施例,可以根据企业的经营情况为标准进行选取,如可参照工业和信息化部、国家统计局、国家发展改革委、财政部《关于印发中小企业划型标准规定的通知》,依据营业收入和从业人员数量进行选择。

(3)通过自然语言分析的方式对所述评论信息和技术发展趋势历史信息进行文本相似度对比,以获得所述评论信息的准确度,即通过对比,分析用户评论是否准确的预测了技术发展的趋势。

(4)对比所述评论信息的评论时间与所述技术发展趋势历史信息中各发展阶段对应的发展时间,以获得所述评论信息的前瞻度,有一些评论信息是在技术趋势已经发生后出现的,这些评论信息虽然和技术趋势内容符合度较高,但并非是用户预测的,不具有前瞻度,反而距离技术趋势发生时间越远的评论信息,前瞻度越高。

(5)根据所述准确度和所述前瞻度得到所述用户的领先度,评论信息的准确度和前瞻度越高,则用户的领先度越高。

(6)确定所述领先度高于领先度阈值的所述用户为领先用户,领先度阈值可以根据需求和实际情况设定。

在本发明的一些实施例中,所述确认待预测的技术领域,并确认该技术领域的技术发展趋势历史信息,包括:

确认所述技术领域,基于关键词在互联网上进行技术发展趋势文本的检索,并整理检索结果得到检索文本;

对检索文本进行字段抽取,抽取的字段为时间字段和技术/产品字段;

对所述技术/产品字段按所述时间字段进行排序整理,得到所述技术发展趋势历史信息;

其中,所述技术/产品字段至少包括以下的一者或几者:产品名称、发布时间、产品特点、产品优势、产品性能。

在本发明的一些实施例中,所述选取属于所述技术领域的在线社区,并获取所述在线社区中的所有用户的评论信息,包括:

基于爬虫方法获取所述评论信息。

在本发明的一些实施例中,所述通过自然语言分析的方式对所述评论信息和技术发展趋势历史信息进行文本相似度对比,包括:

根据分词算法对所述评论信息和所述技术发展趋势历史信息分别进行分词,得到第一词集和第二词集;

分别计算所述第一词集和第二词集中各词组的词频,并向量化所述词频,得到所述第一词集和第二词集分别对应的向量a和向量b;

带入模型公式计算得到所述文本相似度,所述模型公式为:

在本发明的一些实施例中,所述分别计算所述第一词集和第二词集中各词组的词频,并向量化词频,得到所述第一词集和第二词集分别对应的向量a和向量b,具体包括:

计算所述词频,所述词频用于表示所述词组在所述评论信息或技术发展趋势历史信息中出现的频率,优选采用如下公式:

计算所述词频对应的逆文档频率,所述逆文档频率用于表示所述词组在所述评论信息或技术发展趋势历史信息中出现的频率倒数,优选采用如下公式:

计算所述词频与逆文档频率的乘积,得到所述词组的权重,所述权重用于表示所述词组在其对应的所述评论信息或技术发展趋势历史信息中的语义重要程度;

整理所述权重得到向量a和向量b。

本发明还公开了一种领先用户预测方法,如图2所示,包括:

根据上文所述的领先用户识别方法确定领先用户;

获取所述领先用户的特征信息;

获取所述特征信息中的显著特征信息;

获取待预测用户的特征信息,并与所述显著特征信息进行相似度比对;

判断相似度达到预测阈值的用户为所述领先用户。

在本发明的一些实施例中,所述获取所述特征信息中的显著特征信息,包括:

选取所述用户的领先度作为因变量;

选取所述用户的特征信息中的有效信息作为自变量;

选取所述用户的特征信息中的无关信息作为无关变量;

带入因变量、自变量、无关变量至逻辑回归模型,得到回归系数;

对所述回归系数进行解读,以获取所述领先用户的显著特征信息。

本发明还公开了一种技术趋势预测方法,如图2所示,包括:

采用上述任一实施例所公开的任一方法获取领先用户;

获取所述领先用户的评论信息,并通过自然语言分析以获取技术发展趋势。

在本发明的一些实施例中,所述获取所述领先用户的评论信息,并通过自然语言分析以获取技术发展趋势,包括:

获取所述领先用户最新发布的评论信息;

获取评论信息中的评论关键词,并对冗余的所述关键词进行合并和剔除。

本发明还公开了一种计算机可读存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行包括:

上述各实施例所公开的方法。

以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1