评论信息确定方法、装置、服务器及存储介质与流程

文档序号:11234061阅读:833来源:国知局
评论信息确定方法、装置、服务器及存储介质与流程

本发明实施例涉及计算机技术,尤其涉及一种评论信息确定方法、装置、服务器及存储介质。



背景技术:

随着人工智能技术的飞速发展,如何让机器能拥有和人类一样的智能成为当下研究的热点课题。在该背景下,人们希望机器能够读懂一篇文章,并且能够给出有自己观点的评论,或者给出互联网用户对这篇文章的一般性观点。

现有技术中,通过传统的信息检索技术,基于评论事件的关键词索引出相关评论事件的评论,并基于评论事件之间的相关性给出当前评论事件的评论信息。该方案的缺陷在于,评论信息严重同质化且相关性较差,评论信息的智能化程度低,效率低下。



技术实现要素:

本发明提供了一种评论信息确定方法、装置、服务器及存储介质,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

第一方面,本发明实施例提供了一种评论信息确定方法,包括:

获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;

将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;

对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

第二方面,本发明实施例还提供了一种评论信息确定装置,包括:

事件标签确定模块,用于获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;

候选评论确定模块,用于将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;

评论信息确定模块,用于对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

第三方面,本发明实施例还提供了一种服务器,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述评论信息确定方法。

第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种评论信息确定方法,该方法包括:

获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;

将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;

对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

本发明实施例提供的技术方案,通过获取评论事件的文本内容,依据文本内容确定评论事件的事件标签,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论后在最终从候选评论中得到评论信息用以对评论事件进行评论,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1a是本发明实施例提供的一种评论信息确定方法的流程图;

图1b是本发明实施例提供的一种评论信息确定方法过程中利用到的评论图谱的示意图;

图2是本发明实施例提供的另一种评论信息确定方法的流程图;

图3是本发明实施例提供的另一种评论信息确定方法的流程图;

图4是本发明实施例提供的另一种评论信息确定方法的流程图;

图5本发明实施例提供的评论信息确定装置的结构框图;

图6是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

图1a是本发明实施例提供的一种评论信息确定方法的流程图,本实施例可适用于自动对评论事件进行评论的情况,该方法可由计算设备如服务器来执行,如图1a所示,本实施例提供的具体方案如下:

s101、获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签。

在一个实施例中,评论事件可以是新闻事件、微信公众号文章、微博、博客等,其中,评论事件的文本内容为该事件的文字内容,该文字内容可以是描述一个具体的新闻事件,还可以是对某个明星、人物的描写,还可以是对某个地点(如风景名胜景点)的记录、描写,本实施例不做限定。本方案中,可自动生成评论信息以对该评论事件进行评论。示例性的,如张三通过微信公众号发布了一篇关于名人a的娱乐八卦文章,则通过本方案可自动形成针对该八卦文章的评论信息。具体的,可通过网络爬虫爬取到张三发布的娱乐八卦文章的网站网页,通过获取到的网页内容确定出评论事件(即这篇八卦文章)的文本内容。

其中,事件标签表征了评论事件的报道对象、地点、具体发生的事情等,示例性的,评论事件为一篇网页新闻,网址为:

http://news.youth.cn/jsxw/201702/t20170224_12345678.htm,主要报道内容是名人a晒的老年妆的照片,则相应的,该评论事件的事件标签可以被确定为“名人a”、“晒”、“老年妆”、“照片”。

在一个实施例中,依据评论事件的文本内容确定对应的事件标签的过程可以是:

首先,对文本内容进行预处理,得到对应的词语集合。示例性的,通过对文本内容进行基于语义、语法的识别和断句,将文本内容表述的自然语言分断为过个单独的词语。举例而言,评论事件的文本内容为“搜狐娱乐讯23日晚,名人a晒出一张自己老年妆的照片,照片中,名人a头发花白卷曲,架着一副老花镜,穿着羊毛开衫,驼着背。名人a配文:多期盼能陪你老去。我可能改变了命运,因为你回来了。岁月可能留不下美丽的容颜,但能这样和爱的人一起老去,也挺好的。”对应的,得到的词语的集合可以是“搜狐、娱乐、名人a、晒、老年妆、照片...”。

在确定出评论事件文本内容对应的词语集合后,通过预设学习模型确定所述词语集合中词语的权重值,将满足条件的权重值对应的词语确定为所述评论事件的事件标签。具体的,该预设学习模型由svm(supportvectormachine,支持向量机)通过对词语在词语集合中出现的次数、位置、是否为专业名词、是否出现在标题中等多个特征维度学习训练得到,其中,该预设学习模型可预先学习得到,在需要确定评论事件的事件标签时,用于确定得到的词语集合中词语的权重值,示例性的,词语集合中,词语“名人a”出现了3次,且出现在了评论事件标题中,则词语“名人a”的权重值最高,其中词语“照片”出现了两次,且也出现在标题中权重值也较高,词语“搜狐”出现一次,出现频率较低,且非标题中的词语,则相应的词语“搜狐”的权重值较低。通过确定出的词语的权重值来最终确定合适的事件标签,具体的,可按照权重值的高低又高到低对词语进行排序,根据词语集合中词语的数量以及欲得到的事件标签的数量选取合适的百分比例,将排名靠前的词语确定为事件标签。

s102、将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。

在一个实施例中,评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签。图1b是本发明实施例提供的一种评论信息确定方法过程中利用到的评论图谱的示意图。如图1b所示,该评论图谱由多个节点以及节点到节点的边组成。其中,评论图谱的节点可以分为评论节点和标签节点,评论节点中存储的内容即为具体的评论内容,如“<名人a,真美,+>”,:“名人a,支持,+”,“无聊的人天天就关注名人事件,-”等,评论节点中的“+”代表了评论内容为正向内容,即表征积极情绪的评论内容,“-”则相反,代表消极的,批判性的评论内容。评论图谱中的另一类节点如“名人a明星女”,“名人b明星男”即为标签节点,标签节点中存储的内容即为评论标签,其中评论标签由评论内容以及该评论内容对应的评论事件确定得出。

在一个实施例中,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。为了便于说明,将候选评论的确定过程中标签的比对进行简化,示例性的,若确定出的事件标签为“名人a”,则相应的,在评论图谱中找到包含“名人a”的评论标签,将该评论标签指向的评论内容“名人a,真美”作为候选评论。

在一个实施例中,将确定出的事件标签和评论图谱中评论内容对应的评论标签进行比对,依据评论标签命中的事件标签的数量的大小,由高到低对所述评论内容进行排序,将排序靠前的评论内容作为候选评论。

举例而言,如确定出的评论事件的事件标签为“名人a晒照片”,相应的通过评论图谱得到的候选评论可以为(评论内容根据命中的事件标签的数量由高到低排序后取排名靠前的评论内容的结果展示):

a)怎么看都好看,小骨美美哒(该候选评论的评论标签为:名人a晒照片);

b)依旧是大眼睛(该候选评论的评论标签为:名人a晒照片);

c)名人a真漂亮(该候选评论的评论标签为:名人a照片)。

其中,候选评论a、b和c分别命中的事件标签的数量为3、3、2。

s103、对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

在一个实施例中,预设条件指的可以是:评论内容对应的评论标签为事件标签的子集,同时,评论标签命中的事件标签越多的评论内容越优选作为评论信息。由于事件标签一旦没有覆盖到评论标签,即评论标签中出现事件标签中不存在的标签,则该评论内容极易偏离评论主线,故采取上述预设条件。

以s102中举例为例,最终确定出的评论信息可以是“怎么看都好看,小骨美美哒”和“依旧是大眼睛”。

本实施例提供了一种评论信息确定方法,借助于大数据挖掘得到的评论图谱对评论事件进行自动评论,评论图谱中的评论标签由评论内容以及该评论内容对应的评论事件得到,而非单纯的依据评论内容提取关键词和事件标签进行比对得到评论信息,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

图2是本发明实施例提供的另一种评论信息确定方法的流程图,在上述实施例的基础上,可选的,对所述文本内容进行预处理之前,还包括:

在所述文本内容中抽取文本要素;

相应的,在将满足条件的权重值对应的词语确定为所述评论事件的事件标签之后,还包括:

将包含所述事件标签的文本要素中的其它关键词语也确定为所述评论事件的事件标签。

由此,提高了确定出的事件标签的完整性,更加符合评论事件自身的情景。

基于上述优化,如图2所示,本实施例提供的技术方案具体如下:

s201、获取评论事件的文本内容,在所述文本内容中抽取文本要素,依据所述文本内容确定所述评论事件的事件标签。

其中,文本要素可通过事件抽取的方式从文本内容中抽取得到,事件可被描述为一个动作的发生或者状态的变化,事件本身包括事件类型和事件要素,在ace会议中一共定义了8中事件类别以及33中事件子类别。

具体的,举例而言,假定文本内容为“网曝名人a名人b假戏真做坐实恋情,名人a名人b恋爱细节遭扒”,则相应的通过事件抽取程序、算法确定出的文本要素为“坐实恋情,名人a,名人b,none,none”,其中文本要素中的每个单独的词语可被认定为关键词语。

s202、将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。

s203、对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息,同时,将包含所述事件标签的文本要素中的其它关键词语也确定为所述评论事件的事件标签。

举例而言,若确定出的事件标签为“名人a名人b”,s201中确定出的文本要素为“坐实恋情,名人a,名人b,none,none”,则将文本要素中没有被确定为事件标签的关键词语“坐实恋情”一并确定为事件标签。

本实施例提供了一种评论信息确定方法,在确定事件标签过程中,对评论事件的文本内容进行事件抽取得到文本要素,如果文本要素中的关键词语被确定出的事件标签命中,则将文本要素中的其它关键词语一并确定为事件标签,提高了确定出的事件标签的完整性,进一步提高了后续评论信息的相关性。

图3是本发明实施例提供的另一种评论信息确定方法的流程图,在上述实施例的基础上,可选的,评论图谱由其它评论事件以及对应的评论内容生成的过程包括:

通过网络爬虫定向抓取并确定评论内容;

通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点;

依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签;

将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱。

基于上述优化,如图3所示,本实施例提供的技术方案具体如下:

s301、通过网络爬虫定向抓取并确定评论内容,通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点。

在一个实施例中,评论内容抓取、确定的方式可以是:从海量的互联网网页、微博以及ugc资源中,挖掘出有情感倾向的文本,利用网络爬虫,定向抓取评论类型网页,新闻资讯评论,bbs,微博等潜在拥有评论数据的网站数据,对网页内容进行提取以及断句,生成潜在的评论语句,利用情感倾向性分析技术,选择出有情感倾向的句子,最终确定为评论内容。

在一个实施例中,该预设识别模型可以是crf模型(一种无向图模型,在分词、词性标注和命名实体识别等序列标注任务中效果良好),利用crf模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点。举例而言,评论内容为“西游伏妖篇,蛮好看的!”,则确定出的评论主体为“西游伏妖篇”,评论观点为“蛮好看的”。又如,评论内容为“我喜欢名人c”,则通过crf模型识别确定出的评论主体是“名人c”,评论观点是“我喜欢”。

s302、依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签,将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱。

在一个实施例中,评论标签是约束评论的评价环境的词的集合,评论标签在确定过程中和评论事件紧密相关。具体的,首先确定评论事件的事件标签,确定方式如前s101中的描述,此处不再赘述,在确定完毕事件标签后,依据评论主体、评论观点以及事件标签最终确定评论标签,评论标签的确定策略包括:同义词词典直接匹配、基于规则对专名进行同义对齐或基于评论中的实义词与事件标签的相似度进行筛选。其中,评论图谱的具体形式参见s102中的描述,此处不再赘述。

s303、获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签。

s304、将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。

s305、对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

本实施例提供了一种评论信息确定方法,通过网络爬虫定向抓取并确定评论内容,通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点,依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签,将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

图4是本发明实施例提供的另一种评论信息确定方法的流程图,在上述实施例的基础上,可选的,对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息包括:

将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息。

由此,进一步提高了评论信息和评论事件的相关性。

基于上述优化,如图4所示,本实施例提供的技术方案具体如下:

s401获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签。

s402、将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论。

s403、将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息。

举例而言,如确定出的评论事件的事件标签为“名人a晒照片”,相应的通过评论图谱得到的候选评论可以为:

a)怎么看都好看,小骨美美哒(该候选评论的评论标签为:名人a晒照片);

b)依旧是大眼睛(该候选评论的评论标签为:名人a晒照片);

c)美图前后差别不大(该候选评论的评论标签为:名人a晒美颜前后对比照片);

d)名人a真漂亮(该候选评论的评论标签为:名人a照片)。

其中,候选评论c中的评论标签虽然也全部命中了事件标签,但由于评论标签中包含了“美颜前后对比”等内容,导致该条候选评论和评论事件的相关性较差,故排除c作为最终的评论信息。

机器通过对大量语句的训练、学习后,具备判断一条语句是正向还是负向的能力,本实施例中,选取了正向的候选评论作为最终的评论信息,根据不同用户、企业的需求可以选择负向的候选评论或者不具备情感倾向性的候选评论作为评论信息。

本实施例提供了一种评论信息确定方法,将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息,进一步提高了评论信息和评论事件的相关性,同时可人性化的选择确定评论信息的情感倾向。

在上述技术方案的基础上,所述评论事件包括新闻事件,相应的,在将满足预设条件的候选评论确定为所述评论事件的评论信息之后,还包括:确定所述新闻事件的情感逻辑,依据所述情感逻辑选择符合条件的评论信息对所述新闻事件进行评论。本方案新闻事件的情感逻辑可以是正向(积极的、宣扬的)逻辑,还可以是负向(批判性)逻辑,在评论信息确定过程中考量评论信息的正负向性和新闻事件的情感逻辑是否一致,由此确定出的评论信息更具备指导意义。

图5是本发明实施例提供的评论信息确定装置的结构框图,所述装置用于执行上述实施例提供的评论信息确定方法,具备执行方法相应的功能模块和有益效果。如图5所示,所述装置包括事件标签确定模块501、候选评论确定模块502和评论信息确定模块503。

其中,事件标签确定模块501,用于获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;

候选评论确定模块502,用于将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;

评论信息确定模块503,用于对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

本实施例提供的评论信息确定装置,通过获取评论事件的文本内容,依据文本内容确定评论事件的事件标签,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论后在最终从候选评论中得到评论信息用以对评论事件进行评论,使得评论信息和评论事件的相关性增强,评论信息的确定更加智能化,效率更高。

在上述技术方案的基础上,所述事件标签确定模块501具体用于:

对所述文本内容进行预处理,得到和所述文本内容对应的词语集合,所述词语集合中包含有至少两个词语;

通过预设学习模型确定所述词语集合中词语的权重值,将满足条件的权重值对应的词语确定为所述评论事件的事件标签。

在上述技术方案的基础上,所述事件标签确定模块501还用于:

在对所述文本内容进行预处理之前,在所述文本内容中抽取文本要素,所述文本要素包含至少两个关键词语;

在将满足条件的权重值对应的词语确定为所述评论事件的事件标签之后,包含所述事件标签的文本要素中的其它关键词语也确定为所述评论事件的事件标签。

在上述技术方案的基础上,所述候选评论确定模块502具体用于:

将确定出的事件标签和评论图谱中评论内容对应的评论标签进行比对,依据评论标签命中的事件标签的数量的大小,由高到低对所述评论内容进行排序,将排序靠前的评论内容作为候选评论。

在上述技术方案的基础上,所述评论信息确定模块503具体用于:

将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息。

在上述技术方案的基础上,所述评论事件包括新闻事件,所述评论信息确定模块503还用于:

在将满足预设条件的候选评论确定为所述评论事件的评论信息之后,确定所述新闻事件的情感逻辑,依据所述情感逻辑选择符合条件的评论信息对所述新闻事件进行评论。

在上述技术方案的基础上,还包括评论图谱建立模块504,具体用于:

通过网络爬虫定向抓取并确定评论内容;

通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点;

依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签;

将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱。

图6是本发明实施例提供的一种服务器的结构示意图。图6示出了适于用来实现本发明实施方式的示例性服务器12的框图。图6显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的评论信息确定方法。

本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种评论信息确定方法,其特征在于,该方法包括:

获取评论事件的文本内容,依据所述文本内容确定所述评论事件的事件标签;

将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论,所述评论图谱由其它评论事件以及对应的评论内容生成,所述评论图谱包含有评论内容以及对应的评论标签;

对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息。

可选的,依据所述文本内容确定所述评论事件的事件标签包括:

对所述文本内容进行预处理,得到和所述文本内容对应的词语集合,所述词语集合中包含有至少两个词语;

通过预设学习模型确定所述词语集合中词语的权重值,将满足条件的权重值对应的词语确定为所述评论事件的事件标签。

可选的,对所述文本内容进行预处理之前,还包括:

在所述文本内容中抽取文本要素,所述文本要素包含至少两个关键词语;

相应的,在将满足条件的权重值对应的词语确定为所述评论事件的事件标签之后,还包括:

将包含所述事件标签的文本要素中的其它关键词语也确定为所述评论事件的事件标签。

可选的,将确定出的事件标签和评论图谱中的评论标签进行比对,依据比对结果确定候选评论包括:

将确定出的事件标签和评论图谱中评论内容对应的评论标签进行比对,依据评论标签命中的事件标签的数量的大小,由高到低对所述评论内容进行排序,将排序靠前的评论内容作为候选评论。

可选的,对所述候选评论进行筛选,将满足预设条件的候选评论确定为所述评论事件的评论信息包括:

将候选评论中的评论标签和所述评论事件的事件标签一致且正向的候选评论确定为所述评论事件的评论信息。

可选的,所述评论事件包括新闻事件,相应的,在将满足预设条件的候选评论确定为所述评论事件的评论信息之后,还包括:

确定所述新闻事件的情感逻辑,依据所述情感逻辑选择符合条件的评论信息对所述新闻事件进行评论。

可选的,评论图谱由其它评论事件以及对应的评论内容生成的过程包括:

通过网络爬虫定向抓取并确定评论内容;

通过预设识别模型对所述评论内容进行识别,确定和所述评论内容对应的评论主体和评论观点;

依据所述评论主体、所述评论观点以及所述评论内容对应的评论事件确定所述评论内容对应的评论标签;

将所述评论内容以及确定出的评论标签以结构化形式存储为评论图谱。

本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1