一种网络小说商业价值的评估方法及系统与流程

文档序号:13910107阅读:347来源:国知局
一种网络小说商业价值的评估方法及系统与流程

本发明涉及人工智能领域,尤其涉及一种网络小说商业价值的评估方法及系统。



背景技术:

当前对网络小说通常仅仅依靠固定的撰写模式来评价,尚无比较系统的评价方法,以固定的撰写模式来评价,其所能够评价的维度和因素比较狭窄,给了作者单一的导向,使网络小说同质化严重,产生了很多千篇一律的小说,排除了更多的可能性。评价结果无法体现一个网络小说的商业价值,对于小说购买者来说,无法更好地做出购买选择。



技术实现要素:

针对现有技术中的缺陷,本发明提供一种网络小说商业价值的评估方法及系统,能够通过人工智能自动识别网络小说的内容,并对网络小说的商业价值进行评估,帮助小说购买者更好地做出购买选择。

第一方面,本发明提供了一种网络小说商业价值的评估方法,所述方法包括:

获取网络小说的内容,识别网络小说的特征数据;

根据所述特征数据和预设条件,对网络小说的五个模块进行判定;

根据判定结果和预设评估规则,对网络小说的商业价值进行评估。

进一步地,对网络小说的五个模块进行判定,具体包括:

对网络小说的遣词进行判定;

对网络小说的造句进行判定;

对网络小说的内容表达先后判定;

对网络小说的情节进行判定;

对网络小说的设定进行判定。

进一步地,所述对网络小说的遣词进行判定,具体包括:

判定小说中是否含有书面语或口水话,并统计书面语和口水话的数量;

判定小说中是否含有实词或虚词,并统计实词和虚词的数量。

进一步地,所述对网络小说的造句进行判定,具体包括:判定小说中的相邻单句是否能够连接为完整语句,并统计由相邻单句形成的完整语句的数量。

进一步地,,所述对网络小说的内容表达进行判定,具体包括:

判定小说中在主角行动描述之前是否有对应的动机描述;判定小说中在结果描述之后是否有对应的原因描述;判定小说中提及的对象之后是否有所述对象的属性描述;并统计所述动机描述、所述原因描述和所述属性描述中出现的次数。

进一步地,所述对网络小说的情节进行判定,具体包括:判定同一情节中是否引入了变量。

进一步地,所述对网络小说的设定对应进行判定,具体包括:

判定同一情节中,预设属性或预设对象之后,是否有与所述预设属性或预设对象对应的作用描述、目的描述或背景描述,并统计所述作用描述、目的描述和背景描述出现的次数。

进一步地,所述根据判定结果和预设评估规则,对网络小说的商业价值进行评估,具体包括:

根据对网络小说的遣词进行判定的结果,对网络小说进行评分;

根据对网络小说的造句进行判定的结果,对网络小说进行评分;

根据对网络小说的内容表达进行判定的结果,对网络小说进行评分;

根据对网络小说的情节进行判定的结果,对网络小说进行评分;

根据对网络小说的设定进行判定的结果,对网络小说进行评分。

第二方面,本发明还提供了一种网络小说商业价值的评估系统,所述系统包括:识别模块,判定模块,评估模块;

所述识别模块,用于获取网络小说的内容,识别网络小说的特征数据;

所述判定模块,用于根据所述特征数据和预设条件,对网络小说的五个模块进行判定;

所述评估模块,用于根据判定结果和预设评估规则,对网络小说的商业价值进行评估。

由上述技术方案可知,本发明提供一种网络小说商业价值的评估方法及系统,能够自动识别网络小说的内容,通过多种因素对网络小说进行判定,进而对网络小说的商业价值进行评估,帮助小说购买者更好地做出购买选择,可适用于多种网络小说类型。

附图说明

图1示出了本发明提供的网络小说商业价值的评估方法的流程示意图。

图2示出了本发明提供的网络小说商业价值的评估系统的结构示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

实施例一

图1示出了本发明实施例一提供的网络小说商业价值的评估方法的流程示意图。如图1所示,所述方法包括:

步骤s1,获取网络小说的内容,识别网络小说的特征数据;

步骤s2,根据所述特征数据和预设条件,对网络小说的五个模块进行判定;

步骤s3,根据判定结果和预设评估规则,对网络小说的商业价值进行评估。

本发明实施例一的具体技术方案为:

步骤s1,获取网络小说的内容,识别网络小说的特征数据。

其中,特征数据包括但不限于:主语、谓语、宾语、定语、实词、虚词、标点符号、分节符等及其数量。

步骤s2,根据所述特征数据和预设条件,对网络小说的五个模块进行判定。

优选地,对网络小说的五个模块进行判定,具体包括:对遣词(多少)进行判定,对造句(相同)进行判定,对内容表达(先后)进行判定,对情节(引入)进行判定,以及对设定(对应)进行判定。

在对遣词(多少)进行判定之前,还包括建立书面语词库,以存储小说常用的书面语词汇;建立口水话词库,以存储小说常用的口水话词汇;建立实词词库,以存储小说常用的实词词汇;建立虚词词库,以存储小说常用的虚词词汇。

进一步优选地,对遣词(多少)进行判定,即判定词汇的种类及其数量,是遣词判定的关键所在,其具体包括:分析小说中是否含有书面语或口水话,并统计书面语和口水话的数量;分析小说中是否含有实词或虚词,并统计实词和虚词的数量。

其中,常用的书面语例如“就餐”,常用的口水话例如“吃饭”。

通常情况下,虚词用得太多,会使语句读起来较为啰嗦,例如以下描述“小明手突然一伸,然后双掌化做两道火红的残影,在几秒钟内,这样连续击打在前面的湖面上,只见湖面上砰砰砰,冒出几个丈许高的水柱”,这样的描述并不容易抓住要点;多用实词会读起来简单明快,例如以下描述“小明手一伸,双掌化作两道火红的残影,砰砰砰连续击打在湖面上,荡起几个丈高的水柱”。

进一步优选地,对造句(相同)进行判定,是指分析小说中的多个相邻单句是否能够连接为完整语句,并统计此类由多个单句形成的完整语句的数量。

其中,相邻单句能够连接为完整语句的情况有以下几种:

当相邻单句的语境相同时,认为该相邻单句能够连接为完整语句,其中,当相邻单句的主语相同时,认为该相邻单句描述的是同一对象,此时认为该相邻单句能够连接为完整语句;当相邻单句中的首句含有主语,而后面的句子不含有主语时,则认为后面的句子与首句指向共同主语,而后面的句子省略的该主语,即认为该相邻单句能够连接为完整语句;当相邻单句处于同一语境时,认为该相邻单句能够连接为完整语句;上述三种情况存在任意一种,即可认为相邻单句能够连接为完整语句,除此以外的其它情况,则认为不能连接为完整语句。

其中,对于上述第二省略主语的情况,例如“她站在跳板上,伸开双臂,用脚踮了踮,然后猛然起跳,在空中旋转了360度,最后,一个水花,扎入泳池”,省略了同一主语。

其中,通过判断相邻单句前是否存在共同的定语,来判断相邻单句是否处于同一语境,当相邻单句前存在共同的定语时,认为相邻单句处于同一语境。例如“棋盘里,车直走,马斜跳,小兵向前不回头”,后面的三个单句因为前面的“棋盘里”共同的定语“里”,因此能够连接成完整语句。

进一步优选地,对内容表达(先后)进行判定,即判定内容是否以合理的方式表达出来,先写了什么内容,后写了什么内容。其具体包括:分析小说中的主角行动描述之前是否有对应的动机描述;分析小说中的结果描述之后是否有对应的原因描述;分析小说中提及的对象之后是否有该对象的属性描述;并统计上述三类描述出现的次数。

关于主角行动描述可通过以下方式识别:对小说中不同人物主语出现的频率进行统计,设定出现频率最高的或较高的至少一个人物主语为主角,识别在一个完整语句中,是否同时存在指向主角的人物主语和谓语,如果在一个完整语句中,同时存在指向主角的人物主语和谓语,则认为该部分描述为主角行动描述。其中,判断主语是否为人物主语,可以通过将主语与预先建立的存储有涉及人物的姓名、职业等词汇的人物词汇库中的名词或代词进行对比,如果该主语与人物词汇库中某一名词或代词相同,则认为该主语为人物主语。

例如:“主角来到一个小镇,在酒楼用餐,就听隔壁桌上的人吹牛说,前两天有人坊市里面淘到天净沙,于是,主角生出去看一眼的兴趣,用过餐扔一锭银子在桌子上,便向坊市走去,故事就此开始,源于一次吹牛”,对于人物主语“主角”来说,后文出现的“便向坊市走去”中含有相应的谓语,为主角的行动描述。

关于动机描述可通过以下方式识别:识别主角行动描述之前的小说内容中,是否含有“想”、“思考”、“说”、“听”等表示动机的特征词汇,如果含有上述特征词汇,则认为该部分描述为动机描述;可通过建立存储有多个表示动机的特征词汇的动机词汇库,并将小说内容中的词汇与动机词汇库的词汇进行对比的方式,来提高识别的效率。

例如:“主角来到一个小镇,在酒楼用餐,就听隔壁桌上的人吹牛说,前两天有人坊市里面淘到天净沙,于是,主角生出去看一眼的兴趣,用过餐扔一锭银子在桌子上,便向坊市走去,故事就此开始,源于一次吹牛”,对于人物主语“主角”来说,后文出现的“就听隔壁桌上的人吹牛说”中含有“听”、“说”两个特征词汇,因此该描述为动机描述。

关于结果描述可通过以下方式识别:识别小说的某部分内容是否是完整的不含有引号的陈述句,如果是,则认为该陈述句指向结果,为结果描述。例如:“烫金书页的第一页上写着,新秀榜第一名,姬凤儿,再往下一翻,新秀榜第二名,秦磊。”,为结果描述。

关于原因描述可通过以下方式识别:识别结果描述之后的内容中,是否含有“因为”、“所以”、“由于”、“导致”等表示原因的特征词汇,如果含有上述特征词汇,则认为该部分描述为原因描述;可通过建立存储有多个表示原因的特征词汇的原因词汇库,并将小说内容中的词汇与原因词汇库的词汇进行对比的方式,来提高识别的效率。

例如:“周执事笑道:‘公子有所不知,这姬凤儿先登榜首,秦磊之后才逐渐崛起,十年过去,秦磊的实力,虽说在金丹新秀中已无对手,可这秦磊一直爱慕姬凤儿,故而一直未对其发出挑战。所以这姬凤儿,便一直是新秀榜的榜首。’”,该句中出现了“故而”、“所以”等特征词汇,因此该部分描述为原因描述,且是针对上一例的原因描述。

所述对象包括人物名词和事物名词,关于对象的属性描述可通过以下方式识别:识别对象的后面是否含有一个或多个形容词,若有,则认为该形容词的描述为对象的属性描述,此处所说的对象的后面,是相对于同一单句或同一完整语句而言,而非是指全文内容。

例如:“老板抱来一个古朴的酒坛,咚一声,放在桌子上封口一打开,顿时浓郁的香气扑鼻而来,两位酒客耸了耸鼻子,都沉浸于酒香之中。其中一位赞道:‘香气浓而不散,这酒怕是有50年的窖龄了。’”,其中,前面的“酒坛”为对象,后面的“浓郁的”、“香气扑鼻”、“浓而不散”等为该对象的属性描述。

进一步优选地,对情节(引入)的判定具体是指判定某一情节中是否引入了变量,即同一情节的前文中没有出现的对象或属性描述,情节的引入体现方向的改变。

例如:“一个小孩,在海边玩耍,被潮汐卷入海里。小孩游不到岸边,体力又有限,情节进行到了这里,又该如何进行下去呢?海面上突然行驶了一艘船来,渔民打渔回来了,刚好把小孩救了起来”,其中的“船”即为引入的变量。

进一步优选地,对设定(对应)的判定是指随着情节的推进,对于每一个引入的变量,识别在后文中是否有与该变量对应的作用描述、目的描述或背景描述,并统计上述情形出现的次数。对设定的内容本身不作要求,只要设定的属性能与后文对应起来的,就是好的设定,其中,所述的属性包括作用、目的、背景。

关于与该变量对应的作用描述,可通过以下方式识别:识别在同一情节中,该预设属性或预设对象的后文中的,是否同时存在与用于表示该变量的名词或形容词以及“用于”、“作用为”等表示作用或功能的特征词汇;可通过建立存储有多个表示作用或功能的特征词汇的作用词汇库,并将小说内容中的词汇与作用词汇库的词汇进行对比的方式,来提高识别的效率。

关于与该变量对应的目的描述,可通过以下方式识别:识别在同一情节中,该变量的后文中的,是否同时存在与用于表示该变量的名词或形容词以及“为了”、“目的是”等表示目的的特征词汇;可通过建立存储有多个表示目的的特征词汇的目的词汇库,并将小说内容中的词汇与目的词汇库的词汇进行对比的方式,来提高识别的效率。

关于与该变量对应的背景描述,可通过以下方式识别:识别在同一情节中,该变量的后文中的,是否同时存在与用于表示该变量的名词或形容词以及与该变量对应的行动描述,如果两者同时存在,则认为是该部分描述为背景描述。

例如:“主角加入一个门派,无意中发现一个敌对的高手潜伏在门派里面的”,其中主角的后文中出现了“高手”,则该部分描述为背景描述。

其中,是否同一情节可通过作者预先输入的细纲中对情节的划分来识别。

步骤s3,根据判定结果和预设评估规则,对网络小说的商业价值进行评估。

根据对遣词(多少)进行判定的结果,如果小说中的书面语多于口水话,和/或,小说中的实词多于虚词,则认为其有商业价值,多出的数量越多,其商业价值越高。

具体地,对于遣词(多少)的判定,设置一个第一基础分值,当小说中的书面语多于口水话时,将多出的数量与第一设定数量比较,多出的数量每达到一个第一设定数量时,加上一次相应的分值,直至达到第一加分上限为止,该第一加分上限可任意设定;当小说中的书面语少于口水话时,将相差的数量与第一设定数量比较,相差的数量每达到一个第二设定数量时,扣除相应的分值,直至达到第一扣分上限为止,该第一扣分上限不大于第一基础分值。对实词多于或少于虚词数量的加分和扣分规则同上,书面语和实词的最终评分作为遣词分值。

根据对造句(相同)进行判定的结果,如果小说中的相邻单句能够连接为完整语句,则认为其有商业价值,且此类完整语句的数量越高,则认为其商业价值也越高。

具体地,根据统计的上述完整语句的数量进行评分,当该数量达到第二设定数量时,给予第二基础分值,当该数量超出第二设定数量时,多出的数量每达到一个第二设定数量,加上一次相应的分值,直至达到第二加分上限为止,该第二加分上限可任意设定;当该数量少于第二设定数量时,相差的数量每达到一个第二设定数量,扣除相应的分值,直至达到第二扣分上限为止,该扣分上限不大于第二基础分值。经过上述方式得到的最终评分作为造句分值。

根据对内容表达(先后)进行判定的结果,如果小说中的主角行动描述之前是有对应的动机描述,或小说中的结果描述之后是否有对应的原因描述,或小说中提及的对象之后有该对象的属性描述,上述三类描述中出现至少一类描述,则认为其有商业价值,出现的次数越高,认为其商业价值越高。

具体地,根据统计的上述三类描述中出现至少一类描述的次数,对其商业价值进行评分,当出现次数达到第三设定数量时,给予第三基础分值,当该出现次数超出第三设定数量时,多出的数量每达到一个第三设定数量,加上一次相应的分值,直至达到第三加分上限为止,该第三加分上限可任意设定;当该出现次数少于第三设定数量时,相差的数量每达到一个第三设定数量,扣除相应的分值,直至达到第三扣分上限为止,该扣分上限不大于第三基础分值。经过上述评分方式得到的分值作为内容表达分值。

根据对情节(引入)进行判定的结果,如果判定某一情节中引入了变量,则认为其有商业价值,引入的变量越多,则认为其商业价值越高。

具体地,根据统计的引入变量的次数,对其商业价值进行评分,当引入次数达到第四设定数量时,给予第四基础分值,当该引入次数超出第四设定数量时,多出的数量每达到一个第四设定数量,加上一次相应的分值,直至达到第四加分上限为止,该第四加分上限可任意设定;当该引入次数少于第四设定数量时,相差的数量每达到一个第四设定数量,扣除相应的分值,直至达到第四扣分上限为止,该扣分上限不大于第四基础分值。经过上述评分方式得到的分值作为情节分值。

根据对设定(对应)进行判定的结果,如果对于引入的变量,在后文中有与该变量对应的作用描述、目的描述、背景描述的任意一种或多种,则认为其有商业价值,上述几种情形出现的次数越多,则认为其商业价值越高。

具体地,根据统计的任意一种上述情形的出现次数,对其商业价值进行评分,当出现次数达到第五设定数量时,给予第五基础分值,当该引入次数超出第五设定数量时,多出的数量每达到一个第五设定数量,加上一次相应的分值,直至达到第五加分上限为止,该第五加分上限可任意设定;当该引入次数少于第五设定数量时,相差的数量每达到一个第五设定数量,扣除相应的分值,直至达到第五扣分上限为止,该扣分上限不大于第五基础分值。经过上述评分方式得到的分值作为设定分值。

上述遣词分值、造句分值、内容表达分值、情节分值、设定分值的和为该小说的总体分值,该总体分值能够有效反映该小说的商业价值,总体分值越高,其对应的商业价值也越高,计划购买该小说的网站,可以根据该总体分值,通过选择合适的分值范围来选择适合自己的网络小说,从而为小说购买者提供了更方便的参考标准,使小说购买者可以优化自己的选择。

实施例二

对本发明实施例一对应地,图2示出了本发明实施例提供的一种网络小说商业价值的评估系统的结构示意图。如图2所示,包括:识别模块101,判定模块102,评估模块103。

所述识别模块101,用于获取网络小说的内容,识别网络小说的特征数据;所述判定模块102,用于根据所述特征数据和预设条件,对网络小说的五个模块进行判定;所述评估模块103,用于根据判定结果和预设评估规则,对网络小说的商业价值进行评估。

本发明实施例二中未公开的内容与实施例一相同。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1