一种诗句的搜索方法及装置的制作方法

文档序号:6331477阅读:287来源:国知局
专利名称:一种诗句的搜索方法及装置的制作方法
技术领域
本发明涉及计算机领域,尤其涉及一种诗句的搜索方法及装置。
背景技术
诗在中国文学领域中是一项珍贵的文化遗产,占有重要的地位。诗的格式要求较多,例如,对于近体诗,其格式包括有字数与句数的规定如绝句,一首四句、律诗,一首八句,分为五言和七言;字词的音韵绝句与律诗特性类似,其规则是第一句可押韵,可不押韵,以不押韵居多,如果押韵则可押邻韵。第二、四句一定要押韵,而且一韵到底,不能换韵。第一句的最后一个字若不押韵时,限用仄声字;平仄声调的安排古代汉语有四个声调平声、上声、去声、入声。按现代汉语拼音来分一声为阴平,二声为阳平,三、四声为仄声。为了使诗句有音乐美感,要求诗句中各字间平仄交错,诗句间平仄对立和平仄相黏。例如,同一句中,第二字是平声,第四字就用仄声,而第二句第二字也得用仄声;字词的词意对仗绝句可对仗,也可以不对仗。律诗的第二、三联必须对仗;第一、四联则可对可不对。对仗的两句,句型相同、词性相同、平仄相反;格律的限制格律诗中诗句的末三字平仄安排是否恰当,关系到整句诗的声律。因此,不管是五言或是七言,不论是平脚或是仄脚句,都要尽可能避免三字尾都是平声字或是仄声字。另外其他的一些诗如藏头诗等,也都具有相应的格式规定。现代人作诗,需要具备良好的文学基础,并要能掌握相应的诗格式。目前已有的辅助写作诗词的系统和方法大多是基于格律校验。这些系统主要针对创作者查阅工具书不便,提供诗词格律校验系统,或者韵脚和押韵汉字检索系统。如现有的“稻香居计算机作诗机”,用户可以输入或拷贝一首诗,所述作诗机根据格律诗的规范,指出用户输入中哪些不符合规范;现有的“辅助写作诗词楹联的系统”中,在格律校验的基础上,提供一个分类检索库对校验的结果辅助修改;现有的“诗词韵库韵母检索系统”,用户可使用诗词韵库韵母检字输入方法查找韵字,提高诗词歌赋的创作效率。这些系统和方法的核心在于让计算机检查一下平仄、韵律和对仗方面有没有不合适的地方,或者查一查属于某一韵的还有那些汉字可以使用。这些系统和方法都是在用户已经创作了诗词的基础上,提供校验或者辅助修改功能。事实上,大多数用户由于诗词积累不够或者格律不熟,都不会写作诗词,也就很难使用这些系统和方法,因此使得普通用户仍然不能进行诗词的创作。

发明内容
本发明实施例所要解决的技术问题在于,提供一种诗句的搜索方法及装置,其能根据用户输入的搜索条件信息,搜索到满足各种诗格式的句子供用户选择以完成诗的创作。为了解决上述技术问题,本发明实施例提供了一种诗句的搜索方法,包括根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;将用户从搜索到的句子中选择的句子作为本次写作的诗的第一句,根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择,重复本步骤直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。相应地,本发明实施例还提供了一种诗句的搜索装置,包括搜索模块,用于根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;确定模块,用于将用户从所述搜索模块搜索到的句子中选择的句子作为本次写作的诗的第一句,并根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;所述搜索模块还用于根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择,所述搜索模块根据确定的所述诗格式重复进行搜索,直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。采用本发明实施例,仅需根据用户输入的关键字和主题信息等搜索条件信息,便可搜索到较合适的句子供用户选择作为诗的第一句,根据诗的第一句进行诗格式的确认, 确认后,再次根据确认的诗格式搜索后续的满足各种诗格式的最合适的诗句供用户选择, 整个过程中,用户只需输入搜索条件信息以及根据需要作出选择,操作简单,功能多样,使得用户能够根据需要快速、简便地创作各种形式各种主题的诗,提高了用户的使用体验。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明的诗句的搜索装置的第一实施例结构组成示意图;图2是本发明的诗句的搜索装置的第二实施例结构组成示意图;图3是图2的搜索模块的结构组成示意图;图4是图2的确定模块的结构组成示意图;图5是本发明的诗句的搜索方法第一实施例流程示意图;图6是本发明的诗句的搜索方法第二实施例流程示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1是本发明实施例的诗句的搜索装置的结构组成示意图,该装置包括搜索模块1,和确定模块2,其中,所述搜索模块1,用于根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;所述确定模块2,用于将用户从所述搜索模块1搜索到的句子中选择的句子作为本次写作的诗的第一句,并根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;通过所述确定模块2确定了本次写作的诗的第一句以及诗格式之后,所述搜索模块1再次根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择,用户从返回的待选诗句中选择并确定出第二句以后,所述搜索模块1根据所述诗格式重复进行后续每一句诗句的搜索,直至根据所述诗格式中对应的句数返回所有的句子,结束搜索;具体的,当用户需要作诗时,可首先输入包括关键字和主题信息的搜索条件信息, 所述搜索模块1根据所述搜索条件信息中包括的关键字和主题信息,到预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回搜索到的句子供用户选择,用户可在所述搜索模块1返回的一个或者多个句子中,选择一个句子作为本次写作的诗的第一句。当用户选择了第一句后,所述确定模块2便可根据所述第一句和所述搜索条件信息中包括的关键字,确定用户本次写作的诗的格式,诗格式主要是对诗在句数,每一句的字数,声调以及押韵方式等方面的格式规定。本实施例中的诗格式的确定方式为根据所述第一句的字数,确定后续每一句诗句的字数;根据所述第一句的最后一个字的拼音的韵母和第一句的各个字的声调,确定本次写作的诗的平仄关系和押韵的韵母;根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数,例如,若所述关键字的字数在4个字以内,则句数确定为4句,大于4个字的,则确定为8句;最后根据确定的所述后续每一句诗句的字数、所述平仄关系和押韵的韵母以及确定的所述句数,确定本次写作的诗格式。诗格式确定后,所述搜索模块1可在诗句库中搜索并返回第二句的待选诗句供用户选择,在用户选择第二句之后,进一步搜索并返回第三句的待选诗句供用户选择,直至按照诗格式中的句数要求,搜索并返回最后一句的待选诗句供用户选择。另外,所述搜索模块1向用户返回搜索到的句子具体包括所述搜索模块1搜索到相关诗句后,通过用户终端等设备中包括的显示模块将所述搜索到的诗句显示给用户以供用户选择。用户可通过所述终端设备显示模块查看所述搜索模块1返回的句子,并进行选择确认。所述终端设备显示模块还可显示用户选择完成后的诗供用户审阅。用户选择确定最后一句后,一首完整的,符合用户要求,且满足诗格式的诗便创作完成。另外,在选择句子的过程中,若用户觉得之前的某一句不合适时,可以删除掉相应的句子进行重新选择,所述搜索模块1会根据用户新选择的句子,调整搜索策略,将满足用户输入的搜索条件信息最合适的句子搜索出来供用户选择。当然,对于上述的用户输入的搜索条件信息,用户可仅输入关键字,或者仅输入主题信息,所述搜索模块1也可仅根据所述关键字或者仅根据所述主题信息搜索并返回相应的诗句。所述诗句的搜索装置可设置在网络服务器中,用户通过终端连接到服务器便可进
7行诗句的搜索以完成诗的创作;该诗句的搜索装置也可设置在用户终端中,用户随时可根据需要进行诗句的搜索以完成诗的创作。通过上述实施例的描述可知,本发明具有以下优点仅需根据用户输入的关键字和/或主题信息等搜索条件信息,搜索模块便可搜索到较合适的句子供用户选择作为诗的第一句,同时,确定模块根据诗的第一句进行诗格式的确认,确认后,所述搜索模块便可再次根据确认的诗格式搜索后续的满足各种诗格式的最合适的诗句供用户选择,整个过程中,用户只需输入搜索条件信息以及根据需要作出选择,操作简单,功能多样,使得用户能够根据需要快速、简便地创作各种形式各种主题的诗, 提高了用户的使用体验。再请参见图2,是本发明的诗句的搜索装置的第二实施例结构组成示意图,本实施例中,所述诗句的搜索装置设置在网络服务器中,如图2所示,该装置包括图1中所示的搜索模块1,和确定模块2,进一步的,该诗句的搜索装置还包括预置模块3,用于预置诗句库,所述诗句库包括多个诗句和每一个诗句在相应的主题下的主题权重值。所述预置模块3可为一索引表存储器,其存储有大量的诗句以及相应的主题权重值,所述预置模块3与所述搜索模块1相连接。具体的,所述诗句库是根据诗句的关键字和尾韵建立的倒排索引表,根据不同的主题,不同的长度,分开建立索引表以方便所述搜索模块1进行搜索,例如,包括爱情、思乡等主题的索引表,包括五言、七言的长度的索引表。同时,在所述诗句库中,计算并保存有每一诗句在不同的主题下的主题权重值。请参见图3,是图2的搜索模块的结构组成示意图,所述搜索模块1包括分析单元11和搜索子单元12,其中所示分析单元11,用于将所述搜索条件信息中包括的关键字进行切分和/或扩展;所述搜索子单元12,用于根据所述分析单元11对关键字进行切分和/或扩展的结果,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回给用户选择;并且用于根据所述确定模块2确定的所述诗格式,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回搜索到的句子作为本次写作的待选诗句;其中,所述搜索子单元12根据所述诗格式重复进行搜索,直至根据所述诗格式中对应的句数返回所有的句子,结束搜索。具体的,所述搜索模块1在进行搜索时,首先通过所述分析单元11对用户输入的搜索条件信息中包括的关键字进行切分和/或扩展。对关键字进行切分是指根据诗的类型,将所述关键字切分为若干个分词或者字,如对于一般的正体诗和藏头诗、层次递进诗, 所述分析单元11的切分策略可为一般的正体诗根据分词结果切分,而对于藏头诗和层次递进诗则根据单个字切分;对关键字进行扩展主要是针对诗的完整性,如对于一般的正体诗和藏头诗、层次递进诗,所述分析单元11的扩展策略可为对于一般的正体诗,根据相似词进行扩展,对于藏头诗和层次递进诗,直接根据主题关键字进行扩展。所述搜索子单元12根据所述分析单元11的切分和/或扩展的结果,并根据所述搜索条件信息中包括的用户所选择的主题信息,在诗句库中搜索多个与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的诗句,将搜索到的句子返回给用户终端设备,用户终端设备通过其包括的显示模块,将相应诗句显示给用户以供用户选择,用户可在其中选择一个诗句作为本次写作的诗的第一句,所述显示模块在相应的位置显示用户选择的第一句诗句。在用户选择了第一句诗句后,所述搜索子单元12再次根据确定模块2确定的诗格式,在预置模块3的诗句库中搜索并返回与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的诗句。所述终端设备的显示模块相应的将所述搜索子单元12返回的句子显示给用户,用户可在其中选择本次写作的诗的第二句, 所述显示模块将用户选择的句子作为诗的第二句显示在上述第一句的后面。选择完成第二句后,所述搜索子单元12则再次根据诗的类型,搜索后续的句子供用户选择,直至根据诗格式中对应的句数返回所有的句子,用户本次的诗写作结束。另外,在用户进行选择时,若对之前选择的诗句不满意时,可删除掉所述终端设备的显示模块中相应位置显示的诗句,所述搜索子单元12则重新进行第一句或者第一句之后的句子的搜索以供用户选择。进一步的,如图2所示,该诗句的搜索装置还可包括判断模块4,用于判断所述搜索子单元12搜索到的句子的数量是否小于预设的阈值,若是,则通知所述搜索子单元12扩大搜索范围,使得搜索到的句子的数量达到或者超过所述预设的阈值。具体的,对于所述搜索子单元12在诗句库中搜索到的诗句的数量,所述判断模块 4需要将所述搜索到的句子的数量与预设的阈值进行比较判断,若所述搜索子单元12搜索到的句子的数量小于所述阈值时,所述判断模块4便通知所述搜索子单元12扩展搜索范围,重新进行搜索,使得所述搜索子单元12能够搜索到较多的句子供用户选择。例如,可设置阈值为10,当所述判断模块4判断比较的结果为所述搜索子单元12搜索到的句子数量仅有5句时,所述判断模块4则通知所述搜索子单元12调整搜索策略,重新进行搜索,使得搜索到的句子数量达到或者超过10句。用户可根据需要设置所述阈值的大小,在用户没有设置阈值大小时,所述判断模块4根据默认的阈值进行比较判断。进一步的,如图2所示,该诗句的搜索装置还可包括排序模块5,用于对所述搜索子单元12返回的句子进行排序以供用户选择。具体的,所述排序模块5将所述搜索子单元12返回的句子按照所述搜索条件信息中包括的主题信息、诗格式、意境、用户喜好等方面综合排序,将最适合的诗句展示给用户选择。排序方式可以有多种,下面对其中一种排序方式进行详细说明。在主题信息方面,可综合两种分类方法对诗句主题进行分类,一种是基于关键词的分类的关键词权重Weight (key topic),另一种是基于LDA (LatentDirichlet Allocation,隐含狄利克雷分配)模型的分类的LDA权重Weight (Idatopic),则相应地,一个诗句在某一主题下的主题权重Weight (topic)定义为Weight (topic) = a*ffeight (key topic)+b^ffeight (Ida topic),其中,a和b是两个正数参数,且a+b = 1。该公式的含义为 如果含有明显主题类别关键词,则主题权重越高,如果内容能够表达出主题,则主题权重越高。此外,基于LDA模型进行主题分类,能够很好的处理诗的内容短、表达内容隐晦等问题。对于诗格式中押韵方面的要求,可选诗句与已有诗句押韵关系权重 Weight (rhythm)定义如下如果诗的偶句韵脚相同,则Weight (rhythm) = 1,若韵脚相似, 贝Ij Weight (rhythm) = 0. 5,其他 Weight (rhythm) = 0。对于诗的主题信息、意境、用户喜好等方面的一致性,可通过可选诗句与已有诗句内容的相似度来度量。在诗主题分类中,可采用LDA模型将诗句映射到一个低维的主题Topic向量,则诗句pi和诗句p2之间的相似度计算公式可描述如下Similar(pl, p2) = l-(a+KL (Topic (pi), Topic (p2)))/b,其中,a 和 b 是两个正数参数,且 b > a, KL(KulIback-Leibler divergence,相对熵)距离反映了诗句主题分布的差异。此处,基于 LDA模型的诗句相似度的计算,能够很好的度量诗内容一致性,将最适合的诗句展示给用户供用户选择。上述相似度计算公式的含义是诗句主题分布差异越大,表达内容一致性就越差。最后,所述排序模块5根据可选诗句主题信息权重Weight (topic)、与已有诗句的押韵关系权重Weight (rhythm)、相似度权重Weight (similar)计算得到诗权重,并根据所述诗权重对搜索到的诗句进行综合排序,所述诗权重的计算公式如下Weight(p0em) = a* Weight (topic) +b*ffeight (rhythm) +c*ffeight (similar), , a> b、c
a+b+c = 1,该公式的含义是如果可选诗句主题信息权重越高,与用户已选诗句韵律越一致,内容相似度越高,则相关性越大。进一步的,请参见图4,是图2的确定模块的结构组成示意图,所述确定模块2包括第一确定子单元21,用于根据所述第一句的字数,确定后续每一句诗句的字数;第二确定子单元22,用于根据所述第一句的最后一个字的拼音的韵母,确定本次写作的诗的押韵的韵母;第三确定子单元23,用于根据所述第一句中各个字的声调确定后续诗句的字之间的平仄关系;第四确定子单元M,用于根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数;确定子单元25,用于根据所述第一确定子单元21确定的后续诗句的字数、所述第二确定子单元22确定的押韵的韵母、第三确定子单元确定23的平仄关系以及所述第四确定子单元M确定的句数,确定本次写作的诗格式。下面以一具体实例,对该诗句的搜索装置进行说明。本例中的诗句的搜索装置设置在服务器中,用户通过终端设备连接到所述服务器后,可在所述搜索模块1提供的文本框中输入“明月”的关键字,并选择“思乡”的主题信息, 所述搜索模块1中的所述搜索子单元12根据所述关键字“明月”,在所述预置模块3的诗句库中查找在“思乡”主题下的权重值在0.3的权重阈值以内的诗句,在“思乡”的主题下,主题权重值越高的句子,其越符合所述“思乡”主题的意境,所述排序模块5按照上述的诗权重对搜索到的句子进行排序后,通过终端设备的显示模块显示给用户,用户可在显示模块显示的多个诗句中选择其中一句作为本次写诗的第一句,例如选择“床前明月光”作为第一句,所述显示模块在相应位置显示所述“床前明月光”。
选择了第一句后,所述确定模块2可由仅有两个字的关键字“明月”确定本次作诗的句数为4句,根据所述5个字的“床前明月光”确定本次作的诗为五言诗,根据所述“床前明月光”的各个字的声调,确定后续诗句的平仄关系,并根据“床前明月光”最后的“光”字, 确定押韵的韵母为“ang”,以此,所述确定模块2可确定出本次作诗的诗格式为五言绝句, 押“ang”韵,后续句子的各个字的声调需要根据第一句的平仄关系进行平仄交错排列。所述搜索子单元12便再次根据所述确定模块2确定的诗格式,到预置模块3预置的诗句库中搜索与所述关键字“明月”相匹配,且句子的在所述“思乡,,的主题下的主题权重值大于预设的权重阈值0. 3的句子,所述排序模块5按照上述的诗权重对搜索到的句子进行排序后,通过所述终端设备的显示模块显示给用户,用户可在显示模块显示的多个诗句中选择其中一句作为本次写诗的第二句,所述显示模块在所述第一句之后显示所述第二句诗句。用户选择了第二句后,所述搜索子单元12重复进行搜索,直至搜索完所述诗格式所对应的4句并返回第4句的待选诗句供用户选择。所述诗句的搜索装置可设置在服务器中,用户通过终端连接到服务器便可进行诗句的搜索以完成诗的创作;该诗句的搜索装置也可设置在用户终端中,用户随时可根据需要进行诗句的搜索以完成诗的创作。通过上述实施例的描述可知,本发明具有以下优点仅需根据用户输入的关键字和主题信息等搜索条件信息,搜索模块便可搜索到较合适的句子供用户选择作为诗的第一句,同时,确定模块根据诗的第一句进行诗格式的确认,确认后,所述搜索模块便可依次根据确认的诗格式搜索后续的满足各种诗格式的最合适的诗句供用户选择,整个过程中,用户只需输入搜索条件信息以及根据需要作出选择,操作简单,功能多样,使得用户能够根据需要快速、简便地创作各种形式各种主题的诗,提高了用户的使用体验。为了更清楚的说明本发明,下面对本发明的一种诗句的搜索方法进行详细描述。图5是本发明的诗句的搜索方法第一实施例流程示意图,该方法包括S501 根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;具体的,当用户需要作诗时,可首先输入包括关键字和主题信息的搜索条件信息, 根据所述搜索条件信息中包括的关键字和主题信息,S501到预置的诗句库中搜索并返回与所述关键字相匹配,且在所述诗句库中,所述句子在所述主题信息所对应的主题下的主题权重值大于权重阈值的句子供用户选择,用户可在返回的一个或者多个句子中,选择一个句子作为诗的第一句。所述权重阈值可由用户预设,或者为默认设置。所述诗句库为预先设置的由大量的诗句构成的索引表,所述索引表中同时保存有每一句诗句在各类主题下的主题权重值,所述主题权重值是在设置诗句时,根据关键词权重Weight (key topic)和LDA权重Weight (Ida topic)计算得来的。诗句在某一个主题下的主题权重越高,其与该主题的关联性越高,越符合该主题的意境。当然,用户也可以仅输入关键字或者仅选择主题信息进行搜索。另外,当根据当前输入的搜索条件信息,在预置的诗句库中,搜索到的与所述关键字相匹配的句子的数量小于预设的阈值时,根据当前输入的搜索条件信息扩大搜索范围,如对搜索条件信息中的关键字进行切分和扩展时,进行更细的切分,并扩展出更多的近义词等方式来扩大搜索范围,使得搜索到的句子的数量达到或者超过所述预设的阈值。S502:将用户从返回的句子中选择的句子作为本次写作的诗的第一句,根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式。具体的,当用户可在S501返回的句子中选择其中一句作为本次写作的诗的第一句,S502根据所述第一句确定本次写作的诗格式,例如,对于写诗,所述S502根据所述第一句和所述搜索条件信息中的关键字,确定诗的格式步骤包括根据所述第一句的字数,确定后续每一句诗句的字数;根据所述第一句的最后一个字的拼音的韵母确定本次写作的诗的押韵的韵母;根据所述第一句中的每个字的声调,确定本次写作的诗的平仄关系;根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数;最后,根据确定的所述后续诗句的字数、所述平仄关系、所述押韵的韵母以及确定的所述句数,确定本次写作的诗格式。S503:根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择,重复本步骤直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。具体的,S503根据所述搜索条件信息中包括的关键字和主题信息、用户所选的第一句以及诗格式在预置的诗句库中进行后续句子的搜索,S503可在诗句库中依次搜索并返回第二句的待选诗句供用户选择,搜索并返回第三句的待选诗句供用户选择,直至按照诗格式中的句数要求,搜索并返回最后一句的待选诗句供用户选择。另外,当根据所述搜索条件信息、用户所选择的句子以及诗格式搜索到的句子的数量小于预设的阈值时,根据所述搜索条件信息、用户所选择的第一句以及诗格式扩大搜索范围,如对搜索条件信息中的关键字进行切分和扩展时,进行更细的切分,并扩展出更多的近义词等以扩大搜索范围,使得搜索到的句子的数量达到或者超过所述预设的阈值。用户选择确定最后一句后,一首完整的,符合用户要求,且满足诗格式的诗便创作完成。另外,在选择句子的过程中,若用户觉得之前的某一句不合适时,可以删除掉相应的句子进行重新选择,用户重新选择后,S502会根据用户新选择的句子,调整搜索策略,将满足用户输入的搜索条件信息最合适的句子搜索出来供用户选择。通过上述实施例的描述可知,本发明具有以下优点仅需根据用户输入的关键字和主题信息等搜索条件信息,搜索模块便可搜索到较合适的句子供用户选择作为诗的第一句,同时,确定模块根据诗的第一句进行诗格式的确认,确认后,所述搜索模块便可依次根据确认的诗格式搜索后续的满足各种诗格式的最合适的诗句供用户选择,整个过程中,用户只需输入搜索条件信息以及根据需要作出选择,操作简单,功能多样,使得用户能够根据需要快速、简便地创作各种形式各种主题的诗,提高了用户的使用体验。图6是本发明的诗句的搜索方法第二实施例流程示意图,该方法包括S601 预置诗句库;具体的,预置诗句库的步骤包括以下三步第一,诗的预处理。诗的预处理包括褒贬义分析,常用度分析,繁简体转换,近义字词替换,诗句扩充,标点符号统一等。其中,褒贬义分析基于褒贬义词表,对所有诗句褒贬义进行打分;常用度分析则是根据常用字表来对所有诗句常用度进行打分;第二,主题分类。系统根据大多数需求,可预先定义如爱情、祝福、悲恨等几大类主题。用户可以根据自己的需求,选择辅助作诗的主题信息。由于古诗具有短、表达内容隐晦等特点,常用的文本分类方法,对于这种高维稀疏的数据,很难达到好的效果。因此,可综合两种分类方法来对诗句的主题进行分类一种是基于关键词的分类关键词权重Weight (key topic),另一种是基于LDA模型的分类LDA权重Weight (Ida topic)。诗句在上述预定义的各类主题下的主题权重Wfeight(topic)则可定义为Weight (topic) = a*ff eight (key topic)+b*Weight (Idatopic),其中,a和b是两个正数参数,且a+b = 1。该公式的含义如果含有明显类别关键词,则主题权重越高,如果内容能够表达出主题,则主题权重越高。采用上述公式的原因对于那些含有明显类别关键词的,第一种方法能够很好处理,而对于诗句表达隐晦且没有明确的类别关键词时,采用主题模型LDA进行分类则可以取得很好的效果。下面对两种分类方法进行描述。对于基于关键词的分类方法,该方法的思想在于从人工分类的诗句中统计出类别的关键词和相应权重,根据这些关键词对所有未分类的诗句打分。具体打分策略是当诗句中出现类别关键词,则将该类别权重加上关键词权重,最后归一化处理,得到诗句各主题权 M Weight (key topic)即打分结果。对于基于LDA模型的分类方法,其基本思想是,诗句由潜在的多个主题的随机混合来表示,而每个主题由建立在字词上的分布来刻画的。LDA模型将诗句映射到一个低维的向量Topic(p) = (T1,T2,...,Tk),其中,每一维表示某一个主题概率。LDA模型将高维稀疏的诗数据根据语义关系映射到一个低维的主题向量后,以诗句主题向量为特征,可以采用各种分类算法,在人工分类的训练集中,训练一个分类模型,然后使用这个分类模型对所有诗句进行分类,得到诗句各主题权重Weight (Ida topic)。第三,索引建立。可以以诗句中的关键字词和尾韵来建立倒排索引。为了加快搜索速度,可根据不同主题如爱情、祝福等和长度如五言和七言,分开建立索引。在建立索引过程中,计算相应的诗句的主题权重值,并排序。该索引即为诗句库。将所述诗句库存储在存储器中。S602 对所述搜索条件信息中的关键字进行切分和/或扩展;具体的,所述搜索条件信息包括关键字和主题信息等,在根据用户输入搜索条件信息进行搜索之前,可对所述搜索条件信息进行切分和/或扩展。对关键字进行切分是指 根据诗的类型,将所述关键字切分为若干个分词或者字,如对于一般的正体诗和藏头诗、层次递进诗,切分策略可为对于一般的正体诗可根据分词结果切分,而对于藏头诗和层次递进诗则根据单个字切分;对关键字进行扩展主要是针对诗的完整性,如对于一般的正体诗和藏头诗、层次递进诗,扩展策略可为对于一般的正体诗,可根据相似词扩展,对于藏头诗和层次递进诗,直接根据主题关键字进行扩展。S603 根据所述对关键字进行切分和/或扩展的结果,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子;在搜索的过程,如果搜索到的句子的数量较少,小于用户预先设置的一个数量阈值时,S603可通过切分和/或扩展的结果,重新进行搜索,以搜索出更多的句子。
13
S604 对返回的句子进行排序以供用户选择;具体的,在诗句库中搜索出多个诗句后,对搜索到的多个句子进行排序,通过相应的终端设备的显示模块显示返回的多个诗句供用户选择,当用户选择了其中一个诗句作为本次写作的诗的第一句后,所述显示模块相应显示用户选择的诗句。S605 根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;所述确定本次写作的诗格式的步骤具体包括根据所述第一句的字数,确定后续每一个诗句的字数;根据所述第一句的最后一个字的拼音的韵母确定本次写作的诗的押韵的韵母;根据所述第一句中的每个字的声调,确定本次写作的诗的平仄关系;根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数;最后,根据确定的所述后续诗句的字数、所述平仄关系、所述押韵的韵母以及确定的所述句数,确定本次写作的诗格
ο οS606:根据确定的所述诗格式,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回搜索到的句子作为本次写作的待选诗句;S607 对返回的句子进行排序以供用户选择;重复S606直至本次诗的写作结束。具体的,在用户通过S604选择了第一句诗句,并确认了相应的诗格式后,S606进行后续的每一句诗句的搜索,并对返回的句子进行排序,然后通过终端设别的显示模块相应的将S606返回的句子作为第二句的待选诗句显示给用户,当用户选择了相应的句子后, 所述终端设备的显示模块将用户选择的第二句显示在用户选择的第一句之后。同理,搜索第三句待选诗句和第四句的待选诗句的步骤,以及用户的选择和显示模块的显示过程与上述过程相同,在此不赘述。另外,所述S604和所述S607是根据诗权重进行排序的,所述诗权重是根据搜索到的句子在主题信息所对应的主题下的主题权重值、押韵关系权重值以及相似度权重值,并根据诗权重计算公式得到的,所述诗权重计算公式为Weight(p0em) = a^ffeight (topic) + b*ffeight (rhythm) +c*ffeight (similar), , ει、b、 c a+b+c = 1。卞艮据计算得到的各诗句的诗权重值的大小,进行由大到小、或者由小到大进行排序。S606包括多次搜索步骤,其根据所述搜索条件信息、用户所选择的句子以及诗格式进行搜索,直至用户本次的诗写作结束。例如,用户写作的是4句的绝句时,用户根据 S604选择得到第一句后,S606分别进行第二句的搜索,直到搜索返回第4句后结束。另外,在用户进行选择时,若对之前选择的诗句不满意时,可删除掉所述终端设备的显示模块中相应位置显示的诗句,再次执行S603和/或S606重新进行第一句和/或第一句之后的句子的搜索以供用户选择。可以理解的是,本实施例中的S602、S603以及S604对应诗句的搜索方法第一实施例中的S501,S606和S607对应第一实施例的S503。通过上述实施例的描述可知,本发明具有以下优点仅需根据用户输入的关键字和主题信息等搜索条件信息,搜索模块便可搜索到较合适的句子供用户选择作为诗的第一句,同时,确定模块根据诗的第一句进行诗格式的确认,确认后,所述搜索模块便可依次根据确认的诗格式搜索后续的满足各种诗格式的最合适的诗句供用户选择,整个过程中,用户只需输入搜索条件信息以及根据需要作出选择,操作简单,功能多样,使得用户能够根据需要快速、简便地创作各种形式各种主题的诗,提高了用户的使用体验。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory, RAM)等。以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
权利要求
1.一种诗句的搜索方法,其特征在于,包括根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;将用户从搜索到的句子中选择的句子作为本次写作的诗的第一句,根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子, 并返回搜索到的句子作为本次写作的待选诗句供用户选择,重复本步骤直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。
2.如权利要求1所述的方法,其特征在于,还包括预置诗句库,所述诗句库包括多个诗句和每一个诗句在相应的主题下的主题权重值。
3.如权利要求1或2所述的方法,其特征在于,所述搜索条件信息包括关键字和主题信息,所述根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子的步骤,包括对所述搜索条件信息中的关键字进行切分和/或扩展;根据所述对关键字进行切分和/或扩展的结果,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子;对返回的句子进行排序以供用户选择。
4.如权利要求3所述的方法,其特征在于,所述根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子的步骤,还包括当搜索到的句子的数量小于预设的阈值时,根据当前输入的搜索条件信息扩大搜索范围,使搜索到的句子的数量达到或者超过所述预设的阈值。
5.如权利要求1或2所述的方法,其特征在于,所述搜索条件信息包括关键字和主题信息,所述根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择的步骤,包括根据确定的所述诗格式,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回搜索到的句子作为本次写作的待选诗句;对返回的句子进行排序以供用户选择。
6.如权利要求5所述的方法,其特征在于,所述根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择的步骤,还包括当搜索到的句子的数量小于预设的阈值时,根据确定的所述诗格式扩大搜索范围,使得搜索到的句子的数量达到或者超过所述预设的阈值。
7.如权利要求1所述的方法,其特征在于,所述搜索条件信息包括关键字和主题信息, 所述根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式的步骤,包括根据所述第一句的字数,确定后续每一句诗句的字数;根据所述第一句的最后一个字的拼音的韵母确定本次写作的诗的押韵的韵母;根据所述第一句中的每个字的声调,确定本次写作的诗的平仄关系; 根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数; 根据确定的所述后续每一句诗句的字数、所述押韵的韵母、所述平仄关系以及所述句数,确定本次写作的诗格式。
8.一种诗句的搜索装置,其特征在于,包括搜索模块,用于根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;确定模块,用于将用户从所述搜索模块搜索到的句子中选择的句子作为本次写作的诗的第一句,并根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;所述搜索模块还用于根据确定的所述诗格式,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并返回搜索到的句子作为本次写作的待选诗句供用户选择,所述搜索模块根据确定的所述诗格式重复进行搜索,直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。
9.如权利要求8所述的装置,其特征在于,还包括预置模块,用于预置诗句库,所述诗句库包括多个诗句和每一个诗句在相应的主题下的主题权重值。
10.如权利要求9所述的装置,其特征在于,所述搜索模块包括分析单元,用于将所述搜索条件信息中包括的关键字进行切分和/或扩展; 搜索子单元,用于根据所述分析单元对关键字进行切分和/或扩展的结果,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回给用户选择;并且用于根据所述确定模块确定的所述诗格式,在预置的诗句库中搜索与所述关键字相匹配,且句子在所述主题信息所对应的主题下的主题权重值大于预设的权重阈值的句子,并返回搜索到的句子作为本次写作的待选诗句;其中,所述搜索子单元根据所述诗格式重复进行搜索,直至根据所述诗格式中对应的句数返回所有的句子,结束搜索。
11.如权利要求10所述的装置,其特征在于,还包括排序模块,用于对所述搜索子单元返回的句子进行排序以供用户选择。
12.如权利要求11所述的装置,其特征在于,还包括判断模块,用于判断所述搜索子单元搜索到的句子的数量是否小于预设的阈值,若是, 则通知所述搜索子单元扩大搜索范围,使得搜索到的句子的数量达到或者超过所述预设的阈值。
13.如权利要求11所述的装置,其特征在于,所述确定模块包括第一确定子单元,用于根据所述第一句的字数,确定后续每一句诗句的字数; 第二确定子单元,用于根据所述第一句的最后一个字的拼音的韵母,确定本次写作的诗的押韵的韵母;第三确定子单元,用于根据所述第一句中各个字的声调确定后续诗句的字之间的平仄关系;第四确定子单元,用于根据所述搜索条件信息中包括的关键字的字数,确定本次写作的诗的句数;确定子单元,用于根据所述第一确定子单元确定的后续诗句的字数、所述第二确定子单元确定的押韵的韵母、第三确定子单元确定的平仄关系以及所述第四确定子单元确定的句数,确定本次写作的诗格式。
全文摘要
本发明实施例公开了一种诗句的搜索方法,包括根据输入的搜索条件信息,在预置的诗句库中搜索与所述搜索条件信息相匹配的句子,并向用户返回搜索到的句子;用户从搜索到的句子中选出本次写作的诗的第一句,根据所述第一句以及所述搜索条件信息,确定本次写作的诗格式;根据所述诗格式,在预置的诗句库中搜索后续的诗句供用户选择,直至根据所述诗格式中对应的句数返回最后一句的待选诗句供用户选择。本发明实施例还公开了一种诗句的搜索装置。采用本发明,其能根据用户输入的搜索条件信息,搜索到满足各种诗格式的句子供用户选择以完成诗的创作,使得用户能够创作出满意的诗。
文档编号G06F17/30GK102385596SQ201010272860
公开日2012年3月21日 申请日期2010年9月3日 优先权日2010年9月3日
发明者林芬, 贾自艳 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1