文言文搜索方法和装置的制造方法

文档序号:9667500阅读:366来源:国知局
文言文搜索方法和装置的制造方法
【技术领域】
[0001] 本发明涉及互联网技术领域,尤其涉及一种文言文搜索方法和装置。
【背景技术】
[0002] 通过引经据典,提升撰写中文文章的格调,是中文文章写作中的一种常用手法。根 据文章的上下文语境和核心思想,引用古代经典文献中的名言警句,可以提升文章的意境, 体现出作者的文学修养和写作功底。因此存在文言文搜索的需求。相关技术中,可以在专 门的文言文网站中查找文言文,或者,在翻译网站中将白话文翻译成文言文,但是,在文言 文网站中查找的方式需要用户在众多的文言文中进行筛选,增加了用户查找成本,在翻译 网站进行翻译的方式通常是将白话文直译为文言文,比如,将"关于读书的文言文"翻译成 "言读书之文言文",与用户需求相去甚远。

【发明内容】

[0003] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004] 为此,本发明的一个目的在于提出一种文言文搜索方法,该方法可以基于白话文 实现对相关文言文的搜索,并且可以降低用户查找成本、更好满足用户需求。
[0005] 本发明的另一个目的在于提出一种文言文搜索装置。
[0006] 为达到上述目的,本发明第一方面实施例提出的文言文搜索方法,包括:接收白话 文;根据所述白话文进行搜索,获取搜索结果,所述搜索结果包括:与所述白话文相关的文 言文;在搜索结果页上,展现所述搜索结果。
[0007] 本发明第一方面实施例提出的文言文搜索方法,通过对白话文进行搜索,获取相 关的文言文,可以基于白话文实现对相关文言文的搜索,并且由于可以通过搜索直接获取 相关的文言文,不需要用户在种类繁多的文言文中进行查找,降低用户查找成本,另外,获 取的是与白话文相关的文言文,而不是对白话文的直译结果,可以更好满足用户需求。
[0008] 为达到上述目的,本发明第二方面实施例提出的文言文搜索装置,包括:接收模 块,用于接收白话文;获取模块,用于根据所述白话文进行搜索,获取搜索结果,所述搜索 结果包括:与所述白话文相关的文言文;展现模块,用于在搜索结果页上,展现所述搜索结 果。
[0009] 本发明第二方面实施例提出的文言文搜索装置,通过对白话文进行搜索,获取相 关的文言文,可以基于白话文实现对相关文言文的搜索,并且由于可以通过搜索直接获取 相关的文言文,不需要用户在种类繁多的文言文中进行查找,降低用户查找成本,另外,获 取的是与白话文相关的文言文,而不是对白话文的直译结果,可以更好满足用户需求。
[0010] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0011] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解,其中:
[0012] 图1是本发明一实施例提出的文言文搜索方法的流程示意图;
[0013] 图2是本发明实施例中搜索结果页的界面图;
[0014] 图3是本发明实施例中文言文详情页面的界面图;
[0015] 图4是本发明实施例中引证详情页面的界面图;
[0016] 图5是本发明另一实施例提出的文言文搜索方法的流程示意图;
[0017] 图6是本发明另一实施例提出的文言文搜索方法的流程示意图;
[0018]图7是本发明实施例中确定被引量的示意图;
[0019] 图8是本发明另一实施例提出的文言文搜索装置的结构示意图;
[0020] 图9是本发明另一实施例提出的文言文搜索装置的结构示意图。
【具体实施方式】
[0021] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考 附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反, 本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同 物。
[0022] 图1是本发明一实施例提出的文言文搜索方法的流程示意图,该方法包括:
[0023]S11 :接收白话文。
[0024] 例如,如图2所示,页面上包括:搜索框,用户可以在搜索框内输入白话文,输入方 式可以包括:语音输入或文本输入等。
[0025] 另外,用户在输入白话文时,可以只需输入引用文言文的关键场景或上下文,例 如,输入的白话文21是"形容读书的文言文"。
[0026]S12:根据所述白话文进行搜索,获取搜索结果,所述搜索结果包括:与所述白话 文相关的文言文。
[0027]S13 :在搜索结果页上展现所述搜索结果。
[0028] -些实施例中,如图2所示,搜索结果页上还可以包括:结果分类22,从而可以接 收用户选择的结果分类,并展现属于用户选择的结果分类的搜索结果。例如,用户通过标签 (tab)切换选择结果分类。结果分类可以设置,例如包括:"全部文献"、"古文"、"诗词"、"小 说"等四个大类目,可以设置默认选择的结果分类,例如,默认选择"全部文献"。
[0029] -些实施例中,如图2所示,搜索结果页上还可以包括:时间段,时间段在图2中用 时光轴23表示,从而可以接收用户选择的时间段,并展现用户选择的时间段的搜索结果。 时间段的时间范围可以设置,例如,从先秦时期到民国时期。
[0030] -些实施例中,如图2所示,搜索结果页上包括搜索结果24,每条搜索结果可以包 括:标题(title)、作者、出处、时代、被引量和摘要。
[0031] 可以将与白话文相关文言文作为搜索结果的标题。
[0032] 一些实施例中,该方法还可以包括:
[0033] 将所述文言文作为所述搜索结果的标题,当接收到搜索结果的标题的点击指令 后,跳转到文言文详情页面,所述文言文详情页面中包括:所述文言文的出处内容以及出处 内容的白话文译文。
[0034] 例如,当点击一个搜索结果的标题后,可以跳转到如图3所示的文言文详情页面, 文言文详情页面中包括:文言文的出处内容31和出处内容的白话文译文32。
[0035] -些实施例中,如图2所示,搜索结果页上还可以包括:排序方式25,从而可以接 收用户选择的排序方式,根据用户选择的排序方式对所述搜索结果进行排序,并展现排序 后的搜索结果。排序方式可以设置,例如包括:相关性、被引量、时间顺序。
[0036] -些实施例中,如图2所示,搜索结果还可以包括:被引量26,被引量是对应的搜 索结果被其他文章引用的次数。
[0037] 一些实施例中,该方法还可以包括:
[0038] 当接收到对所述被引量的点击指令后,跳转到引证详情页面,所述引证详情页面 中包含对所述文言文的引证情况。
[0039] 例如,接收到用于对一个搜索结果的被引量的点击指令后,可以跳转到如图4所 示的引证详情页面,引证详情页面中包含对所述文言文的引证情况,例如,引证该文言文的 文章的题目、作者、期刊、出现在引证文章的位置等。
[0040] -些实施例中,参见图5,根据白话文进行搜索,获取搜索结果的流程可以包括:
[0041] S121 :根据所述白话文进行用户需求分析,获取所述白话文的关键词。
[0042] 其中,关键词包括白话文中的核心词,或者还可以包括与核心词相关的同义词、近 义词等。
[0043] 白话文中的核心词可以根据预先统计,确定句式的核心词,再根据当前用户输入 的白话文的句式,提取对应的核心词。
[0044] 通过语义分析,抽象出用户query中所想表达的核心词,并通过同义词、近义词等 方式扩展,使用扩展后的白话文query查询索引,得到白话文对应的文言文集合。通过统计 用户输入query的形态,以及命中搜索结果的点击情况,建立统计学习模型,通过机器学习 训练得到用户输入的核心关键字,去除无用的噪声词。
[0045] 如:"关于XXX的文言文",对本检索装置来说,"关于XXX的文言文"是一种常用的 表述文言需求的句式,而用户在点击结果中经统计发现,大部分关键字命中搜索结果中的 XXX,因此可以确定此用户输入的句式的核心词为"XXX",通过学习方式记住此句式,反馈到 用户query处理模块中,过滤无用的噪声,以核心词作为输入关键字,提升检索效果。
[0046] S122:根据预先建立的倒排索引,获取与所述关键词对应的文言文,所述倒排索引 中对应记录白话文与文言文。
[0047] 倒排列表用来记录有哪些文档包含了某个单词。一般在文档集合里会有很多文 档包含某个单词,每个文档会记录文档编号(DocID),单词在这个文档中出现的次数(TF) 及单词在文档中哪些位置出现过等信息,这样与一个文档相关的信息被称做倒排索引项 (Posting),包含这个单词的一系列倒排索引项形成了列表结构,这就是某个单词对应的倒 排列表。如图6所示,是倒
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1