农用土地流转信息检索方法和系统的制作方法

文档序号:8223479阅读:353来源:国知局
农用土地流转信息检索方法和系统的制作方法
【技术领域】
[0001] 本发明涉及一种农业用土地流转信息的检索方法,本发明还涉及一种农业用土地 信息检索系统。
【背景技术】
[0002] 目前主流的搜索引擎检索算法是基于关键词匹配的检索算法,常用的排序算法包 括词频位置加权排序算法、Direct Hit算法、PageRank算法等。
[0003] 基于关键词匹配的检索算法中,可以将所有只要包含查询语句中涉及词语中的一 个或多个的信息全部检索出来,这种词形匹配方式容易造成检索结果冗余。而且在进行土 地流转信息检索时,没有考虑该类信息的地理位置相关性的重要特点,往往得不到理想的 结果。
[0004]目前,尽管图像、视频等内容的检索技术也有了很好的发展,但是网络上绝大多数 的信息为文本信息,因此文本信息检索在信息检索领域仍然占据着主要地位。文本信息检 索是传统(文献)检索方式的延续,是指从大量的文本资源集合中自动地找到与用户查询 条件相关的各种信息。传统的文本信息检索采用的技术模型主要有布尔模型、向量空间模 型和概率模型,使用较多的是向量空间模型。
[0005] 传统的基于关键词检索的文本信息检索方法存在许多问题:
[0006] (1)基于关键词检索方法中较常使用的检索模型是是向量空间模型,此模型可以 将任意文档表示成词条向量。当文本数量较多时,该词项-文档矩阵将成为高阶稀疏矩阵, 空间维数较高,内存占用空间较大,信息处理速度较慢。
[0007] (2)基于关键词检索方法仅仅考虑字形匹配,没有考虑文本信息中词语之间的语 义关系,不能处理同义词、近义词的问题,准确率并不理想。
[0008] (3)农用土地流转信息中包括很多地理信息,当用户检索一块区域的流转信息时, 基于关键字匹配的检索方法没有办法考虑地理位置的空间信息,将包含在该区域内的地块 信息全部检索出来。
[0009]此外,在针对检索结果进行排序的算法中,词频位置加权排序算法是基于网页信 息内容分析的排序算法,其中词语与网页内容的相似度则由它出现的频次和位置决定。 Direct Hit是一种注重信息质量和用户行为反馈的排序算法,网页被点击的次数和浏览的 时间长度都影响网页与用户查询语句的相似度。PageRank算法是一种链接分析算法。在该 算法中,网页的重要性由两部分决定:(1)该页面被多少页面引用(2)该页面被什么页面 引用。针对土地流转信息的特点,应该充分考虑空间关系对地理要素的语义相似度的影响, 并将这一部分作为影响文档与查询语句相似度的一个重要因素。

【发明内容】

[0010] 针对现有技术中的不足,本发明旨在提供一种基于地名匹配的农用土地流转信息 检索方法,以解决传统算法对于土地流转供求信息检索效果不佳的问题。
[0011] 进一步地,在此基础上,本发明还提供了一种基于地理要素的土地流转信息排序 方法,以解决传统算法对于检索出的土地流转供求信息排序效果不佳的问题。
[0012] 为了解决上述问题,该种农用土地流转信息检索方法,其包括如下步骤:
[0013] 服务器接收用户输入的检索条件;
[0014] 服务器对检索条件和待检索的农用土地流转信息进行分词处理,得到分词化检索 条件和分词化农用土地流转信息;
[0015] 服务器查找分词化检索条件中的包含的地名信息,并根据地名匹配算法找到各地 名信息所包含的下级地名信息;
[0016] 服务器根据该地名信息以及下级地名信息对所述分词化农用土地流转信息进行 筛选,得到筛选后的分词化农用土地流转信息;
[0017] 服务器根据分词化检索条件和筛选后的分词化农用土地流转信息创建向量空间 模型,得到词汇-文档矩阵;
[0018] 服务器计算该词汇-文档矩阵中的分词化检索条件与筛选后的分词化农用土地 流转信息之间的相似度Siml ;
[0019] 服务器将相似度Siml满足一定闕值的农用土地流转信息发送给用户。
[0020] 优选地,还包括步骤:
[0021] 所述服务器得到词汇_文档矩阵后,对该词汇-文档矩阵进行潜语义分析操作,得 到去噪后的词汇-文档矩阵,服务器根据该去噪后的词汇-文档矩阵计算分词化检索条件 与筛选后的分词化农用土地流转信息之间的相似度siml。
[0022] 更优选地,所述对词汇-文档矩阵进行潜语义分析操作包括如下步骤:
[0023] 奇异值分解操作:该操作根据公式:\= T 实现,其中:X ^表示mXn阶矩阵, T。为mXm阶酉矩阵;S。为半正定mXn阶对角矩阵;D。为nXn阶酉矩阵,D QT为D。的共轭转 置;
[0024] 选择\中的前k个元素,取S ^中k阶对角矩阵形成矩阵S、取T ^中的k列形成矩 阵T、取中相应的k行形成矩阵DT,从而形成优化后的矩阵TSD1,其中:若m>n,l〈k〈n,若 m〈n,l〈k〈m ;
[0025] 对优化后的矩阵进行奇异值逆分解操作:该操作根据公式:
【主权项】
1. 一种农用土地流转信息检索方法,其特征在于包括如下步骤: 服务器接收用户输入的检索条件; 服务器对检索条件和待检索的农用土地流转信息进行分词处理,得到分词化检索条件 和分词化农用土地流转信息; 服务器查找分词化检索条件中的包含的地名信息,并根据地名匹配算法找到各地名信 息所包含的下级地名信息; 服务器根据该地名信息以及下级地名信息对所述分词化农用土地流转信息进行筛选, 得到筛选后的分词化农用土地流转信息; 服务器根据分词化检索条件和筛选后的分词化农用土地流转信息创建向量空间模型, 得到词汇-文档矩阵; 服务器计算该词汇-文档矩阵中的分词化检索条件与筛选后的分词化农用土地流转 信息之间的相似度Siml
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1