基于地理位置信息的语言采集方法及系统的制作方法

文档序号:10489069阅读:452来源:国知局
基于地理位置信息的语言采集方法及系统的制作方法
【专利摘要】本发明提供一种基于地理位置信息的语言采集方法及系统。其中方法包括:获取被采集人输入的语言信息;获取被采集人所在位置的地理位置信息;根据地理位置信息获得被采集人所在位置对应的语言类型;将语言类型作为语言信息的语言类型。由于其是根据被采集人所在位置的地理位置信息获得需要采集的语言信息的语言类型的,因此无需用户指定输入的语言信息的语言类型,也无需系统自动检测少数几种通用的国际语言类型,就能获得语言信息的语言类型,使得用户的语言采集成功,克服传统语言采集系统易导致用户对语言采集失败的缺陷,满足用户对各种语言的采集需求。
【专利说明】
基于地理位置信息的语言采集方法及系统
技术领域
[0001]本发明涉及语言学领域,特别是涉及一种基于地理位置信息的语言采集方法及系统。
【背景技术】
[0002]传统的语言采集系统,需要用户指定需要采集的语言类型,或者自动检测少数几种通用的国际语言的类型。当用户不清楚需要采集的语言类型时,如用户到某地旅游或出差时,与当地人交流时,想采集当地人的方言时,用户不一定知道当地的方言类型,此时用户无法指定需要采集的语言类型;或者当用户需要采集的语言不在语言采集系统能自动检测的语言类型之内,如用户到某地旅游或出差时,与当地人交流时,想采集当地人的方言时,当地方言类型不在采集系统自动检测的语言类型之内,则采集系统就会检测失败。这两种情况都会导致用户对该语言的采集失败,无法满足用户对各种语言的采集需求。

【发明内容】

[0003]鉴于此,有必要针对传统语言采集系统需要用户指定需要采集的语言类型或需要采集的语言不在语言采集系统能自动检测的语言类型之内时会导致采集失败的问题,提供一种能够满足用户对各种语言采集需求的基于地理位置信息的语言采集方法及系统。
[0004]为达到发明目的,提供一种语言采集方法,所述方法包括:
[0005]获取被采集人输入的语言信息;
[0006]获取被采集人所在位置的地理位置信息;
[0007]根据所述地理位置信息获得所述被采集人所在位置对应的语言类型;
[0008]将所述语言类型作为所述语言信息的语言类型。
[0009]在其中一个实施例中,所述获取被采集人所在位置的地理位置信息的步骤包括:
[0010]对所述被采集人进行定位,获得所述被采集人所在位置的所述地理位置信息。
[0011]在其中一个实施例中,所述根据所述地理位置信息获得所述被采集人所在位置对应的语言类型的步骤包括:
[0012]根据所述地理位置信息查询语言类型空间数据库,其中,所述语言类型空间数据库中预存有多个地理区域及所述地理区域对应的语言类型;
[0013]从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域;
[0014]从所述语言类型空间数据库中根据所述地理区域获得相应的所述语言类型,并将所述语言类型作为所述被采集人所在位置对应的所述语言类型。
[0015]在其中一个实施例中,所述将所述语言类型作为所述语言信息的语言类型的步骤之后还包括:
[0016]将所述语言信息加入到所述语言类型对应的语言数据库中。
[0017]在其中一个实施例中,所述从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域的步骤包括:
[0018]将所述被采集人所在位置与所述语言类型空间数据库中的所述地理区域的地理范围进行比较;
[0019]若所述被采集人所在位置在第一地理区域的地理范围内,则所述被采集人所在位置所属的地理区域为所述第一地理区域。
[0020]本发明还提供一种语言采集系统,所述系统包括:
[0021]语言信息采集模块,用于采集需要采集的语言信息;
[0022]地理位置信息获取模块,用于获取被采集人所在位置的地理位置信息;
[0023]语言类型获取模块,用于根据所述地理位置信息获得所述被采集人所在位置对应的语言类型;
[0024]语言类型作为模块,用于将所述语言类型作为所述语言信息的语言类型。
[0025]在其中一个实施例中,所述地理位置信息获取模块包括:
[0026]定位单元,用于对所述被采集人进行定位,获得所述被采集人所在位置的所述地理位置信息。
[0027]在其中一个实施例中,所述语言类型获取模块包括:
[0028]查询单元,用于根据所述地理位置信息查询语言类型空间数据库,其中,所述语言类型空间数据库中预存有多个地理区域及所述地理区域对应的语言类型;
[0029]匹配单元,用于从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域;
[0030]语言类型获得单元,用于从所述语言类型空间数据库中根据所述地理区域获得相应的所述语言类型,并将所述语言类型作为所述被采集人所在位置对应的所述语言类型。
[0031]在其中一个实施例中,还包括:
[0032]语言信息加入模块,用于将所述语言信息加入到所述语言类型对应的语言数据库中。
[0033]在其中一个实施例中,所述匹配单元包括:
[0034]比较子单元,用于将所述被采集人所在位置与所述语言类型空间数据库中的所述地理区域的地理范围进行比较,若所述被采集人所在位置在第一地理区域的地理范围内,则所述被采集人所在位置所属的地理区域为所述第一地理区域。
[0035]本发明的有益效果包括:
[0036]上述基于地理位置信息的语言采集方法及系统,根据被采集人所在位置的地理位置信息自动获得需要采集的语言信息的语言类型,无需用户指定输入的语言信息的语言类型,也无需系统自动检测少数几种通用的国际语言类型,就能获得语言信息的语言类型,使得用户的语言采集成功,克服传统语言采集系统易导致用户对语言采集失败的缺陷,满足用户对各种语言的采集需求。
【附图说明】
[0037]图1为一个实施例中的语言采集方法的流程示意图;
[0038]图2为另一个实施例中的语言采集方法的流程示意图;
[0039]图3为又一个实施例中的语言采集方法的流程示意图;
[0040]图4为一个实施例中的语言采集系统的结构示意图。
【具体实施方式】
[0041]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明基于地理位置信息的语言采集方法及系统进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0042]在一个实施例中,如图1所示,提供了一种语言采集方法,该方法包括以下步骤:
[0043]SlOO,获取被采集人输入的语言信息。
[0044]S200,获取被采集人所在位置的地理位置信息。
[0045]S300,根据地理位置信息获得被采集人所在位置对应的语言类型。
[0046]S400,将语言类型作为语言信息的语言类型。
[0047]S400,根据语言类型将采集的语言信息加入到相应的语言数据库中。
[0048]本实施例中,根据被采集人所在位置的地理位置信息获得相应的语言类型,然后将得到的语言类型作为被采集人输入的语言信息的语言类型,以便于将语言信息加入到相应的语言数据库中,完成语言信息的采集。由于其是根据被采集人所在位置的地理位置信息自动获得需要采集的语言信息的语言类型的,因此无需用户指定被采集人输入的语言信息的语言类型,也无需系统自动检测少数几种通用的国际语言类型,就能自动得到被采集人输入的语言信息的语言类型,使得用户的语言采集成功,克服传统语言采集系统易导致用户对语言采集失败的缺陷,满足用户对各种语言的采集需求。
[0049]其中,语言采集是对语言的语音、文本等的标本和资料的采集。如:普通话语音标本的采集、普通话文本标本的采集;藏语方言语音标本的采集、藏语方言文本标本的采集;法语语音标本的采集、法语文本标本的采集等。
[0050]在一个实施例中,参见图2,步骤S200包括:
[0051]S210,对被采集人进行定位,获得被采集人所在位置的地理位置信息。
[0052]该实施例是获取被采集人所在位置的地理位置信息的一个【具体实施方式】,在被采集人不知其所在的具体地理位置信息时,可以采用移动定位系统(如GPS ,GlobalPosit1ning System,全球定位系统)对其进行移动定位,从而获得准确的被采集人的所在位置。当然,在另外一个实施例中,若被采集人知道自己的所在位置,也可直接输入其所在的地理位置信息。
[0053]其中,被采集人所在位置的地理位置信息中包括被采集人所在位置;被采集人的所在位置可以是经玮度,也可以是地名,或者是其他能够标志地理位置的信息形式。
[0054]在一个实施例中,参见图3,步骤S300包括:
[0055]S310,根据地理位置信息查询语言类型空间数据库。其中,语言类型空间数据库中预存有多个地理区域及地理区域对应的语言类型。
[0056]S320,从语言类型空间数据库中匹配出被采集人所在位置所属的地理区域。
[0057]S330,从语言类型空间数据库中根据地理区域获得相应的语言类型,并将语言类型作为被采集人所在位置对应的语言类型。
[0058]预先建立语言类型空间数据库,该语言类型空间数据库中包括多个地理区域及地理区域对应的语言类型。在获得被采集人所在位置的地理位置信息之后,查询语言类型空间数据库,并从语言类型空间数据库中匹配出地理位置信息对应的地理区域,进而获得被采集人所在位置的语言类型,并将该语言类型作为被采集人输入的语言信息的语言类型,系统自动给出该地理位置的语言信息所属的语言类型,用户无需指定语言信息的语言类型,也无需系统自动检测少数几种通用的国际语言类型,克服传统技术易导致语言采集失败的缺陷,满足用户对各种语言的采集需求。
[0059]其中,地理区域包括地理区域对应的地理范围信息。便于确定被采集人所在位置所属的地理区域。
[0060]在一个实施例中,步骤S400之后,还包括:
[0061]S500,将语言信息加入到语言类型对应的语言数据库中。
[0062]在得到系统自动给出被采集人在所在位置采集的语言信息对应的语言类型后,将语言信息加入到该语言类型对应的语言数据库中,完成语言信息的采集。
[0063]在一个实施例中,步骤S320包括:
[0064]S321,将被采集人所在位置与语言类型空间数据库中的地理区域的地理范围进行比较。
[0065]S322,若被采集人所在位置在第一地理区域的地理范围内,则被采集人所在位置所属的地理区域为第一地理区域。
[0066]在建立语言类型空间数据库时,为了简化系统设计的复杂度,将具有一定特性的地理范围划分为一个地理区域,在获得被采集人所在位置的地理位置信息后,将地理位置信息与语言类型空间数据库中的地理区域的地理范围进行比较,若该地理位置信息属于某个地理区域的地理范围之内,则将该地理区域作为被采集人所在位置的地理区域,由于每个地理区域都对应有相应的语言类型,因此在获得地理区域之后便能获得相应的语言类型,简单方便,易于实施。
[0067]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
[0068]在一个实施例中,如图4所示,还提供了一种语言采集系统,该系统包括:语言信息采集模块100,用于采集需要采集的语言信息。地理位置信息获取模块200,用于获取被采集人所在位置的地理位置信息。语言类型获取模块300,用于根据地理位置信息获得被采集人所在位置对应的语言类型。语言类型作为模块400,用于将语言类型作为语言信息的语言类型。
[0069]本实施例中的语言采集系统,根据被采集人所在位置的地理位置信息自动获得需要采集的语言信息的语言类型,无需用户指定输入的语言信息的语言类型,也无需系统自动检测少数几种通用的国际语言类型,就能获得语言信息的语言类型,使得用户的语言采集成功,克服传统语言采集系统会导致用户对语言采集失败的缺陷,满足用户对各种语言的米集需求。
[0070]在一个实施例中,地理位置信息获取模块200包括:定位单元210,用于对被采集人进行定位,获得被采集人的所在位置的地理位置信息。
[0071 ]在一个实施例中,语言类型获取模块300包括:查询单元310,用于根据地理位置信息查询语言类型空间数据库,其中,语言类型空间数据库中预存有多个地理区域及地理区域对应的语言类型。匹配单元320,用于从语言类型空间数据库中匹配出被采集人所在位置所属的地理区域。语言类型获得单元330,用于从语言类型空间数据库中根据地理区域获得相应的语言类型,并将语言类型作为被采集人所在位置对应的语言类型。其中,地理区域包括地理范围信息。
[0072]在一个实施例中,还包括:语言信息加入模块500,用于将语言信息加入到语言类型对应的语言数据库中。
[0073]在一个实施例中,匹配单元320包括:比较子单元321,用于将被采集人所在位置与语言类型空间数据库中的地理区域的地理范围进行比较,若被采集人所在位置在第一地理区域的地理范围内,则被采集人所在位置所属的地理区域为第一地理区域。
[0074]由于此系统解决问题的原理与前述一种语言采集方法相似,因此该系统的实施可以参见前述方法的实施,重复之处不再赘述。
[0075]以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0076]以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
【主权项】
1.一种语言采集方法,其特征在于,所述方法包括: 获取被采集人输入的语言信息; 获取被采集人所在位置的地理位置信息; 根据所述地理位置信息获得所述被采集人所在位置对应的语言类型; 将所述语言类型作为所述语言信息的语言类型。2.根据权利要求1所述的语言采集方法,其特征在于,所述获取被采集人所在位置的地理位置信息的步骤包括: 对所述被采集人进行定位,获得所述被采集人所在位置的所述地理位置信息。3.根据权利要求1所述的语言采集方法,其特征在于,所述根据所述地理位置信息获得所述被采集人所在位置对应的语言类型的步骤包括: 根据所述地理位置信息查询语言类型空间数据库,其中,所述语言类型空间数据库中预存有多个地理区域及所述地理区域对应的语言类型; 从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域; 从所述语言类型空间数据库中根据所述地理区域获得相应的所述语言类型,并将所述语言类型作为所述被采集人所在位置对应的所述语言类型。4.根据权利要求1所述的语言采集方法,其特征在于,所述将所述语言类型作为所述语言信息的语言类型的步骤之后还包括: 将所述语言信息加入到所述语言类型对应的语言数据库中。5.根据权利要求4所述的语言采集方法,其特征在于,所述从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域的步骤包括: 将所述被采集人所在位置与所述语言类型空间数据库中的所述地理区域的地理范围进行比较; 若所述被采集人所在位置在第一地理区域的地理范围内,则所述被采集人所在位置所属的地理区域为所述第一地理区域。6.一种语言采集系统,其特征在于,所述系统包括: 语言信息获取模块,用于获取被采集人输入的语言信息; 地理位置信息获取模块,用于获取被采集人所在位置的地理位置信息; 语言类型获取模块,用于根据所述地理位置信息获得所述被采集人所在位置对应的语言类型; 语言类型作为模块,用于将所述语言类型作为所述语言信息的语言类型。7.根据权利要求6所述的语言采集系统,其特征在于,所述地理位置信息获取模块包括: 定位单元,用于对所述被采集人进行定位,获得所述被采集人所在位置的所述地理位置信息。8.根据权利要求6所述的语言采集系统,其特征在于,所述语言类型获取模块包括: 查询单元,用于根据所述地理位置信息查询语言类型空间数据库,其中,所述语言类型空间数据库中预存有多个地理区域及所述地理区域对应的语言类型; 匹配单元,用于从所述语言类型空间数据库中匹配出所述被采集人所在位置所属的地理区域; 语言类型获得单元,用于从所述语言类型空间数据库中根据所述地理区域获得相应的所述语言类型,并将所述语言类型作为所述被采集人所在位置对应的所述语言类型。9.根据权利要求8所述的语言采集系统,其特征在于,还包括: 语言信息加入模块,用于将所述语言信息加入到所述语言类型对应的语言数据库中。10.根据权利要求9所述的语言采集系统,其特征在于,所述匹配单元包括: 比较子单元,用于将所述被采集人所在位置与所述语言类型空间数据库中的所述地理区域的地理范围进行比较,若所述被采集人所在位置在第一地理区域的地理范围内,则所述被采集人所在位置所属的地理区域为所述第一地理区域。
【文档编号】G06F17/30GK105843944SQ201610216974
【公开日】2016年8月10日
【申请日】2016年4月8日
【发明人】朱定局
【申请人】华南师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1