一种站点名称的分词显示方法及装置与流程

文档序号:11918479阅读:258来源:国知局
一种站点名称的分词显示方法及装置与流程

本发明涉及交通信息领域,具体涉及一种站点名称的分词显示方法及装置。



背景技术:

公交电子站牌终端一般采用LCD液晶屏或者LED屏,用于显示实时公交到站信息,而静态的线路和站点信息则通过打印的纸质牌显示。由于公交线路站点变更较为频繁,使更新纸质线路牌工作量大,且效率低。LCD液晶屏不仅可以显示实时的公交到站信息还可以显示静态公交线路和站点的数据,当线路站点变更时,可以通过网络进行在线更新,这样既提高了更新速度,也节省了大量的工作量。因此,目前大多数公交电子站牌采用LCD屏进行显示。

然而,LCD屏的空间有限,预留给显示公交线路和站点名称的空间是一定的,当有的站点名称过长时,会出现显示不全的现象,针对这种现象一般采用滚动显示或局部翻页的方案解决。但无论哪种方案都会涉及到站点名称分词的问题。

现有的针对公交站点名称的分词方法一般都是按照字数进行简单截断,但是这样会使得截断后的词意表达不清楚,误导乘客。

分词是进行信息处理、信息检索的基础,所有的信息处理、信息检索工作都是在分词之后进行的。因此,分词的错误会被叠加到后续的处理过程中,而且很难被消除。由于中文没有明确的词的定义、词和词之间没有分隔符的特性,导致分词很难做到100%的准确。尤其是针对公交站点名称的分词方法,完全不能满足公交站点名称个性化的分词需求。

鉴于此,如何提出一种方法,可准确合理地将公交站点名称进行分词显示,具有十分重要的意义。



技术实现要素:

针对现有技术中的缺陷,本发明实施例提供一种站点名称的分词显示方法及装置。

一方面,本发明实施例提出一种站点名称的分词显示方法,包括:

根据预先确定的目标站点名称的各目标分词组,以及所述各目标分词组中各分词的词频,获取所述各目标分词组的权重值;

根据所述各目标分词组的权重值,以及预设的站点名称显示规则,显示目标站点名称;

其中,所述目标站点名称为字数大于预设的每行或每列显示字数的站点名称,所述各目标分词组为所述目标站点的各分词组。

本发明实施例提供的站点名称的分词显示方法,由于可根据目标分词组中各分词的词频,获取各目标分词组的权重值,并据此对目标分词组进行显示,因此,可确保显示最准确的目标分词组,进而合理地将例如公交站点名称进行分词显示。

另一方面,本发明实施例还提出一种站点名称的分词显示装置,包括:

权重获取模块,用于根据预先确定的目标站点名称的各目标分词组,以及所述各目标分词组中各分词的词频,获取所述各目标分词组的权重值;

名称显示模块,用于根据所述各目标分词组的权重值,以及预设的站点名称显示规则,显示目标站点名称;

其中,所述目标站点名称为字数大于预设的每行或每列显示字数的站点名称,所述各目标分词组为所述目标站点的各分词组。

本发明实施例提供的站点名称的分词显示装置,由于可根据目标分词组中各分词的词频,获取各目标分词组的权重值,并据此对目标分词组进行显示,因此,可确保显示最准确的目标分词组,进而合理地将例如公交站点名称进行分词显示。

附图说明

图1为本发明站点名称的分词显示方法实施例的流程示意图;

图2为本发明站点名称的分词显示装置实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明站点名称的分词显示方法实施例的流程示意图,参看图1,本实施例公开一种站点名称的分词显示方法,包括:

S1、根据预先确定的目标站点名称的各目标分词组,以及所述各目标分词组中各分词的词频,获取所述各目标分词组的权重值;

S2、根据所述各目标分词组的权重值,以及预设的站点名称显示规则,显示目标站点名称;

其中,所述目标站点名称为字数大于预设的每行或每列显示字数的站点名称,所述各目标分词组为所述目标站点的各分词组。

本发明实施例提供的站点名称的分词显示方法,由于可根据目标分词组中各分词的词频,获取各目标分词组的权重值,并据此对目标分词组进行显示,因此,可确保显示最准确的目标分词组,进而合理地将公交站点名称进行分词显示。

需要说明的是,本发明方法实施例的执行主体为计算机。

具体地,所述预设的每行或每列显示字数可根据站点的LCD显示屏或LED显示屏的物理大小、分辨率、显示字体大小等确定。当然,预设的每行或每列显示字数也可以根据实际的应用情景、应用对象以及其他实际需要进行设置,本施例对此不作限定。

下面以预设区域为北京市、目标站点名称为“北京西站南广场”、某一站点的LED显示屏每列显示3个字为预设的每行或每列显示字数为例,对步骤S1-S2进行举例说明:

进一步地,在步骤S1中,所述各目标分词组中各分词的词频可通过以下方式获取:

S11、获取预设区域内所有站点名称,并根据预设的分词规则,对各站点名称进行分词,以获取各站点名称的各分词;

S12、统计各分词在所有站点名称中的词频,进而获取各目标分词组中各分词的词频;其中,所述词频为分词在所有站点名称中出现的频率。

首先,获取北京市内所有公交站点的名称,并根据预设的分词规则,例如开源分词中的单字符切分、正向最大匹配算法等,对收集到的北京市内的所有公交站点的名称进行分词,从而获取各站点名称的各个分词。

在获取到各站点名称的各个分词后,则统计各分词在所有站点名称中的词频,进而获取各目标分词组中各分词的词频。

以目标站点名称“北京西站南广场”为例,其经过预设的分词规则,被分为三组目标分词组:A组“北京西站、南广场”、B组“北京、西站、南广场”以及C组“北京西站南,广场”。而根据统计,“北京西站”在所有站点名称中的词频为0.3%,“南广场”为0.01%,“北京”为0.2%,“西站”为0.02%,“北京西站南”为0.01%以及“广场”为0.1%。因此,目标分词组A组中的词频为:“北京西站”0.3%、“南广场”0.01%;目标分词组B组中的词频为:“北京”0.2%、“西站”0.02%、“南广场”0.01%;目标分词组C组中的词频为:“北京西站南”0.01%、“广场”0.1%。

进一步地,在步骤S1中,所述获取所述各目标分词组的权重值包括:

S121、根据所述各目标分词组中各分词的词频,确定对应的各目标分词组中各分词的权重值;

S122、根据各目标分词组中各分词的权重值之和,确定对应的各目标分词组的权重值。

具体地,可将各分词的权重值设为:分词权重值=分词词频*100,则A组中各分词的权重值为:“北京西站”0.3、“南广场”0.01;B组中各分词的权重值为:“北京”0.2、“西站”0.02以及“南广场”0.01;C组中各分词的权重值为“北京西站南”0.01以及“广场”0.1。

在确定各目标分词组中各分词的权重值后,则A组的权重值为0.3+0.01=0.31;B组的权重值为0.2+0.02+0.01=0.23;C组的权重值为0.01+0.1=0.11。

进一步地,在步骤S2中,所述根据所述各目标分词组的权重值,以及预设的站点名称显示规则,显示目标站点名称包括:

S21、根据所述各目标分词组的权重值大小,依次对所述各目标分词组进行判断,直到确定满足预设条件的目标分词组;

S22、根据预设的站点名称显示规则,对满足预设条件的目标分词组中的各分词进行显示;

其中,所述预设条件包括:目标分词组中的各分词的字数,均不大于预设的每行或每列显示字数。

具体地,根据权重值的大小(A组0.31>B组0.23>C组0.11),首先对A组进行判断,由于A组中“北京西站”的字数为4,而预设的每行或每列显示字数为3,A组中有分词的字数大于预设的每行或每列显示字数,因此A组不满足预设条件。

在完成对A组的判断后,再对B组进行判断,由于B组中“北京”、“西站”以及“南广场”的字数均不大于3,因此B组满足预设条件,从而根据预设的站点名称显示规则,对B组中的各分词进行显示。

其中,所述预设的站点名称显示规则包括:

依次显示目标分词组中的各分词,若下一待显示的分词字数大于当前行或当前列剩余的显示字数,则在下一行或下一列显示所述下一待显示的分词,直到显示完目标分词组中的各分词。具体地,首先在第一列显示“北京”,显示完“北京”后,该列还剩余显示字数为1,而下一待显示的分词“西站”的字数为2,因此下一待显示的分词的字数2大于该列剩余显示字数1,则将“西站”在第二列显示,同样地,下一待显示的分词的字数3(“南广场”)大于该第二列剩余显示字数1,则将“南广场”在第三列显示,至此,目标分词组B组中的各分词显示完毕,则可结束对站点名称“北京西站南广场”的显示。

本发明实施例提出的站点名称的分词显示方法,由于根据各分词的词频,确定了各分词组的权重,因此,可确保所选分词组为最准确的分词组。另一方面,由于在对分词进行显示时,将分词组内的各分词完整地显示,避免了对站点名称生硬的拆分,从而使显示出的站点名称更容易使人理解,进而提高了乘客的服务体验。

图2为本发明站点名称的分词显示装置实施例的结构示意图,参看图2,本实施例提供一种站点名称的分词显示装置,包括:

权重获取模块1,用于根据预先确定的目标站点名称的各目标分词组,以及所述各目标分词组中各分词的词频,获取所述各目标分词组的权重值;

名称显示模块2,用于根据所述各目标分词组的权重值,以及预设的站点名称显示规则,显示目标站点名称;

其中,所述目标站点名称为字数大于预设的每行或每列显示字数的站点名称,所述各目标分词组为所述目标站点的各分词组。

本发明实施例提供的站点名称的分词显示装置,由于可根据目标分词组中各分词的词频,获取各目标分词组的权重值,并据此对目标分词组进行显示,因此,可确保显示最准确的目标分词组,进而合理地将例如公交站点名称进行分词显示。

具体地,所述预设的每行或每列显示字数可根据站点的LCD显示屏或LED显示屏的物理大小、分辨率、显示字体大小等确定。当然,预设的每行或每列显示字数也可以根据实际的应用情景、应用对象以及其他实际需要进行设置,本施例对此不作限定。

下面以预设区域为北京市、目标站点名称为“北京西站南广场”、某一站点的LED显示屏每列显示3个字为预设的每行或每列显示字数为例,对所述装置进行举例说明:

进一步地,所述权重获取模块1还用于:

获取预设区域内所有站点名称,并根据预设的分词规则,对各站点名称进行分词,以获取各站点名称的各分词;

统计各分词在所有站点名称中的词频,进而获取各目标分词组中各分词的词频;其中,所述词频为分词在所有站点名称中出现的频率。

首先,权重获取模块1获取北京市内所有公交站点的名称,并根据预设的分词规则,例如开源分词中的单字符切分、正向最大匹配算法等,对收集到的北京市内的所有公交站点的名称进行分词,从而获取各站点名称的各个分词。

权重获取模块1在获取到各站点名称的各个分词后,统计各分词在所有站点名称中的词频,进而获取各目标分词组中各分词的词频。

以目标站点名称“北京西站南广场”为例,其经过预设的分词规则,被分为三组目标分词组:A组“北京西站、南广场”、B组“北京、西站、南广场”以及C组“北京西站南,广场”。而根据统计,“北京西站”在所有站点名称中的词频为0.3%,“南广场”为0.01%,“北京”为0.2%,“西站”为0.02%,“北京西站南”为0.01%以及“广场”为0.1%。因此,目标分词组A组中的词频为:“北京西站”0.3%、“南广场”0.01%;目标分词组B组中的词频为:“北京”0.2%、“西站”0.02%、“南广场”0.01%;目标分词组C组中的词频为:“北京西站南”0.01%、“广场”0.1%。

所述权重获取模块1还具体用于:

根据所述各目标分词组中各分词的词频,确定对应的各目标分词组中各分词的权重值;

根据各目标分词组中各分词的权重值之和,确定对应的各目标分词组的权重值。

具体地,可将各分词的权重值设为:分词权重值=分词词频*100,则A组中各分词的权重值为:“北京西站”0.3、“南广场”0.01;B组中各分词的权重值为:“北京”0.2、“西站”0.02以及“南广场”0.01;C组中各分词的权重值为“北京西站南”0.01以及“广场”0.1。

在确定各目标分词组中各分词的权重值后,则A组的权重值为0.3+0.01=0.31;B组的权重值为0.2+0.02+0.01=0.23;C组的权重值为0.01+0.1=0.11。

进一步地,所述名称显示模块2具体用于:

根据所述各目标分词组的权重值大小,依次对所述各目标分词组进行判断,直到确定满足预设条件的目标分词组;

根据预设的站点名称显示规则,对满足预设条件的目标分词组中的各分词进行显示;

其中,所述预设条件包括:目标分词组中的各分词的字数,均不大于预设的每行或每列显示字数。

具体地,所述名称显示模块2根据权重值的大小(A组0.31>B组0.23>C组0.11),首先对A组进行判断,由于A组中“北京西站”的字数为4,而预设的每行或每列显示字数为3,A组中有分词的字数大于预设的每行或每列显示字数,因此A组不满足预设条件。

在完成对A组的判断后,所述名称显示模块2再对B组进行判断,由于B组中“北京”、“西站”以及“南广场”的字数均不大于3,因此B组满足预设条件,从而根据预设的站点名称显示规则,对B组中的各分词进行显示。

所述名称显示模块2还具体用于:

依次显示目标分词组中的各分词,若下一待显示的分词字数大于当前行或当前列剩余的显示字数,则在下一行或下一列显示所述下一待显示的分词,直到显示完目标分词组中的各分词。具体地,所述名称显示模块2首先在LED显示屏的第一列显示“北京”,显示完“北京”后,该列还剩余显示字数为1,而下一待显示的分词“西站”的字数为2,因此,下一待显示的分词的字数2大于该列剩余显示字数1,则将“西站”在第二列显示,同样地,下一待显示的分词的字数3(“南广场”)大于该第二列剩余显示字数1,则将“南广场”在第三列显示,至此,目标分词组B组中的各分词显示完毕,则可结束对站点名称“北京西站南广场”的显示。

本发明实施例提出的站点名称的分词显示装置,由于根据各分词的词频,确定了各分词组的权重,因此,可确保所选分词组为最准确的分词组。另一方面,由于在对分词进行显示时,将分词组内的各分词完整地显示,避免了对站点名称生硬的拆分,从而使显示出的站点名称更容易使人理解,进而提高了乘客的服务体验。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1