数据文件的排序方法

文档序号:6505246阅读:166来源:国知局
数据文件的排序方法
【专利摘要】本发明提供一种数据文件的排序方法,适用于电子装置,排序方法包括:从多个数据文件的内容中撷取多个关键词;通过搜寻引擎检索多个关键词所对应的关键词排名;搜寻多个关键词所对应的关键词类别;以及依据多个关键词、多个关键词各自的关键词排名与关键词类别以及多个数据文件各自的目前排名,以产生排序演算法,其中,排序演算法用以计算另一数据文件的预测排名,以排序此另一数据文件。
【专利说明】数据文件的排序方法

【技术领域】
[0001] 本发明涉及一种数据处理方法,特别是涉及一种数据文件的排序方法。

【背景技术】
[0002] 藉由科技的发展,网络已成为现代人生活中不可的或缺的信息取得媒介,尤其是 网络新闻的发展与普及,不仅可取代纸张来符合现今环保的潮流,还可因应瞬息万变的时 事而立即更新新闻讯息。
[0003] 信息爆炸的时代来临,庞大的网络新闻数量亦可造成使用者阅读以及搜索讯息时 的困扰。为了让使用者快速地撷取重要信息,网络新闻的业者通常藉由人工编辑来进行重 点新闻的排序,此举不仅费时费力,重点新闻的排序顺位更有可能受到人工编辑的主观因 素影响而失去其客观性。
[0004] 然而,由于新闻内容本身具有复杂的数据讯息,因此藉由机器来对重点新闻进行 顺位排序的自动化并非一件容易的事情。


【发明内容】

[0005] 本发明提供一种数据文件的排序方法,藉由对已知排序结果的数据文件的内容进 行分析,来产生出排序结果的预测模型,从而减少藉由人工编辑来排序数据文件的负担,或 是可避免人工编辑在排序数据文件时的主观因素。
[0006] 本发明提供一种数据文件的排序方法,适用于电子装置,排序方法包括:从多个数 据文件的内容中撷取多个关键词;通过搜寻引擎检索多个关键词所对应的关键词排名;搜 寻多个关键词所对应的关键词类别;以及依据多个关键词、多个关键词各自的关键词排名 与关键词类别以及多个数据文件各自的目前排名,以产生排序演算法,其中,排序演算法用 以计算另一数据文件的预测排名,以排序另一数据文件。
[0007] 本发明提供一种数据文件的排序方法,适用于电子装置,包括:从第一数据文件 的内容中撷取至少一第一关键词;通过搜寻引擎检索至少一第一关键词所对应的关键词 排名;搜寻至少一第一关键词所对应的关键词类别;以及将至少一第一关键词、至少一第 一关键词各自的关键词排名与关键词类别输入排序演算法,来输出第一数据文件的预测排 名,以排序第一数据文件,其中,排序演算法是依据多个第二数据文件的内容以及多个第二 数据文件各自的目前排名而产生。
[0008] 基于上述,本发明藉由多个数据文件中的关键词、关键词排名、关键词类别以及多 个数据文件的已知目前排名,来产生排序演算法,并可利用排序演算法来计算另一数据文 件的预测排名,以排序另一数据文件。
[0009] 为使本发明的上述特征和优点能更明显易懂,下文特举实施例,并结合附图详细 说明如下。

【专利附图】

【附图说明】
[0010] 图1为根据本发明的多个实施例的电子装置以及伺服器的方块图。
[0011] 图2为根据本发明的一实施例的讯息通知装置的方块图。
[0012] 图3为根据本发明的一实施例的讯息通知方法的流程图。
[0013] 图4为根据本发明的另一实施例的讯息通知方法的流程图。
[0014] 图5是根据本发明的一实施例的地标数据的显示方法的流程图。
[0015] 图6是根据本发明的另一实施例的地标数据的显示方法的流程图。
[0016] 图7为根据本发明的另一实施例的地标数据的显示方法的流程图。
[0017] 图8为根据本发明的另一实施例的地标数据的显示方法的流程图。
[0018] 图9为根据本发明的一实施例的数据文件的地域标记装置的方块图。
[0019] 图10为根据本发明的一实施例的数据文件的地域标记方法的流程图。
[0020] 图11为根据本发明的一实施例的树状结构的示意图。
[0021] 图12为根据本发明的另一实施例的数据文件的地域标记方法的流程图。
[0022] 图13A?图13D为根据本发明的一实施例的树状结构的建构过程的示意图。
[0023] 图14为根据本发明的一实施例的数据文件的排序方法的流程图。
[0024] 图15为根据本发明的一实施例的数据文件的排序方法的流程图。
[0025] 附图符号说明
[0026] 101:电子装置
[0027] 103 :伺服器
[0028] 200 :讯息通知装置
[0029] 210 :通讯单元
[0030] 23〇 :储存单元
[0031] 250 :播放单元
[0032] 270 :陀螺仪
[0033] 29〇 :控制单元
[0034] S310?S330 :讯息通知方法的步骤
[0035] S401、S402、S310?S330 :讯息通知方法的步骤
[0036] S510?S550、S541?S542、S710?S740、S731?S733 :地标数据的显示方法的 步骤
[0037] 900 :地域标记装置
[0038] 910 :分类单元
[0039] 93〇 :撷取单元
[0040] %0 :比对单元
[0041] 970 :标记单元
[0042] 990 :储存数据库
[0043] S1010?S1040 :地域标记方法的步骤
[0044] S1011 ?S1013、S1021 ?S1022、S1031 ?S1033 及 S1041 ?S1042 :地域标记方 法的步骤
[0045] 1301 ?1304 :第二节点
[0046] S1410?S1430、S1440、S1441、S1442及S1450 :数据文件的排序方法的步骤

【具体实施方式】
[0047] 图1为根据本发明的一实施例的电子装置101以及伺服器103的方块图。伺服器 103可以是个人计算机、工作站、主机计算机或是各种其他类型的计算机或处理器。电子装 置101可以是笔记型计算机、平板计算机、个人数字助理、智能型手机或是各种其他类型的 便携式电子装置。电子装置101可通过网络来与伺服器103通讯。在本实施例的叙述中, 将以讯息通知装置200来代表电子装置101的举例。换句话说,电子装置101与讯息通知 装置200可为实质上相等同并可互换的装置。
[0048] 当使用者欲对讯息通知装置200设定所欲关注的信息种类时,使用者可先藉由讯 息通知装置200来发出请求信息。例如,〃如果有最新的日本核事故新闻,马上告诉我"、 〃如果我的自选股中有股票涨跌超过2%,就马上通知我〃或者是〃如果第三十六期彩卷开 出来了马上通知我"等。在本发明实施例中,使用者可藉由语音说话的方式来输入请求信 息至讯息通知装置200。讯息通知装置200可通过各种类型的自然语言处理模块来判别请 求信息的可能意图,或者是可更进一步藉由对储存有大量字词的结构化数据库进行检索以 判别所撷取出的关键字词的属性,藉以对此请求信息进行分析与理解后,可得知对应的命 令条件,并将此命令条件传送至伺服器103。举例来说,命令条件可以是〃有最新的日本核 事故新闻产生〃、〃特定股票涨幅超过2%〃或者是〃第三十六期彩卷开奖〃。伺服器103即 可根据此命令条件,来查询是否具备对应的提示讯息,例如,〃最新的日本核事故新闻的内 容"、"特定股票的股价"或者是"第三十六期彩卷的中奖号码"。在本发明实施例中,可 藉由讯息通知装置200来对请求信息进行分析与理解。在本发明的另一实施例中,讯息通 知装置200亦可将请求信息传送至伺服器103以藉由伺服器103中的各种类型的自然语言 处理模块来判别请求信息的可能意图。或者是,可更进一步藉由对储存有大量字词的结构 化数据库进行检索以判别所撷取出的关键字词的属性,藉以对所撷取出的关键字词进行分 析及理解。伺服器103在查询是否具备满足命令条件的对应提示讯息之后,若判断有具备 满足命令的相关条件时,讯息通知装置200可接着将对应提示讯息下载并储存,接者可将 其播放出来。在本发明实施例的概念中,由于是藉由伺服器103来定期(或即时)记录使 用者所设定其欲关注的信息种类的最新信息,藉以在接收到命令条件时查询对应的提示讯 息,因此,相对于藉由讯息通知装置200来定期(或即时)记录使用者所设定其欲关注的信 息种类的最新信息而言,本发明可进一步降低讯息通知装置200的耗电量与工作量。
[0049] 在本发明实施例中,伺服器103可查询在特定时间间隔内满足命令条件的对应提 示讯息。此特定时间间隔可以是使用者设定的某一段时间间隔,也可以是在使用者离开讯 息通知装置200其间的时间间隔。举例来说,使用者可因洗澡或忘了带出门等因素,而将讯 息通知装置200留在桌上;在经过了特定时间间隔后,使用者又再度回到桌边而拿起了讯 息通知装置200。此时,由于在离开讯息通知装置200其间可能有使用者所关注的信息种类 的最新消息发生,因此讯息通知装置200可对应此特定时间间隔的起始时间与终止时间, 来将其对应的提示讯息从伺服器103下载并储存,并接着播放出来以提醒使用者。下列将 对此进一步详述。
[0050] 图2为根据本发明的一实施例的讯息通知装置的方块图。如图2所示,讯息通知 装置200包括通讯单元210、储存单元230、播放单元250、陀螺仪270以及控制单元290。 控制单元290耦接于通讯单元210、储存单元230、播放单元250以及陀螺仪270。通讯单 元210用以和伺服器103通讯,储存单元230用以储存数据,播放单元250用以播放讯息, 陀螺仪270用以检测讯息通知装置200的角速度。通讯单元210可以是无线通讯芯片或模 块,或是其他具有网络连线功能的芯片或模块。储存单元230可以是各种类型的数据储存 媒介。播放单元250可以是各种类型的数据播放装置,例如扬声器、显示器或是其他的数据 输出装置。控制单元290可以是各种类型的功能模块、芯片或微处理器。图3为根据本发 明的一实施例的讯息通知方法的流程图。如图3所示,根据本发明实施例的讯息通知方法 包括步骤S310?S330。请同时参照图2及图3。
[0051] 在步骤S310中,控制单元290判断是否具备讯息通知装置200开始进入静止状态 的第一时间点(即上述的起始时间)以及终止静止状态的第二时间点(即上述的终止时 间)。举例来说,使用者可因洗澡或忘了带出门等因素,而将讯息通知装置200留在桌上,因 而讯息通知装置200在第一时间点进入了静止状态,此时,控制单元290可将第一时间点记 录于储存单元230中。过了特定时间间隔后,使用者又再度回到桌边而拿起了讯息通知装 置200,因而讯息通知装置200在第二时间点终止了静止状态,此时,控制单元290亦可将第 二时间点记录于储存单元230中。控制单元290可藉由查询储存单元230来判断是否具备 第一时间点与第二时间点。
[0052] 在步骤S320中,若控制单元290判断其具备第一时间点以及第二时间点,则伺服 器103查询是否具备第一时间点至第二时间点之间的至少一提示讯息。举例来说,若控制 单元290判断其具备第一时间点以及第二时间点,此即代表使用者可能离开了讯息通知装 置200-段时间,此时控制单元290将所得知的第一时间点与第二时间点传送至伺服器103 做查询,判断在这段时间内是否有提示讯息产生。例如,若这段时间内使用者有未接来电或 是有未读讯息,则其提示讯息可以是〃您有一通未接来电〃或是〃您有一则未读讯息"。所 述提示讯息还可以是使用者设定的关注信息,比如,热点新闻、股票或彩券等。
[0053] 在步骤S330中,若伺服器103具备至少一提示讯息,则讯息通知装置200下载此 至少一提示讯息并储存至储存单元230,且通过播放单元250来播放此至少一提示讯息。举 例来说,若在使用者所离开的第一时间点以及第二时间点之间,使用者有未接来电或是有 未读讯息,或者是有产生了股票、彩券或热点新闻的关注信息,则讯息通知装置200可将提 示讯息〃您有一通未接来电〃或是〃您有一则未读讯息",或者是对应所产生的股票、彩券 或热点新闻的具体信息下载并储存至储存单元230,并通过播放单元250来播放。在本发明 实施例中,播放单元250播放提示讯息的方式可以是播放文字或是播放影像,在此不加以 限制。
[0054] 图4为根据本发明的另一实施例的讯息通知方法的流程图。如图4所示,根据本 发明实施例的讯息通知方法包括步骤S401、S402、S410、S420及S430。请同时参照图2及 图4。
[0055] 在步骤S401中,使用者可藉由讯息通知装置200接收请求信息。举例来说,使用 者的请求信息可以是"如果有最新的日本核事故新闻,马上告诉我"、"如果我的自选股中 有股票涨跌超过2%,就马上通知我〃或者是〃如果第三十六期彩卷开出来了马上通知我〃。 如上所述,在本发明实施例中,使用者可藉由语音说话的方式来输入请求信息至讯息通知 装置200。在本发明的另一实施例中,使用者亦可藉由特定软件界面或是其他各种方式来输 入请求信息,在此不加以限制。
[0056] 在步骤S402中,撷取请求信息中的至少一关键字词,以判别请求信息的命令条件 以及设定阈值。在本发明实施例中,可藉由控制单元290来撷取请求信息中的关键字词以 进行分析及理解。在本发明的另一实施例中,亦可将请求信息传送到伺服器103,接着于伺 服器103中撷取请求信息中的关键字词以进行分析及理解。关键字词可以是使用者的关注 信息的种类、用以表达命令的字词、或是其他可用以分析及理解的预定义字词。在本发明实 施例中,控制单元290可通过各种类型的自然语言处理模块来判别请求信息的可能意图, 或者是可更进一步藉由对储存有大量字词的结构化数据库进行检索以判别所撷取出的关 键字词的属性,藉以对所撷取出的关键字词进行分析及理解,以求得请求信息中的对应的 命令条件,例如,是否有最新的日本核事故新闻产生,特定股票涨幅是否超过2%,或者是第 三十六期彩卷是否开奖。此外,控制单元290亦可藉由关键字词的分析及理解结果来求得 阈值以在步骤S410中使用。
[0057] 在步骤S410中,控制单元290根据阈值来判断是否具备讯息通知装置200进入静 止状态后的第一时间点,以及终止静止状态的第二时间点。阈值可以是时间阈值或是角速 度阈值。在本发明实施例中,控制单元290可藉由陀螺仪270来检测讯息通知装置200的角 速度,以判别讯息通知装置200是否进入静止状态以及是否终止静止状态,从而取得第一 时间点与第二时间点。举例来说,当讯息通知装置200的角速度小于角速度阈值,则控制单 元290可判定讯息通知装置200进入静止状态,而当讯息通知装置200的角速度小于角速 度阈值且其所持续的时间超过时间阈值,则控制单元290可判定使用者已离开了讯息通知 装置200,从而将此时间点设定为第一时间点。若又再过了一段时间,当讯息通知装置200 的角速度大于或等于角速度阈值时,则控制单元290可判定讯息通知装置200终止了静止 状态(即进入了移动状态),换句话说,控制单元290可判定使用者再度拿起了讯息通知装 置200,从而将此时间点设定为第二时间点。如上所述,第一时间点及第二时间点可记录于 储存单元230中。在本发明实施例中,若讯息通知装置200本身具有震动模式(例如,在有 来电或有简讯时,则讯息通知装置200会进入震动模式),则角速度阈值可大于讯息通知装 置200在震动模式下所造成的角速度,藉此,则控制单元290便不会将在震动模式下的讯息 通知装置200判定为进入了移动状态。在本发明的另一实施例中,控制单元290可藉由检 测讯息通知装置200是否进入休眠模式或者是藉由检测讯息通知装置200是否接收触控输 入讯号,来判断讯息通知装置200是否进入或终止了静止状态。
[0058] 在步骤S420中,若控制单元290判断其具备第一时间点以及第二时间点,则伺服器 103查询其是否具备第一时间点至第二时间点之间满足命令条件的至少一提示讯息。举例来 说,若在第一时间点与第二时间点之间的特定时间间隔内,发生了 "最新的日本核事故新闻 产生〃、〃特定股票涨幅超过2%〃或者是〃第三十六期彩卷开奖〃,则伺服器103可具备有提 示讯息。在本发明实施例中,提示讯息可以是对应使用者所关注信息种类的最新消息的内容 本身,例如,"最新的日本核事故新闻的报导内容"、"特定股票的股价"或者是"第三十六期 彩卷的中奖号码〃。在本发明的另一实施例中,提示讯息亦可以是用以提示使用者已产生有 其所关注信息种类的最新消息内容的讯息,例如,"提醒您,现有最新日本核事故新闻"、"亲 爱的使用者,您的XXX股票已大涨〃或者是〃第三十六期彩卷已经开奖嘞〃。
[0059] 在步骤S430中,若伺服器103具备至少一提示讯息,则讯息通知装置200下载此 至少一提示讯息并储存至储存单元230,且通过播放单元250来播放对应此至少一提示讯 息的语音。举例来说,若在使用者所离开的第一时间点以及第二时间点之间,控制单元290 通过伺服器103来判断其具备有提示讯息〃最新的日本核事故新闻的报导内容"、"特定股 票的股价〃或者是"第三十六期彩卷的中奖号码",则将此提示讯息下载并储存至储存单元 230,并通过播放单元250来播放。在本发明实施例中,播放单元250可将提示讯息的内容 以语音方式播放出来。
[0060] 综上所述,本发明可接收使用者以语音方式输入的请求信息,并撷取其关键字词 以进行判别命令条件以及设定阈值之用,在使用者离开讯息通知装置其间,可根据此阈值 (时间阈值或者角速度阈值)来检测讯息通知装置开始进入静止状态的第一时间点以及终 止静止状态的第二时间点,进而在使用者拿回讯息通知装置时,可在伺服器中查询满足命 令条件的提示讯息,并将提示讯息下载及储存至讯息通知装置,来藉由语音方式播放提示 讯息以提醒使用者,从而减少其忽略重要讯息的机率。
[0061] 下列将从另一个技术观点以及实现此技术观点的实施例,来描述电子装置101以 及伺服器103之间的运作。如图1所示,在本发明的另一实施例中,电子装置101以及伺服 器103亦可用于执行地标数据的显示方法。
[0062] 在本发明实施例中,当使用者藉由电子装置101来执行特定地标的搜寻时,可输 入地名关键字,而电子装置101便可将所输入的地名关键字传送至伺服器103中,伺服器 103对此地名关键字执行搜寻,并接着对所搜寻到的地标数据进行排序,以使较有可能符合 使用者的寻找需求的地标数据具有较高的排序顺位。最后,伺服器再将地标数据的排序结 果传送回电子装置101来显示,使用者便得以从中找寻最有益的讯息。接着,在本发明实施 例中,电子装置101可通过地图应用程序来将排序结果中的地标数据的各自的地标名称显 示出来。在本发明的另一实施例中,电子装置101本身即具有对特定地名的搜寻功能以及 对所搜寻到的地标数据进行排序的功能,因此电子装置101便无需再通过伺服器103即可 对使用者显示出地标数据的排序结果。
[0063] 地标数据可具有特定的特征化参数。举例来说,不同的地标数据可具有不同的知 名度。因此,在地标数据的排序的过程中便可产生对应的顺位关系。因此,在本发明实施例 中,在使用者藉由电子装置101输入地名关键字来执行特定地标的搜寻之前,伺服器103可 对现有的地标数据进行知名度的计算。下列将对此加以详述。
[0064] 图5是根据本发明的一实施例的地标数据的显示方法的流程图。表1是根据本发 明的一实施例的地标数据的示意图。如图5所示,根据本发明实施例的地标数据的显示方 法的步骤包括S510?S550。如表1所示,地标数据可具有地标名称、客观层级类别、地址、 地指引用次数以及对应所计算出的知名度。下列请同时参照图5及表1。
[0065] [表 1]
[0066]

【权利要求】
1. 一种数据文件的排序方法,适用于电子装置,该排序方法包括: 从多个数据文件的内容中撷取多个关键词; 通过搜寻引擎检索这些关键词所对应的关键词排名; 搜寻这些关键词所对应的关键词类别;以及 依据这些关键词、这些关键词所对应的各自的关键词排名与所对应的各自的关键词类 别以及这些数据文件各自的目前排名,以产生该排序演算法; 其中,该排序演算法用以计算另一数据文件的预测排名,以排序该另一数据文件。
2. 如权利要求1所述的排序方法,其中产生该排序演算法的步骤,还包括: 将这些关键词各自的该关键词排名以及该关键词类别设定为排序演算法的输入,并将 这些数据文件各自的该目前排名设定为该排序演算法的输出,以产生该排序演算法。
3. 如权利要求2所述的排序方法,其中该排序演算法是藉由利用模拟函数来执行,且 该模拟函数为线性函数以及非线性函数的其中之一。
4. 如权利要求3所述的排序方法,其中产生该排序演算法的步骤,还包括: 将这些关键词各自的该关键词排名以及该关键词类别设定为该模拟函数的定义域,将 这些数据文件的该目前排名设定为该模拟函数的值域,藉以产生该模拟函数。
5. 如权利要求2所述的排序方法,其中该排序演算法还包括排名权重参数以及类别权 重参数,来分别对应这些关键词各自的该关键词排名以及该关键词类别。
6. 如权利要求2所述的排序方法,其中产生该排序演算法的步骤,还包括: 将这些关键词各自的该关键词类别转换为多个关键词类别转换值。
7. 如权利要求1所述的排序方法,其中这些数据文件的内容还包括标题内容以及正文 内容。
8. -种数据文件的排序方法,适用于电子装置,包括: 从第一数据文件的内容中撷取至少第一关键词; 通过搜寻引擎检索该至少一第一关键词所对应的关键词排名; 搜寻该至少一第一关键词所对应的关键词类别;以及 将该至少一第一关键词、该至少一第一关键词各自的该关键词排名与该关键词类别输 入排序演算法,来输出该第一数据文件的预测排名,以排序该第一数据文件, 其中,该排序演算法是依据多个第二数据文件的内容以及这些第二数据文件各自的目 前排名而产生。
9. 如权利要求8所述的排序方法,其中该排序演算法还依据下列步骤而产生: 从这些第二数据文件的该内容中撷取多个第二关键词; 通过该搜寻引擎检索这些第二关键词所对应的关键词排名; 搜寻这些第二关键词所对应的关键词类别;以及 依据这些第二关键词、这些第二关键词各自的该关键词排名与该关键词类别以及这些 第二数据文件各自的目前排名,以产生该排序演算法。
10. 如权利要求9所述的排序方法,其中该排序演算法还依据下列步骤而产生: 将这些第二关键词各自的该关键词排名以及该关键词类别设定为排序演算法的输入, 并将这些第二数据文件各自的该目前排名设定为该排序演算法的输出,以产生该排序演算 法。
11. 如权利要求10所述的排序方法,其中该排序演算法是藉由利用模拟函数来执行, 且该模拟函数为线性函数以及非线性函数的其中之一。
12. 如权利要求11所述的排序方法,其中该排序演算法还依据下列步骤而产生: 将这些第二关键词各自的该关键词排名以及该关键词类别设定为该模拟函数的定义 域,将这些第二数据文件的该目前排名设定为该模拟函数的值域,藉以产生该模拟函数。
13. 如权利要求10所述的排序方法,其中该排序演算法还包括排名权重参数以及类别 权重参数,来分别对应该至少一第一关键词各自的该关键词排名以及该关键词类别。
14. 如权利要求10所述的排序方法,其中该排序演算法还依据下列步骤而产生: 将这些第二关键词各自的该关键词类别转换为多个关键词类别转换值。
15. 如权利要求1所述的排序方法,其中这些第一数据文件的该内容还包括标题内容 以及正文内容。
【文档编号】G06F17/30GK104281577SQ201310273231
【公开日】2015年1月14日 申请日期:2013年7月2日 优先权日:2013年7月2日
【发明者】张国峰, 朱逸斐 申请人:威盛电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1