数据分类及搜寻方法与流程

文档序号:12596185阅读:817来源:国知局
本案有关于一种分类及搜寻方法,尤指一种错误纪录的数据分类及搜寻方法。
背景技术
::在电子装置的测试领域中,测试部门会将电子装置于测试过程中产生的错误纪录于一数据库。当使用者欲查询某一错误状况时,可利用上述数据库中设计的字段,以进行错误状况的查询、浏览错误列表或产出报表。然而,当用户输入关键词以进行错误状况的查询时,数据库系统仅会通过存储顺序进行搜寻,而找出具有用户输入的关键词的对应错误纪录。藉由上述方式找出的错误纪录的错误纪录列表,仅以错误记录在数据库中的存储顺序为依据,因此,上述错误纪录列表所记载的错误纪录往往不是用户最关注的错误纪录。此外,数据库中存储的错误纪录均为文字描述,由于每位使用者的用字习惯不一定相同,导致数据库内的错误纪录有所差异,如此,亦会导致错误纪录列表内的错误纪录并非用户最关注的错误纪录。由此可见,上述现有的方式,显然仍存在不便与缺陷,而有待改进。为了解决上述问题,相关领域莫不费尽心思来谋求解决的道,但长久以来仍未发展出适当的解决方案。技术实现要素:
发明内容旨在提供本揭示内容的简化摘要,以使阅读者对本揭示内容具备基本的理解。此
发明内容并非本揭示内容的完整概述,且其用意并非在指出本案实施例的重要/关键组件或界定本案的范围。本案内容的一目的是在提供一种数据分类及搜寻方法,藉以改善先前技术的问题。为达上述目的,本案内容的一技术态样关于一种数据分类及搜寻方法,此数据分类及搜寻方法包含:根据多个纪录的原因字段或注记字段所包含的数据,以对该些纪录进行分类标记;根据该些纪录的概要字段所包含的数据,以产生索引;根据该些纪录的概要字段所包含的数据的类别,以对该些纪录进行权重标记;根据关键词由索引搜寻该些纪录中的多个对应纪录;以及根据该些对应纪录的权重,以由该些对应纪录中选出多个相关纪录,并列出该些 相关纪录的分类。因此,根据本案的技术内容,本案实施例提供一种数据分类及搜寻方法,藉以改善搜寻方式仅以数据库中的存储顺序为依据且用户的用字习惯有所差异,而导致搜寻到的错误纪录并非用户最关注的错误纪录的问题。在参阅下文实施方式后,本案所属
技术领域
:中具有通常知识者当可轻易了解本案的基本精神及其他发明目的,以及本案所采用的技术手段与实施态样。附图说明为让本案的上述和其他目的、特征、优点与实施例能更明显易懂,所附图式的说明如下:图1依照本案一实施方式绘示一种数据分类及搜寻方法的流程图。图2依照本案另一实施例绘示一种错误纪录的示意图。图3依照本案再一实施例绘示一种错误纪录列表及错误分类标记的示意图。图4依照本案又一实施例绘示一种错误纪录列表及错误分类百分比的示意图。根据惯常的作业方式,图中各种特征与组件并未依比例绘制,其绘制方式是为了以最佳的方式呈现与本案相关的具体特征与组件。此外,在不同图式间,以相同或相似的组件符号来指称相似的组件/部件。组件标号说明:100:方法110~160:步骤210:错误纪录310:错误纪录列表320:分类410:错误纪录列表420:分类430:错误分类百分比列表具体实施方式为了使本揭示内容的叙述更加详尽与完备,下文针对了本案的实施态样与具体实施例提出了说明性的描述;但这并非实施或运用本案具体实施例的唯一形式。实施方式中涵盖了多 个具体实施例的特征以及用以建构与操作这些具体实施例的方法步骤与其顺序。然而,亦可利用其他具体实施例来达成相同或均等的功能与步骤顺序。除非本说明书另有定义,此处所用的科学与技术词汇的含义与本案所属
技术领域
:中具有通常知识者所理解与惯用的意义相同。此外,在不和上下文冲突的情形下,本说明书所用的单数名词涵盖该名词的复数型;而所用的复数名词时亦涵盖该名词的单数型。为改善用户输入关键词以进行错误状况的查询时,搜寻到的错误纪录列表内的错误纪录往往不是用户最关注的错误纪录的问题,本案提出一种数据分类及搜寻方法,此方法可将以往测试过程中产生的所有错误纪录进行完整的分类,并制作索引,供用户通过索引而快速搜寻到相关错误纪录。另外,此方法更可赋予错误纪录相应的权重,因此,用户搜寻到的错误纪录列表可依照上述权重进行排列,利于使用者找到最关注的错误纪录,详细说明如后。图1依照本案一实施方式绘示一种数据分类及搜寻方法的流程图。如图所示,数据分类及搜寻方法100包含以下步骤:步骤110:根据多个纪录的原因字段或注记字段所包含的数据,以对该些纪录进行分类标记;步骤120:根据该些纪录的概要字段所包含的数据,以产生索引;步骤130:根据该些纪录的概要字段所包含的数据的类别,以对该些纪录进行权重标记;步骤140:根据关键词由该索引搜寻该些纪录中的多个对应纪录;步骤150:根据该些对应纪录的权重,以由该些对应纪录中选出多个相关纪录,并列出该些相关纪录的分类;以及步骤160:统计该些相关纪录的分类,以列出该些相关纪录的各种分类的百分比。为使步骤110的操作方式易于理解,请一并参阅图1及图2。图2依照本案另一实施例绘示一种错误纪录的示意图,此错误纪录210是测试部门对电子装置进行测试时,电子装置的错误状况的纪录表,此错误纪录210包含多个字段,分别纪录错误状况的各种细节,诸如概要字段(Synopsis)、操作细节字段(DetailDescription)、注记字段(Comments/Answer)、原因字段(RootCause)等。本案的数据分类及搜寻方法100会根据上述错误纪录210的字段记载的数据,以对所有过往测试过程中产生的错误纪录进行分类。请参阅步骤110,本案的方法可根据多个错误纪录的原因字段或注记字段记载的数据,以对这些纪录进行分类标记。举例而言,本案的方法可判断这些纪录的每一者的原因字段是否有记载数据,若原因字段有记载数据,则根据此数据由对照表(mappingtable)中取得对应分类,并标记此分类于错误纪录上。例如原因字段记载BIOS(BasicInput/OutputSystem)、 ROM(Read-OnlyMemory)、ACPI(AdvancedConfigurationandPowerInterface)、SMBIOS(SystemManagementBIOS)等,则根据对照表将上述数据分类为BIOSError,另外,原因字段记载iLO(IntegratedLigths-out)、ServerMgmt(SeverManagement)、BMC(BaseboardManagementController)等,则根据对照表将上述数据分类为MgmtFirmwareerror,并将上述分类标记于错误纪录上。反之,若原因字段未记载数据,则根据注记字段记载的数据由对照表中取得对应分类,并标记分类于错误纪录上。举例而言,本案的方法可统计注记字段记载的多个注记,以取得这些注记中数量最多的相关注记,例如注记字段一直出现ROM注记,则ROM即为相关注记。本案的方法根据相关注记ROM由对照表中取得对应分类BIOSerror,并标记分类BIOSerror于错误纪录上。此外,若无法由注记字段取得相关注记,例如注记字段包含太多注记,且这些注记间的出现次数又太接近,例如注记字段包含ROM、BIOS、ACPI、ServerMgmt、BMC,且ROM、BIOS、ACPI、ServerMgmt、BMC皆出现3次,则将错误纪录标记为未知(Unknownerror),并产生一警告。当使用者收到警告时,即可采取相关措施以改善错误纪录,例如此错误的注记太多,表示可能导致电子装置错误的原因较多,此时可以聚集各类测试部门,一同商讨如何解决上述错误。请参阅步骤120,本案的方法可根据多个错误纪录的概要字段记载的数据,以产生索引。举例而言,本案的方法可对所有错误纪录的概要字段利用一索引工具将所有概要字段记载的关键词作成索引,以利查询时能快速反查某一关键词曾出现在哪些错误纪录的概要字段中。请参阅步骤130,本案的方法可根据多个错误纪录的概要字段记载的数据的类别,以对这些错误纪录进行权重标记。举例而言,本案的方法可利用大数据文字处理方式,将系统中所有错误纪录,先对错误纪录的概要字段记载的关键词做预先处理,依据概要字段出现过的所有关键词进行分析,去除与错误分析无关的字词(例如a,an,the,when,system等字词),并将概要字段记载的关键词进行类别标记,并根据概要字段记载的关键词的类别,以取得并标记对应权重于错误纪录上,以利将来在查询比对时可依照每条错误纪录的概要字段,与欲查询的概要字段作一相似度比对,利于找出最相似的错误纪录。在另一实施例中,可采用TF-IDF(termfrequency–inversedocumentfrequency)技术来对错误纪录的概要字段出现过的所有关键词进行分析,以取得各个关键词的权重,以标记对应权重于错误纪录上。举例而言,于概要字段中所描述者,不外乎是被测组件、测试动作、错误现象等,因此,本案的方法可分析概要字段记载的关键词,以将错误纪录归类为被测组件类别、测试动作类 别或错误现象类别。依照概要字段的类别归类方式,可以将CPU、Memory、Windows、Linux、VMWare等字词归类为被测组件类别,将Stress、install、test、diag等归类为测试动作类别,将powercycle、hang、bluescreen、reboot、yellowbang等归类为错误现象类别。再者,本案的方法可对被测组件类别、测试动作类别及错误现象类别进行编码。例如将概要字段记载的关键词用一个位(bit)来编码。如上述实施例所示,被测组件类别有五种组件,测试动作类别有四种动作,错误现象类别有五种错误现象,因此,每一条错误纪录的概要字段记载的关键词可用14位进行编码,如可编码为「00100:1000:01100」。此外,本案的方法可根据概要字段记载的数据的类别,以标记上述编码于错误纪录上。再者,由于概要字段记载的关键词可用14位进行编码,因此,可形成14维的空间向量。本案的方法可根据错误纪录的编码以计算出第一向量,并根据概要字段记载的关键词的类别,以标记第一向量于错误纪录上。再者,本案的方法可分析用户输入的关键词,以将关键词归类为被测组件类别、测试动作类别或错误现象类别,并根据关键词的类别,以标记编码于关键词上,其次,根据关键词的编码以计算第二向量,随后,计算错误纪录的第一向量与关键词的第二向量的向量距离,接着,根据向量距离以选出相关错误纪录,并列出相关错误纪录的分类。需说明的是,向量距离的距离越小代表两向量越相似,因此,可利用此方式来找出最相似的错误纪录。在另一实施例中,可采用余弦相似性(CosineSimilarity)来计算错误纪录的第一向量与关键词的第二向量的相似程度。举例而言,若第一向量为[x1,y1],第二向量为[x2,y2],则余弦相似性的计算公式如下:…公式1此外,余弦相似性亦可适用于n维向量,举例而言,若第一向量与第二向量皆为n维向量,第一向量为[A1,A2,…,An],第二向量为[B1,B2,…,Bn],则余弦相似性的计算公式如下:…公式2需说明的是,于公式1、2中,若计算出的余弦值越接近1,表示两向量的夹角越接近0度,亦即两向量的相似程度越高。如上所述,概要字段记载的关键词可用14位进行编码,而形成14维的空间向量,错误纪录的第一向量与关键词的第二向量可采用上述公式2来进行计算。根据计算出的余弦值即可了解两向量的相似程度,接着,根据相似程度以选出相关错误 纪录,并列出相关错误纪录的分类,因此,可利用此方式来找出最相似的错误纪录。请参阅步骤140,当用户输入关键词以进行错误状况的查询时,本案的方法可根据上述关键词,以步骤120所制作的索引来搜寻多个纪录中的多个对应纪录,换言之,可由所有错误纪录中,找出与关键词对应的错误纪录。为使步骤150的操作方式易于理解,请一并参阅图1及图3。图3依照本案再一实施例绘示一种错误纪录列表及错误分类标记的示意图。于步骤150中,本案的方法可根据多个对应纪录的权重,以由这些对应纪录中选出多个相关纪录。需说明的是,与关键词对应的错误纪录可能笔数非常多,因此,本案的方法更依据权重进行筛选,以选出最接近的相关纪录,例如由1000笔对应错误纪录中,筛选出最接近的100笔相关纪录。如图3所示,错误纪录列表310纪录了步骤150所搜寻到的多个相关错误纪录。此外,本案的方法可列出这些相关错误纪录的分类320。举例而言,错误纪录列表310中编号278039的错误纪录的分类320为BIOS,错误纪录列表310中编号278070的错误纪录的分类320为iLO,以此方式列出所有错误纪录对应的分类320。由于本案的方法可赋予错误纪录相应的权重,因此,用户搜寻到的错误纪录列表310可依照上述权重进行排列,利于使用者找到最关注的错误纪录,并可得知错误纪录的对应分类320,以让使用者针对错误有效除错。为使步骤160的操作方式易于理解,请一并参阅图1及图4。图4依照本案又一实施例绘示一种错误纪录列表及错误分类百分比的示意图,图4的错误纪录列表410及分类420类似于图3的错误纪录列表310及分类320。请参阅步骤160,本案的方法可统计多个相关纪录的分类,以列出如图4所示的相关纪录的各种分类420的百分比。如图4的错误分类百分比列表430所示,BIOS的百分比为75%、iLo的百分比为12%、Driver的百分比为10%而HW的百分比为3%,由上述百分比的高低可知,造成此错误的相关原因中,最有可能的原因为BIOS,因此,使用者可根据错误分类百分比列表430,以得知最有可能造成上述错误的原因,以让使用者针对错误有效除错。如上所述的数据分类及搜寻方法皆可由软件、硬件与/或轫体来执行。举例来说,若以执行速度及精确性为首要考虑,则基本上可选用硬件与/或轫体为主;若以设计弹性为首要考虑,则基本上可选用软件为主;或者,可同时采用软件、硬件及轫体协同作业。应了解到,以上所举的这些例子并没有所谓孰优孰劣的分,亦并非用以限制本发明,熟习此项技艺者当视当时需要弹性设计的。所属
技术领域
:中具有通常知识者当可明白,数据分类及搜寻方法中的各步骤依其执行的功能予以命名,仅是为了让本案的技术更加明显易懂,并非用以限定该等步骤。将各步骤予 以整合成同一步骤或分拆成多个步骤,或者将任一步骤更换到另一步骤中执行,皆仍属于本揭示内容的实施方式。由上述本案实施方式可知,应用本案具有下列优点。本案实施例提供一种数据分类及搜寻方法,藉以改善搜寻方式仅以数据库中的存储顺序为依据且用户的用字习惯有所差异,而导致搜寻到的错误纪录并非用户最关注的错误纪录的问题。虽然上文实施方式中揭露了本案的具体实施例,然其并非用以限定本案,本案所属
技术领域
:中具有通常知识者,在不悖离本案的原理与精神的情形下,当可对其进行各种更动与修饰,因此本案的保护范围当以附随权利要求书所界定者为准。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1