一种文案处理方法及设备与流程

文档序号:15257605发布日期:2018-08-24 20:52阅读:361来源:国知局

本发明涉及数据处理技术,特别涉及一种文案处理方法及设备。



背景技术:

招标投标,是在市场经济条件下进行的大宗货物的买卖、工程建设项目有发包与承包,以及服务项目的采购与提供时,所采用的一种交易方式。在这种交易方式下,通常是由项目采购(包括货物的购买、工程的发包和服务的采购)的采购方作为招标方,通过发布招标公告或者向一定数量的特定供应商、承包商发出招标邀请等方式发出招标采购的信息,提出所需采购项目的性质及其数量、质量、技术要求,交货期、竣工期或提供服务的时间,以及其他供应商、承包商的资格要求等招标采购条件,表明将选择最能够满足采购要求的供应商、承包商与之签订采购合同的意向,由各有意提供采购所需货物、工程或服务的报价及其他响应招标要求的条件,参加投标竞争。经招标方对各投标者的报价及其他的条件进行审查比较后,从中择优选定中标者,并与其签订采购合同。

建筑产品虽然牵涉到每一位民众,但它不像家电产品,民众可以自主行使购买和监督的权力,致使家电业必须以诚信经营为本,取信于民,才能获得市场份额。现实中建筑产品采购权集中在少数人手里(招标人、代理人、评标专家委员会)。由于建筑产品招投标的某些内容及过程需要保密,不便于社会监督,投标人易通过虚假信息而成功中标,公平性无法得到保障。

因此招标人、代理人、评标专家委员会等在审核标书的过程中,需要持有公平公正的态度。一种保证公平公正的方式为将标书中显示表示其来源的信息信息替换。但标书中某些类型信息要被隐藏的同时,某些信息又要被公众可知,例如:如果要隐藏投标人信息,目前通常做法是输入投标人全称、简称,标书中所有投标人全称、简称对应字节被简单替换符同等替换,如一种替换方式为直接替换“a市张三混凝土有限公司”,则可以得到替换后的句子为“***…提供混凝土30吨给王五公司…在a市…张三公司在1月1日之前完成交付”其中透露公司名称的“张三公司”无法被替换掉。又如另一种替换方式为将“张三”进行替换,可以获得“a市***混凝土有限公司…提供混凝土30吨给王五公司…在a市…***公司在1月1日之前完成交付”,则“a市***混凝土有限公司”,可与另一经过替换处理的“a市***混凝土有限责任公司”或“a市***有限公司”形成区别,同样会暗示该公司的具体名称,因此都不可取。故要输入投标人标全称和简称等,才能完全隐藏投标人信息。



技术实现要素:

本发明的目的一是提供一种文案处理方法,其具有将文案中的关键信息进行隐藏的优点。

本发明的上述技术目的一是通过以下技术方案得以实现的:

一种文案处理方法,所述方法包括:

获得文案、以及包含文案来源标识词的输入词组;

对所述输入词组进行分词处理,得到分词组;

根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;

将所述文案中的所述文案来源标识词替换为预定符号。

进一步的,所述对输入词组进行分词处理,获得分词组的方法为:

统计输入词组的字数n,以输入词组的正序提取这一输入词组中字数大于等于2小于等于n的连续的词,组成所述分词组。

进一步的,将所述分词组中的词判断为常用词的方法为:将分词组中的词与常用词词库中的词进行对比,若相同,则判断为常用词;所述分词组中除所述常用词以外的词为所述文案来源标识词。

进一步的,在所述载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号。

进一步的,在所述将文案中的文案来源标识词替换为预定符号后,根据存储的该文案的代号所对应的名称将代号重新替换为名称。

本发明的目的二是提供一种文案处理方法,其具有将文案中的关键信息进行隐藏的优点。

本发明的上述技术目的二是通过以下技术方案得以实现的:

一种文案处理设备,包括:输入输出模组、存储器和处理器,所述输入输出模组用于获得文案、以及包含文案来源标识词的输入词组,所述处理器用于调取所述存储器中存储的指令集来进行如下处理:

获得文案、以及包含文案来源标识词的输入词组;

对所述输入词组进行分词处理,得到分词组;

根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;

将所述文案中的所述文案来源标识词替换为预定符号。

进一步的,所述处理器用于对输入词组进行分词处理,获得分词组,具体为:

统计输入词组的字数n,以输入词组的正序提取这一输入词组中字数大于等于2小于等于n的连续的词,组成所述分词组。

进一步的,所述存储器还用于存储常用词词库,所述处理器还用于将分词组中的词判断为常用词,具体为:

将分词组中的词与存储器中存储的常用词词库中的词进行对比,若相同,则判断为常用词;所述分词组中除所述常用词以外的词为所述文案来源标识词。

进一步的,所述处理器还用于:

在输入输出模组载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号至存储器中。

进一步的,所述处理器还用于:

在处理器将文案中的文案来源标识词替换为预定符号后,根据存储器中的该文案的代号所对应的名称将代号重新替换为名称。

综上所述,本发明具有以下有益效果:通过本发明的文案处理方法,可将文案的输入词组中所包含的文案来源标识词进行替换,并且在替换过程中避免输入词组中包含的常用词在文案中被替换,避免常用词被替换后文案信息不能被完全理解。

附图说明

图1是本发明实施例提供的一种文案处理方法的流程示意图;

图2是本发明实施例提供的另一种文案处理方法的流程示意图;

图3是本发明实施例提供的又一种文案处理方法的流程示意图;

图4是本发明实施例提供的一种文案处理设备的架构示意图。

附图标记:1、输入输出模组;2、存储器;3、处理器。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、设备、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。

文案,指具有文字、表格、图形等组成的电子文件,且文案具有名称。

输入词组,指包含需要进行替换处理的分词的词句,在下文中,输入词组经过分词处理可获得分词组,分词组包括文案来源标识词和常用词。

文案来源标识词,指在文案中需要被替换的词,以让阅读者不能获知文案的来源。

常用词,指较为常用的词汇,可以是人为直接输入的词汇,这类词在文案中被替换,会导致读者无法获知文案所要表达的内容。

预定符号,指对文案来源标识词进行替换的符号,该符号可以是一个/串字母、一个/串符号、一个/多个图片。

参照图1,图1是本发明实施例提供的一种文案处理方法的流程示意图,下面结合附图2对本发明实施例中的文案处理方法进行详细描述。如图1所示,该方法包括以下步骤s101-步骤s103。

步骤s101:获得文案、以及包含文案来源标识词的输入词组;

具体地,可直接将一个/多个文案导入处理器3中,然后根据文案中所要替换的信息输入一个/多个输入词组,进行后续处理。例如在招标过程中,为了保证招标的公正性,在由评审员对标书进行阅读之前,可将该/该些标书中所涉及其公司名称的词进行替换,如标书中有如下句子:“a市张三混凝土有限公司…提供混凝土30吨给王五公司…在a市…张三公司在1月1日之前完成交付”,其中“王五公司”为招标的公司不需要被替换处理。这时可输入输入词组该公司的全称“a市张三混凝土有限公司”。

步骤s102:对所述输入词组进行分词处理,得到分词组;

具体地,分词处理获得分词组的方法为:统计输入词组的字数n,以输入词组的正序提取这一输入词组中字数大于等于2小于等于n的连续的词,组成分词组。以上述输入词组“a市张三混凝土有限公司”为例,经过分词处理的分词组为{a市,市张,张三,三混,混凝,凝土,土有,有限,限公,公司,a市张,市张三,三混凝,混凝土,凝土有,土有限,限公司,a市张三,市张三混,三混凝土,混凝土有,土有限公,有限公司,a市张三混,市张三混凝,张三混凝土有,三混凝土有限,混凝土有限公,凝土有限公司,a市张三混凝,市张三混凝土,张三混凝土有,三混凝土有限,混凝土有限公司,a市张三混凝土,市张三混凝土有,张三混凝土有限,三混凝土有限公,混凝土有限公司,a市张三混凝土有,市张三混凝土有限,张三混凝土有限公,三混凝土有限公司,a市张三混凝土有限,市张三混凝土有限公,张三混凝土有限公司,a市张三混凝土有限公,市张三混凝土有限公司,a市张三混凝土有限公司}。

s103:根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词

具体地,在上述分词组中,将分词组中的词判断为常用词,具体为:将分词组中的词与存储器2中存储的常用词词库中的词进行对比,若相同,则判断为常用词;分词组中除常用词以外的词为文案来源标识词,与常用词词库进行对比可获得常用词{a市,混凝土,有限,公司,有限公司},在分词中剔除常用词,就可获得文案来源标识词{市张,张三,三混,混凝,凝土,土有,限公,a市张,市张三,三混凝,凝土有,土有限,限公司,a市张三,市张三混,三混凝土,混凝土有,土有限公,a市张三混,市张三混凝,张三混凝土有,三混凝土有限,混凝土有限公,凝土有限公司,a市张三混凝,市张三混凝土,张三混凝土有,三混凝土有限,混凝土有限公司,a市张三混凝土,市张三混凝土有,张三混凝土有限,三混凝土有限公,混凝土有限公司,a市张三混凝土有,市张三混凝土有限,张三混凝土有限公,三混凝土有限公司,a市张三混凝土有限,市张三混凝土有限公,张三混凝土有限公司,a市张三混凝土有限公,市张三混凝土有限公司,a市张三混凝土有限公司}。分出常用词和文案来源标识词两组,是为了在后期替换的过程中,避免将“a市”、“混凝土”、“公司”之类的常用词替换掉,进而避免文案所要提供的除其来源的信息均能被清楚的理解。

步骤s104:将所述文案中的所述文案来源标识词替换为预定符号;

具体地,以上述例子为例,预定符号为“***”,符号的字数不以被替换的词中的字数而等量的增加个数。“a市张三混凝土有限公司…提供混凝土30吨给王五公司…在a市…张三公司在1月1日之前完成交付”经过替换后,得到“***…提供混凝土30吨给王五公司…在a市…***公司在1月1日之前完成交付”,在上述被替换的句子中,若将“提供混凝土30吨给王五公司”中的“混凝土”和“公司”替换成“***”,将得到“***30吨…”,导致语义不被理解,但通过分词组中剔除常用词获得文案来源标识词的方式,以达到不替换“混凝土”和“公司”的目的,则可完全避免语义不清的情况发生。

在现有的替换方式中,还是以上述例子为例,如一种替换方式为直接替换“a市张三混凝土有限公司”,则可以得到替换后的句子为“***…提供混凝土30吨给王五公司…在a市…张三公司在1月1日之前完成交付”其中透露公司名称的“张三公司”无法被替换掉。又如另一种替换方式为将“张三”进行替换,可以获得“a市***混凝土有限公司…提供混凝土30吨给王五公司…在a市…***公司在1月1日之前完成交付”,则“a市***混凝土有限公司”,可与另一经过替换处理的“a市***混凝土有限责任公司”或“a市***有限公司”形成区别,同样会暗示该公司的具体名称,因此都不可取。

参照图2,图2是本发明实施例提供的另一种文案处理方法的流程示意图,下面结合附图2对本发明实施例中的文案处理方法进行详细描述。如图2所示,该方法包括以下步骤s201-步骤s205。

步骤s201:载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号。

具体地,由于文案的名称可能也包含的暗示或明示其来源的字词,因此文案名称可被替换为代号,该文案的名称和其对应的代号被存储,以在后期将代号重新替换成对应的名称。

步骤s202-步骤s205的具体阐述同上。

步骤s206:根据存储的该文案的代号所对应的名称将代号重新替换为名称;

具体地,文案在被不知其归属的情况下被阅读及评分后,将代号替换成名称,以了解其归属,便于后续对其归属的公司获得个人进行排序。

参照图3,图3是本发明实施例提供的又一种文案处理方法的流程示意图,下面结合附图3对本发明实施例中的文案处理方法进行详细描述。如图3所示,该方法包括以下步骤s301-步骤s307。

其中,步骤s301、步骤s302、步骤s303、步骤s304和步骤s305和步骤s307,具体阐述同上,在此不再赘述。

步骤s306:将预定符号替换为被其替换的文案来源标识词。

具体地,其中实现上述步骤s306的方法为:在文案来源标识词被替换时,存储被替换的文案来源标识词在文案中的位置及该被替换的文案来源标识词,在将预定符号替换为被其替换的文案来源标识词时,根据被替换的文案来源标识词在文案中的位置,将预定符号替换为对应的文案来源标识词。

如图4所示,图4是本发明实施例提供的一种文案处理设备的架构示意图,包括输入输出模组1、存储器2和处理器3,其中输入输出模组1、存储器2和处理器3可以通过总线或其他方式连接。

输入输出模组1,用于获得文案、以及包含文案来源标识词的输入词组,具体实现中,输入输出模组可以采用实体或虚拟键盘或随机存取存贮器。

处理器3可以是数字信号处理(digitalsignalprocessing,dsp)芯片。

存储器2用于存储指令,具体实现中,存储器2可以采用只读存储器2(英文:read-onlymemory,简称:rom)或随机存取存贮器(英文:randomaccessmemory,简称:ram),在本发明实施例中,存储器2用于存储分词处理的程序代码、替换操作的程序代码、分词组、常用词词库、被替换的文案来源标识词在文案中的位置及该被替换的文案来源标识词等。

处理器3用于调用存储器2中存储的指令集执行如下操作:

对输入词组进行分词处理,获得分词组,其中,分词组包括文案来源标识词和常用词;

将文案中的文案来源标识词替换为预定符号。

具体地,处理器3还用于:

统计输入词组的字数n,以输入词组的正序提取这一输入词组中字数大于等于2小于等于n的连续的词,组成分词组。

进一步地,处理器3还用于:

将分词组中的词与存储器2中存储的常用词词库中的词进行对比,若相同,则判断为常用词;分词组中除常用词以外的词为文案来源标识词。

进一步地,处理器3还用于:

在输入输出模组1载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号至存储器2中。

进一步地,处理器3还用于:

在处理器3将文案中的文案来源标识词替换为预定符号后,根据存储器2中的该文案的代号所对应的名称将代号重新替换为名称。

进一步地,处理器3还用于:

在文案来源标识词被替换时,存储被替换的文案来源标识词在文案中的位置及该被替换的文案来源标识词,在将预定符号替换为被其替换的文案来源标识词时,根据被替换的文案来源标识词在文案中的位置,将预定符号替换为对应的文案来源标识词。

替换时,存储被替换的文案来源标识词在文案中的位置及该被替换的文案来源标识词,在将预定符号替换为被其替换的文案来源标识词时,根据被替换的文案来源标识词在文案中的位置,将预定符号替换为对应的文案来源标识词。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:u盘、移动硬盘、磁碟、光盘、只读存储器(英文:read-onlymemory,缩写:rom)或者随机存取存储器(英文:randomaccessmemory,缩写:ram)等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1