分析打印机使用情况的方法和装置的制作方法

文档序号:6614281阅读:203来源:国知局
专利名称:分析打印机使用情况的方法和装置的制作方法
技术领域
本发明涉及数据处理领域,具体地,涉及分析打印机使用情况的方法 和装置。
背景技术
据估计,在美国,平均每个办公室工作人员每12分钟便会使用一张 纸一一每两个半工作周便用掉一令纸一一每年便消耗掉100 - 200磅纸。并 且,消耗在纸张上的成本还并不像人们所想象的那样仅仅是购买纸张的费 用,而是,以下的成本也会连带地产生
■打印机、复印机的维护和故障修复的成本
■储藏柜的成本一一单为了存放2百万张纸件文档, 一个企业就预期 需要花费$40,000-$60,000在购买档案拒上。但是,如果用CD-ROM 来存储这些相同的文件,则可能仅需要不到10个CD-ROM就够 了。
■丟失邮寄文档的成本
■ 文档废旧的成本
■劳动力低效能的成本
此外,造纸生产还是导致环境污染的一个重要因素。在美国,制浆造 纸厂每年要产生将近245,000公p屯有毒污染气体,其中包括挥发性有机化 合物、硫磺、可吸收的有机卣化物、氯仿、二氧芑以及呋喃等。所有这些 有毒污染气体都^^公认是危害健康的物质。在世界上,制浆造纸还是第5 大能源消耗工业,其占据了大致4%的世界能源使用量。并且,与其他工 业相比,制浆造纸工艺需要使用更多的水才能得到一吨的产量。 一般情况
7下,生产出一吨的量的纸张需JH吏用98吨的各种资源。有关更详细的内容, 参见http:〃www.forestethics.org/pdf/redece.pdfo
有很多以往工作是致力于监视打印机以检测出故障,即墨粉不足、缺 纸等,以^更管理打印机资源而作出的。例如参见ST Gase和CR White的 1996年美国第5,580,177号专利"Printer/client network with centrally updated printer drivers and printer status monitoring ,,, 以及 JK Wedinger、 JFWebb、 GM Songer、 CM Songer和MG的1998年美国第 5,819,015号专利"Method and apparatus for providing remote printer resource m肌agemeiit"。
此外,还有一些以往工作是致力于采集电子邮件消息,以便发现用户 组之间的关联的。例如参见Li, W., Hershkop, S.和Stolfo, S. J.在2004年发 表的"Email archive analysis through graphical visualization" (Proceedings of the 2004 ACM Workshop on Visualization and Data Mining For Computer Security (Washington DC, USA, October 29-29, 2004). VizSEC/DMSEC,04. ACM Press, New York, NY, 128-132).
但是,这些以往工作并未考虑到通过在打印请求者ID的级别上监视 打印机的使用以便驱使业务打印策略或业务进程重新设计,从而在节省能 源方面减少不必要的纸张消耗。

发明内容
为了解决上述问题,本发明提供了一种分析打印机使用情况的方法和 装置,以便通过采集打印机的历史使用数据而识别出具有耗费模式的实体, 从而驱使与该实体相关联的业务进程的重新设计,并且根据所采集的该历 史使用数据对与打印W目关联的各个实体进行打印策略优化,从而减少不 必要的纸张消耗。
根据本发明的一个方面,提供了一种分析打印机使用情况的方法,包 括从至少 一个打印机获得与上述打印机执行的多个打印任务有关的信息, 其中,上述与打印任务有关的信息至少包括每一个打印任务的打印请求者、打印文档属性、打印时间;以及根据包含上述打印请求者的组织结构信息, 将上述与打印任务有关的信息转换为组织结构表示。
根据本发明的另 一个方面,提供了 一种分析打印机使用情况的方法, 包括从至少 一个打印机获得与上述打印机执行的多个打印任务有关的信 息,其中,上述与打印任务有关的信息至少包括每一个打印任务的打印请 求者、打印文档属性、打印时间;从上述与打印任务有关的信息中识别出 多个等价历史打印任务类,其中每一个等价历史打印任务类包括涉及相同 或相似文档的多个历史打印任务;根据上述打印请求者和打印时间的信息, 获得上述多个等价历史打印任务类的每一个的用户序列;以及根据包含上 述请求者的组织结构信息,从上述多个用户序列中识别出跨多个组织单元 的用户序列,作为非正规工作流。
根据本发明的另一个方面,提供了一种分析打印机使用情况的装置, 包括打印信息采集单元,用于从至少一个打印机获得与上述打印机执行 的多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括 每一个打印任务的打印请求者、打印文档属性、打印时间;以及组织结构 表示生成单元,用于根据包含上述打印请求者的组织结构信息,将上述与 打印任务有关的信息转换为组织结构表示。
根据本发明的另 一个方面,提供了 一种分析打印机使用情况的装置, 包括打印信息采集单元,用于从至少一个打印机获得与上述打印机执行 的多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括 每一个打印任务的打印请求者、打印文档属性、打印时间;等价类识别单 元,用于从上述与打印任务有关的信息中识别出多个等价历史打印任务类, 其中每一个等价历史打印任务类包括涉及相同或相似文档的多个历史打印 任务;用户序列映射单元,用于根据上述打印请求者和打印时间的信息, 获得上述多个等价历史打印任务类的每一个的用户序列;以及非正规工作 流识别单元,用于根据包含上述请求者的组织结构信息,从上述多个用户 序列中识别出跨多个组织单元的用户序列,作为非正规工作流。
9


相信通过以下结合附图对本发明具体实施方式
的说明,能够使人们更 好地了解本发明上述的特点、优点和目的。
图1是根据本发明实施例的分析打印机使用情况的方法的流程图2是根据本发明一个实施例的分析打印机使用情况以识别出具有耗 费模式的用户的过程的流程图3是根据本发明一个实施例的分析打印机使用情况以识别出具有耗 费模式的组织单元的过程的流程图4是根据本发明一个实施例的分析打印机使用情况以识别出非正规 工作流的过程的流程图5是根据本发明一个实施例的分析打印机使用情况以进行打印策略 优化的过程的流程图;以及
图6是根据本发明实施例的分析打印机使用情况的装置的方框图。
具体实施例方式
下面就结合附图对本发明的各个优选实施例进行详细说明。
首先,描述本发明的分析打印机使用情况的方法。
图l是根据本发明实施例的分析打印机使用情况的方法的流程图。如 图1所示,首先,在步骤105,从一个或多个打印机采集与这些打印机执 行的多个打印任务有关的信息。在企业内部网络内,由于打印机是被企业 内的用户所共享的,所以,为了能够区分向这些共享打印机发出了打印请 求并执行了打印任务的用户,从这些共享打印机收集的与打印任务有关的 信息中应至少包括每一个打印任务的请求者ID以及后面用于进行具有耗 费模式的实体分析以及策略优化的请求大小、时戳以及所打印的文档的属 性等信息。其中,请求者ID可以是用户的设备标识或设备IP地址。此夕卜, 上述文档的属性可以包括文件类型(例如PPT、 word等)、文件名、业 务进程水印等。此外,除了上述这些属性之外,所收集的与打印任务有关 的信息中还可以包括打印机ID、打印属性等。其中,打印机ID用来区分企业内部网络中的多个不同的打印机,而打印属性则可以包括彩色/黑白、 分辨率、纸张大小、单面/双面等属性。但是,并不限于此,除了上述信息 之外,所收集的与打印任务有关的信息中当然还可以包括其他更多的信息。 对于本领域的技术人员来说可以理解,采集打印机的与打印任务有关 的信息是可以利用现有的技术手段及本领域的现有知识来实现的,本发明 对该步骤没有特别的限制。
接着,在步骤110,根据上述所收集的与打印任务有关的信息,将各
个历史打印任务关联到执行该打印任务的相应实体。
具体地,在该步骤中,可以利用与打印任务有关的信息中的请求者ID, 将各个历史打印任务分别关联到执行该打印任务的相应用户。进而,可以 根据从企业的人力资源管理部门的记录中获得的包括这些用户的组织结构 信息,将执行这些历史打印任务的各个用户分别关联到其所属的组织单元 (organizational unit)。此外,也可以利用文档属性中的业务进程水印信 息(如果存在),将业务进程关联到相应的组织单元,等等。
接着,在步骤115,根据上述所收集的与打印任务有关的信息,利用 数学算法识别出具有耗费模式的实体。具体地,可以是识别出具有耗费模 式的用户、组织单元或非正规工作流,这些将在下面进行详细描述。
其中,在本步骤中所用到的上述数学算法包括但不限于聚合分析 (cluster analysis )、时间序列分析、网络分析等。
本步骤的识别结果可以用来驱使与所识别出的具有耗费模式的实体相 关联的业务进程的重新设计,以尽可能地减少涉及纸张消耗的业务步骤。
在并列步骤120,根据上述所收集的与打印任务有关的信息,对与上 述打印机相关联的各个实体进行打印策略优化。
以上就是对本实施例的分析打印机使用情况的描述。需要说明的是, 上述步骤115和步骤120并没有相互关联,所以其执行的顺序可以是任意 的。
下面,作为一个具体例子,详细描述根据上面图1的过程分析打印机 使用情况以识别出具有耗费模式的用户的方法。图2是根据本发明一个实施例的分析打印机使用情况以识别出具有耗 费模式的用户的方法的流程图。如图2所示,首先,在步骤205,从一个 或多个打印机采集与这些打印机执行的多个打印任务有关的信息。优选地, 从这些打印机收集的与打印任务有关的信息中至少包括每一个打印任务的 请求者ID以及后面用于进行具有耗费模式的用户分析的请求大小、时戳 以及文档属性等信息。
接着,在步骤210,根据上述所收集的与打印任务有关的信息,将各 个历史打印任务关联到执行该打印任务的相应用户。
具体地,在该步骤中,利用与打印任务有关的信息中的请求者ID,将 与打印任务有关的信息所代表的各个历史打印任务分别关联的相应的用 户。
接着,在步骤215,根据上述所收集的与打印任务有关的信息,利用 聚合分析、时间序列分析、网络分析等为上述各个相应的用户统计指定时 间段内的打印量。
在本步骤中,上述指定时间段可以例如是一个月。并且,为上述各个 相应的用户统计该指定时间段、即一个月内的打印量可以包括下列步骤中 的一个或多个为该用户统计该一个月内所打印的文档数量、为该用户统 计该一个月内所打印的总文档大小、为该用户统计该一个月内对同一文档 的打印次数等。
并且,在本步骤中,对于各个用户在指定时间段内的打印量的统计是 根据与该用户相关联的与打印任务有关的信息中所包含的请求大小、时戳 以及文档属性等信息而实现的。具体地,对于各个用户,根据与其相关联 的与打印任务有关的信息中的时戳信息,可以识别出该用户在一个月内的 所有打印任务,进而统计出该用户在该一个月内与这些打印任务相应地所 打印的文档数量;才艮据时戳信息和文档属性中的文档大小信息,可以为该 用户统计出该一个月内所打印的总文档大小;根据时戳信息以及文档属性 中的文档名信息,可以为该用户统计出该一个月内对同一文档的打印次数。
接着,在步骤220,将为上述各个用户统计的、指定时间段内的打印量与针对该用户预先规定的打印量相比较,识别出其指定时间段内的打印 量超过了预定打印量的用户。
具体地,由于为上述各个用户统计的、指定时间段内的打印量可以是 该用户在该一个月内所打印的文档数量、所打印的总文档大小、对同一文 档的打印次数中的一种或多种,所以,针对各个用户预先规定的打印量也
应包括与^M目应的各个度量项。即,应包括下列度量项允许该用户在该 一个月内打印的文档数量(例如100篇文档)、允许该用户在该一个月内 打印的总文档大小(例如10M字节)、允许该用户在该一个月内对同一文 档的打印次数(例如2次)等等。
从而,在本步骤中,将上述各个用户的指定时间段内的打印量与其预 定打印量进行比较,识别出指定时间段内的打印量超过了预定打印量的用 户,认为是具有耗费模式的用户。
以上就是对本实施例的分析打印机使用情况以识别出具有耗费模式的 用户的方法的详细描述。在本实施例中,通过采集打印机的历史使用数据 并将其与执行打印任务的用户相关联,能够识别出具有耗费模式的各个用 户。
下面,作为另一个具体例子,描述根据上面图1的过程分析打印机使 用情况以识别出具有耗费模式的组织单元的方法。
图3是根据本发明一个实施例的分析打印机使用情况以识别出具有耗 费模式的组织单元的方法的流程图。如图3所示,首先,在步骤305,从 一个或多个打印机采集与这些打印机执行的多个打印任务有关的信息。优 选地,从这些打印机收集的与打印任务有关的信息中至少包括每一个打印 任务的请求者ID以及后面用于进行具有耗费模式的组织单元分析的请求 大小、时戳以及文档属性等信息。
接着,在步骤310,根据上述所收集的与打印任务有关的信息,将各 个历史打印任务关联到相应的组织单元,以将上述与打印任务有关的信息 转换为组织结构表示。
具体地,在该步骤中,利用与打印任务有关的信息中的请求者ID,将各个历史打印任务分别关联的相应的用户;然后,根据从企业的人力资源 管理部门的记录中获得的包括这些用户的组织结构信息,将执行历史打印 任务的各个用户进而关联到其所属的组织单元。在本实施例中,优选地, 以树形结构来表示所获得的组织结构,并进而将执行历史打印任务的各个 用户关联到树形结构中其相应的组织单元节点,从而形成组织结构表示。
接着,在步骤315,根据上述所收集的与打印任务有关的信息,利用 聚合分析、时间序列分析、网络分析等为上述组织结构表示中的各个组织 单元节点统计出指定时间段内的打印量。
具体地,在本步骤中,上述指定时间段可以例如是一个月。并且,为 上述组织结构表示中的各个组织单元节点统计出指定时间段、即一个月内 的打印量可以包括下列步骤中的一个或多个为各个组织单元节点统计该 一个月内所打印的文档数量、为各个组织单元节点统计该一个月内所打印 的总文档大小、为各个组织单元节点统计该一个月内对同一文档的打印次 数等。
并且,在本步骤中,对于各个组织单元节点在指定时间段内的打印量 的统计是根据与打印任务有关的信息中所包含的请求大小、时戳以及文档 属性等信息而实现的。具体地,对于各个组织单元节点,根据与该组织单 元节点相关联的与打印任务有关的信息中的时戳信息,为该组织单元节点 识别出其所有用户在一个月内的所有打印任务,进而统计出这些用户在该 一个月内与这些打印任务相应地所打印的文档数量;根据与打印任务有关
的信息中的时戳信息和文档属性中的文档大小信息,为该组织单元节点统 计出其用户在该一个月内所打印的总文档大小;根据时戳信息以及文档属 性中的文档名信息,为该组织单元节点统计出其用户在该一个月内对同一 文档的打印次数。
接着,在步骤320,判断是否需要为上述组织结构表示中的某个组织 单元推导打印策略。如果需要,则该过程前进到步骤325,否则转到步骤 330。
在步骤325,针对需要推导打印策略的组织单元,根据该组织单元的历史打印频率和/或打印请求大小的分布而为其推导出打印策略。具体地,
该推导过程如下首先,对于该组织单元,针对在指定时间段内所打印的 文档数量、在指定时间段内所打印的总文档大小、在指定时间段内对同一 文档的打印次数等各个度量项,计算打印请求的经验分布函数,从而获得 该组织单元的基于历史数据的打印频率和/或打印请求大小的典型分布;然 后,根据该典型分布设置相应的策略,例如规定其子组织单元在指定时间 段内的文档打印量不能超过该组织单元在该指定时间段内的文档打印量的 95%等。
在步骤330,对于上述组织结构表示中的各个组织单元,将其指定时 间段内的打印量与针对该组织单元预先规定或推导出的打印策略相比较, 从而识别出其指定时间段内的打印量背离了打印策略的組织单元。
具体地,由于针对上述各个组织单元统计的、指定时间段内的打印量 是该组织单元在该一个月内所打印的文档数量、所打印的总文档大小、对 同一文档的打印次数中的一种或多种,所以,针对各个组织单元预先规定 或推导出的打印策略可以直接是与上述统计量相应的各个度量项。即,针 对一个組织单元预先规定或推导出的打印策略可以包括下列度量项允许 该组织单元在该一个月内打印某一确定数量的文档(例如500篇文档)、 允许该組织单元在该一个月内打印某一确定大小的文档(例如50M字节)、 允许该组织单元在该一个月内对同一文档打印确定次数(例如10次)等等。
当然,针对各个组织单元预先规定或推导出的打印策略也可以采用其
他非直接度量项的形式。
从而,在本步骤中,将上述各个组织单元的指定时间段内的打印量与 针对该组织单元预先规定或推导出的打印策略进行匹配,识别出其指定时 间段内的打印量背离了打印策略的组织单元,认为是具有耗费模式的组织 单元。
以上就是对本实施例的分析打印机使用情况以识别出具有耗费模式的 组织单元的方法的详细描述。在本实施例中,通过采集打印机的历史使用 数据并将其与执行打印任务的组织单元相关联,能够识别出具有耗费模式的各个组织单元。
下面,作为再一个具体例子,描述根据上面图1的过程分析打印机使 用情况以识别出非正规工作流的方法。
图4是根据本发明一个实施例的分析打印机使用情况以识别出非正规 工作流的方法的流程图。如图4所示,首先,在步骤405,从一个或多个 打印机采集与这些打印机执行的多个打印任务有关的信息。优选地,从这 些打印机收集的与打印任务有关的信息中至少包括每一个打印任务的请求 者ID以及后面用于进行非正规工作流的分析的时戳以及文档属性等信息。
接着,在步骤410,根据上述与打印任务有关的信息中的文档属性信 息,从上述与打印任务有关的信息中识别出多个等价历史打印任务类。其 中,每一个等价历史打印任务类包括涉及相同或相似文档的多个历史打印 任务。
具体地,在该步骤中,首先,根据上述与打印任务有关的信息中所包 含的文档名信息,利用聚类分析方法(Cluster analysis method ),如模糊 名字匹配算法执行聚合分析来寻找相同或相似文档的所有等价类。通过模 糊名字匹配算法所确定的每一个等价类,指上述与打印任务有关的信息所 涉及的文档中名字相同或相似的所有文档。
然后,根据上述与打印任务有关的信息,对于上述相同或相似文档的 等价类中的每一个,找出与其相关联的多个历史打印任务,从而形成与该 等价类相对应的等价历史打印任务类。
关于上述的模糊名字匹配算法,例如在Paul Wu Horng-Jyh、 Na Jin画Cheon 和 Christopher Khoo Soo國Guan ( Nanyang Technological University, 31 Nanyang Link, Singapore 637718)所发表的"A hybrid approach to fuzzy name search incorporating language-based and text-based principles" (Journal of Information Science, Vol. 33, No. 1, 3-19(2007))中进行了详细描述。该文章的全部内容以引用方式包含于此, 以供参考。
接着,在步骤415,根据上述与打印任务有关的信息中的请求者ID和时戳信息,将各个等价历史打印任务类分别映射为代表其相应的打印流的 用户序列。
具体地,在该步骤中,对于每一个等价历史打印任务类,利用与其中
的各个打印任务有关的信息中的请求者id信息,将其中的各个历史打印
任务分别关联到相应的用户;然后,按照该等价历史打印任务类中各个历 史打印任务的时戳顺序,将该各个历史打印任务的用户关联到一起形成一 个用户序列。从而,由于该用户序列是按照该等价历史打印任务类中的各 个历史打印任务的时戳顺序关联而成的,所以其能够代表这些历史打印任 务的打印流。从而,以这种方式,便能够将每一个历史打印任务类都映射 为能够代表其相应打印流的用户序列。
接着,在步骤420,根据组织结构信息,从上述代表打印流的用户序
列中识别出跨多个组织单元的用户序列,认为是非正规工作流。
具体地,在本步骤中,首先,根据从企业的人力资源管理部门的记录 中获得的组织结构信息,将各个用户序列中的各个用户分别关联到其所属
的组织单元;进而,识别出其中的用户跨多个组织单元的用户序列,认为 是非正规工作流。
并且,在本步骤中,将与所识别出的跨多个组织单元的用户序列相应 的文档等价类中的相同或相似文档识别为是参与了非正规工作流的文档。
此外,在一个优选实施例中,在本步骤中,首先从所获得的代表打印 流的多个用户序列中找出最经常出现的用户序列,然后再从这些最经常出 现的用户序列中识别出跨多个组织单元的用户序列,i^为是非正规工作流。
此外,在其他实施例中,在获得代表打印流的多个用户序列之后、识 别非正规工作流之前,还可以对上述多个用户序列进行精简,例如对于一 个用户序列,移除其中在其他用户序列中已经出现过的相同组织单元的多 个实例。
以上就是对本实施例的分析打印机使用情况以识别出非正规工作流的 方法的详细描述。在本实施例中,通过采集打印机的历史使用数据并映射 为能够代表相应打印流的用户序列,能够识别出打印了相同或相似文档的、跨多个组织单元的非正规工作流。
下面,作为又一个具体例子,描述根据上面图1的过程分析打印机使 用情况以进行打印策略优化的方法。
图5是根据本发明一个实施例的分析打印机使用情况以进行打印策略 优化的方法的流程图。如图5所示,首先,在步骤505,从一个或多个打 印机釆集与这些打印机执行的多个打印任务有关的信息。优选地,从这些 打印机收集的与打印任务有关的信息中至少包括每一个打印任务的请求者 ID以及后面用于进行策略分析的请求大小、时戳以及文档属性等信息。
接着,在步骤510,根据上述所收集的与打印任务有关的信息,将各 个历史打印任务关联到相应的组织单元,以将上述与打印任务有关的信息 转换为组织结构表示。
具体地,在该步骤中,利用与打印任务有关的信息中的请求者ID,将 各个历史打印任务分别关联的相应的用户;然后,根据从企业的人力资源 管理部门的记录中获得的包括这些用户的组织结构信息,将执行历史打印 任务的各个用户进而关联到其所属的组织单元。在本实施例中,优选地, 以树形结构来表示所获得的组织结构,并进而将执行历史打印任务的各个 用户关联到树形结构中其相应的组织单元节点,从而形成组织结构表示。
接着,在步骤515,为上述组织结构表示中的各个组织单元,收集预 算成本与实际成本数据和预计打印量与实际打印量数据。该预算成本与实 际成本数据可以从企业的财务部门的关于预算和实际成本的财务报告记录 中获得。
在步骤520,根据上述预算成本与实际成本数据、预计打印量与实际 打印量数据和上述与打印任务有关的信息,为上述组织结构表示中的各个 组织单元确定最佳打印分配策略。
详细描述。在本实施例中,通过采集打印机的历史使用数据,能够根据所 采集的历史使用数据,对与打印^目关联的各个组织单元进行打印策9^L 化,从而减少不必要的纸张消耗。
18在同一发明构思下,本发明提供一种分析打印机使用情况的装置。下 面结合附图对其进行描述。
图6是根据本发明实施例的分析打印机使用情况的装置的方框图。如 图6所示,本实施例的分析打印机使用情况的装置60包括打印信息采集 单元61、组织结构表示生成单元62、用户识别模块63、组织单元识别模 块64、工作流识别模块65和策略优化单元66。
其中,打印信息采集单元61用于从一个或多个打印机采集与这些打印 机执行的多个打印任务有关的信息。其中,上述与打印任务有关的信息至 少包括每一个打印任务的打印请求者、打印文档属性、打印时间等信息。
组织结构表示生成单元62用于根据上述与打印任务有关的信息中的 打印请求者信息以及^^A力资源管理部门获得的组织结构信息,将各个打 印任务关联到执行该任务的用户所属的组织单元,从而将该与打印任务有 关的信息转换为组织结构表示。
用户识别模块63用于根据上述与打印任务有关的信息识别出具有耗 费模式的用户。如图6所示,用户识别模块63可进一步包括用户关联单 元631,用于根据上述与打印任务有关的信息中的请求者信息,将各个历 史打印任务关联到执行该任务的相应用户;统计单元632,用于根据上述 与打印任务有关的信息中的打印时间以及文档属性等信息,为各个上述用 户统计出指定时间段内的打印量;以及用户识别单元633,用于识别出其 上述指定时间段内的打印量超过了预定打印量的用户。
组织单元识别才莫块64用于根据上述与打印任务有关的信息,从上述组 织结构表示中识别出具有耗费模式的組织单元。如图6所示,组织单元识 别模块64可进一步包括统计单元641,用于根据上述与打印任务有关的 信息中的打印时间以及文档属性等信息,为上述组织结构表示中的各个上 述组织单元统计出指定时间段内的打印量;以及组织单元识别单元642, 用于从上述组织结构表示中识别出其上述指定时间段内的打印量背离了打 印策略的组织单元;打印策略推导单元643,用于对于上述组织结构表示 中的一个或多个组织单元,根据该组织单元的历史打印频率和/或打印请求大小的分布为其推导出打印策略。
优选地,上述指定时间段内的打印量可以包括下列中的一项或多项 该指定时间段内所打印的文档数量、该指定时间段内所打印的总文档大小、 该指定时间段内对同一文档的打印次数。
工作流识别才莫块65用于根据上述与打印任务有关的信息识别出具有 耗费模式的非正规工作流。如图6所示,工作流识别模块65可进一步包括 等价类识别单元651,用于根据上述与打印任务有关的信息中的文档属性, 通过利用模糊名字匹配算法执行聚合分析来寻找相同或相似文档的所有等 价类,而从上述与打印任务有关的信息中识别出与^M目应的多个等价历史 打印任务类,其中每一个等价历史打印任务类包括涉及相同或相似文档的 多个历史打印任务;用户序列映射单元652,用于对于上述等价历史打印 任务类的每一个,根据上述与打印任务有关的信息中的打印请求者信息, 将其中的各个历史打印任务关联到用户,并进而使这些用户按照这些历史 打印任务的时戳顺序关联到 一起形成一个能够代表其打印流的用户序列, 从而将该等价历史打印任务类映射为该代表其打印流的用户序列;以及非 正规工作流识别单元653,用于根据从人力资源管理部门获得的组织结构 信息,从上述用户序列映射单元652所获得的多个代表打印流的用户序列 中识别出跨多个组织单元的用户序列,认为是非正规工作流。
优选地,非正规工作流识别单元653从最经常出现的代表打印流的多 个用户序列中识别出跨多个组织单元的用户序列,认为是非正规工作流。
策略优化单元66用于为上述组织结构表示中的各个组织单元,收集预 算成本与实际成本数据和预计打印量与实际打印量数据,并根据该预算成 本与实际成本数据、预计打印量与实际打印量数据以及上述与打印任务有 关的信息,对上述各个组织单元进行打印策略优化。
以上就是对本实施例的分析打印机使用情况的装置的详细描述。本实 施例的分析打印机使用情况的装置60及其各个组成部分,可以由专用的电 路或芯片构成,也可以通过计算机(处理器)执行相应的程序来实现。
此外,在一个实施例中,上述分析打印机使用情况的装置60可仅包括上述打印信息采集单元61、組织结构表示生成单元62、组织单元识别模块 64和策略优化单元66。
在另 一个实施例中,上述分析打印机使用情况的装置60可仅包括上述 打印信息采集单元61和工作流识别模块65。
以上虽然通过一些示例性的实施例对本发明的分析打印机使用情况的 方法和装置进行了详细的描述,但是以上这些实施例并不是穷举的,本领 域技术人员可以在本发明的精神和范围内实现各种变化和修改。因此,本 发明并不限于这些实施例,本发明的范围仅以所附权利要求为准。
权利要求
1. 一种分析打印机使用情况的方法,包括从至少一个打印机获得与上述打印机执行的多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括每一个打印任务的打印请求者、打印文档属性、打印时间;以及根据包含上述打印请求者的组织结构信息,将上述与打印任务有关的信息转换为组织结构表示。
2. 根据权利要求l所述的分析打印机使用情况的方法,其中将上述与打印任务有关的信息转换为組织结构表示的步骤进一步包括才艮据上述与打印任务有关的信息中的打印请求者以及组织结构信息, 将各个打印任务关联到组织结构中执行该任务的用户所属的组织单元,以形成组织结构表示。
3. 根据权利要求l所述的分析打印机使用情况的方法,还包括 从上述组织结构表示中识别出打印任务背离了其打印策略的组织单元。
4. 根据权利要求3所述的分析打印机使用情况的方法,其中从上述组 织结构表示中识别出打印任务背离了其打印策略的组织单元的步骤进一步 包括根据上述与打印任务有关的信息中的打印时间以及文档属性,为上述 组织结构表示中的各个组织单元统计出其用户在指定时间段内的打印量; 以及从上述组织结构表示中识别出其上述指定时间段内的打印量背离了打 印策略的组织单元。
5. 根据权利要求4所述的分析打印机使用情况的方法,其中上述指定 时间段内的打印量包括下列中的一项或多项上述指定时间段内所打印的文档数量、上述指定时间段内所打印的总 文档大小、上述指定时间段内对同一文档的打印次数。
6. 根据权利要求3或4所述的分析打印机使用情况的方法,其中上述 打印策略是预先规定的打印策略,其包括下列中的一项或多项允许该組织单元在上述指定时间段内打印确定数量的文档、允许该组 织单元在上述指定时间段内打印确定大小的文档、允许该组织单元在上述 指定时间段内对同一文档打印确定次数。
7. 根据权利要求3或4所述的分析打印机使用情况的方法,其中在从 上述组织结构表示中识别出打印任务背离了其打印策略的组织单元的步骤 之前还包括对于上述组织结构表示中的一个或多个组织单元,根据该组织单元的 历史打印频率和/或打印请求大小的分布为其推导出打印策略。
8. 根据权利要求l所述的分析打印机使用情况的方法,还包括 根据上述与打印任务有关的信息,对上述组织结构表示中的各个组织单元进行打印策略优化。
9. 根据权利要求8所述的分析打印机使用情况的方法,其中对上述组 织结构表示中的各个组织单元进行打印策略优化的步骤进一步包括为上述組织结构表示中的各个组织单元收集预计打印量与实际打印量 数据;以及根据上述与打印任务有关的信息以及上述预计打印量与实际打印量数 据,为上述各个组织单元确定最佳打印分配策略。
10. 根据权利要求l所述的分析打印机使用情况的方法,其中上述与 打印任务有关的信息还包括下列信息中的一种或多种打印机标识、打印 属性。
11. 根据权利要求l所述的分析打印机使用情况的方法,其中上述文 档属性包括下列各项中的一种或多种文件类型、文件名、文档大小、业 务进程水印。
12. —种分析打印机使用情况的方法,包括从至少一个打印机获得与上述打印机执行的多个打印任务有关的信 息,其中,上述与打印任务有关的信息至少包括每一个打印任务的打印请求者、打印文档属性、打印时间;从上述与打印任务有关的信息中识别出多个等价历史打印任务类,其 中每一个等价历史打印任务类包括涉及相同或相似文档的多个历史打印任务;根据上述打印请求者和打印时间的信息,获得上述多个等价历史打印 任务类的每一个的用户序列;以及根据包含上述请求者的组织结构信息,从上述多个用户序列中识别出 跨多个组织单元的用户序列,作为非正规工作流。
13. 根据权利要求12所述的分析打印机使用情况的方法,其中从上述 与打印任务有关的信息中识别出多个等价历史打印任务类的步骤进一步包 括利用聚类分析方法对上述与打印任务有关的信息所涉及的文档执行聚 合分析,以找出相同或相似文档的多个等价类;以及对于上述相同或相似文档的多个等价类的每一个,根据上述与打印任 务有关的信息,找出与其相关联的多个历史打印任务,作为一个等价历史 打印任务类。
14. 根据权利要求12所述的分析打印机使用情况的方法,其中从上述 多个用户序列中识别出跨多个组织单元的用户序列的步骤进一步包括从上述多个用户序列的最经常出现的用户序列中识别出跨多个组织单 元的用户序列。
15. —种分析打印机使用情况的装置,包括打印信息采集单元,用于从至少一个打印机获得与上述打印机执行的 多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括每 一个打印任务的打印请求者、打印文档属性、打印时间;以及组织结构表示生成单元,用于根据包含上述打印请求者的组织结构信 息,将上述与打印任务有关的信息转换为組织结构表示。
16. 根据权利要求15所述的分析打印机使用情况的装置,其中上述组 织结构表示生成单元根据上述与打印任务有关的信息中的打印请求者以及组织结构信息,将各个打印任务关联到组织结构中执行该任务的用户所属 的组织单元,以形成组织结构表示。
17. 根据权利要求15所述的分析打印机使用情况的装置,还包括组织 单元识别模块,其包括统计单元,用于根据上述与打印任务有关的信息中的打印时间以及文 档属性,为上述组织结构表示中的各个组织单元统计出指定时间段内的打印量;组织单元识别单元,用于从上述组织结构表示中识别出其上述指定时 间段内的打印量背离了打印策略的组织单元。
18. 根据权利要求15所述的分析打印机使用情况的装置,其中上述组 织单元识别单元还包括打印策略推导单元,用于对于上述组织结构表示中的一个或多个组织 单元,根据该组织单元的历史打印频率和/或打印请求大小的分布为其推导 出打印策略。
19. 根据权利要求15所述的分析打印机使用情况的装置,还包括 策略优化单元,用于为上述组织结构表示中的各个组织单元收集预计打印量与实际打印量数据,并根据上述与打印任务有关的信息以及上述预 计打印量与实际打印量数据,为上述各个组织单元确定最佳打印分配策略。
20. —种分析打印机使用情况的装置,包括打印信息采集单元,用于从至少一个打印机获得与上述打印机执行的 多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括每 一个打印任务的打印请求者、打印文档属性、打印时间;等价类识别单元,用于从上述与打印任务有关的信息中识别出多个等 价历史打印任务类,其中每一个等价历史打印任务类包括涉及相同或相似 文档的多个历史打印任务;用户序列映射单元,用于根据上述打印请求者和打印时间的信息,获 得上述多个等价历史打印任务类的每一个的用户序列;以及非正规工作流识别单元,用于根据包含上述请求者的组织结构信息,从上述多个用户序列中识别出跨多个组织单元的用户序列,作为非正规工作流。
全文摘要
本发明提供了一种分析打印机使用情况的方法和装置。该分析打印机使用情况的方法包括从至少一个打印机获得与上述打印机执行的多个打印任务有关的信息,其中,上述与打印任务有关的信息至少包括每一个打印任务的打印请求者、打印文档属性、打印时间;以及根据包含上述打印请求者的组织结构信息,将上述与打印任务有关的信息转换为组织结构表示。在本发明中,通过采集打印机的历史使用数据而识别出具有耗费模式的实体,从而驱使与该实体相关联的业务进程的重新设计,并且根据所采集的该历史使用数据对与打印机相关联的各个组织单元进行打印策略优化,从而减少不必要的纸张消耗。
文档编号G06F3/12GK101452374SQ200710186540
公开日2009年6月10日 申请日期2007年12月7日 优先权日2007年12月7日
发明者B·迪特雷希, B·雷, M·卡拉斯克 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1