内容篡改检测装置的制作方法

文档序号：6512816阅读：113来源：国知局

专利名称：内容篡改检测装置的制作方法
技术领域：
本发明涉及内容篡改检测装置，该内容篡改检测装置检测出对互联网上公开的主页等的内容进行的篡改。
背景技术：
近年来，由于互联网的普及，企业、团体等制作主页并在互联网上公开各种信息，并且使用所公开的主页的用户也增加。但是，用户当中也存在非法访问互联网上的Web服务器并篡改他人主页的源内容的黑客(hacker)。因此，出现了检测出源内容的篡改并发出警告的Web服务器(参照例如特开2002-207623号公报)。在此，利用图1说明具有该内容篡改检测功能的Web服务器(以下称为“篡改检测服务器100”)。
图1所示为现有篡改检测服务器100的结构图。现有篡改检测服务器100与不具有篡改检测功能的Web服务器同样，具有用于对在互联网5上公开提供的主页的源内容(以下称为“源内容”)进行存储的公开内容存储部11、和受理来自用户的访问的受理部12。另外，现有的篡改检测服务器100还具有提取部13，根据用户的访问，从公开内容存储部11提取源内容；发送部14，通过互联网5将提取的源内容发送给用户。
另外，现有的篡改检测服务器100还具有备份存储部15，用于存储作为原始(被篡改前的)源内容的备份的备份内容；以及读取部101，按照规定的时间间隔，从公开内容存储部11和备份存储部15读取源内容和备份内容。而且，现有的篡改检测服务器100还具有比较部102，将读取部101读取的源内容和备份内容进行对比，检测出两者差异；以及警告输出部103，当源内容与备份内容存在差异时，通过互联网5向主页管理者发送警告。
在上述现有的篡改检测服务器100中，比较部102例如每天在规定时刻检查源内容与备份内容是否存在差异。若差异小，警告输出部103视为源内容被篡改而向主页管理者发出警告。这样，主页管理者在源内容被没有权限的用户非法篡改的情况下，可以知道该事实并针对该篡改采取适当措施。
但是，现有的篡改检测服务器100在源内容和备份内容有差异的情况下，不管差异大小都发出警告，因此接收到警告的管理者不知道上述两种内容的差异是大还是小。即，管理者仅接收到警告，但无法判断对源内容的篡改是重大的还是微小的。主页管理者想要知道的不是微小的篡改，而是重大的篡改。

发明内容
本发明的目的是针对上述问题提供一种内容篡改检测装置，检测出对规定的内容进行了预先确定的重大篡改的情况。
为了实现上述目的，本发明的内容篡改检测装置，检测出对互联网上公开的内容进行的篡改，其特征在于，具有比较单元，将第1存储单元中存储的第1内容和第2存储单元中存储的第2内容进行对比，并检测出所述第1内容和所述第2内容的差分；关键字判断单元，针对由所述比较单元检测的各差分，判断在与所述差分关联的部位是否包含规定的关键字；警告判断单元，利用由所述关键字判断单元得到的判断结果，判断是否输出警告；以及警告输出单元，当所述警告判断单元判断为输出警告时，输出警告。
这样，本发明的内容篡改检测装置根据第1内容和第2内容的、与差分关联的部位中是否包含规定关键字，来判断是否输出警告。因此，内容管理者只要预先确定用于判断是否有人进行了自己预先确定的重大篡改的关键字，上述管理者就可以在所述内容被进行了自己预先确定的重大篡改时，知晓该事实。
另外，本发明还可以实现为以本发明内容篡改检测装置的特征构成单元为步骤的内容篡改检测方法，或者可以实现为包含这些步骤的程序。该程序可以通过CD-ROM等记录介质或通信网络等传输介质流通。
本发明可以提供一种内容篡改检测装置，其用于检测出对规定内容进行了预先确定的重大篡改的情况。

图1所示为现有篡改检测服务器100的结构图。
图2所示为实施方式1的内容提供系统的硬件结构图。
图3所示为实施方式1的服务器1的结构框图。
图4所示为以HTML描述的原始主页的源内容(备份内容)的一例。
图5所示为关键字/权重存储部64中存储的关键字和权重的具体示例。
图6所示为原始源内容被篡改后的第1内容(以下称为“第1篡改内容”)的一例。
图7所示为原始源内容被篡改后的第2内容(以下称为“第2篡改内容”)的一例。
图8所示为显示警告时的显示状况示例。
图9所示为实施方式1的内容篡改检测装置16的动作流程图。
图10所示为实施方式2的服务器91的结构框图。
图11所示为实施方式2的内容篡改检测装置92的动作流程图。
具体实施例方式
以下参照

本发明的最佳实施方式。
(实施方式1)首先，通过图2～图8说明实施方式1的内容提供系统的结构。
图2所示为实施方式1的内容提供系统的硬件结构图。实施方式1的内容提供系统是用于收发主页源内容(以下简称为“源内容”)的系统。实施方式1的内容提供系统如图2所示，由具有内容篡改检测装置16的服务器1、管理者计算机2、多个用户计算机3、分别与管理者计算机2和各用户计算机3连接的多个显示装置4，以及将服务器1、管理者计算机2和各用户计算机3相互连接的互联网5构成。
服务器1是根据用户的访问将源内容发送到该用户使用的计算机3的装置。管理者计算机2是主页管理者使用的装置，各用户计算机3是希望浏览主页的用户使用的装置。
图3所示为上述内容提供系统的服务器1的结构框图。如上所述，服务器1是根据用户的访问发送源内容的装置。如图3所示，服务器1具有公开内容存储部11、受理部12、提取部13、发送部14、备份存储部15和内容篡改检测装置16。
公开内容存储部11是用于存储互联网5上公开提供的主页的源内容的结构单元，是第1存储单元的一个例子。另外，在实施方式1中，假定原始的(被篡改前的)源内容是以HTML(Hyper Text Markup Language)描述的。关于原始源内容的具体例子，将通过图4在后描述。而且假定公开内容存储部11有可能被不具有关于改写源内容的权限的用户非法访问。
受理部12是用于从用户使用的用户计算机3受理该用户的访问的结构单元；提取部13是根据受理部12受理的用户的访问，从公开内容存储部11提取源内容的结构单元。发送部14是通过互联网5，将提取部13提取的源内容发送到用户使用的用户计算机3的结构单元；备份存储部15是第2存储单元的一个例子，是用于存储作为原始源内容备份的备份内容的结构单元。另外，备份存储部15与公开内容存储部11不同，假定其不会被不具有改写源内容权限的用户访问。即，假定备份内容不会被篡改。
内容篡改检测装置16当原始源内容被进行了主页管理者预先确定的重大篡改时，检测出该篡改。如图3所示，内容篡改检测装置16具备读取判断部61、读取部62、比较部63、关键字/权重存储部64、关键字判断部65、检测关键字存储部66、权重加法运算部67、阈值存储部68、警告判断部69和警告输出部70。
读取判断部61是访问公开内容存储部11和备份存储部15，并判断是否可以逐行读取源内容和备份内容的结构单元。在实施方式1中，如上所述，原始源内容是以HTML描述的，备份内容是原始源内容的备份，因此原始源内容和备份内容可以逐行读取。因此，当公开内容存储部11中存储的源内容是原始源内容或者是利用HTML对原始源内容篡改后的内容时，源内容可以逐行读取。
读取部62是从公开内容存储部11和备份存储部15分别逐行读取源内容和备份内容的结构单元。
比较部63是将读取部62读取的源内容与备份内容进行对比，并检测出源内容与备份内容的差分的结构单元。关键字/权重存储部64是用于存储主页管理者预先选择的多个关键字、和上述管理者预先向各关键字分配的权重的结构单元。关键字和权重用于判断对原始源内容的篡改是否是上述管理者预先确定的重大篡改。关键字和权重的具体示例将通过图5后述。
关键字判断部65是这样的结构单元，即对比较部63检测出的各差分，判断出表示该差分的属性的标识符中是否包含有关键字/权重存储部64中存储的多个关键字当中的一个，并且判断包含哪个关键字。标识符是与差分相关的部位的一个例子。检测关键字存储部66是这样的结构单元，其中存储被关键字判断部65判断为包含在标识符中的关键字，以及源内容中包含该关键字的行。权重加法运算(重み加算)部67是针对由比较部63检测出的全部差分，对用分配给各标识符中包含的关键字的权重进行加法运算的结构单元。
阈值存储部68是存储作为判断基准的阈值的结构单元，所述判断基准用于判断是否对原始源内容进行了主页管理者预先确定的重大篡改。警告判断部69是这样的结构单元，即检查权重加法运算部67得到的合计值是否超过阈值存储部68中存储的阈值，并当合计值超过阈值时判断为输出警告，当合计值小于等于阈值时判断为不输出警告。警告输出部70是这样的结构单元，即在警告判断部69判断为输出警告的情况下，通过互联网5向主页管理者使用的管理者计算机2输出警告。该警告中包含检测关键字存储部66中存储的各关键字、和源内容中各关键字所在的行。而且，通过与管理者计算机2连接的显示装置4显示警告，对于所显示警告的具体示例，将通过图8在后描述。
图4所示为以HTML描述的原始源内容的一例。原始源内容如图4所示，是利用各种标识符描述所显示主页内的文字或图的大小、形状、颜色等形态的文件数据。在实施方式1中，假设源内容的第1行包含标识符“<http lang＝″ja″>”，第2行包含标识符“<title>”，第7行包含标识符“<comment>”，第10行和第25行包含标识符“<jpg>”。另外，图4左端的数n(n为自然数)表示源内容中的行数。
图5所示为关键字/权重存储部64中存储的关键字和权重的具体示例。关键字和权重如上所述，用于判断对源内容的篡改是否是主页管理者预先确定的重大篡改。在实施方式1中，如图5所示，作为关键字例举了“http”、“jpg”、“cgi”、“exe”、“title”，并分别将权重“6”、“10”、“15”、“20”、“20”分配给各关键字。关键字是由上述管理者选择的，权重是由上述管理者分配的。所分配的权重的数字越大，对管理者来说越重要。
图6所示为图4所示的原始源内容被不具有改写权限的用户非法篡改后的第1内容(第1篡改内容)的示例。与图4所示的原始源内容对比，图6所示的第1篡改内容明显是原始源文件的第7行和第25行这2处被篡改后的内容。
图7所示为图4所示的原始源内容被不具有改写权限的用户非法篡改后的第2内容(第2篡改内容)的示例。与图4所示原始源内容对比，图7所示的第2篡改内容明显是原始源文件的第2行、第7行、第10行和第25行这4处被篡改后的内容。
图8所示为从输出部70输出的警告由与管理者计算机2相连的显示装置4显示时的显示状况的示例。警告输出部70输出警告后，与管理者计算机2相连的显示装置4如图8所示，显示出“主页中识别出重大篡改”的文字。而且，显示装置4还显示被篡改且标识符内包含关键字/权重存储部64中存储的关键字的行的编号，以及该关键字。
以下，说明实施方式1的内容提供系统的动作。
首先，简要说明用户想要浏览主页时内容提供系统的动作。
用户想要浏览主页时，利用自己使用的用户计算机3，通过互联网5访问服务器1。在服务器1中，受理部12受理用户的访问，提取部13根据受理部12受理的用户访问，从公开内容存储部11中提取源内容；发送部14通过互联网5，将提取部13提取的源内容发送给来访的用户计算机3。用户计算机3利用浏览器再生源内容，与用户计算机3相连的显示装置4显示根据源内容再生的图像。源内容如果是原始源内容，则用户就可以浏览期望的主页。
但是，如上所述，公开内容存储部11有可能被不具有改写源内容权限的用户非法访问。因此，公开内容存储部11中存储的源内容有可能不是原始的源内容，而是对其篡改后的内容。以下，通过图9说明内容篡改检测装置16的动作，其检测出对原始源内容进行了主页管理者预先确定的重大篡改的情况。
图9所示为实施方式1的服务器1具备的内容篡改检测装置16的动作流程图。假定内容篡改检测装置16每天在规定时刻(例如每天8点)，检查是否有人对源内容进行了重大篡改。
每天到规定时刻时，读取判断部61访问公开内容存储部11和备份存储部15，判断是否可以分别逐行读取公开内容存储部11中存储的源内容、和备份存储部15中存储的备份内容(S1)。无法逐行读取源内容和备份内容两者或当中的一个时(S1为“否”)，内容篡改检测装置16结束动作。如上所述，在实施方式1中，原始源内容以HTML描述，而备份内容则是原始源内容的备份，因而也以HTML描述。因此，如果源内容是原始源内容或者是通过HTML对原始源内容篡改后的内容，则源内容和备份内容可以逐行读取(S1为“是”)。这样，在可以逐行读取源内容和备份内容的情况下(S1为“是”)，读取部62从公开内容存储部11和备份存储部15，分别逐行读取源内容和备份内容(S2)。
然后，比较部63将读取部62读取的每行源内容和备份内容进行对比，并检查源内容与备份内容是否存在差分(S3)。如果没有差分(S3为“否”)，内容篡改检测装置16的动作返回到上一步骤，即判断是否可以对源内容和备份内容的、分别已读取区域的下一部分读取1行的步骤(以下称为“读取判断步骤”)(S1)。例如，公开内容如果是图6所示的第1篡改内容，则该第1篡改内容的第1行与图4所示的备份内容的第1行相同，两者没有差异。因此，在这种情况下，内容篡改检测装置16的动作返回到读取判断步骤(S1)，即判断是否可以对源内容和备份内容的第2行读取1行。
与此相对，如果源内容和备份内容存在差分(S3为“是”)，关键字判断部65取得关键字/权重存储部64中存储的多个关键字(S4)。然后，关键字判断部65将表示差分属性的标识符和从关键字/权重存储部64取得的多个关键字进行对照，判断标识符中是否包含多个关键字当中的一个(S5)。并且，关键字判断部65判断标识符中包含的关键字是哪一个。结果，如果标识符中不包含任何关键字(S5为“否”)，则内容篡改检测装置16的动作返回上述读取判断步骤(S1)。
在此，说明一具体示例，该例子中，假定源内容是图6所示的第1篡改内容，源内容和备份内容存在差分，但表示该差分的属性的标识符中不包含关键字/权重存储部64中所存储的任何一个关键字。
注意第1篡改内容(参照图6)和备份内容(参照图4)的第7行，第1篡改内容中描述为“<comment>产品种类</comment>”，而备份内容中描述为“<comment>商品种类</comment>”。因此，比较部63对第1篡改内容和备份内容的第7行，检测出相对备份内容的“商品”部分的差分“产品”(S3为“是”)。但是，表示该差分“产品”属性的标识符从图6的第7行可看出，为“<comment>”，该标识符当中不包含关键字/权重存储部64中所存储的任何一个关键字(参照图5)(S5为“否”)。因此，内容篡改检测装置16的动作返回上述读取判断步骤(S1)。
而当关键字判断部65判断为在表示差分属性的标识符中，包含有关键字/权重存储部64中所存储的任意一个关键字时(S5为“是”)，检测关键字存储部66存储该关键字和源内容中包含该关键字的行(S6)。权重加法运算部67从关键字/权重存储部64取得分配给该关键字的权重(S7)。然后，权重加法运算部67对源内容和备份内容的已对比区域的全部差分，对与表示各差分属性的标识符中包含的关键字对应的权重的合计值(到上次为止的总权重)，加上从关键字/权重存储部64取得的权重(表示关键字判断部65本次检测差分属性的标识符中包含的关键字的权重)(S8)。即，权重加法运算部67对源内容和备份内容的、到本次为止已对比区域的全部差分，获得与表示各差分属性的标识符中包含的关键字对应的权重的合计值(到本次为止的总权重)(S8)。
在此，说明一具体例，在该具体例中，假定源内容是图7所示的第2篡改内容，源内容和备份内容有差分，并且表示该差分的属性的标识符中包含关键字/权重存储部64中存储的一个关键字。
注意第2篡改内容(参照图7)和备份内容(参照图4)的第2行，第2篡改内容中描述为“<title>×××电器株式会社</title>”，而备份内容中描述为“<title>○○○电器株式会社</title>”。因此，比较部63对第2篡改内容和备份内容的第2行，检测出相对备份内容的“○○○”部分的差分“×××”(S3为“是”)。表示该差分“×××”属性的标识符可从图7的第2行看出，为“<title>”，该标识符当中包含关键字/权重存储部64中存储的“title”(S5为“是”)。
但是，从图7和图4可看出，第2篡改内容和备份内容的第1行中不存在差分。因此，到源内容的第1行为止的总权重(到上次为止的总权重)为“0”。因此，权重加法运算部67将关键字“title”的权重“20”(参照图5)加到到上次为止的总权重“0”上，从而得到到本次为止的总权重“20”(S8)，所述关键字“title”包含在表示关键字判断部65本次检测的差分(第2行的差分)的属性的标识符中。
作为其它的例子，注意第2篡改内容(参照图7)和备份内容(参照图4)的第10行，第2篡改内容中描述为“<jpg>小汽车</jpg>”，而备份内容中描述为“<jpg>等离子电视</jpg>”。因此，比较部63对第2篡改内容和备份内容的第10行，检测出相对备份内容的“等离子电视”部分的差分“小汽车”(S3为“是”)。从图7的第10行可看出，表示该差分“小汽车”的属性的标识符为“<jpg>”，该标识符当中包含关键字/权重存储部64中存储的“jpg”(S5为“是”)。在此，假定到源内容和备份内容的第9行为止的总权重(到上次为止的总权重)为“20”，则权重加法运算部67将关键字“jpg”的权重“10”(参照图5)加到到上次为止的总权重“20”上，从而得到到本次为止的总权重“30”(S8)，所述关键字“jpg”包含在表示关键字判断部65本次检测的差分(第10行的差分)的属性的标识符中。
这样，在得到到本次为止的总权重后，警告判断部69取得阈值存储部68中存储的阈值(S9)，然后检查权重加法运算部67得到的合计值(到本次为止的总权重)是否超过所取得的阈值(阈值存储部68中存储的阈值)(S10)。如果到本次为止的总权重小于等于阈值(S10为“否”)，则警告判断部69判断不输出警告，并返回上述读取判断步骤(S1)。
如果到本次为止的总权重超过阈值(S10为“是”)，则警告判断部69判断输出警告，并基于该判断，警告输出部70通过互联网5向主页管理者使用的管理者计算机2输出警告(S11)。此时，警告输出部70还输出一信息，该信息用于确定检测关键字存储部66中存储的各关键字、和源内容中包含各关键字的行。
管理者计算机2通过与管理者计算机2连接的显示装置4，显示警告输出部70输出的警告(参照图8)。这样，上述管理者在对源内容被进行了自己预先确定的重大篡改时，可以知晓该篡改。而且，如图8所示，显示装置4显示出对内容进行了篡改的且标识符中包含关键字的行的编号和关键字，因此上述管理者可以知晓源内容的哪个部分被进行了重大篡改。
如上所述，实施方式1的内容篡改检测装置16将源内容和备份内容进行对比，判断表示两内容的差分属性的标识符中是否包含主页管理者所选择的关键字。然后，内容篡改检测装置16在与标识符中包含的关键字对应的权重的相加值超过上述管理者设定的阈值时，向上述管理者输出警告。
例如，图6所示的第1篡改内容与图4所示的原始源内容相比可以看出，第7行和第15行这2个部位被篡改。但是，上述管理者将阈值设定为“25”时，将第1篡改内容和备份内容进行对比得到的总权重为“10”，不超过“25”，因此视为没有进行上述管理者预先确定的重大篡改，不输出警告。
而图7所示的第2篡改内容是图4所示的原始源内容的第2行、第7行、第10行和第25行这4个部位被篡改的内容。因此，第2篡改内容和备份内容在对比到第9行时，权重加法运算部67算出的总权重为“30”，超过了“25”。这样，如果原始源内容被篡改为第2篡改内容，则判断为对原始源内容进行了重大篡改，并输出警告。
这样，实施方式1的内容篡改检测装置16不是在原始源内容被篡改的所有情况下都输出警告，而是仅在原始源内容被进行了主页管理者预先确定的重大篡改的情况下，才输出警告。结果，上述管理者仅在源内容被进行了自己预先确定的重大篡改的情况下，才知晓该篡改。
另外，在上述实施方式1中，权重加法运算部67是针对每行源内容算出权重的合计值，但权重加法运算部67也可以不算出每行的权重合计值，而是算出每个规定范围内的合计值。而且，权重加法运算部67也可以在对整个源内容和整个备份内容进行对比后，得到全部与表示差分属性的标识符中包含的各关键字对应的权重的合计值。
关键字判断部65也可以不通过对表示差分属性的标识符和关键字/权重存储部64中存储的多个关键字进行对照，来判断标识符中是否包含多个关键字当中的一个，而是如下进行判断。即，关键字判断部65也可以将差分自身与上述多个关键字进行对照，并判断差分当中是否包含多个关键字当中的一个。这种情况下，权重加法运算部67对源内容和备份内容中被对比区域的所有差分，得到与各差分中包含的关键字对应的权重的合计值。在此，差分自身是与差分相关的部位的一个例子。另外，与差分关联的部位不限于表示差分属性的标识符和差分自身。
(实施方式2)以下，通过图10和图11说明实施方式2的服务器91和内容篡改检测装置92。
实施方式1的内容篡改检测装置16将源内容和备份内容进行对比，当与表示两个内容差分的属性的标识符中包含的关键字对应的权重的相加值超过规定阈值时，输出警告。而实施方式2的内容篡改检测装置92则如后所述，将源内容和备份内容进行对比后，计算表示两内容差分属性的标识符中包含的关键字的个数，当所计算的个数超过规定的阈值时，输出警告。
该点是实施方式2与实施方式1的不同点，因此在本实施方式2中，以与实施方式1的不同点为中心进行说明。另外，在实施方式2中，对于与实施方式1中出现的构成部分相同的构成部分使用相同的符号，省略对其的重复说明。
图10所示为实施方式2的服务器91的结构框图。服务器91是根据用户的访问发送源内容的装置。服务器91如图10所示，具有公开内容存储部11、受理部12、提取部13、发送部14、备份存储部15和内容篡改检测装置92。
内容篡改检测装置92是当原始源内容被进行了主页管理者预先确定的重大篡改时检测出该篡改的装置。如图10所示，内容篡改检测装置92包括读取判断部61、读取部62、比较部63、关键字存储部93、关键字判断部65、检测关键字存储部66、计测部94、阈值存储部95、警告判断部96和警告输出部70。
关键字存储部93是用于存储主页管理者预先选择的多个关键字的结构单元。关键字用于判断对原始源文件的篡改是否是上述管理者预先确定的重大篡改。计测部94是就比较部63检测出的全部差分，计算表示差分属性的各标识符中包含的关键字个数的结构单元。
阈值存储部95是存储阈值的结构单元，该阈值作为判断是否有人对原始源内容进行了主页管理者预先确定的重大篡改的判断基准。警告判断部96是检查计测部94计测的合计个数是否超过阈值存储部95中存储的阈值，当合计个数超过阈值时，判断为输出警告，当合计个数小于等于阈值时，判断为不输出警告的结构单元。
以下通过图11说明实施方式2的内容篡改检测装置92的动作。
图11所示为实施方式2的内容篡改检测装置92的动作流程图。假定内容篡改检测装置92在每天的规定时刻检查是否有人对源内容进行了重大篡改。
每天到规定时刻时，读取判断部61访问公开内容存储部11和备份存储部15，判断是否可以分别逐行读取公开内容存储部11中存储的源内容、和备份存储部15中存储的备份内容(S21)。无法逐行读取源内容和备份内容两者或当中的一个时(S21为“否”)，内容篡改检测装置92结束动作。可以逐行读取源内容和备份内容的情况下(S21为“是”)，读取部62从公开内容存储部11和备份存储部15分别逐行读取源内容和备份内容(S22)。
然后，比较部63将读取部62读取的每行源内容和备份内容进行对比，并检查源内容与备份内容是否存在差分(S23)。如果没有差分(S23为“否”)，内容篡改检测装置92的动作返回上一步骤，即判断是否可以对源内容和备份内容的各自己读取区域的下一部分读取1行的步骤(以下称为“读取判断步骤”)(S21)。
与此相对，如果源内容和备份内容存在差分(S23为“是”)，关键字判断部65取得关键字存储部93中存储的多个关键字(S24)。然后，关键字判断部65将表示差分属性的标识符与从关键字存储部93取得的多个关键字进行对照，判断标识符中是否包含多个关键字当中的一个(S25)。并且，关键字判断部65判断标识符中包含的关键字是哪一个。
判断结果，如果标识符中不包含任何关键字(S25为“否”)，则内容篡改检测装置92的动作返回上述读取判断步骤(S21)。
而当表示差分属性的标识符中包含关键字存储部93中存储的任意一个关键字时(S25为“是”)，检测关键字存储部66存储该关键字和源内容中包含该关键字的行(S26)。然后，计测部94对源内容与备份内容的已对比区域的全部差分，将表示关键字判断部65本次检测出的差分的属性的标识符中包含的关键字的个数(通常为“1”)，与表示各差分的属性的标识符中包含的关键字的合计个数(到上次为止的总个数)相加(S27)。即，计测部94对源内容和备份内容的到本次为止已对比区域的全部差分，得到表示各差分属性的标识符中包含的关键字的合计个数(到本次为止的总个数)(S27)。
这样，在得到到本次为止的总个数后，警告判断部96取得阈值存储部95中存储的阈值(S28)，然后检查计测部94得到的合计个数(到本次为止的总个数)是否超过所取得的阈值(阈值存储部95中存储的阈值)(S29)。如果到本次为止的总个数小于等于阈值(S29为“否”)，警告判断部96判断为不输出警告，并返回上述读取判断步骤(S21)。
如果到本次为止的总个数超过阈值(S29为“是”)，警告判断部96判断为输出警告，根据该判断，警告输出部70通过互联网5向主页管理者使用的管理者计算机2输出警告(S30)。此时，警告输出部70还输出一信息，该信息用于确定检测关键字存储部66中存储的各关键字、和源内容中包含各关键字的行。
管理者计算机2通过与管理者计算机2连接的显示装置4，显示警告输出部70输出的警告(参照图8)。这样，上述管理者在有人对源内容进行了自己预先确定的重大篡改时，可以知晓该篡改。而且，如图8所示，显示装置4显示内容被篡改且标识符中包含关键字的行的编号和关键字，因此，上述管理者可以知晓源内容的哪个部分被进行了重大篡改。
如上所述，实施方式2的内容篡改检测装置92将源内容和备份内容进行对比，判断表示两内容的差分的属性的标识符中是否包含主页管理者所选择的关键字。然后，内容篡改检测装置92在标识符中包含的关键字的个数超过上述管理者设定的阈值时，向上述管理者输出警告。
即，实施方式2的内容篡改检测装置92不是在原始源内容被篡改的所有情况下都输出警告，而是仅在原始源内容被进行了上述管理者预先确定的重大篡改的情况下，才输出警告。结果，上述管理者仅在源内容被进行了自己预先确定的重大篡改的情况下，才知晓该篡改。
另外，在上述实施方式2中，计测部94对每行源内容计算关键字的合计个数，但也可以不对每行计算合计个数，而是对每个规定范围计算关键字的合计个数。而且，计测部94也可以在对整个源内容和整个备份内容进行对比后，得到全部表示差分的属性的标识符中包含的关键字的合计个数。
关键字判断部65也可以将差分自身与关键字存储部93中存储的多个关键字进行对照，判断差分当中是否包含多个关键字当中的一个。这种情况下，计测部94对源内容和备份内容的被对比区域的所有差分，得到各差分中包含的关键字的合计个数。在此，差分自身是与差分关联的部位的一个例子。另外，与差分关联的部位不限于表示差分属性的标识符和差分自身。
另外，警告判断部96也可以在关键字判断部65判断为与差分关联的部位(标识符内或差分内)中包含关键字时，直接判断为输出警告。
产业上的实用性本发明的内容篡改检测装置具有可以检测出对规定内容进行了预先确定的重大篡改情况的效果，并且可以用作内容篡改检测装置等，检测对互联网上公开的主页等的内容的篡改。
权利要求
1.一种内容篡改检测装置，用于检测对互联网上公开的内容进行的篡改，其特征在于，具有比较单元，将第1存储单元中存储的第1内容和第2存储单元中存储的第2内容进行对比，并检测出所述第1内容和所述第2内容的差分；关键字判断单元，针对由所述比较单元检测的各差分，判断在与所述差分关联的部位是否包含规定的关键字；警告判断单元，利用由所述关键字判断单元得到的判断结果，判断是否输出警告；以及警告输出单元，当所述警告判断单元判断为输出警告时，输出警告。
2.如权利要求1所述的内容篡改检测装置，其特征在于，与所述差分关联的部位是表示所述差分的属性的标识符。
3.如权利要求1所述的内容篡改检测装置，其特征在于，与所述差分关联的部位是所述差分自身。
4.如权利要求1所述的内容篡改检测装置，其特征在于，所述关键字存在多个，并且各所述关键字中分配有规定的权重；所述关键字判断单元判断在与所述差分关联的部位中包含的所述关键字是否是多个所述关键字当中的一个；所述内容篡改检测装置还具有权重加法运算单元，该权重加法运算单元利用由所述关键字判断单元得到的判断结果，针对由所述比较单元检测出的全部差分，将分配到与各所述差分关联的部位中包含的所述关键字的权重相加；在由所述权重加法运算单元得到的合计值超过规定阈值时，所述警告判断单元判断为输出警告。
5.如权利要求4所述的内容篡改检测装置，其特征在于，所述比较单元从头开始依次对每个相互对应的规定范围的所述第1内容和所述第2内容进行对比，并检测出各范围的差分；在所述比较单元每次结束各所述范围的对比时，所述权重加法运算单元针对由所述比较单元对比的全部范围的全部差分，将分配到与各所述差分关联的部位中包含的所述关键字的权重相加；在所述权重加法运算单元每次结束运算时，所述警告判断单元判断由所述权重加法运算单元得到的合计值是否超过所述阈值，所述合计值超过所述阈值时，判断为输出警告。
6.如权利要求5所述的内容篡改检测装置，其特征在于，所述规定范围为1行。
7.如权利要求1所述的内容篡改检测装置，其特征在于，还具有计测单元，计测单元针对由所述比较单元检测出的全部差分，计算与各所述差分关联的部位中包含的所述关键字的个数；在所述计测单元计算出的个数超过规定阈值时，所述警告判断单元判断为输出警告。
8.如权利要求7所述的内容篡改检测装置，其特征在于，所述比较单元从头开始依次对每个相互对应的规定范围的所述第1内容和所述第2内容进行对比，并检测出各范围的差分；在所述比较单元每次结束各所述范围的对比时，所述计测单元针对由所述比较单元对比的全部范围的全部差分，计算与各所述差分关联的部位中包含的所述关键字的个数；在所述计测单元每次结束计算时，所述警告判断单元判断所述计测单元计算出的个数是否超过所述阈值，在计算出的个数超过所述阈值时，判断为输出警告。
9.如权利要求8所述的内容篡改检测装置，其特征在于，所述规定范围为1行。
10.如权利要求1所述的内容篡改检测装置，其特征在于，所述第1内容是所述互联网上公开提供的主页的源内容；所述第2内容是原始的所述源内容的备份。
11.一种服务器，在互联网上公开内容、并检测对所述内容进行的篡改，其特征在于，包括存储第1内容的第1存储单元；存储第2内容的第2存储单元；根据用户的访问发送所述第1内容的发送单元；比较单元，将第1存储单元中存储的第1内容和第2存储单元中存储的第2内容进行对比，并检测出所述第1内容和所述第2内容的差分；关键字判断单元，针对由所述比较单元检测的各差分，判断在与所述差分关联的部位是否包含规定的关键字；警告判断单元，利用由所述关键字判断单元得到的判断结果，判断是否输出警告；以及警告输出单元，当所述警告判断单元判断为输出警告时，输出警告。
12.一种内容篡改检测方法，用于检测对互联网上公开的内容进行的篡改，其特征在于，包括比较步骤，将第1存储单元中存储的第1内容和第2存储单元中存储的第2内容进行对比，并检测出所述第1内容和所述第2内容的差分；关键字判断步骤，针对所述比较步骤中检测出的各差分，判断与所述差分关联的部位中是否包含有规定的关键字；警告判断步骤，利用所述关键字判断步骤中得到的判断结果，判断是否输出警告；以及警告输出步骤，当所述警告判断步骤中判断为输出警告时，输出警告。
13.一种计算机执行程序，用于检测对互联网上公开的内容进行的篡改，其特征在于，包括比较步骤，将第1存储单元中存储的第1内容和第2存储单元中存储的第2内容进行对比，并检测出所述第1内容和所述第2内容的差分；关键字判断步骤，针对所述比较步骤中检测出的各差分，判断与所述差分关联的部位中是否包含有规定的关键字；警告判断步骤，利用所述关键字判断步骤中得到的判断结果，判断是否输出警告；以及警告输出步骤，当所述警告判断步骤中判断为输出警告时，输出警告。
全文摘要
本发明提供了一种检测出对规定内容进行了预先确定的重大篡改的情况的内容篡改检测装置。内容篡改检测装置(16)具有比较部(63)，将公开内容存储部(11)内的主页的源内容和备份存储部(15)内的备份内容进行对比，并检测出两者差分；关键字判断部(65)，针对所检测的各差分，判断表示该差分属性的标识符中是否包含规定关键字，并判断所包含的关键字是哪一个；权重加法运算部(67)，将由比较部(63)检测出的全部差分的各标识符中包含的关键字上所分配的权重相加；警告判断部(69)，当权重加法运算部(67)得到的合计值超过规定阈值时，判断为输出警告；以及警告输出部(70)，当判断为输出警告时，输出警告。
文档编号G06F12/14GK1642113SQ200510004730
公开日2005年7月20日申请日期2005年1月17日优先权日2004年1月15日
发明者角浩二申请人:松下电器产业株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：角浩二
技术所有人：松下电器产业株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。