一种基于社交网络的服务竞争性实现系统及方法

文档序号:6509779阅读:148来源:国知局
一种基于社交网络的服务竞争性实现系统及方法
【专利摘要】一种基于社交网络的服务竞争性实现系统及方法,包括服务采集模块、服务信息分析模块、服务社交网络构建模块、服务竞争性分析模块、服务数据库及终端用户接口。本发明在用户当前所使用的Web服务中断或失效时,可以为其提供准确的替代服务。
【专利说明】—种基于社交网络的服务竞争性实现系统及方法
【技术领域】
[0001]本发明涉及一种基于社交网络的服务竞争性实现系统及方法,属于计算机软件,Web服务【技术领域】。
【背景技术】
[0002]传统的Web服务竞争性分析方法仅仅考虑服务自身的静态信息,例如服务质量、服务功能的相似性等,当用户的原有服务中断或失效而需要替代服务时,往往通过比较用户的需求描述和已有服务的功能的匹配程度,来为用户推荐服务。
[0003]为了更准确地说明服务之间的匹配程度,相似度计算方法被引入到服务比较过程中。它通过一个相似度计算公式将服务之间的功能、质量及其它静态描述信息作比较,从而得到一个量化的相似度分数,并依据此分数来判断服务之间的竞争性。然而,随着Web服务规模的扩大,这种比较过程变得越来越耗时,更为严重的是推荐结果的准确性也越来越低。由于服务数量的增多,功能相似的服务静态描述信息的差别也微乎其微,进而导致量化的相似度分数的差别也变得越来越不显著,使得用户在面对诸多竞争性分数相似的服务时而无法选择,这严重影响了依靠相似度分数来判断服务竞争性解决方案的准确性。
[0004]现有的Web服务竞争性分析方法仅从服务的静态描述信息来判断服务之间的竞争性,而没有从用户使用的动态历史信息中挖掘服务之间的关系,即,现有方法丢失了一部分描述服务之间关系的信息,进而影响了对服务竞争性判断的准确性。另一方面,现有方法对服务竞争结果采用一次计算的方法来进行比较,这种方法在服务规模较小时,可以比较容易的看出结果。但是,当服务规模增大时,这种通过一次计算的结果很难区分服务之间的竞争程度,这也干扰了对服务竞争性判断的准确性。

【发明内容】

[0005]本发明的技术解决问题:克服现有技术的不足,提供一种基于社交网络的服务竞争性实现系统及方法,在用户当前所使用的Web服务中断或失效时,可以为其提供准确的替代服务。
[0006]本发明的技术解决方案:一种基于社交网络的服务竞争性实现系统,包括服务采集模块、服务信息分析模块、服务社交网络构建模块、服务竞争性分析模块、服务数据库及终端用户接口,该系统组成结构如图1所示,其中,服务采集模块用于从Internet上采集用户相关服务信息并将这些信息送至服务信息分析模块;服务信息分析模块再将这些信息进行解析、分类、组合等处理后存储至服务数据库;服务社交网络构建模块从服务数据库中读取分析后的服务信息,组建服务社交网络;服务竞争性分析模块根据服务社交网络挖掘服务之间的相互关系,并通过传播理论将这些关系加强,以确定每个Web服务的竞争性分数,然后将这些信息存储在服务数据库中;用户可以通过系统终端用户接口从服务数据库中快速搜索和选择所需服务。每个模块的详细过程如下所述:
[0007]所述的服务采集模块,用于从不同的Web服务publisher搜集与用户所需功能相关的各种服务,该模块采集的大量服务及相关信息将按照特定格式送至服务信息分析模块。
[0008]所述的服务信息分析模块,是构建服务网络的预处理过程,其作用主要包括:接收并解析服务采集信息,并将解析后的服务信息发送至服务数据库;按照用户的要求对服务添加分类属性标签,即,用户可以根据定制的服务类别属性,来快速搜索并选择所需服务;将服务组建成三元组模式,即〈user, publisher, service〉,并存储在服务数据库中,为Web服务社交网络的构建提供基础数据;提取服务描述的关键字并存储在服务数据库,以供在服务竞争性分析模块中初始化服务竞争性分数使用。
[0009]所述的服务社交网络构建模块,根据服务数据库中服务三元组中的元素及其关系,组建并显示Web服务社交网络,该网络中Web服务之间的相互关系是服务竞争性分析的重要依据。
[0010]所述的服务竞争性分析模块,是该系统的核心部件,该分析过程主要涉及三个主要步骤:首先,初始化各个Web服务竞争性分数。对于每一个功能领域的Web服务,确定一个标准服务(通常为用户当前所使用的服务),采用相似度计算方法,将所采集的服务与标准服务比较,该结果即为服务竞争性初始值。其次,利用传播理论来加强上述竞争性分数的初值。这里需要挖掘Web服务社交网络中服务之间的关系,同时将这种关系与传播理论相关联,然后采用迭代计算的方法使得竞争性分数得到加强和收敛。最后,按照竞争性分数大小对Web服务进行排序。这主要是为了方便终端用户的服务查询需求。
[0011]所述的服务数据库,用户保存采集的服务信息,分析后的服务信息以及服务的竞争性分析结果等内容,是本系统的数据存储截至和交互中心。
[0012]所述终端接口,用户可通过系统终端接口来快速搜索和选择所需服务。
[0013]一种基于社交网络的服务竞争性实现方法的步骤如下:
[0014](I)根据用户当前使用或所需要的服务功能,从Internet上各个Web服务publisher中采集相关的服务信息;
[0015](2)将上述服务信息,按照功能领域进行分类,并添加用户自定义的分类属性标签后存储的在服务数据库中;
[0016](3)从服务数据库中的服务信息中提取服务描述的关键字,并存储在服务数据库中;
[0017](4)从服务数据库中的服务信息中读取服务的user,publisher, service信息,组成〈user, publisher, service)三兀组;
[0018](5)以此三元组中的元素为节点,并以元素之间的关系为边,则构成了一个Web服务社交网络,如图7所示;
[0019](6)根据用户使用历史信息,挖掘并确定上述Web服务社交网络中服务之间的关系,通常包括竞争和协作两种;
[0020](7)利用相似度计算公式,确定每个Web服务的竞争性分数的初值;
[0021](8)利用传播理论并结合步骤(6)中的服务之间的关系信息,通过迭代计算来加强和收敛服务的竞争性分数;
[0022](9)用户可通过上述服务竞争性分数来准确获得所需的服务。
[0023]本发明与现有技术相比的优点在于:[0024](I)本发明的优点在于综合利用Web服务自身的静态描述信息和用户的历史使用信息来分析服务的竞争性。现有的Web服务的竞争性分析方法着眼于服务自身描述信息,仅仅考虑了服务的质量及功能描述等静态信息,而忽略了用户的历史使用信息。本发明从用户使用的历史信息中,充分挖掘了服务之间的关系,确保了服务竞争性分析中信息的完整性。
[0025](2)本发明提供了一种描述服务之间相互关系的新方法。用户对服务调用的历史信息体现了服务之间竞争与组合的关系。如果某几个功能相似的服务同时被一个用户调用,则认为这几个服务之间存在一定的组合关系,被调用次数越多,这种组合关系越强烈;如果某几个功能相似的服务先后被一个用户调用,则认为这几个服务之间存在一定的竞争关系,被调用次数越多,这种竞争性越强烈。本发明采用了社交网络的形式来表现这种服务之间的竞争与组合关系,为服务关系的描述提供了一种新途径。
[0026](3)本发明采用相似度公式来描述服务之间的竞争性初值,为不同服务之间的比较和选择提供了量化依据。
[0027](4)本发明与传统方法相比显著增强了 Web服务竞争性分析的准确性。首先,对用户历史信息的充分挖掘,避免了服务关系信息的丢失;其次,相似度方法的使用为服务竞争性分析结果从定性到定量提供了基础;最后传播理论的迭代方法加强和收敛了竞争性分析结果,从而为用户提供了可靠的选择依据。上述理论和方法确保在用户所使用服务中断或失效时,为其提供准确的替代服务。
[0028](5)本发明可以按照用户自定义的分类属性标签对服务进行分类,极大地方便了用户快速查找并选择替代服务的需求。
【专利附图】

【附图说明】
[0029]图1为本发明系统的组成框图;
[0030]图2为本发明方法的实现流程图;
[0031]图3为服务采集模块的实现流程图;
[0032]图4为服务信息分析模块的实现流程图;
[0033]图5为服务信息关键字提取的实现流程图;
[0034]图6为服务社交网络构建模块的实现流程图;
[0035]图7为服务社交网络示意图;
[0036]图8为服务竞争性分析模块的实现流程图;
[0037]图9为服务关系不意图;
[0038]图10为相似度方法初始化服务竞争性分数实现流程图。
【具体实施方式】
[0039]如图1所示,本发明系统包括:服务信息采集模块、服务信息分析模块、服务网络构建模块、服务竞争性分析模块、服务数据库及终端用户接口。其中:
[0040]服务信息采集模块,主要用于从Internet的Web服务publisher中心,搜索下载用户所需服务或与用户现有服务功能相关的类似服务及其用户使用历史信息。
[0041]服务信息分析模块是在采集过程结束后,对下载后的信息进行功能领域归类、用户自定义标签添加及服务信息三元组构建,并将处理后的信息存储在服务数据库中。
[0042]服务网络构建模块,是为获取服务之间相互关系而使用服务数据库中的服务三元组基础信息来构建Web服务社交网络,这种服务之间的相互关系是本发明中服务竞争性分析的关键依据,也是本发明与传统Web服务竞争性分析的显著区别,它保证了 Web服务竞争性分析中服务信息的完整性。
[0043]服务竞争性分析模块,是本系统的核心组成部分,通过相似度公式计算和服务社交网络可以分别得到服务竞争性初始分数和传播系数,然后利用传播理论将服务竞争性初始分数进行迭代计算,从而获取加强后服务竞争性分数,最后再对这些分数进行排序,以确定服务的竞争性,为用户提供准确的替代服务。
[0044]服务数据库是本发明系统的存储介质和数据交换中心,用于存储系统中各类型的服务信息数据,例如,服务信息解析数据、用户自定义服务属性标签及服务三元组等数据。
[0045]终端是本发明系统与用户的交互接口,用户既可以直接通过功能等关键字查询来获取所需服务,也可以通过开发以本系统中服务数据库为中心的终端系统来使用本发明系统。
[0046]如图2所示,为本发明方法的实现流程图,其主要步骤如下:
[0047](1)服务信息采集模块从1社611161:web Service Publisher中抓取相关与用户现有或所需服务相关的服务信息,形成服务信息的元素数据,即,按照预定义的格式将抓取的服务信息包括用户使用记录、注册中心等传送至服务信息分析模块;
[0048](2)服务信息分析模块将从服务采集模块输送的原始服务信息进行解析,并按照用户自定义的服务属性标签及服务自身功能领域,对解析后的原始服务信息进行归类存储。同时,以〈user, publisher, service〉三元组的形式提取服务中的信息,存储的服务数据库中作为构建Web服务社交网络的基础数据。此外,在该模块中对服务的关键字进行了提取并存储在服务数据库中,以便为服务竞争性模块中的初始化服务竞争性分数提供输A ;
[0049](3)服务社交网络构建模块,调用服务数据库中的服务三元组信息,构建并显示Web服务社交网络,该网络中主要提供Web服务历史调用信息包括使用用户、使用时间等信息,以作为社交网络中服务之间相互关系挖掘的基础;
[0050](4)服务竞争性分析模块,依据服务社交网络中提供的Web服务信息,挖掘服务之间的相互关系包括竞争和协作(也称组合)关系。然后,再利用传播理论将这种关系加强,并量化加强的结果,形成服务竞争性分析结果并存储在服务数据中,以供终端用户使用。
[0051]如图3所示,为服务采集模块的实现流程图,其实现过程如下:
[0052](I)开始服务信息采集,与用户现有或所需服务相关的初始Web Service的URL被加入处理队列;
[0053](2)判断运行队列是否为空;
[0054](3)若处理队列为空,则结束服务信息采集工作;
[0055](4)若处理队列不为空,则抓取网页中所含的Web服务信息,并将等待队列中的一个URL移入运行队列;
[0056](5)将抓取的Web服务信息按照预先定义的格式输出;
[0057](6)判断移入的URL中是否有新的服务信息链接;[0058](7)若没有新的服务信息链接,则将该网页的URL移入完成队列,然后转至步骤
(2);
[0059](8)若有新的服务信息链接,检查网页中包含的下一 Web服务信息链接;
[0060](9)网页中的下一服务信息链接是否指向html的链接;
[0061 ] (10 )若不是指向html链接,则报告其他Web服务链接,然后,转至步骤(6 );
[0062](11)若为指向html链接,则判断新Web服务信息链接与前一 Web服务信息链接是否在同一服务器;
[0063](12)若步骤(11)中的两个Web服务信息链接不是同一服务器,则报告外部链接,然后,转至步骤(6);
[0064](13 )若步骤(11)中的两个Web服务信息链接在同一服务器,则将新链接加入等待队列,然后转至步骤(6)。
[0065]如图4所示,为服务信息处理模块的实现流程图,其实现过程如下:
[0066](I)启动Web服务数据分析程序;
[0067](2)接收从 Internet\Web Service Publisher 采集的格式化 Web 服务数据;
[0068](3)根据预定义规则解析格式化服务信息数据,并将解析后的数据存储到服务数据库;
[0069](4)添加用户自定义的Web`服务属性标签,例如,除功能领域分类外,还可以添加Web服务的使用周期(即使用时间)、自定义的服务质量评级以及服务的历史调用信息等属性标签,并将这些属性标签一并存储在服务数据库中;
[0070](5)利用采集的Web服务数据构建服务三元组,即通过查找服务相关的user和publisher,以〈user, publisher, service〉的形式组成服务三元组,作为构建Web服务社交网络的基础数据,并存储在服务数据库中;
[0071](6)对服务描述中的关键字进行提取,以便为下面的服务相似度函数提供输入,其具体的提取流程参见图5。
[0072]如图5所示,为服务信息关键字提取的实现流程图,这里为提取Web服务描述的关键字,米用了 TF-1DF (term frequency -1nverse document frequency)算法,其基本思想是一个词的重要程度(即关键字)不仅取决与该次在文中出现的频率TF,而且与该词的逆文档频率IDF (可以理解为该词的权重)相关联。即,一个词的重要性的大小可以用该词出现的频率与其逆文档频率的乘积来表示。这里,逆文档频率表示该词的权重,它的大小与一个词的常见程度成反比。下面是实现流程图的具体步骤:
[0073](I)去除服务描述中的停用词,即过滤掉对结果毫无帮助的词,例如,语气词、助词等。如果是非英文等需要分词的描述,则先分词;
[0074](2)统计每个词的词频TF,记录每个词在服务描述中出现的次数;
[0075](3)考虑到不同服务描述的长短不同,为便于比较,使用公式(I)对词频进行标准
化,即,
[0076]
【权利要求】
1.一种基于社交网络的服务竞争性实现系统,其特征在于包括:服务采集模块、服务信息分析模块、服务社交网络构建模块、服务竞争性分析模块、服务数据库及终端用户接口 ;其中: 服务采集模块,从Internet\Web Service Publisher中抓取相关与用户现有或所需服务相关的服务信息,形成服务信息的元素数据,即,按照预定义的格式将抓取的服务信息包括用户使用记录、注册中心传送至服务信息分析模块; 服务信息分析模块,服务信息分析模块将从服务采集模块输送的原始服务信息进行解析,并按照用户自定义的服务属性标签及服务自身功能领域,对解析后的原始服务信息进行归类存储;同时,以〈user, publisher, service〉三元组的形式提取服务中的信息,存储的服务数据库中作为构建Web服务社交网络的基础数据;提取服务描述的关键字并存储在服务数据库,以供在服务竞争性分析模块中初始化服务竞争性分数使用; 服务社交网络构建模块,调用服务数据库中的服务三元组信息,构建并显示Web服务社交网络,该网络中主要提供Web服务历史调用信息包括使用用户、使用时间信息,以作为社交网络中服务之间相互关系挖掘的基础; 服务竞争性分析模块,依据服务社交网络中提供的Web服务信息,挖掘服务之间的相互关系包括竞争和协作也称组合关系;然后,再利用传播理论将这种关系加强,并量化加强的结果,形成服务竞争性分析结果并存储在服务数据中,以供终端用户使用; 服务数据库是本发明系统的存储介质和数据交换中心,用于存储系统中各类型的服务信息数据; 用户通过终端用户接口从服务数据库中快速搜索和选择所需服务。
2.根据权利要求1所述的基于社交网络的服务竞争性实现系统,其特征在于:所述服务竞争性分析模块具体实现如下:首先,初始化各个Web服务竞争性分数;对于每一个功能领域的Web服务,确定一个标`准服务,采用相似度计算方法,将所采集的服务与标准服务比较,该结果即为服务竞争性初始值;其次,利用传播理论来加强上述竞争性分数的初值,这里需要挖掘Web服务社交网络中服务之间的关系,同时将这种关系与传播理论相关联,然后采用迭代计算的方法使得竞争性分数得到加强和收敛;最后,按照竞争性分数大小对Web服务进行排序。
3.一种基于社交网络的服务竞争性实现方法,其特征在于步骤如下: (O根据用户当前使用或所需要的服务功能,从Internet上各个Web服务publisher中采集相关的服务信息; (2)将上述服务信息,按照功能领域进行分类,并添加用户自定义的分类属性标签后存储的在服务数据库中; (3)从服务数据库中的服务信息中提取服务描述的关键字,并存储在服务数据库中; (4)从服务数据库中的服务信息中读取服务的user,publisher, service信息,组成〈user, publisher, service)三兀组; (5)以此三元组中的元素为节点,并以元素之间的关系为边,则构成了一个Web服务社交网络; (6)根据用户使用历史信息,挖掘并确定上述Web服务社交网络中服务之间的关系,通常包括竞争和协作两种;(7)利用相似度计算公式,确定每个Web服务的竞争性分数的初值; (8)利用传播理论并结合步骤(5)中的服务之间的关系信息,通过迭代计算来加强和收敛服务的竞争性分数; (9 )用户可通过上述服务竞争性分数来准确获得所需的服务。
【文档编号】G06F17/30GK103455593SQ201310390913
【公开日】2013年12月18日 申请日期:2013年9月1日 优先权日:2013年9月1日
【发明者】荣文戈, 吴勤奋, 欧阳元新, 彭宝霖, 熊璋 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1