一种向用户提供对象信息的方法和装置制造方法

文档序号:6631261阅读:181来源:国知局
一种向用户提供对象信息的方法和装置制造方法
【专利摘要】本发明提供了一种在计算机设备中向用户提供对象信息的方法,其中,该方法包括以下步骤:a.从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词;b.将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合,其中,该相匹配的关键词集合所描述的对象与所述关键词所描述的对象匹配;c.将所述对象信息提供给所述相匹配的关键词集合所对应的用户。根据本发明的方法,用户不需要经常性地刷新网页,或者通过搜索引擎去查找该用户所关注的对象信息,计算机设备可通过将从对象信息中提取出的关键词与多个关键词集合进行匹配,将该对象信息提供给与关键词相匹配的关键词集合所对应的用户。
【专利说明】一种向用户提供对象信息的方法和装置

【技术领域】
[0001]本发明涉及计算机【技术领域】,尤其涉及一种向用户提供对象信息的方法和装置。

【背景技术】
[0002]目前,互联网上存在大量的多种多样的信息,且信息的发布往往是散乱无序的,或者,仅对信息进行大致的归类并发布(如门户网站会将信息分为娱乐、科技、教育等板块进行发布。因此,当用户希望获得针对一个对象的信息时,其需要自行搜索,并在海量的搜索结果中自行筛选出感兴趣的信息;此外,这种自行搜索的结果中,各个信息的发布也往往是无序的,若用户希望获得一个对象的最新信息,其需要自行查找最新的发布信息。
[0003]很明显地,这种针对一个对象的信息获取方式不仅浪费时间,且导致用户体验满意度较低。


【发明内容】

[0004]本发明的目的是提供一种向用户提供对象信息的方法和装置。
[0005]根据本发明的一个方面,提供一种在计算机设备中向用户提供对象信息的方法,其中,该方法包括以下步骤:
[0006]a.从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词;
[0007]b.将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合,其中,该相匹配的关键词集合所描述的对象与所述关键词所描述的对象匹配;
[0008]c.将所述对象信息提供给所述相匹配的关键词集合所对应的用户。
[0009]根据本发明的另一个方面,还提供了一种在计算机设备中向用户提供对象信息的装置,其中,该装置包括以下装置:
[0010]用于从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的装置;
[0011]用于将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合的装置,其中,该相匹配的关键词集合所描述的对象与所述关键词所描述的对象匹配;
[0012]用于将所述对象信息提供给所述相匹配的关键词集合所对应的用户的装置。
[0013]与现有技术相比,本发明具有以下优点:1)用户不需要通过搜索引擎去查找该用户所关注的对象信息,计算机设备可通过将从对象信息中提取出的关键词与多个关键词集合进行匹配,自动地将该对象信息提供给与关键词相匹配的关键词集合所对应的用户。也即,当计算机设备获得新的对象信息后,可自动将该新的对象信息提供给可能对该新的对象信息感兴趣的用户,因而,很大程度上减少了用户获取信息的时间成本,大大增强了用户的体验满意度。2)在确定相应的关键词集合后,还可根据从对象信息中提取出的关键词来更新该相应的关键词集合,从而使关键词集合能够随着不断发布的新的对象信息进行相应调整。3)可将描述相匹配的对象的关键词聚合为一个关键词集合,从而获得分别描述不同对象的关键词集合,并确定对不同对象感兴趣的用户(即各个关键词集合分别对应的用户)。由此,在后续过程中,对于一个新的对象信息,计算机设备仅需要确定与该新的对象信息中的关键词匹配的关键词集合,即能确定可能对该新的对象信息感兴趣的用户,并进行对象信息的提供操作。

【专利附图】

【附图说明】
[0014]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0015]图1为本发明一个实施例的向用户提供对象信息的方法的流程示意图;
[0016]图2为本发明另一个实施例的向用户提供对象信息的方法的流程示意图;
[0017]图3为本发明一个实施例的向用户提供对象信息的装置的结构示意图;
[0018]图4为本发明另一个实施例的向用户提供对象信息的装置的结构示意图。
[0019]附图中相同或相似的附图标记代表相同或相似的部件。

【具体实施方式】
[0020]下面结合附图对本发明作进一步详细描述。
[0021]图1为本发明一个实施例的向用户提供对象信息的方法的流程示意图。
[0022]其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。
[0023]需要说明的是,所述计算技术设备仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0024]根据本实施例的方法包括步骤S1、步骤S2和步骤S3。
[0025]在步骤SI中,计算机设备从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0026]其中,所述对象信息包括任何用于描述对象的信息;优选地,所述对象信息在网络中的发布及时性能够影响用户对该对象信息的关注的程度;优选地,所述对象信息包括新闻信息。
[0027]其中,对象信息所针对的对象包括任何可被用户关注的事物;优选地,所述对象包括但不限于可被用户关注的人物、事件等。
[0028]其中,从对象信息中提取出的关键词包括任何用于描述该对象信息所针对的对象的词汇;优选地,所述对象信息中包括对该对象信息的概括性或引导性描述,如对象信息中包括主标题、副标题、导语等,且被提取的关键词来自该等概括性或引导性描述;优选地,所述关键词包括但不限于:
[0029]I)地点类词汇,该地点类词汇包括任何用于描述对象所关联的地点的词汇,如“上海”、“北京”、“黄山”、“黄石公园”等。
[0030]2)时间类词汇,该时间类词汇包括任何用于描述对象所关联的时间的词汇,如“2014年3月15日”、“今夏”、“中秋节傍晚”等。
[0031]3)事件类词汇,该事件类词汇包括任何用于描述对象所对应的事件的词汇,如“亚运会”、“马航失事”等。需要说明的是,当一个对象为一个事件时,该事件类词汇包括任何描述该对象的词汇。
[0032]4)人物类词汇,该人物类词汇包括任何用于描述对象所关联的人物的词汇,如新闻事件所涉及的人物姓名;又如,新闻事件所涉及的一群人的总称,如“男篮”、“女排”等。需要说明的是,当一个对象为一个人物时,该人物类词汇包括任何描述该人物的词汇。
[0033]具体地,计算机设备可采用多种方式从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0034]例如,计算机设备可采用特定算法,如自然语言处理算法或主题模式算法等,从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。如对象信息为新闻信息,该新闻包括标题:“张恒夺得亚运会女子飞碟双向团体冠军”。计算机设备采用自然语言处理算法对该标题进行处理,获得该对象信息中的人物类词汇“张恒”,以及事件类词汇“亚运会”、“女子飞碟双向团体”。
[0035]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式,均应包含在本发明的范围内。
[0036]在步骤S2中,计算机设备将所提取的关键词与多个关键词集合进行匹配,确定相匹配的关键词集合。
[0037]其中,该相匹配的关键词集合所描述的对象与所述关键字所描述的对象匹配;优选地,所述匹配表示相匹配的关键词集合所描述的对象与所述关键字所描述的对象相同或者相似。
[0038]优选地,对象信息的时间信息晚于所确定的相匹配的关键词集合中的关键词所来自的对象信息的时间信息。优选地,对象信息的时间信息用于指示该对象信息的发布时间或建立时间。
[0039]具体地,计算机设备可采用多种方式来确定相匹配的关键词集合。
[0040]优选地,步骤S2包括对于多个关键词集合中的全部或部分关键词集合中的每个关键词集合执行的步骤S21,且步骤S2还包括步骤S22。
[0041]在步骤S21中,计算机设备将所述关键词与当前处理的关键词集合中的各个关键词进行比对,来确定所述关键词与该关键词集合中的关键词的相似度。
[0042]其中,计算机设备可基于多种算法确定所述关键词与该关键词集合中的关键词的相似度,例如,字符串相似度算法、基于语义的文本相似度算法、基于空间向量的余弦算法坐寸ο
[0043]在步骤S22中,计算机设备根据所述相似度,确定与所述关键词相匹配的关键词隹A
口 O
[0044]具体地,计算机设备根据所述相似度,确定与所述关键词相匹配的关键词集合的方式包括但不限于:
[0045]I)每执行步骤S21来获得关键词与一个关键词集合的相似度,计算机设备即根据该相似度确定关键词是否与该关键词集合匹配。
[0046]优选地,当相似度高于预定相似度阈值时,计算机设备确定关键词与关键词集合匹配,否则,计算机设备确定关键词与关键词集合不匹配。
[0047]需要说明的是,本实现方式中,计算机设备确定与关键词匹配的一个关键词集合后,可不再继续对未确定是否与关键词匹配的关键词集合执行步骤S21和步骤S22。因此,在此场景下,计算机设备仅需对所述多个关键词集合的部分关键词集合中的每个关键词集合执行步骤S21和步骤S22。例如,预定相似度阈值为60%,关键词集合包括:Setl、Set2、Set3。计算机设备对Setl执行步骤S21并确定关键词与Setl中的关键词的相似度为20%,并经过步骤S22确定关键词与Setl不匹配;接着,计算机设备对Set2执行步骤S21并确定关键词与Set2中的关键词的相似度为70%,并经过步骤S22确定关键词与Set2匹配(也即确定Set2为与关键词相匹配的关键词集合);则由于已找到相匹配的关键词集合,则计算机设备不再对Set3执行步骤S21和步骤S22。
[0048]或者,计算机设备可确定关键词与每个关键词集合的相似度,并选择相似度高于预定相似度阈值的一个或多个关键词集合,作为相匹配的关键词集合。因此,在此场景下,计算机设备会对全部关键词集合执行步骤S21和步骤S22。
[0049]2)计算机设备对全部关键词集合均执行步骤S21,并从中选择相似度最高的关键词集合,或选择相似度高于预定相似度阈值的一个或多个关键词集合,作为相匹配的关键词集合。
[0050]例如,关键词集合包括:Setl、Set2、Set3。在步骤S21中,计算机设备确定关键词与Setl中的关键词的相似度为40%,与Set2的关键词的相似度为80%,关键词与Set3中的关键词的相似度为60% ;则在步骤S22中,计算机设备将所对应的相似度最高的Set2作为与关键词相匹配的关键词集合。
[0051]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所提取的关键词与多个关键词集合进行匹配,确定相匹配的关键词集合的实现方式,均应包含在本发明的范围内。
[0052]在步骤S3中,计算机设备将待提供的对象信息提供给所述相匹配的关键词集合所对应的用户。
[0053]其中,关键词集合所对应的用户包括但不限于关注与关键词集合所描述的对象相关的对象信息的用户等。优选地,关键词集合所对应的用户,包括对该关键词集合中的关键词所来自的对象信息进行标识的用户,其中,对一个对象信息进行标识表示用户关注该对象信息。其中,用户可采用多种方式来标识对象信息;例如,计算机设备向用户推送多个可供订阅的对象信息,则用户浏览该多个对象信息,并进行选择操作,从而对其希望继续关注的对象信息进行标识;又例如,用户通过对用于指示关注该对象信息的按键进行预定操作(如点击等)来标识对象信息。
[0054]例如,关键词集合所描述的对象为“仁川亚运会”,则关键词集合所对应的用户包括关注描述“仁川亚运会”的对象信息的用户。
[0055]又例如,关键词集合包括3个关键词“马航失事”、“客机MH370”、“马航乘客”。其中,该三个关键词分别来自三个对象信息,则该关键词集合所对应的用户包括关注该三个关键词分别来自的三个对象信息的用户。
[0056]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所述对象信息提供给所述相匹配的关键词集合所对应的用户的实现方式,均应包含在本发明的范围内。
[0057]作为一种优选方案,本实施例的方法还包括以下步骤:计算机设备根据所提取的关键词,更新所述相匹配的关键词集合。
[0058]具体地,计算机设备根据所提取的关键词,对与所述关键词相匹配的关键词集合进行合并去重处理。
[0059]例如,计算机设备在步骤SI中提取的关键词包括:亚运会、张恒、女子飞碟双向团体。计算机设备在步骤S2中确定的相匹配的关键词集合包括:仁川、亚运会、女子飞碟。则计算机设备根据所提取的关键词,对相匹配的关键词集合进行合并去重处理,将该相匹配的关键词集合更新为:仁川、亚运会、女子飞碟、张恒、女子飞碟双向团体。
[0060]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所提取的关键词,更新所述相匹配的关键词集合的实现方式,均应包含在本发明的范围内。
[0061]根据本实施例的方案,用户不需要通过搜索引擎去查找该用户所关注的对象信息,计算机设备可通过将从对象信息中提取出的关键词与多个关键词集合进行匹配,自动地将该对象信息提供给与关键词相匹配的关键词集合所对应的用户。也即,当计算机设备获得新的对象信息后,可自动将该新的对象信息提供给可能对该新的对象信息感兴趣的用户,因而,很大程度上减少了用户获取信息的时间成本,大大增强了用户的体验满意度。
[0062]并且,在确定相应的关键词集合后,还可根据从对象信息中提取出的关键词来更新该相应的关键词集合,从而使关键词集合能够随着不断发布的新的对象信息进行相应调難
iF.0
[0063]图2为本发明另一个实施例的向用户提供对象信息的方法的流程示意图。本实施例的方法主要由计算机设备来实现,其中,参照图1所示实施例中对计算机设备所做的任何说明,均以引用的方式包含于此。
[0064]根据本实施例的方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。其中,所述步骤S1、步骤S2和步骤S3已在参照图1所示实施例中予以详述,在此不再赘述。
[0065]在步骤S4中,计算机设备获取从多个对象信息中分别提取出的多个关键词。
[0066]其中,从一个对象信息中提取出的关键词用于描述该对象信息所针对的对象。
[0067]具体地,计算机设备获取从多个对象信息中分别提取出的多个关键词的实现方式包括但不限于:
[0068]I)对于所述多个对象信息中的每个对象信息,计算机设备直接获取已从该对象信息中提取出的多个关键词。
[0069]例如,对于一个对象信息,计算机设备直接从数据库中获取该数据库中存储的、已从该对象信息中提取出的多个关键词。
[0070]2)对于所述多个对象信息中的每个对象信息,计算机设备从该对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0071]其中,计算机设备从对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式,与参照图1所示步骤Si中计算机设备从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式相同或相似,在此不再赘述。
[0072]需要说明的是,作为步骤S4的一种优选方案,对于所述多个对象信息中的每个对象信息,计算机设备可获取从该对象信息中提取出的所有关键词,作为一组关键词词组,其中,从该对象信息中提取出的关键词用于描述该对象信息所针对的对象。并且,与步骤S4的上述两种实现方式相类似的,所述多个对象信息中的每个对象信息,计算机设备可直接获取从该对象信息中提取出的关键词词组,或者,计算机设备从该对象信息中提取用于描述该对象信息所针对的对象的关键词,作为一组关键词词组。
[0073]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取从多个对象信息中分别提取出的多个关键词的实现方式,均应包含在本发明的范围内。
[0074]在步骤S5中,计算机设备通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合。
[0075]具体地,计算机设备通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的实现方式包括但不限于:
[0076]I)在步骤S4中,计算机设备获得分别来自多个对象信息的多个关键词词组,则在步骤S5中,计算机设备以关键词词组作为最小聚合单元,通过将关键词词组中描述相匹配对象的关键词词组聚合为一个关键词集合,来获得至少一个关键词集合。
[0077]例如,从对象信息Infol中提取的一组关键词词组描述的对象为“仁川亚运会”,从对象信息Info2中提取的一组关键词词组描述的对象为“世锦赛”,从对象信息Info3中提取的一组关键词词组描述的对象为“世锦赛”,从对象信息Info4中提取的一组关键词词组描述的对象为“仁川亚运会”,从对象信息Info5中提取的一组关键词词组描述的对象为“仁川亚运会”。则在步骤S5中,计算机设备以关键词词组为最小聚合单元,将Infol对应的一组关键词词组、Info4对应的一组关键词词组、Info5对应的一组关键词词组聚合为一个关键词集合,并将Info2对应的一组关键词词组和Info3对应的一组关键词词组聚合为一个关键词集合。
[0078]其中,需要说明的是,“以关键词词组作为最小聚合单元”表示属于同一组的关键词不会被聚合至两个关键词集合中。例如,若一组关键词词组包括3个关键词,则该3个关键词必定会聚合至一个关键词词组中。需要进一步说明的是,若聚合至同一个关键词集合的不同关键词词组中存在相同或相似的关键词,则可对该等相同或相似的关键词进行去重处理。
[0079]2)计算机设备根据每个关键词所描述的对象,通过直接将描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合。
[0080]例如,在步骤S4中,计算机设备获取关键词:Keyl、Key2、Key3、Key4、Key5、Key6。在步骤S5中,计算机设备直接根据每个关键词所描述的对象,将描述“亚运会”的关键词Keyl、Key2聚合为一个关键词集合,并将描述“世锦赛”的Key3、Key4、Key5、Key6聚合为一个关键词集合。
[0081]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的实现方式,均应包含在本发明的范围内。
[0082]需要说明的是,当关键词集合被确定后,对该关键词集合中所包含的关键词所来自的对象信息进行关注的用户,也被确定为该关键词集合所对应的用户。
[0083]需要说明的是,可针对不同的对象信息多次执行步骤S4和步骤S5,以获得新的关键词集合。并且,若步骤S5基于其实现方式I)来执行,则可将在步骤S5之前已获得的关键字集合作为关键词词组,并以关键词词组作为最小聚合单元,将步骤S4中获得的关键词词组以及步骤S5之前获得的作为关键词词组的关键词集合一起进行聚合,从而获得更新后的关键词集合;若步骤S5基于其实现方式2)来执行,则可对在步骤S5之前已获得的关键字集合中的关键词与步骤S4中获得的关键词进行聚合,从而获得更新后的关键词集合。
[0084]需要说明的是,步骤S4和步骤S5,与步骤S1、步骤S2、步骤S3之间可间隔较长时间。例如,通过一次或多次执行步骤S4和S5并获得至少一个关键词集合后,当获得时间较新的对象信息时,对该对象信息执行步骤S1、S2和S3,以确定该新的对象信息需要被提供至的用户。
[0085]根据本实施例的方案,计算机设备可将描述相匹配的对象的关键词聚合为一个关键词集合,从而获得分别描述不同对象的关键词集合,并确定对不同对象感兴趣的用户(即各个关键词集合分别对应的用户)。由此,在后续过程中,对于一个新的对象信息,计算机设备仅需要确定与该新的对象信息中的关键词匹配的关键词集合,即能确定可能对该新的对象信息感兴趣的用户,并进行对象信息的提供操作。
[0086]图3为本发明一个实施例的向用户提供对象信息的装置的结构示意图。该向用户提供对象信息的装置(以下简称为“提供装置”)包括用于从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的装置(以下简称为“提取装置I”)、用于将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合的装置(以下简称为“匹配装置2”)、以及用于将所述对象信息提供给所述相匹配的关键词集合所对应的用户的装置(以下简称为“子提供装置3”)。
[0087]提取装置I从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0088]其中,所述对象信息包括任何用于描述对象的信息;优选地,所述对象信息在网络中的发布及时性能够影响用户对该对象信息的关注的程度;优选地,所述对象信息包括新闻信息。
[0089]其中,对象信息所针对的对象包括任何可被用户关注的事物;优选地,所述对象包括但不限于可被用户关注的人物、事件等。
[0090]其中,从对象信息中提取出的关键词包括任何用于描述该对象信息所针对的对象的词汇;优选地,所述对象信息中包括对该对象信息的概括性或引导性描述,如对象信息中包括主标题、副标题、导语等,且被提取的关键词来自该等概括性或引导性描述;优选地,所述关键词包括但不限于:
[0091]I)地点类词汇,该地点类词汇包括任何用于描述对象所关联的地点的词汇,如“上海”、“北京”、“黄山”、“黄石公园”等。
[0092]2)时间类词汇,该时间类词汇包括任何用于描述对象所关联的时间的词汇,如“2014年3月15日”、“今夏”、“中秋节傍晚”等。
[0093]3)事件类词汇,该事件类词汇包括任何用于描述对象所对应的事件的词汇,如“亚运会”、“马航失事”等。需要说明的是,当一个对象为一个事件时,该事件类词汇包括任何描述该对象的词汇。
[0094]4)人物类词汇,该人物类词汇包括任何用于描述对象所关联的人物的词汇,如新闻事件所涉及的人物姓名;又如,新闻事件所涉及的一群人的总称,如“男篮”、“女排”等。需要说明的是,当一个对象为一个人物时,该人物类词汇包括任何描述该人物的词汇。
[0095]具体地,提取装置I可采用多种方式从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0096]例如,提取装置I可采用特定算法,如自然语言处理算法或主题模式算法等,从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词。如对象信息为新闻信息,该新闻包括标题:“张恒夺得亚运会女子飞碟双向团体冠军”。提取装置I采用自然语言处理算法对该标题进行处理,获得该对象信息中的人物类词汇“张恒”,以及事件类词汇“亚运会”、“女子飞碟双向团体”。
[0097]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式,均应包含在本发明的范围内。
[0098]匹配装置2将所提取的关键词与多个关键词集合进行匹配,确定相匹配的关键词
口 O
[0099]其中,该相匹配的关键词集合所描述的对象与所述关键字所描述的对象匹配;优选地,所述匹配表示相匹配的关键词集合所描述的对象与所述关键字所描述的对象相同或者相似。
[0100]优选地,对象信息的时间信息晚于所确定的相匹配的关键词集合中的关键词所来自的对象信息的时间信息。优选地,对象信息的时间信息用于指示该对象信息的发布时间或建立时间。
[0101]具体地,匹配装置2可采用多种方式来确定相匹配的关键词集合。
[0102]优选地,匹配装置2包括对于多个关键词集合中的全部或部分关键词集合中的每个关键词集合执行操作的第一确定装置(图未示),且匹配装置2还包括第二确定装置(图未不)O
[0103]第一确定装置将所述关键词与当前处理的关键词集合中的各个关键词进行比对,来确定所述关键词与该关键词集合中的关键词的相似度。
[0104]其中,第一确定装置可基于多种算法确定所述关键词与该关键词集合中的关键词的相似度,例如,字符串相似度算法、基于语义的文本相似度算法、基于空间向量的余弦算法等。
[0105]第二确定装置根据所述相似度,确定与所述关键词相匹配的关键词集合。
[0106]具体地,第二确定装置根据所述相似度,确定与所述关键词相匹配的关键词集合的方式包括但不限于:
[0107]I)第一确定装置每执行操作来获得关键词与一个关键词集合的相似度,第二确定装置即根据该相似度确定关键词是否与该关键词集合匹配。
[0108]优选地,当相似度高于预定相似度阈值时,第二确定装置确定关键词与关键词集合匹配,否则,第二确定装置确定关键词与关键词集合不匹配。
[0109]需要说明的是,本实现方式中,第二确定装置确定与关键词匹配的一个关键词集合后,第一确定装置和第二确定装置可不再继续对未确定是否与关键词匹配的关键词集合执行操作。因此,在此场景下,第一确定装置和第二确定装置仅需对所述多个关键词集合的部分关键词集合中的每个关键词集合执行操作。例如,预定相似度阈值为60%,关键词集合包括:Setl、Set2、Set3。第一确定装置对Setl执行操作并确定关键词与Setl中的关键词的相似度为20%,第二确定装置确定关键词与Setl不匹配;接着,第一确定装置对Set2执行操作并确定关键词与Set2中的关键词的相似度为70%,第二确定装置确定关键词与Set2匹配(也即确定Set2为与关键词相匹配的关键词集合);则由于已找到相匹配的关键词集合,则第一确定装置和第二确定装置不再对Set3执行操作。
[0110]或者,第一确定装置可确定关键词与每个关键词集合的相似度,第二确定装置选择相似度高于预定相似度阈值的一个或多个关键词集合,作为相匹配的关键词集合。因此,在此场景下,第一确定装置和第二确定装置会对全部关键词集合执行操作。
[0111]2)第一确定装置对全部关键词集合均执行操作,第二确定装置从中选择相似度最高的关键词集合,或选择相似度高于预定相似度阈值的一个或多个关键词集合,作为相匹配的关键词集合。
[0112]例如,关键词集合包括:Setl、Set2、Set3。第一确定装置确定关键词与Setl中的关键词的相似度为40%,与Set2的关键词的相似度为80%,关键词与Set3中的关键词的相似度为60% ;第二确定装置将所对应的相似度最高的Set2作为与关键词相匹配的关键词集合。
[0113]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所提取的关键词与多个关键词集合进行匹配,确定相匹配的关键词集合的实现方式,均应包含在本发明的范围内。
[0114]子提供装置3将待提供的对象信息提供给所述相匹配的关键词集合所对应的用户。
[0115]其中,关键词集合所对应的用户包括但不限于关注与关键词集合所描述的对象相关的对象信息的用户等。优选地,关键词集合所对应的用户,包括对该关键词集合中的关键词所来自的对象信息进行标识的用户,其中,对一个对象信息进行标识表示用户关注该对象信息。其中,用户可采用多种方式来标识对象信息;例如,计算机设备向用户推送多个可供订阅的对象信息,则用户浏览该多个对象信息,并进行选择操作,从而对其希望继续关注的对象信息进行标识;又例如,用户通过对用于指示关注该对象信息的按键进行预定操作(如点击等)来标识对象信息。
[0116]例如,关键词集合所描述的对象为“仁川亚运会”,则关键词集合所对应的用户包括关注描述“仁川亚运会”的对象信息的用户。
[0117]又例如,关键词集合包括3个关键词“马航失事”、“客机MH370”、“马航乘客”。其中,该三个关键词分别来自三个对象信息,则该关键词集合所对应的用户包括关注该三个关键词分别来自的三个对象信息的用户。
[0118]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所述对象信息提供给所述相匹配的关键词集合所对应的用户的实现方式,均应包含在本发明的范围内。
[0119]作为一种优选方案,本实施例的提供装置还包括用于根据所提取的关键词,更新所述相匹配的关键词集合的装置(图未示,以下简称为“更新装置”)。
[0120]具体地,更新装置根据所提取的关键词,对与所述关键词相匹配的关键词集合进行合并去重处理。
[0121]例如,提取装置I提取的关键词包括:亚运会、张恒、女子飞碟双向团体。匹配装置2确定的相匹配的关键词集合包括:仁川、亚运会、女子飞碟。则更新装置根据所提取的关键词,对相匹配的关键词集合进行合并去重处理,将该相匹配的关键词集合更新为:仁川、亚运会、女子飞碟、张恒、女子飞碟双向团体。
[0122]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所提取的关键词,更新所述相匹配的关键词集合的实现方式,均应包含在本发明的范围内。
[0123]根据本实施例的方案,用户不需要通过搜索引擎去查找该用户所关注的对象信息,计算机设备可通过将从对象信息中提取出的关键词与多个关键词集合进行匹配,自动地将该对象信息提供给与关键词相匹配的关键词集合所对应的用户。也即,当计算机设备获得新的对象信息后,可自动将该新的对象信息提供给可能对该新的对象信息感兴趣的用户,因而,很大程度上减少了用户获取信息的时间成本,大大增强了用户的体验满意度。
[0124]并且,在确定相应的关键词集合后,还可根据从对象信息中提取出的关键词来更新该相应的关键词集合,从而使关键词集合能够随着不断发布的新的对象信息进行相应调難
iF.0
[0125]图4为本发明另一个实施例的向用户提供对象信息的装置的结构示意图。本实施例的提供装置包括提取装置1、匹配装置2、子提供装置3、用于获取从多个对象信息中分别提取出的多个关键词的装置(以下简称为“第一获取装置4”)、以及用于通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的装置(以下简称为“第二获取装置5”)。其中,所述提取装置1、匹配装置2、子提供装置3已在参照图3所示实施例中予以详述,在此不再赘述。
[0126]第一获取装置4获取从多个对象信息中分别提取出的多个关键词。
[0127]其中,从一个对象信息中提取出的关键词用于描述该对象信息所针对的对象。
[0128]具体地,第一获取装置4获取从多个对象信息中分别提取出的多个关键词的实现方式包括但不限于:
[0129]I)对于所述多个对象信息中的每个对象信息,第一获取装置4直接获取已从该对象信息中提取出的多个关键词。
[0130]例如,对于一个对象信息,第一获取装置4直接从数据库中获取该数据库中存储的、已从该对象信息中提取出的多个关键词。
[0131]2)第一获取装置4包括用于对于所述多个对象信息中的每个对象信息,从该对象信息中提取用于描述该对象信息所针对的对象的关键词的装置(图未示,以下简称为“第三子获取装置”)。对于所述多个对象信息中的每个对象信息,第三子获取装置从该对象信息中提取用于描述该对象信息所针对的对象的关键词。
[0132]其中,第三子获取装置从对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式,与参照图3中提取装置I从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的实现方式相同或相似,在此不再赘述。
[0133]需要说明的是,作为第一获取装置4的一种优选方案,第一获取装置4包括用于对于所述多个对象信息中的每个对象信息,获取从该对象信息中提取出的所有关键词,作为一组关键词词组的装置(图未示,以下简称为“第一子获取装置”),其中,从该对象信息中提取出的关键词用于描述该对象信息所针对的对象。并且,与第一获取装置4的上述两种实现方式相类似的,所述多个对象信息中的每个对象信息,第一子获取装置可直接获取从该对象信息中提取出的关键词词组,或者,第一子获取装置从该对象信息中提取用于描述该对象信息所针对的对象的关键词,作为一组关键词词组。
[0134]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取从多个对象信息中分别提取出的多个关键词的实现方式,均应包含在本发明的范围内。
[0135]第二获取装置5通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合。
[0136]具体地,第二获取装置5通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的实现方式包括但不限于:
[0137]I)第二获取装置5包括用于以关键词词组作为最小聚合单元,通过将关键词词组中描述相匹配对象的关键词词组聚合为一个关键词集合,来获得至少一个关键词集合的装置(图未示,以下简称为“第二子获取装置”)。第一子获取装置获得分别来自多个对象信息的多个关键词词组,则第二子获取装置以关键词词组作为最小聚合单元,通过将关键词词组中描述相匹配对象的关键词词组聚合为一个关键词集合,来获得至少一个关键词集合。
[0138]例如,第一子获取装置从对象信息Infol中提取的一组关键词词组描述的对象为“仁川亚运会”,从对象信息Info2中提取的一组关键词词组描述的对象为“世锦赛”,从对象信息Info3中提取的一组关键词词组描述的对象为“世锦赛”,从对象信息Info4中提取的一组关键词词组描述的对象为“仁川亚运会”,从对象信息Info5中提取的一组关键词词组描述的对象为“仁川亚运会”。则第二子获取装置以关键词词组为最小聚合单元,将Infol对应的一组关键词词组、Info4对应的一组关键词词组、Info5对应的一组关键词词组聚合为一个关键词集合,并将Info2对应的一组关键词词组和Info3对应的一组关键词词组聚合为一个关键词集合。
[0139]其中,需要说明的是,“以关键词词组作为最小聚合单元”表示属于同一组的关键词不会被聚合至两个关键词集合中。例如,若一组关键词词组包括3个关键词,则该3个关键词必定会聚合至一个关键词词组中。需要进一步说明的是,若聚合至同一个关键词集合的不同关键词词组中存在相同或相似的关键词,则可对该等相同或相似的关键词进行去重处理。
[0140]2)第二获取装置5根据每个关键词所描述的对象,通过直接将描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合。
[0141]例如,第一获取装置4获取关键词:Keyl、Key2、Key3、Key4、Key5、Key6。第二获取装置5直接根据每个关键词所描述的对象,将描述“亚运会”的关键词Keyl、Key2聚合为一个关键词集合,并将描述“世锦赛”的Key3、Key4、Key5、Key6聚合为一个关键词集合。
[0142]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的实现方式,均应包含在本发明的范围内。
[0143]需要说明的是,当关键词集合被确定后,对该关键词集合中所包含的关键词所来自的对象信息进行关注的用户,也被确定为该关键词集合所对应的用户。
[0144]需要说明的是,第一获取装置4和第二获取装置5可针对不同的对象信息多次执行操作,以获得新的关键词集合。并且,若第二获取装置5基于其实现方式I)来执行操作,则可将在第二获取装置5执行操作之前已获得的关键字集合作为关键词词组,并以关键词词组作为最小聚合单元,将第一获取装置4获得的关键词词组以及第二获取装置5执行操作之前获得的作为关键词词组的关键词集合一起进行聚合,从而获得更新后的关键词集合;若第二获取装置5基于其实现方式2)来执行,则可对在第二获取装置5执行操作之前已获得的关键字集合中的关键词与第一获取装置4获得的关键词进行聚合,从而获得更新后的关键词集合。
[0145]需要说明的是,第一获取装置4和第二获取装置5,与提取装置1、匹配装置2、子提供装置3执行的操作之间可间隔较长时间。例如,第一获取装置4和第二获取装置5通过一次或多次执行操作来获得至少一个关键词集合后,当获得时间较新的对象信息时,提取装置1、匹配装置2、子提供装置3对该对象信息执行操作,以确定该新的对象信息需要被提供至的用户。
[0146]根据本实施例的方案,计算机设备可将描述相匹配的对象的关键词聚合为一个关键词集合,从而获得分别描述不同对象的关键词集合,并确定对不同对象感兴趣的用户(即各个关键词集合分别对应的用户)。由此,在后续过程中,对于一个新的对象信息,计算机设备仅需要确定与该新的对象信息中的关键词匹配的关键词集合,即能确定可能对该新的对象信息感兴趣的用户,并进行对象信息的提供操作。
[0147]需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0148]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
【权利要求】
1.一种在计算机设备中向用户提供对象信息的方法,其中,该方法包括以下步骤: a.从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词; b.将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合,其中,该相匹配的关键词集合所描述的对象与所述关键词所描述的对象匹配; c.将所述对象信息提供给所述相匹配的关键词集合所对应的用户。
2.根据权利要求1所述的方法,其中,所述对象信息的时间信息晚于所述相匹配的关键词集合中的关键词所来自的对象信息的时间信息。
3.根据权利要求1或2所述的方法,其中,所述步骤b包括对于所述多个关键词集合中的全部或部分关键词集合中的每个执行的以下步骤: -将所述关键词与该关键词集合中的各个关键词进行比对,来确定所述关键词与该关键词集合中的关键词的相似度; 其中,所述步骤b还包括以下步骤: -根据所述相似度,确定与所述关键词匹配的关键词集合。
4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括以下步骤: -根据所提取的关键词,更新所述相匹配的关键词集合。
5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括以下步骤: X获取从多个对象信息中分别提取出的多个关键词,其中,从一个对象信息中提取出的关键词用于描述该对象信息所针对的对象; y通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合。
6.根据权利要求5所述的方法,其中,所述步骤X包括以下步骤: -对于所述多个对象信息中的每个对象信息,获取从该对象信息中提取出的所有关键词,作为一组关键词词组,其中,从该对象信息中提取出的关键词用于描述该对象信息所针对的对象; 其中,所述步骤I包括以下步骤: -以关键词词组作为最小聚合单元,通过将关键词词组中描述相匹配对象的关键词词组聚合为一个关键词集合,来获得至少一个关键词集合。
7.根据权利要求5所述的方法,其中,所述步骤X包括以下步骤: -对于所述多个对象信息中的每个对象信息,从该对象信息中提取用于描述该对象信息所针对的对象的关键词。
8.根据权利要求1至7中任一项所述的方法,其中,关键词集合所对应的用户,包括对该关键词集合中的关键词所来自的对象信息进行标识的用户。
9.根据权利要求1至8中任一项所述的方法,其中,从对象信息中提取出的关键词包括以下至少一种: -地点类词汇; -时间类词汇; -事件类词汇; -人物类词汇。
10.一种在计算机设备中向用户提供对象信息的装置,其中,该装置包括以下装置: 用于从待提供的对象信息中提取用于描述该对象信息所针对的对象的关键词的装置; 用于将所述关键词与多个关键词集合进行匹配,确定相匹配的关键词集合的装置,其中,该相匹配的关键词集合所描述的对象与所述关键词所描述的对象匹配; 用于将所述对象信息提供给所述相匹配的关键词集合所对应的用户的装置。
11.根据权利要求10所述的装置,其中,所述对象信息的时间信息晚于所述相匹配的关键词集合中的关键词所来自的对象信息的时间信息。
12.根据权利要求10或11所述的装置,其中,用于所述确定相匹配的关键词集合的装置包括对于所述多个关键词集合中的全部或部分关键词集合中的每个执行操作的以下装置: 用于将所述关键词与该关键词集合中的各个关键词进行比对,来确定所述关键词与该关键词集合中的关键词的相似度的装置; 其中,所述用于确定相匹配的关键词集合的装置还包括以下装置: 用于根据所述相似度,确定与所述关键词匹配的关键词集合的装置。
13.根据权利要求10至12中任一项所述的装置,其中,该装置还包括以下装置: 用于根据所提取的关键词,更新所述相匹配的关键词集合的装置。
14.根据权利要求10至13中任一项所述的装置,其中,该装置还包括以下装置: 用于获取从多个对象信息中分别提取出的多个关键词的装置,其中,从一个对象信息中提取出的关键词用于描述该对象信息所针对的对象; 用于通过将所述多个关键词中描述相匹配的对象的关键词聚合为一个关键词集合,来获得至少一个关键词集合的装置。
15.根据权利要求14所述的装置,其中,所述用于获取从多个对象信息中分别提取出的多个关键词的装置包括以下装置: 用于对于所述多个对象信息中的每个对象信息,获取从该对象信息中提取出的所有关键词,作为一组关键词词组的装置,其中,从该对象信息中提取出的关键词用于描述该对象信息所针对的对象; 其中,用于获得所述至少一个关键词集合的装置包括以下装置: 用于以关键词词组作为最小聚合单元,通过将关键词词组中描述相匹配对象的关键词词组聚合为一个关键词集合,来获得至少一个关键词集合的装置。
16.根据权利要求14所述的装置,其中,所述用于获取从多个对象信息中分别提取出的多个关键词的装置包括以下装置: 用于对于所述多个对象信息中的每个对象信息,从该对象信息中提取用于描述该对象信息所针对的对象的关键词的装置。
17.根据权利要求10至16中任一项所述的装置,其中,关键词集合所对应的用户,包括对该关键词集合中的关键词所来自的对象信息进行标识的用户。
18.根据权利要求10至17中任一项所述的装置,其中,从对象信息中提取出的关键词包括以下至少一种: -地点类词汇; -时间类词汇;-事件类词汇;-人物类词汇。
【文档编号】G06F17/30GK104391859SQ201410568887
【公开日】2015年3月4日 申请日期:2014年10月22日 优先权日:2014年10月22日
【发明者】张超 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1