一种具有信息发布和搜索功能的系统及信息发布方法

文档序号:6356395阅读:831来源:国知局
专利名称:一种具有信息发布和搜索功能的系统及信息发布方法
一种具有信息发布和搜索功能的系统及信息发布方法
技术领域
本发明涉及搜索技术领域,特别涉及一种具有信息发布和搜索功能的系统及信息 发布方法。
背景技术
随着互联网技术的发展,搜索已经成为了人们生活当中不可或缺的一部分。通过 搜索,人们可以轻易地获取到各个领域的知识和信息,这大大地加速了信息的传播。搜索 技术的出现,极大地改变了人们传统的学习方式,以往需要从图书馆、教育机构才能获取的 知识,现在人们只要轻点一下鼠标,就可以轻松地从浩瀚的互联网信息海洋中获取到。随 着搜索技术向着更加智能的方向发展,人们也越来越容易获取到个性化的信息,然而,随 着TOB2.0的广泛应用,现在的互联网已经成为了一个沟通和交流的平台,人们不仅从互联 网获取信息,更是常常为互联网提供信息,例如人们广泛使用的博客、微博、知识问答社区、 SNS等,都为人们提供了一个发布信息、分享知识的平台,但是目前的还没有一种系统,能够 根据用户输入的信息,判断用户的意图,从而决定是给用户返回搜索结果还是将用户输入 信息发布到上文所述的平台上去。此外,由于目前上文所述的平台彼此之间都是独立的,每 一个发布信息的平台都建立在自己的管理基础之上,如果用户在多个平台都注册了服务, 并且希望在不同的平台发布相同的信息,那么他就不得不在多个平台进行登录和发布的操 作,这显然给用户带来了不便。

发明内容本发明所要解决的技术问题是提供一种具有信息发布和搜索功能的系统及信息 发布方法,以实现通过用户输入信息判断用户意图,并根据用户意图对输入信息进行检索 或发布的目的。本发明为解决技术问题而采用的技术方案是提供一种具有信息发布和搜索功能 的系统,包括展示模块,用于为用户提供所述系统的使用界面,所述使用界面用于接收用 户的输入信息和将所述系统返回的处理结果展示给用户;分类器构建模块,用于根据线下 挖掘的历史数据或第三方信息发布平台提供的语料数据,构建分类器模型;信息分析模块, 用于根据所述分类器模型对所述输入信息进行分析,输出所述输入信息具有信息发布需求 的第一概率,所述第一概率用于描述所述输入信息基于语义特征角度的具有所述信息发布 需求的可能性;综合决策模块,用于根据所述第一概率决定是否对所述输入信息进行检索 或发布;发布模块,用于调用所述第三方信息发布平台的数据接口,连接互联网以将所述输 入信息发布到所述第三方信息发布平台;检索模块,用于根据所述输入信息查询索引库,并 将查询结果返回给所述展示模块。根据本发明之一优选实施例,所述系统为搜索引擎系统。根据本发明之一优选实施例,所述使用界面的形式包括TOB页面、WAP页面、带有 搜索插件的浏览器与所述WEB页面的结合、或带有搜索插件的浏览器与所述WAP页面的结口 O根据本发明之一优选实施例,所述TOB页面或所述WAP页面内包括搜索框、地址 栏、输入法框或信息输入界面。根据本发明之一优选实施例,所述第三方信息发布平台包括微博平台、社交网络 平台、论坛平台或电子公告平台。根据本发明之一优选实施例,所述分类器模型是根据所述历史数据或所述语料数 据,采用机器学习算法构建的。根据本发明之一优选实施例,所述信息发布需求包括具体信息发布需求或通用信 息发布需求。根据本发明之一优选实施例,所述系统在发布前由所述展示模块对用户进行提示 以获取用户对所述提示的确认信息。根据本发明之一优选实施例,所述展示模块在对用户进行提示时返回所述检索模 块对所述输入信息的检索结果。根据本发明之一优选实施例,所述提示包括多个关于所述第三方信息发布平台的 提示信息。根据本发明之一优选实施例,所述确认信息包括对所述第三方信息发布平台的选 择信息或登录信息。根据本发明之一优选实施例,所述展示模块在接收到用户对所述提示的确认信息 后,通过所述发布模块对所述输入信息进行发布。根据本发明之一优选实施例,所述发布模块进一步用于将所述输入信息发布于多 个所述第三方信息发布平台。根据本发明之一优选实施例,所述系统进一步包括用户信息获取模块,用于获取 用户在所述第三方信息发布平台中的用户信息,以得到所述输入信息具有所述信息发布需 求的第二概率,其中所述第二概率用于描述所述输入信息基于用户信息特征角度的具有信 息发布需求的可能性;所述综合决策模块利用所述第一概率与所述第二概率,决定是否对 所述输入信息进行检索或发布。根据本发明之一优选实施例,所述用户信息包括用户的帐号信息或用户的使用频
率信息。根据本发明之一优选实施例,所述用户信息的获取方式包括检验用户在所述第三 方信息发布平台的在线状态、调用用户在所述第三方信息发布平台的帐号的使用记录或接 收用户在所述展示模块的输入。根据本发明之一优选实施例,所述系统进一步包括用户行为分析模块,用于分析 用户以往的行为,以得到所述输入信息具有所述信息发布需求的第三概率,其中所述第三 概率用于描述所述输入信息基于用户历史行为特征角度的具有所述信息发布需求的可能 性;所述综合决策模块利用所述第一概率与所述第三概率,决定是否对所述输入信息进行 检索或发布。根据本发明之一优选实施例,所述系统进一步包括高级语法挖掘模块,用于对 互联网数据进行挖掘,从所述互联网数据中提取用户描述所述第三方信息发布平台的关键 词,并对所述关键词进行语义扩展,生成针对所述第三方信息发布平台的描述词语库;高级
7语法匹配模块,用于根据所述描述词语库对所述输入信息进行匹配验证,以判断用户使用 高级语法的第四概率,当所述第四概率大于第一阈值时,所述高级语法匹配模块进一步将 所述输入信息分解为内容部分与语法部分,并将所述内容部分与所述第四概率传递给所述 信息分析模块,当所述第四概率不大于第一阈值时,所述高级语法匹配模块进一步将所述 输入信息直接传递给所述信息分析模块;所述信息分析模块利用所述高级语法匹配模块传 递的数据及所述分类器模型,输出所述第一概率。根据本发明之一优选实施例,所述系统进一步包括用户配置模块,用于根据用户 的选择为所述系统配置默认的行为模式,所述默认的行为模式包括默认为搜索或默认为发 布,其中当系统被配置成所述默认为搜索时,系统只执行检索不执行发布,系统被配置成所 述默认为发布时,系统只执行发布不执行检索;用户配置识别模块,用于识别用户配置信 息,并根据所述用户配置信息对所述输入信息进行检索或发布。根据本发明之一优选实施例,所述系统在发布前由所述展示模块对用户进行提示 以获取用户对所述提示的确认信息。本发明还提供了一种信息发布方法,包括步骤a.接收用户输入信息;b.根据分 类器模型对所述输入信息进行分析,以得到所述输入信息具有信息发布需求的第一概率, 所述第一概率用于描述所述输入信息基于语义特征角度的具有所述信息发布需求的可能 性;c.根据所述第一概率对所述输入信息进行检索或将所述输入信息发布到第三方信息 发布平台。根据本发明之一优选实施例,所述步骤a中从搜索引擎的使用界面接收用户输入 fn息ο根据本发明之一优选实施例,所述使用界面的具体形式包括TOB页面、WAP页面、 带有搜索插件的浏览器与所述WEB页面的结合、或带有搜索插件的浏览器与所述WAP页面 的结合。根据本发明之一优选实施例,所述TOB页面或所述WAP页面内包括搜索框、地址 栏、输入法框或信息输入界面。根据本发明之一优选实施例,所述第三方信息发布平台包括微博平台、社交网络 平台、论坛平台或电子公告平台。根据本发明之一优选实施例,所述分类器模型是根据线下挖掘的历史数据或所述 第三方信息发布平台提供的语料数据,采用机器学习算法构建的。根据本发明之一优选实施例,所述信息发布需求包括具体信息发布需求或通用信 息发布需求。根据本发明之一优选实施例,所述步骤c中,在所述发布前对用户进行提示以获 取用户对所述提示的确认信息。根据本发明之一优选实施例,在对用户进行所述提示时返回对所述输入信息的检
索结果。根据本发明之一优选实施例,所述提示包括多个关于所述第三方信息发布平台的 提示信息。根据本发明之一优选实施例,所述确认信息包括对所述第三方信息发布平台的选 择信息或登录信息。
根据本发明之一优选实施例,在接收到用户对所述提示的确认信息后,对所述输 入信息进行发布。根据本发明之一优选实施例,所述步骤c中,将所述输入信息发布于多个所述第
三方信息发布平台。根据本发明之一优选实施例,所述方法在步骤c前进一步包括步骤d.获取用户 在所述第三方信息发布平台中的用户信息,以得到所述输入信息具有所述信息发布需求的 第二概率,其中所述第二概率用于描述所述输入信息基于用户信息特征角度的具有所述信 息发布需求的可能性;所述步骤c中利用所述第一概率与所述第二概率对所述输入信息进 行检索或将所述输入信息发布到第三方信息发布平台。根据本发明之一优选实施例,所述用户信息包括用户的帐号信息或用户的使用频
率信息。根据本发明之一优选实施例,所述步骤d中用户信息的获取方式包括检验用户在 所述第三方信息发布平台的在线状态、调用用户在所述第三方信息发布平台的帐号的使用 记录或接收用户在所述展示模块的输入。根据本发明之一优选实施例,所述方法在步骤c前进一步包括步骤e.分析用户 以往的行为,以得到所述输入信息具有所述信息发布需求的第三概率,其中所述第三概率 用于描述所述输入信息基于用户历史行为特征角度的具有所述信息发布需求的可能性;所 述步骤c中利用所述第一概率与所述第三概率对所述输入信息进行检索或将所述输入信 息发布到第三方信息发布平台。根据本发明之一优选实施例,所述方法在步骤b前进一步包括步骤f.根据描述 词语库对所述输入信息进行匹配验证,以判断用户使用高级语法的第四概率,其中所述描 述词语库是通过对互联网数据进行挖掘,从所述互联网数据中提取用户描述所述第三方信 息发布平台的关键词,并对所述关键词进行语义扩展后生成的;当所述第四概率大于第一 阈值时,将所述输入信息分解为内容部分与语法部分,所述步骤b利用所述内容部分与所 述第四概率及所述分类器模型得到第一概率。根据本发明之一优选实施例,所述方法在步骤b前进一步包括步骤g.识别用户 配置信息,其中所述用户配置信息是根据用户的选择为系统配置的默认的行为模式,所述 默认的行为模式包括默认为搜索或默认为发布,其中当系统被配置成所述默认为搜索时, 系统只执行检索不执行发布,系统被配置成所述默认为发布时,系统只执行发布不执行检 索;当识别出系统具有用户配置信息时,根据所述用户配置信息对所述输入信息进行检索 或发布。根据本发明之一优选实施例,在所述发布前对用户进行提示以获取用户对所述提 示的确认信息。由以上技术方案可以看出,所述系统通过对用户输入信息进行分析判断,可以很 好地满足不同用户的不同需要,使得所述系统在信息检索的基础上具有了信息发布功能,, 在用户有不指定特定发布平台的信息发布需求时,所述系统还可以轻易地为用户在多个信 息发布平台上进行信息发布,这不仅大大简化了信息发布流程,节约了用户的时间,也为用 户发布的信息更快更准确地到达信息需求方提供了可能。
9
图1是本发明实施例中具有信息发布和搜索功能的系统的实施例一的结构示意 框图;图2是本发明实施例中使用界面的一种具体形式的实施例示意图;图3是本发明实施例中使用界面的另一种具体形式的实施例示意图;图4是本发明实施例中使用界面将系统返回的结果展示给用户时的一个实施例 示意图;图5是本发明实施例中展示模块返回的提示中包含多个第三方信息发布平台的 提示信息的实施例示意图;图6是本发明实施例中展示模块返回的提示中包含登录提示的实施例示意图;图7为本发明实施例中展示模块返回的提示中包含选择提示的实施例示意图;图8为本发明实施例中发布成功后展示模块返回发布成功的通知的实施例示意 图;图9是本发明实施例中具有信息发布和搜索功能的系统的实施例二的结构示意 框图;图10是本发明实施例中具有信息发布和搜索功能的系统的实施例三的结构示意 框图;图11是本发明实施例中具有信息发布和搜索功能的系统的实施例四的结构示意 框图。图12是本发明实施例中信息发布方法的实施例一的流程示意图;图13是本发明实施例中信息发布方法的实施例二的流程示意图;图14是本发明实施例中信息发布方法的实施例三的流程示意图;图15是本发明实施例中信息发布方法的实施例四的流程示意图。
具体实施方式为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对 本发明进行详细描述。本发明中具有信息发布和搜索功能的系统,可以是任意的搜索引擎系统,或其他 的BS(browser-server)结构或CS(client-server)结构的系统。图1为本发明实施例中 具有信息发布和搜索功能的系统的实施例一的结构示意框图。如图1所示,具有信息发布和搜索功能的系统包括展示模块101、分类器构建模块 102、信息分析模块103、综合决策模块104、发布模块105、检索模块106。其中,展示模块101,用于为用户提供系统的使用界面,该使用界面可接收用户的 输入信息和将搜索引擎返回的处理结果展示给用户。如图2所示,为使用界面的一种具体形式的实施例示意图。使用界面包括了 WEB 页面与WAP页面,其中TOB页面是符合HTML格式的普通电脑浏览器可以识别的网页文本, WAP页面是更适用于手机浏览器显示的网页文本。如图3所示,为使用界面的另一种具体形式的实施例示意图。在该实施例中,使用 界面并不仅仅是一个页面,而是包含了搜索插件的浏览器与页面的结合,在浏览器的搜索插件的搜索框处,也可以获取用户输入的信息。如图4所示,为使用界面将系统返回的结果展示给用户时的一个实施例示意图。 在该实施例中,使用界面在搜索的结果页面中增加了对用户发布信息的引导提示。在上述的TOB页面或WAP页面内,可以包含搜索框、地址栏、输入法框或信息输入 界面,其中的信息输入界面可以用来输入各种需要发表的信息,包括微博信息、社交网络信 息、论坛信息或电子公告信息等。其中的社交网络包括开心网,人人网等网站。对于有明确 的信息发表目的的用户来说,通过信息输入的界面,就可以直接输入信息,通过搜索引擎将 信息发布出去。分类器构建模块102,用于根据线下挖掘的历史数据或第三方信息发布平台提供 的语料数据,采用机器学习算法,构建分类器模型。所述第三方信息发布平台指的是与所述 系统建立了技术关联的信息发布平台系统,包括微博平台、社交网络平台、论坛平台或电子 公告平台。线下挖掘的历史数据与第三方信息发布平台提供的语料数据,指的是用户的 query输入数据,是采用机器学习算法构建分类器模型时的训练样本,下面以SVM(支持向 量机)这种机器学习算法为例,对构建分类器模型进行介绍。SVM的分类原理可概括为寻找一个分类超平面,使得训练样本中的两类样本点 能被分开,并且距离该平面尽可能地远;而对线性不可分的问题,通过核函数将低维输入空 间的数据映射到高位空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性 可分问题。对于两类问题,给定样本集(Xpyi)^i e Rd, Yi = {1,-1}, i = 1,2,... 1,以及核 函数K(Xi,Xj) = (Φ (Xi) ·Φ(χ」)),其中Φ是非线性映射函数。SVM训练出的学习机器为f (x) = (w · Φ (χ) )+b,其中w是权重,b是偏置。对本发明而言,样本集(Xi,Yi)中的Xi是由训练语料(即线下挖掘数据或第三方 信息发布平台提供的数据)的特征组成的特征向量,Yi表示两类问题中的其中一个,如果存 在多类问题,可以把它变为多个两类问题进行处理。在本发明中的类型,指的是信息属于哪 类发布需求,包括有发布平台一的发布需求、有发布平台二的发布需求等等。由此可见,要用样本训练出具有较好分类效果的分类器,也就是得到理想的分类 器权重w和偏置b,特征选取是个关键因素。在本发明中,可以采用下述变量作为特征 query中各种标点符号的数量以及位置、query中字符串长度、query的末尾是否为字符、 query是否有特殊字符串、query中数字的个数、query中是否有属于分类词汇表中的词语、 query中每个词的搜索量、query中每个词由搜索引擎得到的搜索结果数等,其中的分类词 汇表指的是诸如经济、历史、天文、地理之类的类别表。需要强调的是,上述所列的特征仅是为了说明本实施例而列举,并不代表本发明 仅限于使用上述特征,任何为了构建分类器模型而使用的特征,都不超出本发明的思想范围。信息分析模块103,用于根据由分类器构建模块102构建的分类器模型对用户输 入信息进行分析,输出用户输入信息具有信息发布需求的第一概率,其中所述第一概率用 于描述输入信息基于语义特征角度的具有信息发布需求的可能性。
所述信息发布需求包括具体信息发布需求或通用信息发布需求。具体信息发布需 求指的是诸如发布于微博、SNS等特定的发布平台的发布需求,而通用的信息发布需求指的 是用户没有指定发布平台的发布需求,例如用户可能想要转让火车票,或者需要在某个区 域租一套房子,这些信息发布需求并不指定特定的发布平台,用户只是希望将此类型的信 息发布到互联网上,只要能被其他用户看到,那么信息发布的用户并不介意信息在哪个平 台上发布。信息分析模块依靠分类器模型,可以对用户输入的信息在语义上进行分析,判断 用户输入的信息从语义角度考虑,在各种发布平台上发布的第一概率大小。例如用户输入 的信息为“求租中关村三居室一套”,信息分析模块输出的结果为(求租中关村三居室一 套,Ps^= 0. 9)、(求租中关村三居室一套,Pws= 0. 7)、(求租中关村三居室一套,Pm55问答 ttK=0. 2)等等,其中P代表的是第一概率。如果用户输入的信息为“哪儿的菜最好吃”,那 么信息分析模块输出的结果为(哪儿的菜最好吃,P⑩=0. 2)、(哪儿的菜最好吃,Pws = 0. 1)、(哪儿的菜最好吃,PMR1Mttg= 0. 1)等等,由于在各个平台上得到的第一概率都很 小,那么“哪儿的菜最好吃”从语义角度考虑,就很可能不具备信息发布需求,而有可能是用 户输入的查询信息。另外如果用户输入“发微博”,则表明用户就是打算要在微博平台上发 布信息,相应的在微博平台上的第一概率就非常大,在其他平台上的第一概率就很小。上述 输出结果的数据结构仅是为了说明本发明而采用的示意性描述,在具体实现时可根据需要 采取其他方式,本发明对此不作限定。综合决策模块104,用于根据第一概率决定是否对用户输入的信息进行检索或发 布。在判断出应该对输入信息进行发布时进一步包括判断是否需要在发布前对用户进行提 示。当需要对用户进行提示时,由展示模块返回对用户的提示,其中所述的提示可包括一个 或多个关于第三方信息发布平台的提示信息。请参考图5,图5为本发明实施例中展示模块 返回的提示中包含多个第三方信息发布平台的提示信息的实施例示意图。例如当第一概率很小时(假设概率< 阈值一),可以对用户输入的信息执行普通 搜索引擎的检索流程,把用户输入信息当作查询信息来处理。当第一概率位于某个区间时(假设阈值二<概率<阈值三),则通过展示模块提 示用户是否需要发布信息,例如在搜索结果页面提示“在新浪微博发布这条信息我今天买 了一件衣服”,当展示模块接收到用户返回的确认信息后,就可以对输入信息进行发布。进 一步地,提示可包括登录提示或第三方信息发布平台的选择提示或在第三方信息发布平台 的帐号提示,相应的,确认信息可包括第三方信息发布平台的登录信息或选择信息。其中的 登录信息包括帐号或密码,选择信息包括对第三方信息发布平台的选择或对在第三方信息 发布平台上的帐号的选择。请参考图6和图7,其中图6为本发明实施例中展示模块返回的 提示中包含登录提示的实施例示意图,图7为本发明实施例中展示模块返回的提示中包含 选择提示的实施例示意图。值得注意的是,在对用户进行发布提示的时候,也可以同时对输 入信息执行检索操作,将发布提示与查询结果一并返回。当第一概率非常大时(假设概率> 阈值四),系统就直接发布该条信息。除以上策 略之外,也可以根据概率的不同,对用户输入信息分别执行单纯的搜索、搜索与发布提示并 存、单纯的发布提示或直接发布等操作。另外,在发布成功后,还可以给用户返回发布成功的通知。请参考图8,图8为本发明实施例中发布成功后展示模块返回发布成功的通知的实施例示意图。发布模块105,用于调用第三方信息发布平台的数据接口,连接互联网以将用户输 入的信息发布到第三方的信息发布平台。当综合决策模块判断需要对用户输入信息进行发布时,综合决策模块将调用发布 模块将用户输入的信息发布到第三方信息发布平台。此外当展示模块接收到用户返回的 对发布提示的确认信息时,发布模块也会将用户信息输入的信息发布到第三方信息发布平台。根据具体需要的不同,发布模块可以将具有某一具体信息发布需求的信息发布到 微博、知识问答社区、社交网络之类的发布平台,也可以将具有通用信息发布需求的信息发 布到诸如58同城之类的分类信息发布平台。此外,发布模块还可以将用户输入的信息发布 于多个第三方信息发布平台。例如用户想要发布一条转让火车票的信息,以往用户为了尽 快让更多人找到自己的这条信息,会在多个分类信息发布平台上发布这条信息,但是通过 本发明,用户只需要在搜索引擎的搜索框中输入信息,本发明的系统就可以自动将该信息 发布于多个信息发布平台,大大简化了信息发布流程。检索模块106,用于根据用户输入信息查询索引库,并将查询结果返回给展示模 块。在用户的输入信息没有发布需求或者用户的输入信息有发布需求但需要返回发 布提示的情况下,综合决策模块通过调用检索模块,都可实现对输入信息的检索。检索模块包括查询子模块和排序子模块,与普通的搜索引擎一样,查询子模块用 于根据用户输入信息查询索引库,而排序子模块用于对查询结果进行排序,并将排序后的 结果返回。由于检索模块的实现技术与现有技术相同,在此不再赘述。图9为本发明实施例中具有信息发布和搜索功能的系统的实施例二的结构示意 框图。在本实施例中,具有信息发布和搜索功能的系统进一步还包括用户信息获取模块107 或用户行为分析模块108或以上两个模块的任意组合。其中用户信息获取模块107,用于获取用户在第三方信息发布平台中的用户信息, 以得到输入信息具有信息发布需求的第二概率,所述第二概率用于描述输入信息基于用户 信息特征角度的具有信息发布需求的可能性。用户在第三方信息发布平台中的用户信息, 包括用户的帐号信息或用户的使用频率信息,其中帐号信息指用户是否在第三方信息发布 平台具有帐号及帐号是什么,使用频率信息指哪一个第三方信息发布平台是用户的常用平 台。用户信息获取模块可以通过用户的cookie数据或用户的IP地址或电脑的MAC地 址等多种方式向多个第三方信息发布平台进行轮询,得到用户在第三方信息发布平台的用 户信息。用户信息获取的方式还包括检验用户在第三方信息发布平台的在线状态、调用用 户在第三方信息发布平台的帐号的使用记录或接收用户在展示模块的输入。例如在展示模 块,提供用户登录微博的帐号和密码窗口,由用户自行在窗口输入信息。由于有了第二概率,因此在一个实施例中,综合决策模块根据第一概率决定是否 对输入信息进行检索或发布时的具体实施方式
为利用第一概率与第二概率决定是否对输 入信息进行检索或发布,具体可采用为第一概率与第二概率预置权重的方式,来决定最终 的判断逻辑。
用户行为分析模块108,用于分析用户以往的行为,以得到输入信息具有信息发布 需求的第三概率,该第三概率用于描述输入信息基于用户历史行为特征角度的具有信息发 布需求的可能性。用户过去的行为对推导用户当前行为意图具有指导作用。如果用户常常用同一种 语言方式发布信息,那么当用户仍以这种语言方式输入信息时,就较有可能是为了发布信 息。用户以往的行为包括其在搜索引擎、微博、论坛、博客等平台上的行为,表现为语言方 式、行为习惯(如常向别人提问还是常回答别人的问题)等。用户行为分析模块采用的技术手段包括数据挖掘和机器学习,即通过用户日志, 挖掘出用户的行为数据作为训练样本,由特征选择算法及机器学习方法,对用户的行为进 行分类并输出第三概率。由于有了第三概率,在一个实施例中,综合决策模块根据第一概率决定是否对输 入信息进行检索或发布时的具体实施方式
为利用第一概率与第三概率决定是否对输入信 息进行检索或发布,具体可采用为第一概率与第三概率预置权重的方式,来决定最终的判 断逻辑。图10为本发明实施例中具有信息发布和搜索功能的系统的实施例三的结构示意 框图。在本实施例中,具有信息发布和搜索功能的系统进一步还包括高级语法挖掘模块109 与高级语法匹配模块110。其中高级语法挖掘模块109,用于对互联网数据进行挖掘,从所述互联网数据中提 取用户描述第三方信息发布平台的关键词,并对关键词进行语义扩展,生成针对第三方信 息发布平台的描述词语库。例如,微博平台通常被称为围脖,可以由微博扩展出“wb ”或“围脖”作为对微 博第三方信息发布平台的描述词语。常用的数据挖掘方法包括神经网络方法、遗传算法、决策树方法、粗集方法、统计 分析方法、模糊集方法等,由于这些都属于现有技术,在此不再进行详细描述。高级语法匹配模块110,用于根据描述词语库对输入信息进行匹配验证,以判断用 户使用高级语法的第四概率,当第四概率大于阈值X时,将输入信息分解为内容部分及语 法部分,并将内容部分及第四概率传递给信息分析模块,当第四概率不大于阈值X时,直接 将输入信息传递给信息分析模块。所谓的高级语法,指的是符合描述词语库写法的信息输 入方式,例如输入信息为“wb 今天钓到一条很大的鱼”,就使用了高级语法。在高级语法匹配模块中,进一步包括验证单元与分解单元,其中验证单元用于根 据预先定义的策略对输入信息进行匹配验证,并产生相应的用户使用高级语法的第四概 率,分解单元用于将第四概率大于阈值χ的信息分解为内容部分和语法部分。例如用户输入“wb 今天钓到一条很大的鱼”,验证单元根据预先定义的策略对输 入信息进行扫描以得到第四概率,例如一种策略为在输入信息的开头扫描到完全符合描述 词语库中的描述词语时,第四概率为0. 9。假设阈值X为0. 5,由于第四概率大于阈值X,则 分解单元会将“wb 今天钓到一条很大的鱼”分解为“wb ”和“今天钓到一条很大的鱼”,其 中“wb ”为语法部分,“今天钓到一条很大的鱼”为内容部分。高级语法匹配模块不仅会输出分解后的内容部分,还会输出用户使用高级语法的 第四概率。验证单元在匹配验证时,根据不同的策略,可以得到不同的使用高级语法第四
14概率,例如用户输入信息的开头部分完全匹配描述词语库中的描述词语时,得到第四概率 为0.9 ;用户输入信息的开头部分不完全匹配描述词语库中的描述词语时,得到第四概率 为0. 5 ;用户输入信息的中间部分匹配描述词语库中的描述词语时,得到第四概率为0. 3等寸。在本实施例中,高级语法匹配模块输出的内容部分与第四概率将传递到信息分析 模块,用以为信息分析模块计算第一概率提供更多的依据。信息分析模块根据分类器模型 输出第一概率的具体实施方式
为利用高级语法匹配模块传递的数据及分类器模型输出第 一概率,可采用预置策略实现,例如第四概率很大,说明用户使用高级语法的可能性很大, 相应地,用户想要发布信息的可能性也就很大,第一概率也就很大。图11为本发明实施例中具有信息发布和搜索功能的系统的实施例四的结构示意 框图。在本实施例中,具有信息发布和搜索功能的系统进一步包括用户配置模块111和用 户配置识别模块112。其中,用户配置模块111,用于根据用户的选择为搜索引擎系统配置默认的行为模 式。默认的行为模式包括默认为搜索或默认为发布,其中当系统被配置成默认为搜索时,系 统只执行检索不执行发布;当系统被配置成默认为发布时,系统只执行发布不执行检索。默认为搜索或默认为发布可以进一步分为更细化的配置,例如默认为发布时,又 可以配置为每次接收到用户输入的信息,都通过发布模块直接发布或通过展示模块向用户 显示发布信息前的提示,或者是配置为发布到某个特定的平台等等。用户配置识别模块112,用于识别用户配置信息,并根据用户配置信息对输入信息 进行搜索发布,其中在发布前还可由展示模块对用户进行提示以获取用户对提示的确认信 肩、O系统如果识别出用户配置为默认搜索,则将用户输入信息都当作查询信息看待, 对输入信息发出搜索请求;系统如果识别出用户配置为默认发布,则根据进一步细化的配 置,判断是直接发布的配置还是在发布前进行提示的配置。如果是直接发布配置,则对用户 输入信息发出直接发布的请求,否则就对输入信息发出在发布前对用户进行提示的请求, 当接收到用户的确认信息时,就可以对输入信息进行发布。例如,用户配置为将输入信息直 接发布到新浪微博,这说明用户使用本发明的搜索引擎系统,是有特定目的的,用户自己本 身非常明确这种目的,在这种情况下,只要按照用户配置进行相应的处理,就能够很好地满 足用户需要了,因此没有必要再让搜索引擎执行其他的操作。如果用户识别模块识别的结果是用户并未进行任何配置,则将用户输入信息输出 至下一个处理模块。图12为本发明实施例中信息发布方法的实施例一的流程示意图。在本实施例中, 信息发布方法包括步骤201 接收用户输入信息。在一种方式下,是从搜索引擎的使用界面 接收用户输入信息,其中搜索引擎的使用界面包括了 WEB页面、WAP页面、带有搜索插件的 浏览器与WEB页面的结合、或带有搜索插件的浏览器与WAP页面的结合。在上述的WEB页 面或WAP页面内,可以包含搜索框、地址栏、输入法框或信息输入界面,其中的信息输入界 面可以用来输入各种需要发表的信息,包括微博信息、社交网络信息、论坛信息或电子公告 信息等。接收用户输入信息是进行后续处理的前提。步骤202 根据分类器模型对用户输入信息进行分析,以得到输入信息具有信息发布需求的第一概率,其中第一概率用于描述输入信息基于语义特征角度的具有信息发布 需求的可能性。分类器模型是根据线下挖掘的历史数据或第三方信息发布平台提供的语料数据, 采用机器学习算法进行构建的。线下挖掘的历史数据与第三方信息发布平台提供的语料数 据,指的是用户的query输入数据,是采用机器学习算法构建分类器模型时的训练样本,下 面以SVM(支持向量机)这种机器学习算法为例,对构建分类器模型进行介绍。SVM的分类原理可概括为寻找一个分类超平面,使得训练样本中的两类样本点 能被分开,并且距离该平面尽可能地远;而对线性不可分的问题,通过核函数将低维输入空 间的数据映射到高位空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性 可分问题。对于两类问题,给定样本集(X^yi)jXi e Rd, Yi = {1,-1}, i = 1,2,... 1,以及核 函数K(Xi,Xj) = (Φ (Xi) ·Φ(χ」)),其中Φ是非线性映射函数。SVM训练出的学习机器为f (x) = (w · Φ (χ) )+b,其中w是权重,b是偏置。对本发明而言,样本集(Xi,Yi)中的Xi是由训练语料(即线下挖掘数据或第三方 信息发布平台提供的数据)的特征组成的特征向量,Yi表示两类问题中的其中一个,如果存 在多类问题,可以把它变为多个两类问题进行处理。在本发明中的类型,指的是信息属于哪 类发布需求,包括有发布平台一的发布需求、有发布平台二的发布需求等等。由此可见,要用样本训练出具有较好分类效果的分类器,也就是得到理想的分类 器权重w和偏置b,特征选取是个关键因素。在本发明中,可以采用下述变量作为特征 query中各种标点符号的数量以及位置、query中字符串长度、query的末尾是否为字符、 query是否有特殊字符串、query中数字的个数、query中是否有属于分类词汇表中的词语、 query中每个词的搜索量、query中每个词由搜索引擎得到的搜索结果数等,其中的分类词 汇表指的是诸如经济、历史、天文、地理之类的类别表。信息发布需求包括具体信息发布需求或通用信息发布需求,其中具体信息发布需 求指的是诸如发布于微博、SNS等特定的发布平台的发布需求,而通用的信息发布需求指的 是用户没有指定发布平台的发布需求,例如用户可能想要转让火车票,或者需要在某个区 域租一套房子,这些信息发布需求并不指定特定的发布平台,用户只是希望将此类型的信 息发布到互联网上,只要能被其他用户看到,那么信息发布的用户并不介意信息在哪个平 台上发布。依靠分类器模型,可以对用户输入的信息在语义上进行分析,判断用户输入的信 息从语义角度考虑,在各种发布平台上发布的第一概率大小。例如用户输入的信息为“求 租中关村三居室一套”,分析的结果为(求租中关村三居室一套,Pgg= 0.9)、(求租中关村 三居室一套,Pws= 0. 7)、(求租中关村三居室一套,Ptowinmttg= 0. 2)等等,其中P代表的 是第一概率。如果用户输入的信息为“哪儿的菜最好吃”,那么信息分析模块输出的结果为 (哪儿的菜最好吃,0. 2)、(哪儿的菜最好吃,Pttw= 0. 1),(哪儿的菜最好吃,Ptowfn^ ttK= 0. 1)等等,由于在各个平台上得到的第一概率都很小,那么“哪儿的菜最好吃”从语义 角度考虑,就很可能不具备信息发布需求,而有可能是用户输入的查询信息。另外如果用户 输入“发微博”,则表明用户就是打算要在微博平台上发布信息,相应的在微博平台上的第一概率就非常大,在其他平台上的第一概率就很小。上述结果的数据结构仅是为了说明本 发明而采用的示意性描述,在具体实现时可根据需要采取其他方式,本发明对此不作限定。

步骤203 根据第一概率对输入信息进行检索或将输入信息发布到第三方信息发 布平台。其中将所述输入信息发布到第三方信息发布平台进一步包括在发布前对用户进行 发布提示。所述提示可包括一个或多个关于第三方信息发布平台的提示信息。根据第一概 率的不同,可以预先设置一系列的策略对用户输入信息执行检索还是发布进行判断。例如当第一概率很小时(假设概率< 阈值一),可以对用户输入的信息执行普通 搜索引擎的检索流程,把用户输入信息当作查询信息来处理。当第一概率位于某个区间时(假设阈值二<概率<阈值三),提示用户是否需要 发布信息,例如在搜索结果页面提示“在新浪微博发布这条信息我今天买了一件衣服”,当 接收到用户返回的确认信息后,就可以对输入信息进行发布。进一步地,提示可包括登录提 示或第三方信息发布平台的选择提示或在第三方信息发布平台的帐号提示,相应的,确认 信息可包括第三方信息发布平台的登录信息或选择信息。其中的登录信息包括帐号或密 码,选择信息包括对第三方信息发布平台的选择或对在第三方信息发布平台上的帐号的选 择。值得注意的是,在对用户进行发布提示的时候,也可以同时对输入信息执行检索操作, 将发布提示与查询结果一并返回。当第二概率非常大时(假设概率> 阈值四),系统就直接发布该条信息。在发布成 功后,还可以给用户返回发布成功的通知。除了这种策略之外,也可以根据概率的不同,对 用户输入信息分别执行单纯的搜索、搜索与发布提示并存、单纯的发布提示或直接发布等 操作。当需要对用户输入信息进行发布时,通过调用第三方信息发布平台的数据接口, 就可以将用户输入的信息发布到第三方信息发布平台。根据具体需要的不同,可以将具有 某一具体信息发布需求的信息发布到微博、知识问答社区、社交网络之类的发布平台,也可 以将具有通用信息发布需求的信息发布到诸如58同城之类的分类信息发布平台。此外,本 发明的方法还可以将用户输入的信息发布于多个第三方信息发布平台。例如用户想要发布 一条转让火车票的信息,以往用户为了尽快让更多人找到自己的这条信息,会在多个分类 信息发布平台上发布这条信息,但是通过本发明的方法,用户只需要在搜索引擎的搜索框 中输入信息,就可以实现将该信息发布于多个信息发布平台的目的,大大简化了信息发布 流程。当需要对用户输入信息进行检索时,可以执行普通搜索引擎的检索流程,这里不 再详细描述。图13为本发明实施例中信息发布方法的实施例二的流程示意图。请参考图13,在 本实施例中,步骤301、302分别与实施例一中的步骤201、202、相同,在此不再赘述。步骤303 获取用户在第三方信息发布平台中的用户信息,以得到输入信息具有 信息发布需求的第二概率,或分析用户以往的行为,以得到输入信息具有信息发布需求的 第三概率,其中第二概率用于描述输入信息基于用户信息特征角度的具有信息发布需求的 可能性,第三概率用于描述输入信息基于用户历史行为特征角度的具有信息发布需求的可 能性。用户在第三方信息发布平台中的用户信息,包括用户的帐号信息或用户的使用频
17率信息,其中帐号信息指用户是否在第三方信息发布平台具有帐号及帐号是什么,使用频 率信息指哪一个第三方信息发布平台是用户的常用平台。通过用户的cookie数据或用户 的IP地址或电脑的MAC地址等多种方式向多个第三方信息发布平台进行轮询,就得到用户 在第三方信息发布平台的用户信息。用户信息获取的方式还包括检验用户在第三方信息 发布平台的在线状态、调用用户在第三方信息发布平台的帐号的使用记录或由用户自行输 入。用户过去的行为对推导用户当前行为意图具有指导作用。如果用户常常用同一种 语言方式发布信息,那么当用户仍以这种语言方式输入信息时,就较有可能是为了发布信 息。用户以往的行为包括其在搜索引擎、微博、论坛、博客等平台上的行为,表现为语言方 式、行为习惯(如常向别人提问还是常回答别人的问题)等。对用户行为进行分析,采用的技术手段包括数据挖掘和机器学习,即通过用户日 志,挖掘出用户的行为数据作为训练样本,由特征选择算法及机器学习方法,对用户的行为 进行分类并输出第三概率。步骤304 利用第一概率与第二概率或利用第一概率与第三概率对输入信息进行 检索或将输入信息发布到三方信息发布平台。由于有了第二、第三概率,在步骤304中根据第一概率对输入信息进行检索或将 输入信息发布到第三方信息发布平台的具体实施方式
为利用第一概率与第二概率、第三概 率的任意组合对输入信息进行检索或将输入信息发布到第三方信息发布平台,具体可采用 为各个概率预置权重的方式,来决定最终的判断逻辑。图14为本发明实施例中信息发布方法的实施例三的流程示意图。请参考图14, 在本实施例中,步骤401、404、405分别与实施例二中的步骤301、303、304相同,在此不再赘 述。步骤402 根据描述词语库对用户输入信息进行匹配验证,以判断用户使用高级 语法的第四概率。其中所述描述词语库是通过对互联网数据进行挖掘,从所述互联网数据中提取用 户描述所述第三方信息发布平台的关键词,并对关键词进行语义扩展后生成的。例如,微博 平台通常被称为围脖,可以由微博扩展出“wb: ”或“围脖”作为对微博第三方信息发布 平台的描述词语。常用的数据挖掘方法包括神经网络方法、遗传算法、决策树方法、粗集方 法、统计分析方法、模糊集方法等,由于这些都属于现有技术,在此不再进行详细描述。所谓 的高级语法,指的是符合描述词语库写法的信息输入方式,例如输入信息为“wb 今天钓到 一条很大的鱼”就使用了高级语法。对用户输入信息进行匹配验证可以根据预先定义的策略进行。例如用户输入信息 的开头部分完全匹配描述词语库中的描述词语时,得到第四概率为0.9;用户输入信息的 开头部分不完全匹配描述词语库中的描述词语时,得到第四概率为0.5 ;用户输入信息的 中间部分匹配描述词语库中的描述词语时,得到第四概率为0. 3等等。更进一步的,在第四概率大于阈值X时,步骤402进一步包括步骤4021 将用户输 入信息分解为内容部分与语法部分。例如用户输入“wb 今天钓到一条很大的鱼”,得到第四 概率为0. 9。假设阈值X为0. 5,由于第四概率大于阈值X,则步骤4021会将“wb 今天钓到 一条很大的鱼”分解为“wb: ”和“今天钓到一条很大的鱼”,其中“wb: ”为语法部分,“今天钓到一条很大的鱼”为内容部分。步骤403根据第四概率的不同,可以执行两条分支,当第四概率不大于第一阈值 时,步骤403利用分类器模型对输入信息进行分析,以得到输入信息具有信息发布需求的 第一概率;当第四概率大于第一阈值时,步骤403'利用内容部分与第四概率及分类器模 型对输入信息进行分析,以得到输入信息具有信息发布需求的第一概率,这是因为在第四 概率比较大时,把第四概率也作为计算第一概率的一个依据,可以有效地提高第一概率的 置信度。图15为本发明实施例中信息发布方法的实施例四的流程示意图。请参考图15,在 本实施中,步骤501、503、5031、504(504' )、505、506与实施例三中的步骤401、402、4021、 403(403' )、404、405相同,在此不再赘述。步骤502 识别用户配置信息,其中用户配置信息是根据用户的选择为系统配置 的默认的行为方式。默认的行为模式包括默认为搜索或默认为发布,其中当系统被配置成默认为搜索 时,系统只执行检索不执行发布;当系统被配置成默认为发布时,系统只执行发布不执行检 索。默认为搜索或默认为发布可以进一步分为更细化的配置,例如默认为发布时,又可以配 置为每次接收到用户输入的信息,都直接发布或显示发布信息前的提示,或者是配置为发 布到某个特定的平台等等。更进一步地,当识别出系统具有用户配置信息时,步骤502进一步包括步骤5021 根据用户的配置信息对用户输入信息进行检索或发布。在发布前还可对用户进行提示以获 取用户对所述提示的确认信息。例如用户配置为对每次接收到的用户输入信息,都直接发 布到新浪微博,这说明用户发布信息的目的非常明确,在这种情况下,只要按照用户配置进 行相应的处理,就能够很好地满足用户需要了,因此没有必要再执行其他的操作。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
19
权利要求
1.一种具有信息发布和搜索功能的系统,其特征在于,所述系统包括展示模块,用于为用户提供所述系统的使用界面,所述使用界面用于接收用户的输入 信息和将所述系统的处理结果展示给用户;分类器构建模块,用于根据线下挖掘的历史数据或第三方信息发布平台提供的语料数 据,构建分类器模型;信息分析模块,用于根据所述分类器模型对所述输入信息进行分析,输出所述输入信 息具有信息发布需求的第一概率,所述第一概率用于描述所述输入信息基于语义特征角度 的具有所述信息发布需求的可能性;综合决策模块,用于根据所述第一概率决定是否对所述输入信息进行检索或发布;发布模块,用于调用所述第三方信息发布平台的数据接口,连接互联网以将所述输入 信息发布到所述第三方信息发布平台;检索模块,用于根据所述输入信息查询索引库,并将查询结果返回给所述展示模块。
2.根据权利要求1所述的系统,其特征在于,所述系统为搜索引擎系统。
3.根据权利要求1所述的系统,其特征在于,所述使用界面的形式包括WEB页面、WAP 页面、带有搜索插件的浏览器与所述WEB页面的结合、或带有搜索插件的浏览器与所述WAP 页面的结合。
4.根据权利要求3所述的系统,其特征在于,所述WEB页面或所述WAP页面内包括搜索 框、地址栏、输入法框或信息输入界面。
5.根据权利要求1所述的系统,其特征在于,所述第三方信息发布平台包括微博平台、 社交网络平台、论坛平台或电子公告平台。
6.根据权利要求1所述的系统,其特征在于,所述分类器模型是根据所述历史数据或 所述语料数据,采用机器学习算法构建的。
7.根据权利要求1所述的系统,其特征在于,所述信息发布需求包括具体信息发布需 求或通用信息发布需求。
8.根据权利要求1所述的系统,其特征在于,所述系统在发布前由所述展示模块对用 户进行提示以获取用户对所述提示的确认信息。
9.根据权利要求8所述的系统,其特征在于,所述展示模块在对用户进行提示时返回 所述检索模块对所述输入信息的检索结果。
10.根据权利要求8所述的系统,其特征在于,所述提示包括多个关于所述第三方信息 发布平台的提示信息。
11.根据权利要求8所述的系统,其特征在于,所述确认信息包括对所述第三方信息发 布平台的选择信息或登录信息。
12.根据权利要求8所述的系统,其特征在于,所述展示模块在接收到用户对所述提示 的确认信息后,所述发布模块对所述输入信息进行发布。
13.根据权利要求1所述的系统,其特征在于,所述发布模块进一步用于将所述输入信 息发布于多个所述第三方信息发布平台。
14.根据权利要求1所述的系统,其特征在于,所述系统进一步包括用户信息获取模 块,用于获取用户在所述第三方信息发布平台中的用户信息,以得到所述输入信息具有所 述信息发布需求的第二概率,其中所述第二概率用于描述所述输入信息基于用户信息特征角度的具有信息发布需求的可能性;所述综合决策模块利用所述第一概率与所述第二概 率,决定是否对所述输入信息进行检索或发布。
15.根据权利要求14所述的系统,其特征在于,所述用户信息包括用户的帐号信息或 用户的使用频率信息。
16.根据权利要求14所述的系统,其特征在于,所述用户信息的获取方式包括检验用 户在所述第三方信息发布平台的在线状态、调用用户在所述第三方信息发布平台的帐号的 使用记录或接收用户在所述展示模块的输入。
17.根据权利要求1所述的系统,其特征在于,所述系统进一步包括用户行为分析模 块,用于分析用户以往的行为,以得到所述输入信息具有所述信息发布需求的第三概率,其 中所述第三概率用于描述所述输入信息基于用户历史行为特征角度的具有所述信息发布 需求的可能性;所述综合决策模块利用所述第一概率与所述第三概率,决定是否对所述输 入信息进行检索或发布。
18.根据权利要求1所述的系统,其特征在于,所述系统进一步包括高级语法挖掘模块,用于对互联网数据进行挖掘,从所述互联网数据中提取用户描述 所述第三方信息发布平台的关键词,并对所述关键词进行语义扩展,生成针对所述第三方 信息发布平台的描述词语库;高级语法匹配模块,用于根据所述描述词语库对所述输入信息进行匹配验证,以判断 用户使用高级语法的第四概率,当所述第四概率大于第一阈值时,所述高级语法匹配模块 进一步将所述输入信息分解为内容部分与语法部分,并将所述内容部分与所述第四概率传 递给所述信息分析模块,当所述第四概率不大于第一阈值时,所述高级语法匹配模块进一 步将所述输入信息直接传递给所述信息分析模块;所述信息分析模块利用所述高级语法匹 配模块传递的数据及所述分类器模型,输出所述第一概率。
19.根据权利要求1所述的系统,其特征在于,所述系统进一步包括用户配置模块,用于根据用户的选择为所述系统配置默认的行为模式,所述默认的行 为模式包括默认为搜索或默认为发布,其中当系统被配置成所述默认为搜索时,系统只执 行检索不执行发布,系统被配置成所述默认为发布时,系统只执行发布不执行检索;用户配置识别模块,用于识别用户配置信息,并根据所述用户配置信息对所述输入信 息进行检索或发布。
20.根据权利要求19所述的系统,其特征在于,所述系统在发布前由所述展示模块对 用户进行提示以获取用户对所述提示的确认信息。
21.一种信息发布的方法,其特征在于,所述方法包括步骤a.接收用户输入信息;b.根据分类器模型对所述输入信息进行分析,以得到所述输入信息具有信息发布需求 的第一概率,所述第一概率用于描述所述输入信息基于语义特征角度的具有所述信息发布 需求的可能性;c.根据所述第一概率对所述输入信息进行检索或将所述输入信息发布到第三方信息 发布平台。
22.根据权利要求21所述的方法,其特征在于,所述步骤a中从搜索引擎的使用界面接 收用户输入信息。
23.根据权利要求22所述的方法,其特征在于,所述使用界面的具体形式包括WEB页 面、WAP页面、带有搜索插件的浏览器与所述WEB页面的结合、或带有搜索插件的浏览器与 所述WAP页面的结合。
24.根据权利要求23所述的方法,其特征在于,所述WEB页面或所述WAP页面内包括搜 索框、地址栏、输入法框或信息输入界面。
25.根据权利要求21所述的方法,其特征在于,所述第三方信息发布平台包括微博平 台、社交网络平台、论坛平台或电子公告平台。
26.根据权利要求21所述的方法,其特征在于,所述分类器模型是根据线下挖掘的历 史数据或所述第三方信息发布平台提供的语料数据,采用机器学习算法构建的。
27.根据权利要求21所述的方法,其特征在于,所述信息发布需求包括具体信息发布 需求或通用信息发布需求。
28.根据权利要求21所述的方法,其特征在于,所述步骤c中,在所述发布前对用户进 行提示以获取用户对所述提示的确认信息。
29.根据权利要求观所述的方法,其特征在于,在对用户进行所述提示时返回对所述 输入信息的检索结果。
30.根据权利要求观所述的方法,其特征在于,所述提示包括多个关于所述第三方信 息发布平台的提示信息。
31.根据权利要求观所述的方法,其特征在于,所述确认信息包括对所述第三方信息 发布平台的选择信息或登录信息。
32.根据权利要求观所述的方法,其特征在于,在接收到用户对所述提示的确认信息 后,对所述输入信息进行发布。
33.根据权利要求21所述的方法,其特征在于,所述步骤c中,将所述输入信息发布于 多个所述第三方信息发布平台。
34.根据权利要求21所述的方法,其特征在于,所述方法在步骤c前进一步包括步骤d.获取用户在所述第三方信息发布平台中的用户信息,以得到所述输入信息具有所述信息 发布需求的第二概率,其中所述第二概率用于描述所述输入信息基于用户信息特征角度的 具有所述信息发布需求的可能性;所述步骤c中利用所述第一概率与所述第二概率对所述 输入信息进行检索或将所述输入信息发布到第三方信息发布平台。
35.根据权利要求34所述的方法,其特征在于,所述用户信息包括用户的帐号信息或 用户的使用频率信息。
36.根据权利要求34所述的方法,其特征在于,所述步骤d中用户信息的获取方式包括 检验用户在所述第三方信息发布平台的在线状态、调用用户在所述第三方信息发布平台的 帐号的使用记录或接收用户在所述展示模块的输入。
37.根据权利要求21所述的方法,其特征在于,所述方法在步骤c前进一步包括步骤e.分析用户以往的行为,以得到所述输入信息具有所述信息发布需求的第三概率,其中所 述第三概率用于描述所述输入信息基于用户历史行为特征角度的具有所述信息发布需求 的可能性;所述步骤c中利用所述第一概率与所述第三概率对所述输入信息进行检索或将 所述输入信息发布到第三方信息发布平台。
38.根据权利要求21所述的方法,其特征在于,所述方法在步骤b前进一步包括步骤f.根据描述词语库对所述输入信息进行匹配验证,以判断用户使用高级语法的第四概率, 其中所述描述词语库是通过对互联网数据进行挖掘,从所述互联网数据中提取用户描述所 述第三方信息发布平台的关键词,并对所述关键词进行语义扩展后生成的;当所述第四概 率大于第一阈值时,将所述输入信息分解为内容部分与语法部分,所述步骤b利用所述内 容部分与所述第四概率及所述分类器模型得到第一概率。
39.根据权利要求21所述的方法,其特征在于,所述方法在步骤b前进一步包括步骤g.识别用户配置信息,其中所述用户配置信息是根据用户的选择为系统配置的默认的行为 模式,所述默认的行为模式包括默认为搜索或默认为发布,其中当系统被配置成所述默认 为搜索时,系统只执行检索不执行发布,系统被配置成所述默认为发布时,系统只执行发布 不执行检索;当识别出系统具有用户配置信息时,根据所述用户配置信息对所述输入信息 进行检索或发布。
40.根据权利要求39所述的方法,其特征在于,在所述发布前对用户进行提示以获取 用户对所述提示的确认信息。
全文摘要
本发明提供了一种具有信息发布和搜索功能的系统及信息发布方法,其中所述系统包括展示模块;分类器构建模块,用于构建分类器模型;信息分析模块,用于根据分类器模型对输入信息进行分析,输出所述输入信息具有信息发布需求的第一概率;综合决策模块,用于根据第一概率决定是否对所述输入信息进行检索或发布;发布模块,用于将输入信息发布到第三方信息发布平台;检索模块,用于将查询结果返回给所述展示模块。通过上述方式,所述系统在搜索的基础上具有了信息发布的功能,可以很好地满足不同用户的需要。
文档编号G06F17/30GK102110170SQ20111006613
公开日2011年6月29日 申请日期2011年3月18日 优先权日2011年3月18日
发明者廖若雪, 李彦宏 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1