计算机化的互联网搜索系统和方法

文档序号:8323882阅读:643来源:国知局
计算机化的互联网搜索系统和方法
【专利说明】计算机化的互联网搜索系统和方法
[0001]相关申请的交叉引用
[0002]本申请要求于2012年3月22日提交的申请序列号为61/614163美国临时专利申请的优先权,其全部内容通过引用合并于此。
技术领域
[0003]本发明涉及互联网搜索系统或引擎,尤其涉及搜索社交媒介以及新闻网站、电子商务、网站、博客和博客网站信息以创建和呈现搜索结果的互联网搜索引擎。
【背景技术】
[0004]互联网将几乎无限多的信息提供给接入互联网的计算机、平板电脑以及电话用户,但人们需要一种有效的搜索工具来检索、组织并以对搜索者而言有用的形式呈现检索到的信息。已使用不同的方法和算法创建了各种搜索引擎以获取并组织数据,以及呈现与搜索对象(subject of search)相关的广告。因此,整个行业已经围绕这些各类搜索引擎得到了发展。
[0005]最早的成功的搜索引擎之一是Netscape,其使用关键词在互联网上搜索感兴趣的条目(item)。Netscape包括算法从而根据结果与搜索词的相关度来排序并显示结果。
[0006]后来,Google公司推出了另一种更成功的搜索引擎。同Netscape—样,Google基于输入搜索窗口的关键词或短语,使用有助于检索和排序搜索结果的算法搜索关键词。Google使用以各种方式排序结果的算法,包括根据关键词在检索到的条目或网站中出现的次数(包括在元数据和至其他网站和自其他网站的链接中出现的次数)。这使得Google易受到那些了解Google所使用的对搜索中检索到的信息排序并显示的算法的人的操纵。此夕卜,Google引入由通过购买Google “广告词”对该显示付费的广告商在搜索结果的旁边或上方显示广告的功能,使得每次用户输入搜索词时,广告或公告将出现在搜索结果的旁边或上方,并且将相应地向广告商的帐户收取用于广告的费用。广告词的价格根据其流行程度而浮动,这样,非常流行的搜索词(指被经常使用的搜索词)将比较不流行或较不常使用的搜索词费用高得多。Google已经开发出了基于流行程度对广告词定价的算法。
[0007]Facebook已经推出了著名的社交媒介网站,在那里用户可以创建Facebook页面,其中包括发布在订阅用户的个人网站上的照片、评论、链接等。通过联络其他订阅用户或将他们“加为好友”,该网站向订阅用户提供与其他订阅用户联络的机会,允许他们在彼此的Facebook页面上发送消息、发布消息、照片等。Facebook还宣布将推出使用Facebook的搜索引擎,但其确切的操作机制以及与现有搜索引擎的不同之处还不清楚。
[0008]此外,Google已经推出了社交媒介网站,在某些方面与Facebook类似,下面将讨论,但目前还不清楚该网站将得到多广泛的使用,或者其是否及如何关联到基本的Google搜索引擎,以及Google如何将这个网站提供给它的广告商。Google主要基于页面,因为其显示的搜索结果为来自其他网站的页面,例如来自报纸的文章或维基百科(由用户贡献词条的著名的在线百科全书)上的词条。
[0009]Twitter提供通过互联网通信的另一项最新的社交媒介模式,其允许用户和订阅用户“推送(tweet)”消息给已签约接收由特定个人推送的消息的“粉丝”。这些消息可以是从几个词到相当长的“博客”的链接或关于特定事件或“推送者(tweeter) ”或“粉丝”感兴趣的条目的评论。即使这些消息通过被许多个人(包括名人、演员、政治家、新闻报道者、记者和其他人)使用而已变得很常用,然而这些消息大部分似乎并不会被现有的搜索引擎检索到。Twitter还被各种企业使用以将产品公告和特别报价提供给已经签约接收此类信息的客户。
[0010]仍然需要一种搜索引擎,该搜索引擎可以搜索诸如报纸、杂志和互联网网站以及社交网站和推送消息、评论和其他用户生成消息等更多传统条目,并以易于使用、有组织的及用户友好的方式呈现如此检索或定位的信息的方式来组织这些条目。还需要一种搜索引擎,该搜索引擎可以即时地分析和测试响应,并且给出关于涉及特定条目或感兴趣的人物的活动的报告(包括社会人口统计学和其他明显特征)。这些信息允许赞助商跟随特定群体,并还将允许广告商挑选特定主题或搜索结果以在一旁投放广告。此外,这些信息还将允许民意调查和其他类型的分析,以测试公众对具有政治意义的事件的反应。

【发明内容】

[0011]本发明实现上述目标并克服之前的或其他系统的缺点,本发明提供了一种搜索引擎和系统,包括存储有计算机系统可执行指令的非临时性计算机可读存储介质,所述非临时性计算机可读存储介质包括指令以:在计算机系统处:从诸如笔记本电脑、个人电脑、平板电脑、移动电话、智能手机之类的用户的计算设备接收指定的搜索主题;对于所述指定的搜索主题,搜索一个或多个社交媒介网络、新闻或其他网站、博客或博客网站和/或电子商务网站,以识别发布到所述一个或多个社交媒介或其他网站的与所指定的主题相关的消息;从远程计算机接收对与被识别消息中的每个消息潜在关联的一个或多个属性的选择;根据一个或多个被选择的属性对被识别消息中的每个消息进行分类;生成用来指示根据一个或多个被选择的属性分类的被识别消息的数量的视觉呈现;以及使所述视觉呈现提供到所述远程计算机。
【附图说明】
[0012]通过查看下面结合以下附图对优选实施例的详细描述,本发明的进一步的目的、特征和优点将对本领域普通技术人员变得更清晰,附图中:
[0013]图1是用于实现本互联网搜索系统发明的实施例的系统和方法的示意图;
[0014]图2是示出图1的系统的广告动作特征的操作的示意图;
[0015]图3至图20是图1所示的本发明的实施例的各种特征的示意的屏幕截图;
[0016]图21是示出围绕感兴趣的对象的社交媒介活动的量的图表。
[0017]图22是示出所分析的社交媒介用户对于特定主题的相对两极分化(积极的和消极的)的图表;以及
[0018]图23是描绘社交媒介用户倾向于支持或不支持一政治家的地图。
【具体实施方式】
[0019]如本文所用,“内容排名”指的是加权平均好感分数。它将对任何主题(人物、地点、事件或事物)的积极情绪标准化,使得可以针对任何其他主题(即使是不同类型的)来比较和排序“内容排名”。可以随时间跟踪主题的内容排名的发展趋势。实现这一点的算法涉及收集并记录由对特定主题搜索返回的内容的条数;确定每条内容中表达的情绪对应该主题是积极的、消极的还是中立的。
[0020]“内容脉搏”指的是传播性分数;关于一主题的消息的平均传播速度。实现这一点的算法包括:
[0021]1.记录针对特定主题的搜索返回的内容(文本、图片、视频或任何其他形式的内容)的条目数;
[0022]2.确定每条内容的时间戳之间的间隔;
[0023]3.将时间戳的间隔相加;
[0024]4.将时间戳的间隔的总和除以返回的内容条数;以及
[0025]5.创建表格,该表格中时间戳的值适配对应的非数值分数(例如,高传播性可以由分数“A+”表示,低传播性可以由分数“F”来表示)。
[0026]本文中,传播性方向指的是指示增大或减小一主题的传播性的分数。
[0027]用于确定传播性方向的算法包括:
[0028]1.创建具有“X”轴和“Y”轴的图表;其中:
[0029]a)X轴将以逆序标记多条内容的位置,使得最新的一条内容处于X轴上的“I”位置,而最早的一条内容被给予X轴上的“N”位置,其中N为内容的总条数(例如,如果搜索中返回100条内容,则N为100,而最早的一条内容具有X轴上第100的位置);
[0030]b) Y轴将指示从O到无穷大的时间值;
[0031]2.为每条内容的时间戳与它前面一条内容(X坐标)之间的间隔绘制时间值(Y坐标);
[0032]3.画出穿过所有绘制点的最小二乘线;
[0033]4.确定所得到的线的斜率(如果所得到的线的斜率是正的,并且间隔逐渐越来越短,则该主题的传播性在增大;如果所得到的线的斜率是负的,并且间隔逐渐越来越长,则该主题的传播性在减小);以及
[0034]5.当传播性在增大时,用“ + ”指示,并且当传播性在减小时,用指示。
[0035]转向附图,图1示出本发明的社交内容和媒介搜索引擎40的操作的示意图。用户42使用登录屏幕44 (例如可以是Facebook或其他社交网站的登录页面)登录到系统中,并且输入搜索词。系统使用包括在本发明的系统40中的服务器48处理该搜索,该服务器48从所监测的网站(包括社交媒介网站、电子商务网站和博客网站等)的组合内容50检索原始内容。通过系统的服务器48处理原始内容50,并通过内容清理和增强算法52 (包括社会人口数据库、以及美国和世界人口普查数据库、计算语言学引擎、极性聚合引擎、知识提取引擎、地理位置提取引擎、用于提取用户的社会人口和教育背景的引擎以及与每个社交网站的用户的代理服务器“元”身份)过滤原始内容50。
[0036]在清理和增强处理之后,由内容关联处理56进一步处
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1