日历感知的资源检索的制作方法

文档序号:23068074发布日期:2020-11-25 17:55阅读:136来源:国知局
日历感知的资源检索的制作方法

优先权申请

本申请要求于2018年5月30日提交的题为“calendar-awareresourceretrieval”的序列号为15/992,795的美国申请的优先权,该申请要求于2018年1月29日提交的题为“calendar-awareresourceretrieval”的序列号为62/623,391的美国申请的优先权,其公开内容通过整体引用并入本文。



背景技术:

对电子邮件的使用在过去的几十年内在总容量(信息过载)方面和在电子邮件被用于的用途的数量(功能过载)方面已经得到了发展。电子邮件不仅用作通信工具,而且用作任务储存库、个人存档和日历工具。尽管各种研究已经关注于如何通过将任务支持或日历直接集成在电子邮件客户端内来支持该功能过载,但是几乎没有研究关注于其他数据源中存在的信息如何可以被利用以减轻在跨电子邮件的储存库搜索或再次查找项中存在的信息过载和搜索问题。



技术实现要素:

本发明内容部分被提供从而以简化形式介绍实施例的各方面,下面在具体实施方式中对这些实施例进行了进一步的解释。本发明内容部分不旨在标识所要求保护的主题的必要或所需特征,并且本发明内容部分中列出的元素的组合和次序不旨在提供对所要求保护的主题的元素的限制。

一种系统可以包括:显示器,其用以提供用户接口,该用户接口提供对个人信息管理(pim)应用的功能性的用户访问,显示器提供pim接口,该pim接口提供对pim应用的功能性的访问;处理器;以及被耦合到处理器的存储器设备,存储器设备包括被存储在其上的程序,其中程序在被运行(execute)时使处理器执行操作,该操作包括:确定日历事件被安排为在指定时间段中发生,响应于该确定,提取消息传送接口的日历上的日历事件的内容,生成由用户可访问并且与日历事件的所提取的内容相关的资源列表,通过对日历事件的所提取的内容与资源列表的资源的内容的比较来对资源进行排名,以及使具有较高相应排名的指定数量的相应资源的相应汇总(summary)被输出在pim接口上。

一种方法可以由计算系统的至少一个处理器执行。该方法可以包括:由用户接口接收用户已经选择了用户接口的推荐资源控件的指示,响应于接收到指示,提取用户的个人信息管理应用上的日历事件的内容,该内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、日期和时间和正文中的文本,生成由用户可访问并且与日历事件的所提取的内容相关的资源列表,通过对以下中的至少两项的比较来对资源进行排名:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性(recency);以及(d)相应资源与日历事件在资源关系图(graph)中的关系,以及使具有较高相应排名的指定数量的资源的相应汇总被显示在用户接口上。

至少一个机器可读存储介质,其包括指令,该指令用于由处理电路运行以执行操作,该操作包括:提取个人信息管理应用上的日历事件的内容,该内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、以及日期和时间,标识由用户可访问并且与日历事件的所提取的内容相关的资源列表,通过对以下中的至少一项的比较来对资源进行排名:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系,以及使具有较高相应排名的指定数量的资源的相应汇总被显示在显示器上。

附图说明

图1通过示例的方式图示了用于日历感知的资源检索的系统的实施例的示意图。

图2通过示例的方式图示了推荐项接口的实施例的示意图。

图3通过示例的方式图示了用于日历感知的资源检索的方法的实施例的示意图。

图4通过示例的方式图示了日历事件的实施例的示意图。

图5通过示例的方式图示了详述日历事件、人以及资源之间的连接的异构图的实施例的示意图。

图6通过示例的方式图示了元路径(meta-path)的实施例的示意图。

图7通过示例的方式图示了资源关系图的实施例的示意图。

图8通过示例的方式图示了用于推荐资源以供用户访问的方法的实施例的示意图。

图9通过示例的方式图示了用于实现一个或多个实施例的机器(例如,计算机系统)的实施例的框图。

具体实施方式

在下面的描述中,对附图进行引用,附图形成本文的一部分并且通过图示的方式在描述中示出了在其中可以被实践的特定实施例。这些实施例以充分的细节进行描述,以使得本领域技术人员能够实践实施例。应理解,其他实施例可以被利用,并且在不脱离实施例的范围的情况下,结构、逻辑和/或电气改变可以被做出。因此,下面的对实施例的描述不应在限制的意义上来理解,并且实施例的范围由随附权利要求限定。

在一些实施例中,本文中描述的操作、功能或算法可以在软件中被实现。软件可以包括计算机可执行指令,该计算机可执行指令被存储在计算机或其他机器可读介质或存储设备上,诸如一个或多个非瞬态存储器(例如,非瞬态机器可读介质)或其他类型的基于硬件的存储设备(本地的或联网的)。另外,这样的功能可以对应于子系统,其可以是软件、硬件、固件或其组合。多个功能可以根据需要在一个或多个子系统中被执行,并且所描述的实施例仅仅是示例。软件可以被运行在操作于计算机系统(诸如个人计算机、服务器或其他计算机系统)上的数字信号处理器、asic、微处理器、中央处理单元(cpu)、图形处理单元(gpu)、现场可编程门阵列(fpga)、或其他类型的处理器上,从而将这样的计算机系统转变成专用编程机器。功能或方法可以使用处理电路来实现,处理电路诸如可以包括电的和/或电子部件(例如,一个或多个晶体管、电阻器、电容器、电感器、放大器、调制器、解调器、天线、无线电收发装置、稳压器、二极管、振荡器、复用器、逻辑门、缓冲器、缓存、存储器、gpu、cpu、现场可编程门阵列(fpga)等)。功能或方法中的一些可以包括使用显示器,诸如可以由处理电路驱动的。显示器可以包括交互式或非交互式屏幕。交互式屏幕可以由用户输入设备驱动,用户输入设备可以包括支持本文档中讨论的各种功能的任何类型的用户输入设备,诸如触摸屏、键盘、小键盘、触摸板、跟踪球、操纵杆、以及鼠标。用户接口设备可以从输入设备接收输入并在用户接口输入合适的情况下允许用户执行本文档中讨论的任何其他功能。输出可以借助于显示器上的图形、通过扬声器的音频等来提供。

电子邮件已经成为重要的基于互联网的通信媒介达超过二十五(25)年。尽管电子邮件最初被设计用于异步通信,但是人们已经使对电子邮件的使用“过载”有其他功能,诸如任务管理和个人归档。随着在线服务和web的发展,电子邮件不仅继续服务于这些目的,而且数量不断增长(例如,作为用于电子商务购买的接收文件柜,作为身份/认证流程的标准部分,以及作为日历管理工具,等等)。关于日历管理,因为会议布置和时间协商常常通过电子邮件发生,所以几乎每个现代电子邮件服务(web电子邮件和客户端应用两者)提供日历管理。尽管如此整合,大多数特征发展已经关注于将信息从电子邮件移动到用户的日历中,但是几乎没有工作已经关注于日历信息对改进个人信息管理(pim)服务的其他功能性的影响。

本文讨论了可以包括日历感知资源推荐或资源数据检索系统、设备、方法以及非瞬态机器可读介质的实施例。实施例可以基于日历事件来访问日历事件、过滤器资源(例如,电子邮件、文件、附件、电子联系人(例如电子邮件地址、电话号码、称呼(handle)、用户名等))的数据,并基于日历事件的内容对经过滤的资源进行排名。日历事件的内容可以包括主题栏中的文本、正文、参加的人、暂时参加的人或受邀请但未参加的人、一个或多个附件的内容、日历事件的日期和时间、日历事件的位置、日历事件的组织者等。日历事件可以包括会议、约会、任务等。资源可以包括文件、日历事件、电子邮件(email)等。文件可以包括音频、文本、图像、视频、其他文件或其组合。资源可以包括在用户本地(被本地存储在用户的设备上)或在用户远程(由用户通过网络连接可访问)的资源。未被过滤掉或否则被确定为与日历事件相关联的资源可以被先发制人地检索,或到资源的链接可以被主动提供给用户。

存在许多类型的先前资源推荐系统,包括上下文信息检索、个人搜索、上下文感知和个人推荐、电子邮件信息提取和分类、以及电子邮件搜索和推荐。相比于先前工作,实施例可以使用上下文信号,如人、时间、资源、人或资源与人之间的关系,用于与日历事件相关的资源的主动推荐。实施例使用影响推荐质量的因素,并且可以提供因素与不同建模选择的影响之间的权衡。

本文中公开的实施例提供未存在于其他推荐器系统中的隐私水平。实施例至少部分地通过缩小可以被检索或推荐的资源库来实现这一点。资源库可以限于直接由用户可访问的资源。如本文中所使用的,直接可访问一般指示用户可以导航至并访问来自他们的计算机的资源,无论资源是本地的、远程的、在相同网络上还是在不同网络上,而不违反强制执行个人隐私、组织隐私、或访问策略的计算机策略。关于不被策略允许的其他用户的信息在提供该资源推荐中不被散布(disseminate)。这与推荐通常与另一产品一起购买的产品的推荐器系统以及许多其他推荐器系统形成对比。这些其他系统固有地提供关于其他用户的信息。本文中讨论的推荐器系统的隐私提供超过先前推荐器系统的技术优点。

在个人数据上构建有效推荐模型可以在隐私方面具有挑战性。许多预测模型访问大量(隐式或显式标记的)数据。然而,个人内容通常伴随有防止常见方法被应用的隐私挑战。例如,甚至简单词袋(bag-of-words)模型可以经由单个词的重要性的学习到的权重将信息从一个人泄露给另一个人。在该领域中,该任务的上下文性质被认为产生以下表示,其中模型可以被训练或跨用户使用而没有隐私风险,从而允许模型利用可能的最大量数据。这些上下文相似度特征是上下文(会议项)与候选(电子邮件或文件)之间的匹配的度量。例如,特征可以被部署以确定会议中的人的集合与电子邮件上的人的集合之间的相似度,同时不披露关于哪些人被涉及的隐私信息。同样地,该数据可以通过并入来自用户自己的信息的信息(诸如联系频率)来进一步参数化。然后,这些特征的重要性可以跨用户被训练或使用,从而有效地允许足够的数据以学习更复杂的交互并产生更有效的模型。概念证明(proof-of-concept)实验表明,使用甚至很小的这样的上下文相似度特征的集合来学习有效推荐模型的能力是可能的。更一般地,这些相似度特征可以被参数化以进一步实现跨用户学习而不跨用户泄露个人信息。实验和其他细节被描述在于2018年1月29日提交的申请号为62/623,391并且题为“calendar-awareresourcedataretrieval”的临时专利申请的附录中,其通过整体引用并入本文。

日历数据提供信息源,因为其提供针对信息需求的可能时间界限的指示以及相关的人(例如,邀请中的人)和内容(主题+正文)两者。本文中的实施例可以通过“零查询”推荐器系统来利用该信息。推荐器系统可以基于一个或多个即将到来的日历事件来主动选择并向用户显示潜在有用的资源。显示和便于访问资源可以帮助日历事件准备、日历事件跟进等。

资源访问的大部分与会议相关。用于主动推荐内容的各种推荐器结构的有效性被考虑。四类因素在推荐器中的每个中被考虑:资源内容量、资源新近性、日历资源内容匹配、以及日历资源人匹配。全部四个因素可以具有关于资源对日历事件准备的有用性的积极影响。

实施例可以确定在日历项中提供的上下文信息是否可以用于不仅仅简单地提醒人们即将到来的约会。日历项是人的未来意图的强指示器并且标识约会的时间(例如,通知需要的可能界限)以及通常包括所涉及的人、主题和描述。这形成用以探索的丰富的上下文基础,主动发现并推荐用户对于即将到来的日历约会将可能需要的资源。

主动电子邮件推荐可以通过实现“按照会议进行搜索”,来既改进电子邮件搜索效率又降低查询说明的难度。在实施例中,实施例可以不等待用户发出查询,但是可以基于关于用户的当前和未来日历约会哪些是已知的(“零查询”搜索体验),来主动形成并发出针对用户的查询。搜索可以通过选择约会或默认(例如,预测关注的日历项和相关联的信息两者)来激活。

图1通过示例的方式图示了用于日历感知的主动资源检索的系统100的实施例的示意图。如所图示的系统100包括个人信息管理器(pim)102和推荐器系统104。pim102可以包括日历接口106、电子邮件接口108、以及推荐项接口110。pim的示例包括:来自美国(usa)华盛顿州雷蒙德市的微软公司的outlook,来自美国加利福尼亚州山景城市的谷歌公司的gmail、来自爱沙尼亚的astonsoft有限公司的essentialpim、来自美国加利福尼亚州山景城市的mozilla基金会的thunderbird、来自美国加利福尼亚州旧金山市的emclient公司的emclient、以及来自美国纽约州布法罗市的synacor公司的zimbradesktop等。不是所有pim都包括电子邮件和日历功能性。实施例可以与单独的日历和电子邮件pim集成,使得pim102无需包括电子邮件和日历功能性中的任一者或两者。

用户可以通过日历接口106管理约会、会议、任务和/或提醒。日历接口106提供用于用户记录关于日期、时间、参加的人、主题、附件、事件的描述(例如,正文)、提醒时间等的数据的控件。存在用于日历应用的许多配置,并且实施例不限于特定日历配置。

用户可以通过电子邮件接口108管理电子邮件。电子邮件接口108提供用于用户在邮件上进行组织、访问、搜索、存储、删除或执行其他操作的接口。存在用于电子邮件应用的许多配置,并且实施例不限于特定电子邮件配置。

如所图示的pim102还包括检索相关项控件126。该控件是软件项,其响应于被选择(例如,通过点击和释放、触摸触摸屏、音频命令、视线滞留(gazedwell)等),而将一个或多个信号提供给推荐器系统104以启动用于填充推荐项接口110的操作。推荐器系统104的操作可以响应于用户选择检索相关项控件126、日期和时间流逝、指定时间段流逝等而被启动。

推荐器系统104可以包括应用编程接口(api)或其他处理电路或正在处理电路上操作的软件,它们可以向用户提供日历感知的资源推荐。在操作112处,如所图示的推荐器系统104构建候选集114。候选集114可以根据与电子邮件接口108相关联的电子邮件、外部数据124或与日历接口106相关联的日历事件来构建。操作112可以是针对由与推荐器系统104相关联的用户可访问的所有文件或其他资源的粗糙过滤器。操作112可以返回:被附接到日历事件的、被附接到发往或来自参加日历事件的人或日历事件的组织者的电子邮件的、由参加日历事件的人或日历事件的组织者创作的一个或多个文件(包括日历事件的主题、主体、或其他部分中的相同或相似单词或短语);或被确定为与日历事件相关、甚至在日历事件远程并且由pim102的用户(例如,登录到pim102中的用户)可访问的其他文件。

外部数据124可以被存储在用户的硬盘驱动器、共享驱动器、云上、或pim102外部的其他文件上或从其获得。候选集114可以包括通过操作112的粗糙过滤器的项。候选集114可以包括一个或多个电子邮件、电子邮件附件、由参加日历事件的人或日历事件的组织者创作的文件、包括与日历事件中的主题或其他内容相关的主题内容的文件等。数据在类型上不受限制,并且可以包括文本、音频、图像、统一资源定位符(url)、或视频数据、其组合等。

在操作116处,候选集114的每个项的特征表示可以被确定。特征表示可以包括内容量、资源新近性、内容匹配和/或人匹配。内容量可以包括资源的长度和/或资源是否包括附件(例如,在其中资源是电子邮件的示例中)。资源长度可以包括主题(例如,标题)和正文中的单词的数量。资源长度可以被转换成指示相对于候选集114中的所有其他资源的资源长度的分位数。如果资源包括附件,则资源是否包括附件可以被设置为“1”,并且如果资源不包括附件,则资源是否包括附件可以被设置为“0”。

资源新近性指示当前时间与以下中的一项之间的时间差异:资源被创建的时间,资源最后被访问的时间,资源最后被修改的时间,资源最后被保存的时间等。资源新近性可以被转换成指示相对于候选集114中的所有其他资源的资源长度的分位数。

内容匹配分数可以包括内容匹配分数和/或主题匹配分数。内容匹配分数可以包括资源的单词计数向量与日历事件的内容(例如,包括主题和正文两者)之间的余弦相似度。主题匹配分数可以包括资源的内容(例如,主题和正文中的一个或多个)的单词计数向量与日历事件的主题之间的余弦相似度。

人匹配可以包括人匹配分数、来自参加者分数和/或来自组织者分数。人匹配分数可以包括资源的人(例如,资源的(多个)作者或资源的正文中提到的人)与参加、被邀请到或组织日历事件的人的jaccard指数。如果资源是来自参加者的电子邮件或来自参加者的电子邮件的附件,或者资源的作者是参加者,则来自参加者分数可以为“1”,否则参加者分数可以为“0”。如果资源是来自组织者的电子邮件或来自组织者的电子邮件的附件,或者资源的作者是组织者,则来自组织者分数可以为“1”,否则组织者分数可以为“0”。

日历事件和特征化项118可以被提供到模型排名器120。模型排名器120可以基于特征匹配和/或机器学习技术来确定哪些项最可能与日历事件有关。模型排名器120可以基于项与日历事件有关的可能性来提供前k个推荐项122的排名列表。前k(k≤n)个项可以是可能性方面的并且可以被提供到pim102。pim102可以将推荐项接口110中的前k个项的列表提供给用户。推荐项接口110可以包括每个项的描述和链接,该链接在由用户选择时向用户提供项的视图。

系统100具体地基于以下观察来关注日历事件:在工作环境中,人们严重依赖电子邮件和日历事件两者来组织他们的日常活动和必要的信息。系统100访问用户的日历接口106,并获得包括个人的即将到来的信息需求的时间、持续时间和内容的上下文。系统100可以学习电子邮件的有用性以及关于准备或主持日历事件的任务的其他项(有时称为资源)。有用性是比相关性(以及偏好)更严格的准则,因为资源可以在内容方面与日历事件高度话题相关但是可能不具有准备日历事件本身的实用性。系统100可以通过在线机器学习技术来更新模型。

实施例可以考虑以下中的一项或多项:(1)资源访问与日历事件的相关程度,(2)哪些因素影响人们是否准备会议,哪些因素影响资源对会议的有用性以及如何影响,(3)哪些模型要用于资源推荐,以及(4)资源推荐中的资源新近性(例如,创建日期和时间或访问日期和时间)的作用。

图2通过示例的方式图示了推荐项接口110的实施例的示意图。如所图示的,推荐项接口110包括有用资源202和日历事件206。有用资源202中的推荐项细节204a和204b对应于来自模型排名器120的推荐项122和日历事件206的所选择的日历事件。响应于用户选择了日历事件细节208a-208b之一,对应于所选择的日历事件细节208a-208b的日历事件的推荐项细节204a-204b可以被显示。响应于用户选择了推荐项细节204a-204b,对应于所选择的推荐项的资源可以被检索并显示。

如先前所讨论的,推荐项接口110可以包括两个显示面板,诸如单独的窗口、带状物、弹出窗口或其他格式。一个面板可以列出用户的即将到来的日历事件(例如,按时间排序,诸如在日历事件206中),并且另一面板可以呈现(例如,有用资源202中的)针对其他面板中所选择的日历事件的资源推荐列表。在具有标准大小的台式机或膝上型屏幕中,指定数量的资源和会议可以被显示,并且用户可以在任一面板中滚动(例如,向上,向下,向左,或向右)以查看更多资源或日历事件。默认地,当前或第一个即将到来的日历事件可以被选择,并且用户可以通过选择日历事件主题(点击单独的链接“细节”打开具有日历事件的细节(例如内容)的弹出窗口)来将关注切换到不同日历事件。日历事件206和有用资源202中的一个或多个可以利用固定时间间隔(五分钟或更多或更少时间)刷新。在一个或多个实施例中,用户将不会感知到刷新,除非日历事件的列表改变或资源推荐的列表改变。用户还可以通过点击“刷新”或类似控件来手动刷新日历事件206或有用资源202推荐。

用户可以选择推荐项细节204a-204b之一来打开具有所选择的资源的完整内容的弹出窗口。资源内容的缩短版本可以连同推荐项细节204a-204b中的资源主题一起被显示。在一个或多个实施例中,用户可以通过悬停在推荐项细节204a-204b中的缩短预览上来预览资源的完整内容。

图3通过示例的方式图示了用于日历感知的资源推荐的方法300的实施例的示意图。如所图示,方法300包括:在操作310处,提取日历事件信息;在操作320处,检测触发条件被满足;在操作330处,生成候选资源集;在操作340处,对所生成的候选资源集的候选进行排名;以及在操作350处,显示指定数量的最高排名的资源的汇总(或提供引起对指定数量的最高排名的资源的汇总的显示的一个或多个信号)。

操作310可以包括从日历事件中提取日历事件中涉及的主题、正文、以及人。操作310可以包括提取具有来自当前用户的相同或相似信息的即将到来的日历事件m。日历事件可以诸如以可扩展标记语言(xml)、超文本标记语言(html)、或另一格式被存储在存储器中。图4图示了日历事件的实施例的视图。

触发条件可以包括用户选择了日历事件、指定日期或时间到达、指定时间段流逝、日历事件被安排为在指定时间段(例如,半个小时、十五分钟、十分钟、五分钟、或其他时间段)中开始的确定、特定日历事件应当是当前关注的预测等。响应于操作320,关键词可以从会议的主题和正文文本被提取(例如,获取根据关键词排名技术(例如,词频-反相文档频率(tf-idf))关于m的内容进行排名的指定数量的顶部关键词)。

操作330可以包括,在其中资源搜索服务由pim102提供的实施例中,利用所提取的关键词以及会议m中涉及的人中的一个或多个人(包括参加者和组织者)来查询服务。在一些实施例中,作为电子邮件搜索服务的附加或备选,硬盘驱动器(例如,“c:”驱动器)可以利用所提取的关键词以及会议中涉及的人中的一个或多个人被搜索以得到资源。从该搜索返回的资源被表示为候选集s。操作112可以包括操作330。

操作340可以包括根据各种不同排名技术中的一种排名技术对s中的资源进行排名。排名技术对于不同推荐器技术(例如图2中所详述的)而言可以是不同的。该排名的资源集可以被表示为r。方法300可以包括返回r。方法300还可以包括:响应于用户选择会议m(例如,日历事件)(诸如日历事件细节208a-208b),而显示每个资源r的细节(作为推荐项细节204a-204b)。操作116和/或由模型排名器120执行的操作可以是操作340的一部分。

方法300是当日历事件由用户选择或默认时的推荐流程的实施例。注意,方法300的输入可以包括当前用户的日历中的被(用户或默认)选择的会议以外的附加会议。在一个或多个实施例中,操作320、330和340可以被提前执行,使得所排名的候选通过存储器存取被提供在推荐项接口110上。

图4通过示例的方式图示了日历事件400的视图的实施例的示意图。日历事件400可以以xml、html、或其他格式被存储,其中元数据描述日历事件的内容。如所图示的日历事件400包括(多个)组织者、(多个)参加者、和/或(多个)受邀请者402、主题404、位置406、时间408、(多个)附件410、以及正文412。主题404一般概述将被覆盖在日历事件400中的内容。位置406一般指示物理位置或日历事件400是否将通过电话或web进行。时间408一般是时区相关的并且指示日历事件400的日期和时间并且有时指示日历事件400的持续时间。(多个)附件410是组织者(或受邀请者或参加者)认为与日历事件400相关的资源。正文412包括描述哪些将在日历事件400中被完成的内容的文本、图像或其他数据。日历事件400的信息中的任何信息可以用于帮助确定哪些资源要提供给参加、组织或跟进日历事件的用户。

图5通过示例的方式图示了详述诸如日历事件502、人504以及资源506和508的实体之间的连接的异构图500的实施例的示意图。资源还可以包括用户的外部发布,诸如博客发布、yammer发布、共享点(sharepoint)文档、谷歌驱动文档、共享盒文档等。日历事件502包括日历事件502a、502b和502c。人504包括人504a、504b、504c、504d和504e。资源506包括文件506a、506b和506c。资源508包括电子邮件508a、508b、508c和508d。异构图500包括连接510a、510b、510c和510d。针对连接510a-510e中的每个连接,异构图500包括相应标记(例如,标记512a、512b、512c以及512d)。不是所有连接都包括附图标记,并且不是所有标记都包括不会遮挡异构图500的视图的附图标记。

连接510a-510d指示连接的每个端部上的实体(例如,人、资源或会议)之间的直接关系。标记512a-512d指示连接510a-510d的每个端部上的实体之间的关系的性质。标记(有时被称为关系类型)可以包括:“共享的(shared)”,用于已经共享了资源的人;“给(to)”,诸如用于被提供给人的资源;“发送者”,用于已经提供了资源的人;“组织者”,用于组织了日历事件的人;“参加者”,用于已经接受了参加日历事件的邀请的人;“受邀请的(invited)”,用于尚未对参加日历事件的邀请做出回应的人;“编辑的(edited)”,用于已经修改了资源的人;“创建的(created)”,用于已经创作了资源的人;等。

一连串连接可以被组合以形成人、资源和/或日历事件之间的元路径。图6通过示例的方式图示了元路径600的实施例的示意图。元路径600可以包括比异构图500更多类型的资源、人、以及日历事件之间的连接。这些连接可以包括资源或日历事件的子集,诸如可以包括标签(tag)、关键词、人之间的关系(例如,在组织处的角色,诸如主管、经理、工程师、管理人员、程序员、开发者、生产专员、或其他角色)等。元路径600可以各自与定义资源与元路径中连接的日历事件相关的可能性的分数相关。日历事件与资源之间的连接可以包括一个或多个“原子元路径”,所有元路径可以从该一个或多个“原子元路径”得出。原子元路径中的每个可以与分数相关,并且形成日历事件与资源之间的连接的原子元路径可以被组合以确定针对连接的最终分数。

给定日历事件502a-502c,被直接或间接连接到日历事件502a-502c的实体可以基于它们与日历事件502a-502c的距离(与其分离的连接的数量)以及其相关性(例如,将日历事件502a-502c与资源分离的原子元路径)来排名。将进行排名的候选可以使用所有直接或间接连接的候选、排名或加权随机行走或基于它们到日历事件502a-502c的距离来确定。排名可以用于向用户推荐一个或多个资源。机器学习模型(诸如利用监督式机器学习技术训练以求解回归问题的模型)可以用于对一个或多个资源进行排名和/或过滤。这样的机器学习技术的示例包括线性回归或随机森林,以及其他。机器学习技术中评估的特征可以包括时间、结构和/或语义特征,诸如先前关于图1讨论的那些。

时间特征可以包括新近性,使得较靠近日历事件日期/时间或日历事件创建日期/时间交换的资源比其他资源加权得更大。在复发性日历事件中,在日历事件的先前发生之后提供的资源可以比其他资源被加权得更大。

结构特征可以包括实体(例如,考虑标记512a-512d)之间的关系。元路径600提供实体与日历事件之间的关系的结构的考虑。元路径600还可以诸如通过标记512a-512d向关系的结构提供语义含义。

在一个或多个实施例中,异构网络的实体之间的相关性度量可以使用异构相似度来确定。存在确定项(例如,日历事件与资源)之间的异构相似度的各种方式。

相关性度量可以包括图遍历技术(例如,与相关性等式一致)。图遍历技术可以有效地在大图上操作。

图7通过示例的方式图示了资源关系图700的实施例的示意图。资源关系图700图示了在指定数量的连接510内的从日历事件702到资源706a和706b的所有连接。资源706a-706b可以通过人704a、704b和704c被连接到日历事件702。对资源706a-706b的排名可以基于资源连接图700中的从日历事件702到资源706a-706b的独立连接的数量。在图7中图示的实施例中,资源706a可以被排名得比资源706b更高,因为到资源706a的独立连接的数量(例如,在图7的实施例中为三个)大于到资源706b的独立连接的数量(例如,在图7的实施例中为一个)。

基于元路径的集合,特征向量可以针对将被排名的每个实体而被确定。分数可以基于所确定的特征向量来确定。操作330或340可以包括内容比较(如先前所讨论的)。内容比较可以包括确定内容特征向量,诸如通过使用对日历事件和资源中的单词或字符串的项频率-反向文档频率(tf-idf)比较。资源的内容特征向量与日历事件的内容特征向量的点积可以被用作内容相似度分数。

内容、结构和时间相似性的分数可以被组合成用于资源排名的总分数,诸如通过模型排名器120或在操作340处。由模型排名器120执行的操作112、116、330或340操作可以包括关于图5-图7讨论的一个或多个操作。

图8通过示例的方式图示了用于日历感知的资源推荐/检索(诸如可以包括比当前推荐/检索技术更多的隐私)的方法800的实施例的示意图。如所图示的方法800包括:在操作810处,接收用户已经选择了用户接口的推荐资源控件的指示;在操作820处,提取用户的个人信息管理应用上的日历事件的内容;在操作830处,生成由用户可访问并且与日历事件的所提取的内容相关的资源列表;在操作840处,对列表的资源进行排名;以及在操作850处,使具有较高相应排名的指定数量的资源的相应汇总被显示在用户接口上。在操作810处,该指示可以由用户接口接收。操作820可以响应于在操作810处接收到指示而被执行。操作830的内容可以包括以下中的一项或多项:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、日期和时间、以及正文中的文本。操作840可以包括对以下中的至少两项的比较:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系。

方法800还可以包括由用户接口接收用户已经选择了相应汇总中的一个汇总的第一指示。方法800还可以包括检索与所选择的汇总相关联的资源。方法800还可以包括使所选择的汇总被显示在显示器上。方法800还可以包括:使用在线监督式机器学习技术来确定针对每个资源的特征向量,特征向量指示以下中的三项或更多项:(a)相对于资源中的一个或多个其他资源的资源中的内容量,(b)相对于资源中的一个或多个其他资源的资源的时间新近性,(c)资源与日历事件的内容之间的内容相似性,以及(d)参加日历事件、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配。操作840还可以包括,其中对资源进行排名包括基于所确定的特征向量对资源进行排名。

特征向量可以包括指示相对于资源中的一个或多个其他资源的资源中的内容量的数据,并且操作还包括确定正文和标题中的单词的数量,进行组合,并基于相对于一个或多个其他资源的资源中的内容量将单词的数量转换为分位数。特征向量可以包括指示资源是否包括一个或多个附件的数据。

特征向量可以包括指示资源与日历事件的内容之间的内容相似度的数据,并且操作还包括确定资源的内容与日历事件的主题之间的相似度。特征向量可以包括指示资源与日历事件的内容之间的内容相似度的数据。方法800还可以包括确定资源的内容与日历事件的主题和正文之间的相似度。

特征向量可以包括指示参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配的数据,并且操作还包括:基于参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称来确定jaccard指数,其中资源中的一个或多个人的名称包括以下中的一项或多项:作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。特征向量可以包括指示组织者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或所述资源的正文中提到的人的数据。

特征向量可以包括指示日历事件的参加者或受邀请者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人的数据。方法800还可以包括生成资源关系图,资源关系图具有作为连接图的节点的资源和作为连接图的节点之间的相应标记边的日历事件,其中标记边的标记指示边中的一条边的每个端部上的节点之间的关系。方法800还可以包括,其中生成由用户可访问并且与日历事件的所提取的内容相关的资源列表包括确定资源关系图中来自日历事件和相应资源的边的最小数量。

方法800还可以包括,其中对资源进行排名包括:通过对资源关系图中相应资源与日历事件的关系的比较来对资源进行排名,包括将分数指派给相应标记并且使用监督式机器学习技术来组合一个或多个分数,以确定排名。方法800还可以包括,其中资源包括被存储在用户本地或远程并且由用户可访问的以下中的一项或多项:电子邮件、电子邮件的附件、以及可访问的一个或多个其他文档。

与较大组会议相比,人可以更倾向于准备小组会议或一对一会议。与会议有关的人的角色影响人何时以及是否准备会议,但是此外,会议准备不仅仅限于人是主持人或组织者的会议。实施例可以以至少两种方式说明这些结果。人匹配特征可以对来自会议的组织者与参加者的电子邮件不同地进行加权。实施例可以默认到下一个即将到来的会议以实现默认的主动推荐,但是可以附加地或备选地允许用户选择会议从而允许用户启动的上下文推荐。

存在可以潜在地影响资源在准备日历事件中的有用性的许多因素。第一,资源中的内容量可以是重要因素,资源具有的信息越多,其一般越可能有用。第二,资源搜索和个人搜索两者中的新近性(例如,在个人搜索系统中,用户更频繁地访问了最新项并发出了更多查询,其中它们按日期对结果进行了排序)。资源中的新近性和对何人被涉及在资源中(例如,作为发送者、接收者、复制联系人、作者、主题等)与日历事件的匹配两者可以是在确定资源的相关性中的因素。

所涉及的人的角色(例如,电子邮件是由组织者发送还是由参加者发送)可以是重要因素。直观来说,涉及组织者的资源对参加者准备会议可能有用。内容匹配可以是资源相关性的因素,类似于搜索系统中的查询与搜索结果之间的匹配。四类因素被汇总在表1中,包括每种因素可以如何在推荐器系统中被实现。注意,这些特征是这四种因素可以被捕获的方式中的一些方式的非穷举示例。

表1

表1图示了在预测针对日历事件的资源有用性中的四类因素中的提取的特征。为了帮助理解建模选择的空间,六个推荐器被描述。头两个(时间和搜索)提供非学习基线(例如,它们不是基于机器学习模型的),接下来两个(静态线性和静态hero)提供不利用进一步交互更新的学习的基线,并且是相同的但是具有基于新近性的重新排名。最后两个(在线线性和在线svd)提供关于在线学习的影响以及非线性建模的信息。这些模型在表2中和下文更深入地进行描述。

表1定义了初始检索的电子邮件候选集s如何被排名(例如,方法300的操作340),除了替代方法300中的所有操作310、320和300的时间(用作基线)和搜索(简单实验)条件,因为候选生成和排名两者在那些模型中是不同的。在所有情况下,发送的资源和接收的资源两者都可以被认为是候选,因为人可以在他们已经发送或接收的资源中找到实用性。实施例可以被容易地受限于仅仅发送的资源或仅仅接收的资源。

对于时间条件,资源可以包括最新资源,最新资源从最新到最不新被排序。这提供基于新近性的简单基线。在搜索条件中,人可以执行的简单搜索被复制以找到针对日历事件的项,但不具有学习哪些因素对相关性贡献最大的益处。为了构建查询,多个关键词可以被选择,诸如根据项频率(tf)反相文档频率(-idf)准则从日历事件的主题的tf和来自用户的日历事件的即将到来的两周的所有日历事件主题的idf。这可以模拟用户搜索的结果,但是可以不同于实际用户搜索(例如,用户在他们的脑海中不具有针对即将到来的会议的确切信息但是他们可以比使用三个关键词更有效地进行搜索)。

静态线性条件可以包括有用性标记的电子邮件-会议对。利用标记的数据,线性模型被训练(通过本文中其他地方描述的线性ucb技术),以及预测资源对日历事件的有用性值(例如,如果被标记为“有用”,则值=1.0,如果被标记为“可能有用”,则值=0.5,并且如果被标记为“没有用”,则值=0.0)的奇异值分解(svd)(因式分解机器)模型。

线性模型的学习的权重可以由静态线性条件和在线线性条件来使用。然而,如果参与者添加更多标记,则在线线性条件可以在基于任务的实验正在进行的同时继续学习,因此使模型在线。类似地,svd模型可以被自引导并且在实验期间继续学习。注意,这两个模型可以被同时更新,诸如利用相同标记的数据点。这可以帮助保持这两个推荐器对之间的比较(例如,不存在排序效果)。

时间可以是资源排名中的重要因素,因为人甚至在给定搜索查询的上下文中具有针对他们的邮件的基于时间的排序的强偏好。与搜索查询有关的头两个相关搜索结果可以被推进到顶部,跟着基于时间排序的相关结果的完整集合。

在svd(因式分解机器)模型中,资源有用性可以被预测为等式1中示出的以下双线性函数:

其中w=(w,u)是模型参数,w是具有等于特征的数量d的长度的参数向量。u是dxk矩阵,其中k(在实施例中k=10)是表示特征i(i=0,…,d)的潜在因素的维数。通过转换,x0=1使得w0表示模型的学习到的拦截或全局偏差。设y是用户的有用性反馈,模型使用等式2的随机梯度下降(sgd)技术来最小化l2范数(最小二乘)损失函数,

其中err=y-f。等式2:

wi←wi+η·err

ui←ui+η·err·uj

表2

表2包括推荐器模型的汇总。用于学习四类因素的线性混合权重的线性ucb技术预测资源是“有用的”(例如,被标记为1.0)、“可能有用的”(例如,被标记为0.5)或“没有用”(例如,被标记为0.0)。数据:针对t=1,...,t的(xt,yt)的序列,其中x表示表1中的特征,并且y表示用户的有用性反馈。

参数:β=1;d是xt的维数。注意,线性ucb技术还具有探索参数α。等效地,这里,我们使用α=0。基本上,该技术可以用于在线估计线性回归模型。

初始化:a=βid,b=1d,(对于所有输入特征权重相等)。

fort=1,2,...,tdo

θt=a-1b

设用户关于有用性的反馈为yt

h←b+xtyt

end

结果:θ和线性模型被表示为f(x,θ)=θt

图9通过示例的方式图示了用以实现一个或多个实施例的机器900(例如,计算机系统)的实施例的框图。一个示例机器900(以计算机的形式)可以包括处理单元1002、存储器1003、可移除存储装置1010、以及不可移除存储装置1012。尽管示例计算设备被图示并描述为机器900,但是计算设备在不同实施例中可以处于不同形式。例如,计算设备可以替代地是包括如关于图9图示和描述的相同或相似元件的智能电话、平板电脑、智能手表、或其他计算设备。诸如智能电话、平板电脑以及智能手表的设备一般统称为移动设备。另外,尽管各种数据存储元件被图示为机器900的一部分,但是存储设备还可以或备选地包括经由诸如互联网的网络可访问的基于云的存储装置。

存储器1003可以包括易失性存储器1014和非易失性存储器1008。机器900可以包括(或访问计算环境,该计算环境包括)各种计算机可读介质,诸如易失性存储器1014和非易失性存储器1008、可移除存储装置1010以及不可移除存储装置1012。计算机存储装置包括随机存取存储器(ram)、只读存储器(rom)、可擦可编程只读存储器(eprom)与电可擦可编程只读存储器(eeprom)、闪存或其他存储器技术、压缩盘只读存储器(cdrom)、数字多用盘(dvd)或其他光盘存储装置、磁带盒、磁带、能够存储计算机可执行指令以供运行以执行本文中描述的功能的磁盘存储装置或其他磁性存储设备。

机器900可以包括(或访问计算环境,该计算环境包括)输入部1006、输出部1004以及通信连接1016。输出部1004可以包括显示设备,诸如触摸屏,其还可以用作输入设备。输入部1006可以包括以下中的一项或多项:触摸屏、触摸板、鼠标、键盘、相机、一个或多个设备特定按钮、集成在机器900内或经由有线或无线数据连接耦合到该机器900的一个或多个传感器以及其他输入设备。计算机可以使用通信连接以连接到一个或多个远程计算机(诸如数据库服务器,包括基于云的服务器和存储装置)而在网络环境中操作。远程计算机可以包括个人计算机(pc)、服务器、路由器、网络pc、对等设备或其他共同网络节点等。通信连接可以包括局域网(lan)、广域网(wan)、蜂窝、电气与电子工程师协会(ieee)802.11(wi-fi)、蓝牙、或其他网络。

存储在计算机可读存储设备上的计算机可读指令由机器900的处理单元1002可运行。硬盘驱动器、cd-rom和ram是包括诸如存储设备的非瞬态计算机可读介质的制品的一些示例。例如,计算机程序1018可以用于使处理单元1002执行本文中描述的一个或多个方法或算法。

示例1包括至少一个机器可读存储介质,其包括用于由处理电路运行以执行操作的指令,该操作包括:提取用户的个人信息管理应用上的日历事件的内容,该内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、以及日期和时间,生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表,通过对以下中的至少两项的比较来对多个资源进行排名:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系,以及使具有较高相应排名的指定数量的多个资源的相应汇总被显示在用户接口上。

在示例2中,示例1还可以包括,其中操作还包括:由用户接口接收用户已经选择了相应汇总中的一个汇总的第一指示,检索与所选择的汇总相关联的资源,并且使所选择的汇总被显示在显示器上。

在示例3中,示例1-示例2中的至少一项还可以包括,其中操作还包括由用户接口接收以下中的一项的第二指示:(a)用户已经选择了软件控制来检索相关项,(b)指定日期和时间已经流逝,(c)自上一次更新,指定时间段已经流逝,以及(d)日历事件被安排为在第二指定时间段内开始,并且其中提取日历事件的内容响应于接收到第二指示而发生。

在示例4中,示例1-示例3中的至少一项还可以包括,其中操作还包括使用在线监督式机器学习技术来确定针对每个资源的特征向量,特征向量指示以下中的三项或更多项:(a)相对于多个资源中的一个或多个其他资源的资源中的内容量,(b)相对于多个资源中的一个或多个其他资源的资源的时间新近性,(c)资源与日历事件的内容之间的内容相似性,以及(d)参加日历事件、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且其中对资源进行排名包括基于所确定的特征向量来对多个资源进行排名。

在示例5中,示例4还可以包括,其中特征向量指示相对于多个资源中的一个或多个其他资源的资源中的内容量,并且操作还包括:确定正文和标题中的单词的数量的度量,进行组合,并基于相对于一个或多个其他资源的资源中的内容量将单词的数量转换为分位数。

在示例6中,示例4-示例5中的至少一项还可以包括,其中特征向量指示资源是否包括一个或多个附件或指示一个或多个附件的大小。

在示例7中,示例4-示例6中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题之间的相似度。

在示例8中,示例4-示例7中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题和正文之间的相似度。

在示例9中,示例4-示例7中的至少一项还可以包括,其中特征向量指示参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且操作还包括:基于参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称来确定jaccard指数或余弦相似度,其中资源中的一个或多个人的名称包括以下中的一项或多项:作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例10中,示例4-示例9中的至少一项还可以包括,其中特征向量指示组织者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例11中,示例4-示例10中的至少一项还可以包括,其中特征向量指示日历事件的参加者或受邀请者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例12中,示例1-示例11中的至少一项还可以包括,其中操作还包括生成资源关系图,资源关系图具有作为连接图的节点的资源和作为连接图的节点之间的相应标记边的日历事件,其中标记边的标记指示边中的一条边的每个端部上的节点之间的关系;并且其中生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表包括:确定资源关系图中来自日历事件和相应资源的边的最小数量。

在示例13中,示例1-示例12中的至少一项还可以包括,对多个资源进行排名包括:通过对资源关系图中相应资源与日历事件的关系的比较来对多个资源进行排名,包括将分数指派给相应标记并且使用监督式机器学习技术来组合一个或多个分数以确定排名。

在示例14中,示例13还可以包括,其中多个资源包括被存储在用户本地或远程并且由用户能够访问的以下中的一项或多项:电子邮件、电子邮件的附件、以及能够被访问的一个或多个其他文档。

示例15包括一种方法,该方法由计算系统的至少一个处理器执行,该方法包括:由用户接口接收用户已经选择了用户接口的推荐资源控件的指示,响应于接收到指示,提取用户的个人信息管理应用上的日历事件的内容,内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、日期和时间、正文中的文本,生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表,通过对以下中的至少两项的比较来对多个资源进行排名:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系,并且使具有较高相应排名的指定数量的多个资源的相应汇总被显示在用户接口上。

在示例16中,示例15还可以包括,由用户接口接收用户已经选择了相应汇总中的汇总的第一指示,检索与所选择的汇总相关联的资源,并且使所选择的汇总被显示在显示器上。

在示例17中,示例15-示例16中的至少一项还可以包括,使用在线监督式机器学习技术来确定针对每个资源的特征向量,特征向量指示以下中的三项或更多项:(a)相对于多个资源中的一个或多个其他资源的资源中的内容量,(b)相对于多个资源中的一个或多个其他资源的资源的时间新近性,(c)资源与日历事件的内容之间的内容相似性,以及(d)参加日历事件、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且其中对资源进行排名包括基于所确定的特征向量来对多个资源进行排名。

在示例18中,示例17还可以包括,其中特征向量指示相对于多个资源中的一个或多个其他资源的资源中的内容量的数据,并且操作还包括:确定正文和标题中的单词的数量的,进行组合,并基于相对于一个或多个其他资源的资源中的内容量将单词的数量转换为分位数。

在示例19中,示例17-示例18中的至少一项还可以包括,其中特征向量指示资源是否包括一个或多个附件。

在示例20中,示例17-示例19中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题之间的相似度。

在示例21中,示例17-示例20中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题和正文之间的相似度。

在示例22中,示例17-示例20中的至少一项还可以包括,其中特征向量指示参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且操作还包括:基于参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称来确定jaccard指数,其中资源中的一个或多个人的名称包括以下中的一项或多项:作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例23中,示例17-示例22中的至少一项还可以包括,其中特征向量指示组织者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例24中,示例17-示例23中的至少一项还可以包括,其中特征向量指示日历事件的参加者或受邀请者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例25中,示例17-示例24中的至少一项还可以包括,生成资源关系图,资源关系图具有作为连接图的节点的资源和作为连接图的节点之间的相应标记边的日历事件,其中标记边的标记指示边中的一条边的每个端部上的节点之间的关系;并且其中生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表包括:确定资源关系图中来自日历事件和相应资源的边的最小数量。

在示例26中,示例15-示例25中的至少一项还可以包括,对多个资源进行排名包括:通过对资源关系图中相应资源与日历事件的关系的比较来对多个资源进行排名,包括将分数指派给相应标记并且使用监督式机器学习技术来组合一个或多个分数以确定排名。

在示例27中,示例26还可以包括,其中多个资源包括被存储在用户本地或远程并且由用户能够访问的以下中的一项或多项:电子邮件、电子邮件的附件、以及能够被访问的一个或多个其他文档。

示例28包括一种系统,其包括:用户接口,其用以提供对个人信息管理(pim)应用的功能性的用户访问,pim应用包括日历接口、电子邮件接口、以及推荐资源接口;处理器;以及被耦合到处理器的存储器设备,存储器设备包括存储在其上的程序,程序用于由处理器运行以执行操作,操作包括:确定日历事件被安排为在指定时间段中发生,响应于该确定,提取日历接口的日历上的日历事件的内容,内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、日期和时间、正文中的文本,生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表,通过对以下中的至少两项的比较来对多个资源进行排名:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系,并且使具有较高相应排名的指定数量的相应资源的相应汇总被显示在推荐资源接口上。

在示例29中,示例28还可以包括,其中操作还包括:由用户接口接收用户已经选择了相应汇总中的一个汇总的第一指示,检索与所选择的汇总相关联的资源,并且使所选择的汇总被显示在推荐资源接口上。

在示例30中,示例28-示例29中的至少一项还可以包括,其中操作还包括使用在线监督式机器学习技术来确定针对每个资源的特征向量,特征向量指示以下中的三项或更多项:(a)相对于多个资源中的一个或多个其他资源的资源中的内容量,(b)相对于多个资源中的一个或多个其他资源的资源的时间新近性,(c)资源与日历事件的内容之间的内容相似性,以及(d)参加日历事件、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且其中对资源进行排名包括基于所确定的特征向量来对多个资源进行排名。

在示例31中,示例30还可以包括,其中特征向量指示相对于多个资源中的一个或多个其他资源的资源中的内容量的数据,并且操作还包括确定正文和标题中的单词的数量,进行组合,并基于相对于一个或多个其他资源的资源中的内容量将单词的数量转换为分位数。

在示例32中,示例30-示例31中的至少一项还可以包括,其中特征向量指示资源是否包括一个或多个附件。

在示例33中,示例30-示例32中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题之间的相似度。

在示例34中,示例30-示例33中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题和正文之间的相似度。

在示例35中,示例30-示例33中的至少一项还可以包括,其中特征向量指示参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且操作还包括:基于参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称来确定jaccard指数或余弦相似度,其中资源中的一个或多个人的名称包括以下中的一项或多项:作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例36中,示例30-示例35中的至少一项还可以包括,其中特征向量指示组织者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例37中,示例30-示例36中的至少一项还可以包括,其中特征向量指示日历事件的参加者或受邀请者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例38中,示例28-示例37中的至少一项还可以包括,其中操作还包括生成资源关系图,资源关系图具有作为连接图的节点的资源和作为连接图的节点之间的相应标记边的日历事件,其中标记边的标记指示边中的一条边的每个端部上的节点之间的关系;并且其中生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表包括确定资源关系图中来自日历事件和相应资源的边的最小数量。

在示例39中,示例28-示例38中的至少一项还可以包括,对多个资源进行排名包括:通过对资源关系图中相应资源与日历事件的关系的比较来对多个资源进行排名,包括将分数指派给相应标记并且使用监督式机器学习技术来组合一个或多个分数以确定排名。

在示例40中,示例28-示例39中的至少一项还可以包括,其中多个资源包括被存储在用户本地或远程并且由用户能够访问的以下中的一项或多项:电子邮件、电子邮件的附件、以及能够被访问的一个或多个其他文档。

示例41可以包括一种系统,其包括:显示器,其用于提供用户接口,用户接口提供对个人信息管理(pim)应用的功能性的用户访问,显示器提供pim接口,pim接口提供对pim应用的功能性的访问;处理器;以及被耦合到处理器的存储器设备,存储器设备包括存储在其上的程序,其中程序当被运行时使处理器执行操作,操作包括:确定日历事件被安排为在指定时间段中发生,响应于该确定,提取消息传送接口的日历上的日历事件的内容,生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表,通过对日历事件的所提取的内容与资源列表的资源的内容的比较来对多个资源进行排名,并且使具有较高相应排名的指定数量的相应资源的相应汇总被输出在pim接口上。

在示例42中,示例41还可以包括,其中操作还包括:由用户接口接收用户已经选择了相应汇总中的汇总的第一指示,检索与所选择的汇总相关联的资源,并且使资源由显示器输出。

在示例43中,示例41-示例42中的至少一项还可以包括,其中日历事件的内容包括:日历事件的主题、参加或受邀请的人的一个或多个名称、组织者的名称、日期和时间、以及正文中的文本,并且对多个资源进行排名包括使用以下中的至少两项:(a)相应资源与主题和正文中的文本中的一个或多个的内容相似度;(b)参加或受邀请的人的名称和相应资源中的人的一个或多个名称;(c)相应资源的时间新近性;以及(d)相应资源与日历事件在资源关系图中的关系。

在示例44中,示例41-示例43中的至少一项还可以包括,其中操作还包括使用利用在线监督式机器学习技术训练的模型来确定针对每个资源的特征向量,特征向量指示以下中的三项或更多项:(a)相对于多个资源中的一个或多个其他资源的资源中的内容量,(b)相对于多个资源中的一个或多个其他资源的资源的时间新近性,(c)资源与日历事件的内容之间的内容相似性,以及(d)参加日历事件、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且其中对资源进行排名包括基于所确定的特征向量来对多个资源进行排名。

在示例45中,示例43还可以包括,其中特征向量指示相对于多个资源中的一个或多个其他资源的资源中的内容量的数据,并且操作还包括:确定正文和标题中的单词的数量,进行组合,并基于相对于一个或多个其他资源的资源中的内容量将单词的数量转换为分位数。

在示例46中,示例43-示例45中的至少一项还可以包括,其中特征向量指示资源是否包括一个或多个附件。

在示例47中,示例43-示例46中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题之间的相似度。

在示例48中,示例43-示例47中的至少一项还可以包括,其中特征向量指示资源与日历事件的内容之间的内容相似度,并且操作还包括确定资源的内容与日历事件的主题和正文之间的相似度。

在示例49中,示例43-示例48中的至少一项还可以包括,其中特征向量指示参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称之间的人匹配,并且操作还包括:基于参加、被邀请到日历事件的一个或多个人或日历事件的组织者的名称与资源中的一个或多个人的名称来确定jaccard指数或余弦相似度,其中资源中的一个或多个人的名称包括以下中的一项或多项:作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例50中,示例43-示例49中的至少一项还可以包括,其中特征向量指示组织者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例51中,示例43-示例50中的至少一项还可以包括,其中特征向量指示日历事件的参加者或受邀请者是作者或共同作者、发送者、接收者、复制联系人、最后修改资源的人、或资源的正文中提到的人。

在示例52中,示例41-示例51中的至少一项还可以包括,其中操作还包括生成资源关系图,资源关系图具有作为连接图的节点的资源和作为连接图的节点之间的相应标记边的日历事件,其中标记边的标记指示边中的一条边的每个端部上的节点之间的关系;并且其中生成由用户能够访问并且与日历事件的所提取的内容相关的资源列表包括确定资源关系图中来自日历事件和相应资源的边的最小数量。

在示例53中,示例52还可以包括,其中对多个资源进行排名包括:通过对资源关系图中相应资源与日历事件的关系的比较来对多个资源进行排名,包括将分数指派给相应标记并且使用利用监督式机器学习技术训练的机器学习模型来组合一个或多个分数以确定排名。

在示例54中,示例41-示例53中的至少一项还可以包括,其中多个资源包括被存储在用户本地或远程并且由用户能够访问的以下中的一项或多项:电子邮件、电子邮件的附件、以及能够被访问的一个或多个其他文档。

尽管几个实施例已经在上文被详细描述,但是其他修改是可能的。例如,在附图中描绘的逻辑流程不要求所示出的次序,或顺序次序,来实现期望的结果。其他步骤可以被提供,或者步骤可以从所描述的流程被消除,并且其他部件可以被添加到所描述的系统或者从所描述的系统被移除。其他实施例可以在随附权利要求书的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1