用于选择人工智能应用的负样本的自适应采样技术的制作方法

文档序号：6350741阅读：193来源：国知局

专利名称：用于选择人工智能应用的负样本的自适应采样技术的制作方法
技术领域：
本发明涉及要求具有正和负样本的训练集的人工智能应用，特别是推荐系统，更特别是用于电视的推荐系统。更具体而言，本发明涉及利用统计学上有效的技术为训练集选择负样本的应用。
背景技术：
2000年4月2日提交，在此引作参考的序列号为No.09/498,271的美国专利申请(US000018)披露了一种电视推荐系统。在该系统中，根据观看了的和没有观看的节目的模式进行推荐。当然，没有观看的节目必然比观看了的节目多。因此，开发出一种选择没有观看的节目的启发式。该启发式将根据每个观看了的节目选择一个没有观看的节目，所述没有观看的节目是从对应的观看了的节目所在的时间段以外的其它时间段中随机选取的。
一般而言，许多人工智能应用具有由正和负样本构成的训练集。选择负样本的启发式需要比参照各个单独的正样本随机逐个选择负样本的原理有所改进。

发明内容
本发明的目的是改进用于为人工智能应用的训练集选择负样本的启发式。
该目的通过如下方式得以实现，即对应于一组正样本选择一组负样本，而不是逐个选择。
该目的还通过如下方式得以实现，即根据一个假设占优的特征对正样本组进行分析。然后从与正样本共享该特征的可能是非正的样本中选出第一部分负样本。
该目的还通过如下方式得以实现，即节目的第二部分是从对应于上述特征的特征空间中的一个预定范围内的时间段选取的。该目的还通过如下方式得以实现，即没有任何负样本被选择一次以上。
优选地，所述应用是如电视等内容的推荐器，其中正样本是所选择的内容，负样本是没有选择的内容。同样优选地，所述特征是广播时刻。
其它目的和优点将在下文中更加清楚。
附图简述下面参考附图，通过非限制性的举例说明本发明。

图1示出对应于具体的观众，即用户H，如何利用均匀的随机采样选择负样本；图2示出对应于图1的正样本的柱状图；图3示出对应于图1的负样本的柱状图；图4与图1相似，但是对应于用户C；图5与图2相似，但是对应于用户C；图6与图3相似，但是对应于用户C；图7与图1相似，但是利用本发明选择负样本；图8与图4相似，但是利用本发明选择负样本；图9与图3相似，但是利用本发明选择负样本；图10与图6相似，但是利用本发明选择负样本；图11示出用户H的击中率作为假的正样本率(false positiverate)的函数；图12与图11相似，但是对应于用户C；图13示出实现本发明的硬件；图14示出根据本发明建立一个训练集的过程的流程图；图15示出一个表；图16示出一个表。
优选实施例详述下面参考用于电视的推荐器说明本发明，但是它同样可以用于任何人工智能应用的训练集，包括用于其它类内容的推荐器。术语“节目”包括可能被推荐器推荐的任何其它类内容，包括音频、软件、和文本信息。术语“观看”或“观看过”包括任何类正样本选择，包括经历任何类内容，如听和读。对本发明的描述还基于这样的假设，即时间是区别观看过和没有观看的内容的主要特征；但是，其它占优的特征也可以用作为训练集选择负样本的参数。
图13示出实现本发明的硬件。该硬件典型地包括显示器1、某种处理器2、通过某种连接3连接到该处理器的至少一个用户输入设备4；以及某种接收数据如电视节目或电子节目指南(“EPO”)数据的链接5。显示器1一般是电视屏幕，但也可以是其它类显示设备。处理器2可以是机顶盒、PC、或其它数据处理设备，只要具有足够的处理能力就行。用户输入设备4可以是遥控器，连接3可以是无线连接，如红外线连接。假如处理器是PC，用户输入设备通常至少应多于一个，如键盘和指点设备如鼠标。用户输入设备也可以是触敏显示器。与外部世界的链接5可以是天线、电缆、连到因特网的电话线、网络连接、或任何其它类数据链接。此外，链接5可以与许多不同类型的设备通讯，如远程处理器、外设、和/或存储器设备。
通常至少应当有一个存储器设备6，如CD ROM驱动器、软盘驱动器、或任何其它类存储器设备。存储器设备6可以存储数据、软件、或同时存储该两种内容。
也可以有其它未示出的外设，如声音识别系统、PC照相机、扬声器、和/或打印机。
图1示出对应于具体的观众，即用户H，如何利用均匀的随机采样选择负样本。纵轴表示节目的时刻。横轴表示采样的序数。圆圈是观看过的节目，星号对应于没有观看的节目。可以看出，观看了的节目主要集中在傍晚的黄金时段，只有少数节目在一天中的其它时间观看，特别是每天清晨，大概是在观众离家去学校或上班之前。
图2示出正样本，即用户H观看的节目，的基数与时间关系的柱壮图，对应于图1所示的圆圈数据。——关于图2、3、5、6、9和10，请注意，横轴的比例只是近似的。不应当认为图中的条严格对应于其下面所列的时间。
图3示出利用均匀随机采样的负样本，即没有观看的节目的柱壮图。同样，绘出的是节目的基数与时间的关系。该数据对应于图1中的星号。
图4中表示与图1相同的数据，但是对应于第二位用户，即用户C。为该用户所取的样本比为用户H所取的少。用户C有175个样本，而用户H有275个以上。
图5与图2相似，但是对应于用户C。
图6与图3相似，但是对应于用户C。
图14示出根据本发明建立一个训练集的过程的流程图。该流程图的运行可以在处理器2上执行，或在任何与处理器2连接或通过例如链接5从处理器2接收数据的处理器上执行。类似地，上述人工智能应用本身，如内容推荐器，可以在处理器2上训练或运行，也可以在任何与处理器2连接或通过例如链接5从处理器2接收数据的处理器上训练或运行。
在步骤1401，积累观看过的节目的对象总体到统计学上有意义的规模。在用户H和C的例子中，该对象总体的规模分别为275和175，但是，其它规模的对象总体也可以采用，只要它们在统计学上有意义。
在步骤1402，确定观看过的节目关于时间的分布，并确定优选的时间段。该分布可以用柱壮图的形式表示，如图2或图5所示。在优选实施例中，选择了具有最多节目的5个时间段。但是，也可以选择较多或较少的优选时间段。可选地，用户所观看过的所有时间段都可以使用。在所举例子中，用户H的5个最优选时间段按顺序分别是21:00、20:00、19:00、23:00、和22:00，而用户C的5个最优选时间段按顺序分别是8:00、23:00、20:00、24:00、和10:00。
然后，在步骤1403，在该用户的优选时间段中选择负样本的第一部分。在优选实施例中，该部分为50％。
在步骤1404，可选地，从优选的一个或多个时间段附近的预定时间间隔选择负样本的第二部分。在优选实施例中，该第二部分将从紧邻单个最优选的时间段之前的一小时和之后的一小时中选择。如果省略步骤1404，那么所有负样本都将从优选时间段或从该用户观看过的所有时间段中选择。因此，当省略步骤1404时，在步骤1402利用用户用过的所有时间段的选项最有可能被选择。
然后，在步骤1405，使得负样本集包括第一部分和任何第二部分。在优选实施例中，该负样本集实际上只是第一和第二部分。
在步骤1406，利用正和负样本集对推荐器进行训练。图7示出与图1所示用于用户H的相同类型的图，但是该图中负样本是根据图1 4中的技术选择的。应当注意，根据时间，负样本基本上在正样本衰减的地方衰减。负样本中明显的单调曲线只是选择负样本的次序的人为结果。它们用不着按照任何特殊次序选择。
图8示出与图4所示用于用户C的相同类型的图，但是该图中负样本是根据图14中的技术选择的。同样，负样本中明显的单调曲线没有特殊意义，因为它只是选择负样本的次序的人为结果。图9类似于图3，是关于用户H的，但是该图中负样本是根据图14中的技术选择的。用户H的正样本的柱壮图在此不予重复，因为它与前述相同。
图10类似于图6，用于用户C，但是该图中负样本是根据图14中的技术选择的。
实验表明，图14的技术平均可以实现20％的性能提高。性能是根据对一组电视节目的推荐的准确性测量的，针对该组电视节目，收集了用户认为推荐正确的评价。图15示出一个对理解如何评价性能有用的表。该表中定义了4个条款系统预报“是”，实际也是“是”(TP)系统预报“否”，实际是“是”(FN)系统预报“是”，实际是“否”(FP)系统预报“否”，实际也是“否”(TN)然后，根据下列公式确定“击中率” 假的正样本率根据下列公式确定图11示出对用户H的击中率作为假的正样本率的函数。星号示出根据自适应采样技术进行采样的曲线，而圆圈示出负样本均匀随机分布的采样的曲线。
通常，内容推荐器首先将对应于一个用户指定对每项内容的成功概率。然后，如果一项内容的成功概率超过某个阈值，该项内容就将被推荐。图11所示曲线上的点对应于不同阈值。图16中的表2示出得出图11的计算类型的另一种解释。该表中，击中次数、假的负样本次数、真的拒绝次数、假的正样本次数、击中率、以及假的正样本率的值是对应于各种阈值示出的，即在步骤.05中取自0-1。表2中的值实际上是针对用户H的，利用了根据本发明选择的负样本。
图12示出关于用户C的相同曲线。两种技术对用户H使用的效果都好于用户C，因为用户H的正样本对象总体比用户C的大；但是，在两种情况下，根据自适应采样法的负样本集都产生至少20％的提高。
在上述例子中，通常将负样本集选择为具有与正样本集相等的成员数。但是，本领域的普通技术人员可以根据本发明设计负样本数多于或少于正样本数的集合。
通过阅读本说明书，对本领域的普通技术人员来说，其它的改动将是显然的。这样的改动可能涉及在设计、制造和使用人工智能应用的训练集时已知的，可以代替或辅助此处描述的特征使用的特征。尽管本申请中的权利要求的表达为特征的特定组合，但是应当理解，本申请公开内容的范围还包括此处明确或暗示公开的任何新颖特征或特征的新颖组合，或其任何概括，不管它是不是象本发明一样减轻了任何或全部相同的技术问题。申请人提请注意，在进行本申请或由本申请引出的任何其它申请的过程中，有可能提交对这些特征的新的权利要求，包括方法、在存储介质中实现的软件、以及“用于……的装置”的权利要求。
此处所用的术语“包括”不应当被认为排除其它的元素。此处所用的“一”不应当被认为排除多个元素。
权利要求
1.处理装置，用于实现人工智能应用，该人工智能应用要求使用具有正和负样本的训练集，该装置包括至少一个存储器，用于存储数据和/或指令；至少一个处理器，用于利用所述至少一个存储器执行下列操作识别并保持用于训练的正样本集；和根据该正样本集选择用于训练的负样本集。
2.根据权利要求1的装置，其中所述负样本集与正样本集的成员数相等。
3.根据权利要求1的装置，其中所述人工智能应用是内容推荐器。
4.根据权利要求3的装置，其中所述内容是电视节目。
5.根据权利要求1的装置，其中所述正和负样本可以根据至少一个特征描述，该特征具有一个特征空间内的多个可能值；所述正样本集包括至少一个子集，每个子集包括相应的多个成员，这些成员同样具有所述特征空间中一个给定特征的相应的值，该给定的特征是事先在所述特征空间中被确定为占优特征的特征；以及所述负样本集包括至少一个相应的子集，该子集对应于上述正样本集的至少一个子集，每个相应的负样本子集的成员被选择为与对应于相应的负样本子集的正样本子集的成员共享给定特征的同样的相应值。
6.根据权利要求5的装置，其中所述负样本集包括至少一个相应的第二负样本子集，该相应的第二负样本子集的成员被选择为其给定特征的值在上述同样的值的预定范围之内，但不包括该同样的相应值。
7.根据权利要求6的装置，其中在所述负样本集中，没有一个负样本出现两次。
8.根据权利要求5的装置，其中所述给定的特征是时刻。
9.一种推荐内容的方法，该方法要求使用具有正和负样本的训练集，包括以下步骤识别并保持用于训练的正样本集；和根据该正样本集选择用于训练的负样本集。
10.根据权利要求9的方法，其中所述负样本集与正样本集的成员数相等。
11.一种计算机程序产品，当执行该计算机程序产品时，使得一个可编程装置能够起到如权利要求1-8任一项所定义的装置的作用。
全文摘要
人工智能应用要求利用包括正和负样本的训练集。负样本是利用正样本对应于特征空间中占优的特征的分布来选择的。负样本应当与正样本共享样本空间中大体相同的占优特征值。这种训练集是相对于内容推荐器说明的，特别是电视节目推荐器。
文档编号G06N5/04GK1511413SQ02800902
公开日2004年7月7日申请日期2002年3月25日优先权日2001年3月28日
发明者S·V·R·古塔, K·P·李, J·D·沙费尔, S V R 古塔, 李, 沙费尔申请人:皇家菲利浦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.V.R.古塔;K.P.李;J.D.沙费尔
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人

上一篇：用于自动控制个人化联网环境的方法和系统的制作方法
上一篇：多点触摸型输入控制系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。