基于动态语言模型的推荐方法与推荐系统的制作方法

文档序号：6358331阅读：106来源：国知局

专利名称：基于动态语言模型的推荐方法与推荐系统的制作方法
技术领域：
本发明涉及一种利用动态语言模型(Dynamic Language Model)分析搜寻所得的推荐信息的结果，作为推荐信息排序依据的推荐系统。
背景技术：
个人化推荐系统已经被广泛地运用到各种行销模式，通过个人化推荐系统与使用者进行互动，取得使用者的个人行为模式加以分析学习，进而提供符合使用者需求的信息，以作为使用者决策的指标。目前，推荐系统主要是分析使用者过去的行为模式，建立基于关键词汇或关键语意的个人描述文件(user profile),搜寻可能符合使用者偏好的信息。然而，在传统的搜寻过程中，并未考虑其推荐的信息是否属于使用者熟悉的语言风格，造成推荐的信息往往无法符合使用者的需求。

发明内容
本发明是有关于一种基于动态语言模型重新分析推荐数据所得的结果，作为排序依据的推荐系统，其可以依据使用者的阅读历程建构动态语言模型，藉以分析使用者偏好及使用者熟悉的语言风格，提供符合使用者需求的个人化推荐服务。根据本发明的第一方面，提出一基于动态语言模型的推荐方法。基于动态语言模型的推荐方法包括以下步骤。提供一笔或多笔语句数据，该一笔或多笔语句数据包括多个词汇。分析这些词汇于该一笔或多笔语句数据的多笔词汇出现机率。分析这些词汇之间的多笔词汇接续机率。依据这些词汇出现机率及这些词汇接续机率，建构一笔或多笔语言模型。整合该一笔或多笔语言模型，建构一动态语言模型。提供一关键词，依据该关键词，搜寻多笔推荐语句数据。针对这些推荐语句数据，分析每笔推荐语句数据与该动态语言模型在词汇出现机率与词汇接续机率的差异程度，个别计算出一歧异度，以求得多笔岐异度。依据这些岐异度，排序这些推荐语句数据，以提供一推荐列表。根据本发明的第二方面，提出一种基于动态语言模型的推荐系统。基于动态语言模型的推荐系统包括一语言模型建构模块、一语言模型调适模块、一语句数据选粹模块及一语句数据推荐模块。语言模型建构模块用以依据一笔或多笔语句数据包含的多个词汇，分析出这些词汇于该一笔或多笔语句数据的多笔词汇出现机率及这些词汇之间的多笔词汇接续机率，并依据这些词汇出现机率及这些词汇接续机率，建构一笔或多笔语言模型。语言模型调适模块包括一调适单元，根据该一笔或多笔语言模型，以建构一动态语言模型。语句数据选粹模块用以依据该一个或多个关键词，自一包含一笔或多笔语句数据的数据库中搜寻多笔推荐语句数据。语句数据推荐模块用以针对这些推荐语句数据，分析每笔推荐语句数据与该动态语言模型在词汇出现机率与词汇接续机率的差异程度，个别计算出一歧异度，以求得多笔岐异度，并依据这些岐异度，排序这些推荐语句数据，以提供一推荐列表。为了对本发明的上述及其他方面更了解，下文特举实施例，并结合附图详细说明如下。

图I绘示本实施例的基于动态语言模型的推荐系统的方块图。图2绘示本实施例的基于动态语言模型的推荐方法的流程图。附图符号说明1000 :基于动态语言模型的推荐系统100 :语言模型建构模块110:语句数据提供单元120 :分析单元130 :建构单元200 :语言模型调适模块220 :调适单元300 :语句数据选粹模块310:搜寻线索提供单元320 :数据库330 :搜寻单元400 :语句数据推荐模块410:比对单元420 :排序单元500 :语料库K :关键词L :推荐列表M :调适语言模型Md、M/ :动态语言模型SlOO S104、S200 S202、S300 S304 :流程步骤
具体实施例方式请参照图1，其绘示本实施例基于动态语言模型的推荐系统1000的方块图。基于动态语言模型的推荐系统1000包括一语言模型建构模块100、一语言模型调适模块200、一语句数据选粹模块300及一语句数据推荐模块400。语言模型建构模块100用以建构一初始语言模型(Initial Language Model)或调适语言模型(Adaptive language Model)M。语言模型调适模块200用以整合初始语言模型与调适语言模型M或根据调适语言模型M，建构一个动态语言模型Md,或是整合之前建构的动态语言模型M/与调适语言模型M,建构调适后的动态语言模型Md。语句数据选粹模块300利用关键词K进行初步筛选。语句数据推荐模块400则利用个人化动态语言模型Md进行推荐，以提供使用者一推荐列表L。语言模型建构模块100包括一语句数据提供单元110、一分析单元120及一建构单元130。语句数据提供单元110用以提供或输入各种数据例如是一键盘、一滑鼠、连接数据库的一连接线或一接收天线等。分析单元120用以进行各种数据分析程序，建构单元130则用以进行各种数据模型的建构程序。分析单元120及建构单元130例如是微处理芯片、固件电路、储存数组程序码的储存媒体。语言模型调适模块200包括一调适单元220。调适单元220用以进行各种数据模型的调适程序。调适单元220例如是微处理芯片、固件电路、储存数组程序码的储存媒体。语句数据选粹模块300包括一搜寻线索提供单元310、一数据库320及一搜寻单元330。搜寻线索提供单元310用以提供各种搜寻线索例如是一键盘、一滑鼠、连接数据库的一连接线或一接收天线等。数据库320用以储存各种数据，例如是一硬盘、一存储器或一光盘片。搜寻单元330用以进行各种数据搜寻程序，例如是微处理芯片、固件电路、储存数组程序码的储存媒体。语句数据推荐模块400包括一比对单元410及一排序单元420。比对单元410用以进行各种数据比对程序，排序单元420用以进行各种数据排序程序。比对单元410及排序单元420例如是微处理芯片、固件电路、储存数组程序码的储存媒体。请参照图2，其绘示本实施例的基于动态语言模型Md的建构方法与基于动态语言模型Md重新排序推荐数据的推荐方法的流程图。以下是结合图I的基于动态语言模型的推荐系统1000说明基于动态语言模型Md的建构方法与基于动态语言模型Md重新排序推荐数据的推荐方法，然而本发明所属技术领域的技术人员均可了解本实施例的基于动态语言模型Md的建构方法与基于动态语言模型Md重新排序推荐数据的推荐方法并不局限于图I的基于动态语言模型的推荐系统1000，且图I的基于动态语言模型的推荐系统1000也不局限应用于图2的流程步骤。在步骤SlOO S104中，是通过语言模型建构模块100实施调适语言模型M的建构方法。在步骤SlOO中首先判断是否建构语言模型，若需建构语言模型，则进入步骤S101，否则进入步骤S300，判断是否进行推荐。在步骤SlOl中，语句数据提供单元110提供一笔或多笔语句数据。语句数据包括数个词汇。在此步骤的一实施例中，语句数据提供单元110可以依据使用者的阅读历程提供一使用者曾经阅读的一已阅读书籍，例如是「Old Man andSea(老人与海)」、「Popeye the Sailor Man (大力水手)」及「Harry Potter (哈利波特)」。语句数据提供单元110依据这些已阅读书籍的内容，撷取语句数据。语句数据可以是每本书籍的全部文字，或者是部份文字。语句数据提供单元110提供这些书籍的方式可以通过使用者自行输入，或者由网络上的个人书籍订购信息来获得，或者由图书馆的个人书籍借阅数据来获得。在另一实施例中，语句数据提供单元110也可以依据使用者的订购历程提供一使用者曾经订购的一已订购商品，例如是「computer(电脑)」、「bicycle(自行车)」、「bluetooth ear phone (蓝牙耳机)」、「DVD player (DVD播放器)」及「LCD TV (液晶电视)」。语句数据提供单元110依据这些已订购商品的简介，撷取语句数据。语句数据可以是每份简介的全部文字，或者是部份文字。语句数据提供单元110提供这些订购历程的方式可以通过使用者自行输入，或者由网络上的个人商品订购信息来获得，或者由商家的会员数据来获得。在一实施例中，除了根据使用者提供的初始语句数据建立初始语言模型，语句数据提供单元110也可以利用使用者的背景数据，自语料库500撷取与背景数据相关的语句数据以建构初始语言模型。例如语句数据提供单元110获得使用者的求学背景后，可根据求学背景提供相关的语句数据。
举例来说，语句数据提供单元110通过上述方法撷取到以下第一语句数据「no，he was being stupid. Potter was not such an unusual name. He was sure there werelots of people called Potter who had a son called HarryJ0 这段语句数据中，词汇的总数为27。在步骤S102中，分析单元120分析这些词汇于语句数据的数笔词汇出现机率。举例来说，上述词汇「was」的出现次数为3，所以词汇「was」于上述语句数据的词汇出现机率为3/27 ;上述词汇「he」的出现次数为2，所以词汇「he」于上述语句数据的词汇出现机率为2/27。前述词汇出现机率可以利用下式(I)为例作说明
权利要求
1.一种基于动态语言模型的推荐方法，包括提供ー笔或多笔语句数据，该ー笔或多笔语句数据包括多个词汇；分析这些词汇于该一笔或多笔语句数据的多笔词汇出现机率；分析这些词汇之间的多笔词汇接续机率；依据这些词汇出现机率及这些词汇接续机率，建构ー笔或多笔语言模型；整合该ー笔或多笔语言模型，建构ー动态语言模型；提供一关键词，依据该关键词，搜寻多笔推荐语句数据；针对这些推荐语句数据，分析每笔推荐语句数据与该动态语言模型在词汇出现机率与词汇接续机率的差异程度，个别计算出ー歧异度，以求得多笔岐异度；以及依据这些岐异度，排序这些推荐语句数据，以提供一推荐列表。
2.如权利要求I所述的基于动态语言模型的推荐方法，其中该关键词为ー书籍的书名，这些推荐语句数据为该书籍的内容。
3.如权利要求I所述的基于动态语言模型的推荐方法，其中该关键词为ー单字或一片语，这些推荐语句数据为该单字或该片语的示范例句或词义解释。
4.如权利要求I所述的基于动态语言模型的推荐方法，其中提供该ー笔或多笔语句数据的步骤包括提供一使用者曾经阅读的一已阅读书籍；以及依据该已阅读书籍的内容，撷取该一笔或多笔语句数据。
5.如权利要求I所述的基于动态语言模型的推荐方法，其中该ー笔或多笔语言模型包括至少ー初始语言模型或ー笔或多笔调适语言模型。
6.如权利要求5所述的基于动态语言模型的推荐方法，其中提供该ー笔或多笔语句数据的步骤包括提供一使用者的背景数据；以及依据该使用者的背景数据，提供该ー笔或多笔语句数据，以建构该初始语言模型。
7.如权利要求5所述的基于动态语言模型的推荐方法，其中在建构该动态语言模型的步骤中，还整合该ー笔或多笔调适语言模型与之前建构的该动态语言模型，以更新该动态语目模型。
8.一种基于动态语言模型的推荐系统，包括ー语言模型建构模块，用以依据ー笔或多笔语句数据包含的多个词汇，分析出这些词汇于该一笔或多笔语句数据的多笔词汇出现机率及这些词汇之间的多笔词汇接续机率，并依据这些词汇出现机率及这些词汇接续机率，建构ー笔或多笔语言模型；ー语言模型调适模块，包括一调适单元，根据该ー笔或多笔语言模型，以建构一动态语目模型；一语句数据选粹模块，用以依据该ー个或多个关键词，自一包含ー笔或多笔语句数据的数据库中搜寻多笔推荐语句数据；以及一语句数据推荐模块，用以针对这些推荐语句数据，分析每笔推荐语句数据与该动态语言模型在词汇出现机率与词汇接续机率的差异程度，个别计算出ー歧异度，以求得多笔岐异度，并依据这些岐异度，排序这些推荐语句数据，以提供一推荐列表。
9.如权利要求8所述的基于动态语言模型推荐系统，其中该语言模型建构模块，进ー步包括一语句数据提供单元，用以提供一笔或多笔语句数据，该语句数据包括多个词汇；一分析单元，用以分析这些词汇于该语句数据的多笔词汇出现机率，并分析这些词汇之间的多笔词汇接续机率；及一建构单元，依据这些词汇出现机率及这些词汇接续机率，建构该一笔或多笔语言模型。
10.如权利要求8所述的基于动态语言模型推荐系统，其中该语句数据选粹模块，进一步包括一搜寻线索提供单元，用以提供一个或多个关键词；一数据库，包含一笔或多笔语句数据 '及一搜寻单元，依据该一个或多个关键词，自该数据库中搜寻多笔推荐语句数据。
11.如权利要求8所述的基于动态语言模型推荐系统，其中该语句数据推荐模块，进一步包括一比对单元，针对这些推荐语句数据，分析每笔推荐语句数据与该动态语言模型在词汇出现机率与词汇接续机率的差异程度，个别计算出一歧异度，以求得多笔岐异度；及一排序单元，依据这些岐异度，排序这些推荐语句数据，以提供一推荐列表。
12.如权利要求8所述的基于动态语言模型推荐系统，其中该关键词为一书籍的书名，各该推荐语句数据为该书籍的内容。
13.如权利要求8所述的基于动态语言模型推荐系统，其中该关键词为一单字或一片语，各该推荐语句数据为该单字或该片语的示范例句或词义解释。
14.如权利要求9所述的基于动态语言模型推荐系统，其中该语句数据提供单元提供一使用者曾经阅读的一已阅读书籍，并依据该已阅读书籍的内容，撷取该语句数据。
15.如权利要求8所述的基于动态语言模型推荐系统，其中该一笔或多笔语言模型包括至少一初始语言模型或一笔或多笔调适语言模型。
16.如权利要求9所述的基于动态语言模型推荐系统，其中该语句数据提供单元提供一使用者的背景数据，并依据该使用者的背景数据，提供该语句数据，建构该初始语言模型。
17.如权利要求8所述的基于动态语言模型推荐系统，其中该调适单元更整合该一笔或多笔调适语言模型与之前建构的该动态语言模型，以更新该动态语言模型。
全文摘要
一种基于动态语言模型推荐方法及推荐系统。基于动态语言模型的推荐系统包括一语言模型建构模块、一语言模型调适模块、一语句数据选粹模块及一语句数据推荐模块。语言模型建构模块用以建构语言模型。语言模型调适模块可动态整合不同的语言模型，以建构动态语言模型。语句数据选粹模块依据关键词，自数据库中搜寻以得到数笔推荐语句数据。语句数据推荐模块分析这些推荐语句数据与动态语言模型的岐异度，重新排序推荐语句数据，以提供一推荐列表。
文档编号G06F17/30GK102682045SQ201110098759
公开日2012年9月19日申请日期2011年4月20日优先权日2011年3月18日
发明者李青宪, 沈民新, 邱中人申请人:财团法人工业技术研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沈民新;邱中人;李青宪
技术所有人：财团法人工业技术研究院
我是此专利的发明人

上一篇：光学式触控装置及其对象辨识方法
上一篇：图像处理系统、图像处理装置和判定装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。