一种餐饮推荐方法、服务器及存储介质与流程

文档序号:17551011发布日期:2019-04-30 18:16阅读:149来源:国知局
一种餐饮推荐方法、服务器及存储介质与流程

本发明涉及餐饮领域,涉及一种餐饮推荐方法,以及相关的服务器及存储介质。



背景技术:

现在许多商家都接入了大众点评、饿了么、美团等类似带有评分的系统平台,通常如果用户要选择在哪个商家进行消费,如选择在哪家吃饭,一般是根据上述平台用户的评分或者用户的评论来做选择。当平台接入的商家较多且在商家消费的用户评论较多,或者用户没有太多时间去浏览评分信息的时候,用户往往不知道如何进行商家选择。



技术实现要素:

本发明的目的在于提出一种基于评分的餐饮推荐方法、服务器及存储介质,可有效地节约食客的选择时间。

本发明提供了一种餐饮推荐方法,包括如下:

采用爬虫遍历至少一个平台的餐饮数据,将爬虫获取到的餐饮数据存入数据库中;所述餐饮数据包含商家信息、评论内容、评论对应的评分、评论对应的等级或标签,所述评论对应的等级为若干类别的等级,所述评论对应的标签包含若干类别的标签;所述商家信息包括但不限于商家地址、商家电话、推荐菜、服务、环境;所述餐饮数据还包括但不限于人均价格、评论时间、餐饮分类、餐饮口味、用户信用等级;

对若干个类别的等级或标签的评论用有监督学习的方法,训练一个文本情感分类器;对餐饮数据的评论经过训练后的文本情感分类器筛选,并获得评论的句子评分;

对若干个类别的等级或标签的评论用有监督学习的方法,训练一个词语分类器;对餐饮数据的评论经过训练后的词语分类器分析某家商家的标签或分类的情感方向得出词语评分;

将评论的句子评分与对应商家对应的词语评分进行加权求和得出综合评分;

将包含餐饮口味、服务、环境、人均价格、餐饮分类、价格区间中的任意一种或者两种及其以上组合与所述综合评分结合得出推荐指数,根据推荐指数的大小确认商家是否值得推荐。

进一步的,所述方法还包括:将确认推荐的商家地址、商家电话、推荐菜进行展示。

进一步的,所述方法中,步骤一还包括:

对数据库中的餐饮数据进行清洗操作,过滤掉无效的评论。

进一步的,优选地,所述数据库为redis数据库;

所述餐饮数据包括但不限于人均价格、评分、评分等级、评论时间,餐饮分类、商家地址、餐饮口味、服务、环境、评论标签、商家电话、用户信用等级、推荐菜。

进一步的,采用爬虫遍历至少一个平台的餐饮数据的频率限制在一定的频率范围内,维护一个代理池,并定时验证代理有效性。

进一步的,所述方法还包括,

采用爬虫定时地遍历至少一个平台的餐饮数据;实时监测用户输入的商家信息,并根据用户输入的商家信息获取该商家的推荐指数。

进一步的,数据库未包含该商家的餐饮数据,则爬虫立即调度去爬该商家的餐饮数据,并获取该商家的推荐指数;若爬虫后确认平台无该商家信息,则告知用户和/或通知系统管理员。

进一步的,所述方法还包括,根据商家的餐饮数据判断商家是否存在刷评论嫌疑,若存在刷评论嫌疑的商家在推荐列表中,则显示该商家存在刷评论嫌疑。

相应的,本发明还提供了一种服务器,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述项所述餐饮推荐方法。

相应的,本发明还提供了计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述餐饮推荐方法步骤。

与现有平台化式构建的餐饮推荐相比,本发明餐饮推荐方法、服务器及存储介质,本发明从多个平台获取餐饮数据,对用户进行餐饮推荐,通过数据库中的餐饮数据进行清洗操作能有效地过滤无效评论,可靠、高效地为客户提供用餐推荐,有效地节约食客的选择时间。同时,可以根据用户的筛选相关条件,如用户手动选择口味、餐饮分类、价格区间等信息,将包含餐饮口味、服务、环境、人均价格、餐饮分类、价格区间中的任意一种或者两种及其以上组合与所述综合评分结合得出推荐指数进行推荐,提升推荐的主观适应性。

附图说明

此处所说明的附图用来提供对发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本发明实施例1的一种餐饮推荐方法的流程步骤示意图;

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,本发明所指的若干是包含一个或者多个,多个为两个或两个以上。

实施例1

本发明提供了一种餐饮推荐方法,所述方法包括如下步骤,如附图1所示,采用爬虫遍历至少一个平台的餐饮数据,将爬虫获取到的餐饮数据存入数据库中;所述餐饮数据包含商家信息、评论内容、评论对应的评分、评论对应的等级或标签,所述评论对应的等级为若干类别的等级,所述评论对应的标签包含若干类别的标签;所述商家信息包括但不限于商家地址、商家电话、推荐菜、服务、环境;所述餐饮数据还包括但不限于人均价格、评论时间、餐饮分类、餐饮口味、用户信用等级;

对若干个类别的等级或标签的评论用有监督学习的方法,训练一个文本情感分类器;对餐饮数据的评论经过训练后的文本情感分类器筛选,并获得评论的句子评分;

对若干个类别的等级或标签的评论用有监督学习的方法,训练一个词语分类器;对餐饮数据的评论经过训练后的词语分类器分析某家商家的标签或分类的情感方向得出词语评分;

将评论的句子评分与对应商家对应的词语评分进行加权求和得出综合评分;

将包含餐饮口味、服务、环境、人均价格、餐饮分类、价格区间中的任意一种或者两种及其以上组合与所述综合评分结合得出推荐指数,根据推荐指数的大小确认商家是否值得推荐。

需要说明的是本发明所指的至少一个平台可以为某个平台,或者为两个或两个以上平台,所述平台包括但不限于大众点评、饿了么、美团餐饮消费平台。

需要说明的是本发明分析某家商家的标签或分类的情感方向,即为对评论内容进行文本情感分析,按照评论内容的粒度不同,评论内容情感分析大致可分为词语级、句子级、篇章级三个研究层次。在本发明方法中,优选的,采用句子级的情感分析和词语级的情感分析,具体情感包括:生气、憎恨、害怕、内疚、感兴趣、高兴、悲伤等。

进一步的,所述餐饮数据中,评论对应的标签包含若干类别的分类可以为三个等级,也可以三个以上等级如5个等级;在本发明方法是实施例以三个等级的评论分类,分别为很满意、基本满意、差评。对很满意(或好评)、基本满意(或中评)、差评的评论用有监督学习的方法,训练一个文本情感分类器;对餐饮数据的评论经过训练后的文本情感分类器筛选,并获得评论的句子评分;当分析某商家的评论时,参考好评、中评、差评、好评数量、中评数量、差评数量、好评是否带图片、中评是否带图片、差评是否带图片得出一个句子评分,通常一般带图片的评论更加有说服力。在数据库中,有些评论内容是差评,但是却在好评的那一列,故在本发明方法中,餐饮数据的评论通过一个训练好的分类器进一步筛选。标签问题上,一般带有图片的评论情感比较一致。比如说好评带有图片的评论,情感方向一般是推荐,差评同理。

进一步的,将评论的句子评分与对应商家对应的词语评分进行加权求和得出综合评分;按照某个权重来做个结合,例如:综合评分=评论的句子评分*a+对应商家对应的词语评分*b,其中,a≥0,b≥0,且a+b=1;在本发明一实施例,a=0.7,b=0.3。

在本发明方法中,为了使用户进一步了解信息,供用户进一步进行主观选择,本发明的所述方法还包括:将确认推荐的商家地址、商家电话、推荐菜进行展示。

所述方法中,步骤一还包括:对数据库中的餐饮数据进行清洗操作,过滤掉无效的评论。对数据库中的餐饮数据进行清洗操作目的包括某店的评论是否出现刷评价的嫌疑和过滤掉无效的评论,例如只回复了好吃等短文本,情感表达不足即为无效的评论。好的评论是有对菜品的评价,另外刷的评论有一个特点,评论时间相对集中,可以参考该评论是否带有图片和用户的信用等级,是否为新号,若为新号刷评论的概率较大。

在本发明方法的实施例中,优选地,所述数据库为redis数据库。所述redis数据库是一个基于内存的高性能的key-value数据库,支持多种数据类型和支持分布式,redis数据库是不仅速度快而且具有免费开放使用等特点。

所述餐饮数据包括但不限于人均价格、评分、评分等级:好评(该评论是否带有图片)、中评(该评论是否带有图片)、差评(该评论是否带有图片);评论时间,餐饮分类(火锅、烧烤等)、商家地址、餐饮口味、服务、环境、评论标签、商家电话、用户信用等级、推荐菜。

采用爬虫遍历至少一个平台的餐饮数据的频率限制在一定的频率范围内,维护一个代理池,并定时验证代理有效性。注意该爬虫要限制频率,每个平台的服务器都有自己的带宽,如果说占了他人的会有封爬虫ip或者短时间内不允许访问的风险,所以需要限制频率和注意平台的反爬虫,最好维护一个代理池,定时验证代理有效性(高匿名)。

优选地,所述方法还包括,采用爬虫定时地遍历至少一个平台的餐饮数据;例如每家店每天更新一次评论信息,需要及时更新数据库的餐饮数据。

用户也可以自行输入,进一步,实时监测用户输入的商家信息,并根据用户输入的商家信息获取该商家的推荐指数。让系统自动获取该店的推荐指数,若数据库未包含该商家的餐饮数据,则爬虫立即调度去爬该商家的餐饮数据,并获取该商家的推荐指数;若爬虫后确认平台无该商家信息,则告知用户和/或通知系统管理员。

对存在刷评论嫌疑的店,需要显示在推荐列表上,但是要告知用户存在刷评论嫌疑。述方法还包括,根据商家的餐饮数据判断商家是否存在刷评论嫌疑,若存在刷评论嫌疑的商家在推荐列表中,则显示该商家存在刷评论嫌疑。

为了使得餐饮推荐更适合用户,用户可以手动选择口味、餐饮分类、价格区间等信息,将包含餐饮口味、服务、环境、人均价格、餐饮分类、价格区间中的任意一种或者两种及其以上组合与所述综合评分结合得出推荐指数,根据推荐指数的大小确认商家是否值得推荐。

本发明方法中,有监督学习,具体为,用已知某种或某些特性的样本作为训练集,以建立一个数学模型,所述数学模型如模式识别中的判别模型,人工神经网络法中的权重模型等,再用已建立的模型来预测未知样本。

实施例2

本发明实施例中提供了一种服务器,所述服务器包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行餐饮推荐方法步骤。本实施例的所述餐饮推荐方法步骤与实施例1的相同,不再赘述。

实施例3

本发明实施例中提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现餐饮推荐方法步骤。本实施例的所述餐饮推荐方法步骤与实施例1的相同,不再赘述。

本发明提供了一种餐饮推荐方法如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得服务器(可以是个人计算机、云服务器、网络设备、或者为包含处理器的设备等)执行本发明各个实施例所述方法的全部或部分。所述计算机可读存储介质包括但不限于只读存储器(rom,readonlymemory)、随机存取存储器(ram,randomaccessmemory)、u盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。本发明实施例不限制于任何特定的硬件和软件结合。

以上仅为本发明的优选实施例,仅用以说明本发明的技术方案,但应当理解本发明并非局限于上述实施例,通过本发明的启示,本领域技术人员结合公知或现有技术、知识所进行的修改,或者对其中部分或者全部技术特征进行等同替换也应视为在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1