一种汽车后服务推荐方法和系统的制作方法_2

文档序号:9631944阅读:来源:国知局
据采集模块用于通过网络爬虫技术抓取汽车后服务相关讨论信息;
[0026] 所述模式序列生成模块连接至所述数据采集模块以及所述汽车基础数据知识库 构建模块,用于根据所述汽车基础数据知识库构建模块所构建的汽车基础数据知识库,自 动生成抽取规则,以利用所述抽取规则从所述汽车后服务相关讨论信息中进行特征提取, 从而产生多条汽车后服务讨论数据,并对每条汽车后服务讨论数据进行规范化,并将每条 汽车后服务讨论数据都形式化为对应的模式序列,多个模式序列形成模式序列集合;
[0027] 所述树状决策器构建模块连接至所述模式序列生成模块,用于根据所述模式序列 集合,采用ID3决策树分类器技术构建树状决策器;
[0028] 所述用户画像构建模块连接至所述模式序列生成模块,用于根据所述多条汽车后 服务讨论数据,采用统计信息、假设验证和显著性分析得到用户汽车后服务消费的多种分 布模式,从所述多种分布模式中选取出现概率大于一阈值的所有分布模式,构成多个对应 的用户喜好矢量,每个用户喜好矢量及其用户基本信息构成一个用户画像;
[0029] 所述后服务推荐模块连接至所述用户画像构建模块以及所述树状决策器构建模 块,用于根据预先采集的预定用户车辆特征集合以及对应的所述用户画像输入到所述树状 决策器中,根据各条路径的匹配程度得到ΤορΝ条推荐路径,产生N种汽车后服务推荐方案 给具有所述预定用户车辆特征集合的用户;
[0030] 所述实体店推荐模块连接至所述后服务推荐模块和所述模式序列生成模块,用 于:针对Ν种汽车后服务推荐方案中的每项汽车后服务,根据所述模式序列从汽车后服务 实体店数据库中推荐ΤορΜ个实体店给用户;其中,Μ和Ν为自然数。
[0031] 在更优选的方案中,所述推荐系统还包括自学习调整模块,连接至所述模式序列 生成模块,用于将每次用户汽车后服务消费信息都形式化为对应的模式序列加入到所述模 式序列集合中,并利用adaboost方法来更新所述模式序列集合中每个模式序列上每个特 征的权重;
[0032] 还连接至所述用户画像构建模块以及所述实体店推荐模块,用于将每次用户汽车 后服务消费信息都加入到构建所述用户画像以及所述汽车后服务实体店数据库所需的基 础输入数据中。
[0033] 在更优选的方案中,所述推荐系统还包括用户喜好探测模块,连接至所述模式序 列生成模块以及所述用户画像构建模块,用于根据用户的浏览足迹、咨询记录、问卷调查记 录以及主动推荐服务来收集和分析用户喜好,以为所述模式序列集合和所述用户画像的构 建新增基础输入数据。
【附图说明】
[0034] 图1是本发明优选实施例提供的一种汽车后服务推荐系统的框图。
【具体实施方式】
[0035] 下面结合附图和优选的实施方式对本发明作进一步说明。
[0036] 本发明的【具体实施方式】提供一种汽车后服务推荐系统,用于在合适的时机向用户 推荐合适的汽车后服务,所述推荐系统包括数据采集模块、汽车基础数据知识库构建模块、 模式序列生成模块、树状决策器构建模块、用户画像构建模块、后服务推荐模块以及实体店 推荐模块。
[0037] 所述数据采集模块用于通过网络爬虫技术抓取汽车后服务相关讨论信息。例如, 从互联网上的汽车后服务相关论坛、博客、问答系统、社交网络等抓取所述汽车后服务相关 讨论信息,可以采用NoSQL(非关系型的数据库)存储方式进行存储,方便采用分布式环境 下的大数据挖掘。所述汽车后服务相关讨论信息包括很多条,例如,从大众点评网抓取的 汽车后服务相关讨论信息有十万条,每条至少包括后服务类型、用户基本信息、消费的实体 店、用户汽车基本信息、消费价格、服务评价等。
[0038] 参考图1,所述模式序列生成模块连接至所述数据采集模块以及所述汽车基础数 据知识库构建模块,用于根据所述汽车基础数据知识库构建模块所构建的汽车基础数据知 识库,自动生成抽取规则,并利用所述抽取规则从所述汽车后服务相关讨论信息中进行特 征提取,从而产生多条汽车后服务讨论数据,并对每条汽车后服务讨论数据进行规范化,并 将每条汽车后服务讨论数据都形式化为对应的模式序列,多个模式序列形成模式序列集 合。
[0039] 所述汽车基础数据知识库构建模块根据汽车服务百科信息和专家人工构建的汽 车后服务相关的基础专业数据来构建所述汽车基础数据知识库。所述汽车基础数据知识库 包括具体车型相关的后服务内容和价格,可以覆盖国产和进口的多家品牌及其多种车型, 覆盖的配件多于K万个品种,即至少有K多万条相关数据。每款车型的零部件价格、替代配 件、工时费价格、保养规则等都入库。汽车基础数据知识库的节点之间涵盖了专业领域里的 逻辑关系,包括层次类别关系和实例归类信息。汽车基础数据知识库与后服务推荐的细粒 度紧密相关,细粒度推荐的结果就是知识库最下一层的本体知识,即具体的汽车后服务。
[0040] 优选地,在进行所述特征提取之前,先对所述汽车后服务相关讨论信息进行如下 过滤处理,以得到较为干净的数据之后再进行所述特征提取。所述过滤处理例如可以包括 如下过程:先去停用词、初步去噪音;再利用2-10阶语言模型进一步去除噪音,其中语言模 型的训练数据来自所述汽车基础数据知识库;接着再采用LDA分类器将非关于汽车的数据 进一步过滤掉。
[0041] 在一种具体的实施例中,所述特征提取具体包括:提取关键词以及关键词对应的 值;根据情感词词典抽取情感词。其中,关键词取自所述汽车基础数据知识库的每个节点和 实例数据,例如包括汽车后服务项目、车型参数、车况参数、实体店参数等。
[0042] 在具体的实施方式中,对每条汽车后服务讨论数据进行规范化具体包括:将情感 词按照情感词词典定义的极性(即正负性)和强度转化为-10~10之间的值;将关键词转 化为所述汽车基础数据知识库中的对应名称,将关键词对应的值转化为测度值。例如:信用 评分规范化为1-10之间的数字。
[0043] 将每条汽车后服务讨论数据都形式化为对应的模式序列具体采用隐马尔可夫模 型方法以及循环神经网络方法。模式序列可以采用(X,Y) - (S) - (Z)形式进行表示,缺 省项用默认项替代,其中X代表用户车辆特征集合,Y代表用户喜好矢量,S表示后服务方 案,Z表示实体店方案,模式序列(X,Y) - (S) - (Z)表征了具有某一用户车辆特征集合且 符合用户喜好矢量Υ的用户所采用的后服务方案为S,实体店为Ζ。每条数据所形成的模式 序列共同构成模式序列集合。
[0044] 参考图1,所述树状决策器构建模块连接至所述模式序列生成模块,用于根据所
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1