一种标题重建方法及装置与流程

文档序号:18475498发布日期:2019-08-20 20:59阅读:174来源:国知局
一种标题重建方法及装置与流程
本申请涉及数据处理
技术领域
,特别涉及一种标题重建方法及装置。
背景技术
:在电子商务平台中,为了提高产品的搜索召回指数和曝光机会,往往会在展示的产品标题中堆砌很多描述词,如修饰词、营销词、产品词等。而过量的描述词会导致产品标题过长且包含不同程度的冗余信息。由于用户客户端设备(手机、平板电脑)的屏幕尺寸有限,在产品搜索结果展示页中往往展示固定长度的产品标题,因此,需要对原始的过长的产品标题进行压缩。现有技术中产品标题重建方法可以包括截断处理,即直接从原始标题中截取部分描述词作为展示的标题。比如原始的产品标题为“xx牌煎锅少油烟不粘锅煎盘牛排锅平底锅燃气专用”,受限于客户端设备屏幕的显示长度,利用现有技术中截断处理的方式,可以从原始标题中截取出展示标题“xx牌煎锅少油烟不粘锅煎盘”。可以发现,上述展示标题中缺少原始标题中的重要信息“燃气专用”,而展示标题中的“煎锅”、“不粘锅”和“煎盘”都是语义相近的词,造成产品标题的信息冗余。综上所述,现有技术中的产品标题重建方法往往造成产品部分关键信息缺失的问题,用户只有点击进入产品详情页才能获取产品全部信息,增加了用户获取信息的难度。另外,现有的标题重建方法往往包括大量语义相同词的堆砌,浪费有限的展示空间。因此,现有技术中亟需一种基于用户个性化需求的产品标题重建方法。技术实现要素:本申请实施例的目的在于提供一种标题重建方法及装置,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。本申请实施例提供的标题重建方法及装置具体是这样实现的:一种标题重建方法,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。一种标题重建装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。一种产品标题生成方法,所述方法包括:从产品的描述信息中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择标题描述词;利用所述标题描述词生成所述产品的标题。本申请提供的标题重建方法及装置,可以根据用户对产品标题中的描述词的权重值对较长的产品标题进行压缩处理,其中所述权重值根据用户的历史行为数据计算得到,并且可以用于表征用户对所述描述词的兴趣偏好与实际需求。利用本申请提供的实施例方法,可以在所述重建标题中保留符合用户偏好与需求的描述词,这样可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是利用现有技术方法对产品标题进行重建后的界面图;图2是利用本申请技术方案对产品标题进行重建后的界面图;图3是本申请提供的标题重建方法的一种实施例的方法流程图;图4是本申请提供的计算描述词权重值方法的一种实施例的方法流程图。具体实施方式为了使本
技术领域
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。为了方便本领域技术人员理解本申请实施例提供的技术方案,下面先对技术方案实现的技术环境进行说明。由上述可知,现有技术中利用简单的截断处理的方式对产品标题进行重建,不仅会造成部分关键产品信息的丢失,还会使得重建后的产品标题中包含堆砌的具有相同语义的描述词,造成重建后产品标题的信息冗余。可以发现,在实际的产品标题中,包含的信息比较多,其中一些信息与用户的偏好与需求等相关。例如用户小明通过搜索词“夏凉被”搜索到大量的夏凉被产品信息,当然,夏凉被的相关元素有很多,诸如“冰丝”、“卡通”、“套装”、“蚕丝”、“透气”等多种信息元素。假设小明比较喜欢卡通元素,并且在小明的历史搜索行为中也有所体现,那么在对夏凉被产品标题进行重建的过程中,如果能在产品标题中保留“卡通”或者类似的描述词时,不仅可以提高小明访问该产品的概率,还可以帮助用户小明快速地做出决策,确定最终所偏好的产品。但是在现有技术的标题重建过程中,往往忽略了用户的历史行为数据的作用,导致生成的重建标题一般不能体现用户的偏好和需求,使得重建标题不具有对用户的引导作用。基于类似于上文描述的技术需求,本申请提供的标题重建方法可以在进行标题重建的过程中,基于用户的历史行为数据,保留产品标题中符合用户偏好与需求的描述词,这样,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。下面通过一个具体的应用场景说明本实施例方法的具体实施方式。用户小m在某购物平台上挑选商品,在输入搜索词“连衣裙”之后,该购物平台上根据搜索词“连衣裙”推荐多个连衣裙的产品信息。图1所示的界面100中展示的是其中一件连衣裙的产品信息,如图1所示,由于客户端设备的尺寸限制,在图1所述的标题展示位101上只能展示14个字符。已知该连衣裙的原始完整标题为“y牌2017新款春装女装韩版修身显瘦真丝连衣裙a字裙有大码”,共27个字符。图1中界面100的标题展示位101中展示的重建标题根据现有技术中简单的截取方式生成,如直接从原始标题中截取前14个字符。可以发现,利用现有技术的截取方式得到的重建标题中缺少一些必要信息(如“连衣裙”)以及一些重要信息(如材质描述词“真丝”),而多了一些价值较低的营销描述词(如“新款”)。由此可见,现有技术中标题重建的方式往往造成产品部分关键信息缺失以及提供冗余信息的问题,浪费有限的展示空间,增加了用户获取有用信息的难度。图2展示了利用本申请技术方案对原始标题进行重建得到的标题,如界面200的标题展示位101所示的“y牌韩版修身真丝连衣裙女装”。下面具体介绍利用本申请技术方案对原始标题“y牌2017新款春装女装韩版修身显瘦真丝连衣裙a字裙有大码”进行重建的过程。首先,对原始标题进行分词处理,得到“y牌”、“2017”、“新款”、“春装”、“女装”、“韩版”、“修身”、“显瘦”、“真丝”、“连衣裙”、“a字裙”、“有大码”等12个描述词。然后,如表2所示,获取各个描述词的用户权重值。本场景中,可以根据用户小m的历史行为数据计算得到各个描述词的权重值,描述词的权重值越大,表示用户小m与该描述词的关联度越大,具体可以表现为用户小m的点击记录、收藏记录、交易记录、搜索记录经常涉及到该描述词。根据表1所示的描述词及其权重值的关系表,用户小m的历史用户数据中涉及到描述词“连衣裙”、“真丝”的概率较大,因此,描述词“连衣裙”、“真丝”的权重值也较大。在获取到各个描述词的权重值之后,可以从描述词中去除语义重复的描述词。在判断两个描述词是否语义重复时,可以根据两个描述词的相似度确定是否语义重复,例如当相似度大于预设阈值时,可以确定两个描述词属于同一语义簇,即语义重复。本场景中,通过计算或者查询已有的语义簇数据,确定上述描述词中,“修身”和“显瘦”、“连衣裙”和“a字裙”属于同一语义簇,则可以只保留其中一个,在一种实施例中,可以保留权重值较大的描述词,经比较,可以保留“修身”、“连衣裙”。这样,原始的描述词剩余“y牌”、“2017”、“新款”、“春装”、“女装”、“韩版”、“修身”、“真丝”、“连衣裙”、“有大码”等10个描述词。在确定冗余描述词之后,可以提取剩余描述词中的核心词,所述核心词包括如果在重建标题中不透出将导致语义表达不完整的描述词。在本场景中,可以确定其中的核心词包括品牌核心词“y牌”、材质核心词“真丝”、产品核心词“连衣裙”。在确定核心词之后,可以将核心词的权重值置1,并对其他的描述词进行归一化处理,得到如表2所示的处理之后的描述词及其权重值的关系列表。可以发现,核心词的总字数为7字,还剩余7字的空闲展示位。本场景中,可以将剩余的描述词中权重值最大的描述词添加至空闲展示位,使得重建标题在满足字数要求的前提下,所有描述词的权重值和最大。可以利用背包算法等方式计算得到,在剩余的描述词中,可以将“女装”、“韩版”、“修身”等描述词添加至空闲展示位中。这样,可以得到最终确定添加至标题展示位的描述词包括“y牌”、“真丝”、“连衣裙”、“女装”、“韩版”、“修身”。利用预设语言模型对上述描述词进行词序调整,生成重建标题“y牌韩版修身真丝连衣裙女装”。表1描述词及其权重值关系表y牌2017新款秋装女装韩版修身显瘦真丝连衣裙a字裙有大码0.020.010.010.010.030.050.150.050.200.250.050.02表2权重值归一化处理后描述词及其权重值关系表y牌2017新款秋装女装韩版修身真丝连衣裙有大码10.030.030.030.110.180.54110.07下面结合附图对本申请所述的标题重建方法进行详细的说明。图3是本申请提供的标题重建方法的一种实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际中的标题重建过程中或者装置执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。图3是本申请提供的标题重建方法的一种实施例的方法流程图,如图3所述,所述方法可以包括以下步骤:s301:获取产品标题,并从所述产品标题中提取至少一个描述词。本实施例中,所述产品标题可以包括根据用户的搜索词召回的产品的原始标题,所述产品例如可以包括各种商品(如实体商品、虚拟商品等)、资讯(如新闻)、电影等等。在产品的原始标题中,往往可以包括多种类型的描述词,诸如修饰词、营销词、产品词、数量词等,产品词又包括品牌词、材料词、功能词等。本实施例中,在获取到产品标题之后,可以从所述产品标题中提取至少一个描述词。具体地,可以首先对所述产品标题进行分词处理,即将所述产品标题分解成至少一个独立的描述词。在一个实施例中,可以利用基于字符串匹配的分词方法对所述产品标题进行分词处理,在该方法中,可以将所述产品标题中的字符串与现有的预设字符串库进行逐个匹配,若从确定所述预设字符串库中搜索到所述产品标题中的字符串,则可以将所述字符串从所述产品标题中分出来。当然,在其他实施例中,还可以统计模型的序列标注切分等方法对所述产品标题进行分词,对此,本申请在此不做限制。然后,可以从对所述产品标题进行分词处理后的描述词中提取至少一个描述词。具体地,例如可以从所述产品标题中去除一些停用词,所述停用词可以包括不具有产品信息的描述词等,诸如“了”、“的”、“有”等描述词。如对于产品标题“包邮樱花款珍珠汽车钥匙扣包挂创意手工挂件钥匙链牛皮礼物有赠品”,对该产品标题进行分词处理,并去除其中的停用词“有”之后,提取得到“包邮”、“樱花款”、“珍珠”、“汽车”、“钥匙扣”、“包挂”、“创意”、“手工”、“挂件”、“钥匙链”、“牛皮”、“礼物”、“赠品”等独立的描述词。其中,“樱花款”、“珍珠”、“钥匙扣”、“包挂”、“手工”、“挂件”、“钥匙链”、“牛皮”、“礼物”为产品词,“包邮”、“赠品”为营销词、“创意”为修饰词。本实施例中,在从所述产品标题中提取出至少一个描述词之后,还可以对提取得到的描述词进行标注,如标注分词的属性。s303:分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到。本实施例中,可以获取所述至少一个描述词的用户权重值,其中,所述权重值可以根据所述用户的历史行为数据计算得到。本实施例中,可以确定用户与每个描述词之间具有权重关系,若某描述词的用户权重值越大,则可以确定用户在其历史行为数据到涉及到该描述词的频率越大。例如,若用户在其历史行为数据经常涉及到描述词“猫咪”,典型的,如用户的搜索词中经常出现描述词“猫咪”,或者用户收藏的产品标题中经常包括描述词“猫咪”等等,则可以确定该用户对描述词“猫咪”的用户权重值越大。本实施例中,可以预先建立用户对至少一个预设描述词的权重值,这样,后续在需要获取所述权重值时,可以直接查询用户对所述至少一个预设描述词的权重值信息,而不必实时计算得到。如图4所示,在本申请的一个实施例中,根据用户的历史行为数据计算得到用户对描述词的权重值可以包括:s401:获取多个用户的历史行为数据;s403:从所述历史行为数据中统计出所述多个用户分别对多个预设描述词的访问频率;s405:根据所述多个用户分别对所述多个预设描述词的访问频率计算得到所述多个用户分别对所述多个描述词的权重值。本实施例中,可以获取到多个用户的历史行为数据,所述多个用户可以包括某平台上的全部或者部分注册用户,所述注册用户在所述平台上具有唯一的用户标识,如用户id等等。通过所述用户标识可以存储各个用户在所述平台上的行为数据,如用户的点击记录、收藏记录、交易记录、搜索记录等访问数据记录。在获取所述历史行为数据的过程中,可以从多个数据源中收集所述用户标识下的所有访问数据记录,其中,所述数据源可以包括平台上的用户数据、其他平台上的用户数据等。一般地,用户在平台上涉及到的描述词是数量有限的,如用户b在平台上大部分只涉及到“连衣裙”、“t恤女”、“衬衫女”、“针织衫女”等女装一类的产品描述词。因此,可以统计出用户分别对各个描述词的访问频率。如在近一年的时间内,用户b对“连衣裙”的访问频率为12000次,其中,所述访问频率可以包括搜索、收藏、点击、交易等行为的次数。而在各个平台上,可以设置多个预设描述词,所述预设描述词例如可以包括所述平台上的全部或者部分的产品标题中可能出现的描述词。那么,根据上述统计得到的用户对历史行为数据中出现的描述词的访问频率,则可以对应地统计得到用户对所述预设描述词的访问频率。所述访问频率可以包括用户对所述预设描述词的访问次数,也可以包括所述预设描述词的访问次数占总预设描述词访问次数的比例,还可以为对所述预设描述词的访问次数的对数值,对此,本申请在此不做限制。可以发现,所述预设描述词的范围远远大于各个用户在历史行为数据中涉及到的描述词的范围,那么,在统计用户对所述预设描述词的访问频率时,若用户访问过所述预设描述词,则可以对应地设置其访问频率,若用户未访问过所述预设描述词,则可以设置其访问频率为零。这样,可以生成基于整个平台上的多个用户分别对多个预设描述词访问频率的数据关系。本实施例中,可以根据所述多个用户分别对所述多个预设描述词的访问频率计算得到所述多个用户分别对所述多个描述词的权重值。在一个实施例中,可以将所述访问频率作为所述用户对所述预设描述词的权重值。在另一个实施例中,可以对所述访问频率数据进行压缩处理,生成数据量较小的权重值数据。例如,可以利用矩阵分解算法(svd)计算所述多个用户分别对所述多个描述词的权重值。所述根据所述多个用户对所述多个预设描述词的访问频率计算得到所述用户分别对所述多个描述词的权重值可以包括:ss1:建立用户与预设描述词的访问频率之间的关系矩阵;ss3:利用矩阵分解算法(svd)对所述关系矩阵进行处理,生成用户与预设描述词的权重值之间的关系矩阵。本实施例中,可以建立用户与预设描述词的访问频率之间的关系矩阵。例如,所述关系矩阵的每一行可以表示各个用户对某个描述词的访问频率,所述关系矩阵的每一列可以表示某个用户对各个描述词的访问频率。具体地,假设建立的用户与预设描述词的访问频率之间的关系矩阵为a,所述关系矩阵的大小为m×n,则对所述关系矩阵a进行矩阵分解(svd)可以得到如下表达式:其中,u为左奇异矩阵,v为右奇异矩阵,矩阵∑除了对角线上具有数值之外,其他位置处均为0,矩阵∑对角线上的数值为所述关系矩阵a的奇异值,所述奇异值可以用于表征关系矩阵a的特征,且每个奇异值对应于左奇异矩阵u中的一列以及右奇异矩阵v中的一行。但是,在很多情况下,前10%甚至1%的奇异值的和可以占全部奇异值之和的99%甚至99%以上。因此,可以用数值排序位于前r位(r的数值远小于m,n)的奇异值近似描述所述关系矩阵a,并保留左奇异矩阵u中的对应列以及右奇异矩阵v中的对应行,生成如下表达式:通过矩阵分解算法(svd)对所述关系矩阵a的压缩处理,可以获取得到数据量较小的所述关系矩阵a的近似矩阵。需要说明的是,在其他实施例中,还可以利用因子分解机(factorizationmachine)算法、深度匹配(deepmatching)算法对所述关系矩阵a进行处理,对此,本申请在此不做限制。在本实施例中,利用svd等算法对所述关系矩阵a进行处理之后,可以将数据量较大的用户利用描述词的访问频率数据压缩成数据量较小的数据,并可以将压缩后的数据作为用户对所述描述词的权重值。例如,在压缩前,用户小明对手机的访问频率为12000,经过压缩之后,可以得到权重值为0.68,这样,不仅可以保留用户与描述词之间的相关性,还可以大大减少访问频率等数据的存储量。另一方面,将所述左奇异向量和所述右奇异向量都取二维矩阵之后,可以将所述多个用户与所述多个描述词投射至同一个平面上。在投射的平面上,可以发现一些描述词的位置关系比较紧密,则可以认为这些描述词属于同一个语义类,如“高脚杯”、“葡萄酒杯”、“红酒杯”属于同一个语义簇,则在投射的平面上,描述词“高脚杯”、“葡萄酒杯”、“红酒杯”的位置比较紧密。在确定多个用户对所述预设描述词的权重值之后,可以利用关系列表的形式存储所述权重值,例如,所述关系列表的行表示某个用户对所有预设描述词的权重值,所述关系列表的列表示所有用户分别对某个预设描述词的权重值。当然,所述权重值还可以利用其它方式存储,对此,本申请在此不做限制。此后,在分解得到产品标题的描述词之后,可以利用所述关系列表查询某用户对某描述词的权重值。当然,有时候用户对一些描述词从未访问过,但是对与这些描述词的相似描述词访问过。例如,在用户的历史行为数据中,可以发现用户访问过描述词“高脚杯”,但从未访问过描述词“红酒杯”,但是可以确定用户对“高脚杯”与对“红酒杯”的偏好程度比较相似。因此,若在对产品标题分解之后得到描述词“红酒杯”,则可以根据描述词“高脚杯”的权重值计算描述词“红酒杯”的权重值。本实施例中,可以计算预设描述词之间的相似度,将相似度较高的描述词归为同一语义簇,例如经过计算,可以将“高脚杯”、“葡萄酒杯”、“红酒杯”归为同一语义簇。在一个实施例中,在计算所述预设描述词之间的相似度的过程中,可以计算所述预设描述词的词向量,即可以将每个预设描述词转化成相同位数的二进制字符串,然后,可以通过计算词向量之间的距离确定两个描述词之间的相似度(词向量之间的距离越小,相似度越大),若所述相似度大于预设阈值,则可以确定两个或者多个描述词属于同一语义簇。当然,在其他实施例中,还可以利用基于共现矩阵的glove模型或者word2vec模型获取所述预设描述词中属于同一个语义簇的词向量,对此,本申请在此不做限制。在确定所述预设描述词中的同一个语义簇之后,可以对权重值进行平滑处理,例如,用户a对描述词“高脚杯”、“葡萄酒杯”、“红酒杯”的权重值分别为(0.009,null,null),由于描述词“高脚杯”、“葡萄酒杯”、“红酒杯”属于同一语义簇,那么经过平滑处理后,可以将用户a对描述词“高脚杯”、“葡萄酒杯”、“红酒杯”的权重值平滑为(0.009,0.008,0.008)。在其他实施例中,对预设描述词中属于同一个语义簇的描述词进行平滑处理的步骤可以在统计得到所述多个用户分别对多个预设描述词的访问频率之后进行,即直接对所述访问频率进行平滑处理。s305:根据所述权重值从所述至少一个描述词中选择重建描述词。本实施例中,可以根据所述权重值从所述至少一个描述词中选择重建描述词。在本申请的一个实施例中,在所述根据所述权重值从所述至少一个描述词中选择重建描述词之前,可以对所述至少一个描述词进行去重处理,即从所述至少一个描述词中去除语义重复的描述词。例如,产品标题中既包括描述词“高脚杯”,也包括描述词“葡萄酒杯”、“红酒杯”,由于描述词“高脚杯”、“葡萄酒杯”、“红酒杯”属于同一语义簇,则可以只保留上述描述词中的一个描述词。本实施例中,可以保留属于同一语义簇的描述词中权重值最大的描述词,由于“高脚杯”、“葡萄酒杯”、“红酒杯”的权重值为(0.009,0.008,0.008),则可以保留其中的描述词“高脚杯”。本实施例中,在对所述至少一个描述词进行去重之后,可以提取所述至少一个描述词中的核心词,所述核心词包括如果在重建标题中不透出将导致语义表达不完整的描述词,核心词一般可以包括描述词中的产品词。例如在产品标题“包邮樱花款珍珠汽车钥匙扣包挂创意手工挂件钥匙链牛皮礼物有赠品”中,提取到的核心词为“樱花款”、“钥匙扣”、“牛皮”。由于重建标题往往具有字数限制,例如由于客户端屏幕尺寸的限制,重建标题只能展示14个字的描述词。当然,在其他实施例中,所述重建标题可以对字数没有限制,但限制展示预设数量的描述词。核心词作为必要展示的描述词,则剩余的展示位可以用于展示除所述核心词以外的描述词中选取权重值最大的若干个描述词,或者权重值大于预设权重阈值的描述词,并将选取的所述描述词以及所述核心词作为重建描述词。因此,可以对除所述核心词以外的描述词按照权重值大小进行排序,将剩余的展示位填充上除所述核心词以外的描述词中权重值最大的若干个描述词。当然,在其他实施例中,若所述重建标题有字数要求,但是在剩余的展示位填充上除所述核心词以外的描述词中权重值最大的若干个描述词之后,所述重建标题不能满足所述字数要求,如不足所述字数要求,或者超过所述字数要求。因此,可以利用背包算法或者整数线性规划等方式使得所述重建标题在满足字数要求的前提下,各个重建描述词的权重值的和最大。s307:利用所述重建描述词生成所述产品标题的重建标题。本实施例中,在确定所述重建描述词之后,可以利用语言模型将所述重建描述词调整成所述产品标题的重建标题。由于获取得到的重建描述词之间的词序往往前后比较混乱,因此,可以利用语言模型对所述重建描述词进行词序调整,生成语序恰当的重建标题。在本申请的一个实施例中,在生成所述重建标题之后,可以在客户端中展示所述重建标题。这样,用户可以通过客户端设备看到展示的产品的重建标题。如果所述产品标题包括根据所述用户的搜索词搜索得到的产品标题,即所述用户处于实时搜索的过程,那么在此过程中,用户可能由于对当前展示的产品不满意或者改变挑选策略而调整搜索词,例如,用户在搜索“高脚杯”的过程中,发现水晶材质的高脚杯比玻璃材质的更精致,因此可以将搜索词调整为“高脚杯水晶”,在进一步的搜索过程中,用户觉得无铅的水晶高脚杯更有益于健康,因此,可以进一步地将搜索词调整为“高脚杯水晶无铅”。而此时,根据不同的搜索词,平台向用户推荐的产品也随之变化,但是推荐的产品往往与调整后的搜索词相匹配,例如产品标题中可以包含所有的搜索词。另外,用户在搜索过程中,还有可能减少原有的多个搜索词。对此,在本申请的一个实施例中,在所述展示所述产品标题的重建标题之后,所述方法还可以包括:获取对所述搜索词进行调整操作之后生成的更新产品标题的描述词,所述调整操作包括增加搜索词和/或减少搜索词;若所述更新产品标题的描述词中包括增加的搜索词,则增加所述描述词的权重值;若描述词中包括减少的搜索词,则降低所述描述词的权重值;根据调整权重值后的描述词,对所述更新产品标题进行标题重建。本实施例中,可以获取用户对所述搜索词的调整操作,所述调整操作可以包括增加搜索词和/或减少搜索词。然后,可以根据对所述搜索词的调整,获取对所述搜索词进行调整操作之后生成的更新产品标题的描述词。若所述更新产品标题的描述词中包括增加的搜索词,则增加所述描述词的权重值;若描述词中包括减少的搜索词,则降低所述描述词的权重值。例如,在上述示例中,当搜索词由“高脚杯”调整为“高脚杯水晶”之后,如果更新后的产品标题中出现描述词“水晶”,则可以增加描述词“水晶”的权重值。具体地,在一个实施例中,可以计算产品标题中其他描述词分别与描述词“水晶”之间的相似度,若相似度越高,则可以确定该描述词与“水晶”关联度越大,因此,也可以同时增加与“水晶”相似度较大的描述词的权重值。当然,还可以利用相同的方式降低减少的搜索词的权重值。最后,可以跟据调整后的描述词的权重值,利用上述实施例方法对更新后的产品标题进行重建。本实施例中,可以根据用实时会话中的一系列搜索词的改写行为,刻画用户的兴趣偏好和实际需求,为不同用户生成定制化的产品标题,以提升用户体验和用户搜索到偏好产品的效率。本申请提供的标题重建方法,可以根据用户对产品标题中的描述词的权重值对较长的产品标题进行压缩处理,其中所述权重值根据用户的历史行为数据计算得到,并且可以用于表征用户对所述描述词的兴趣偏好与实际需求。利用本申请提供的实施例方法,可以在所述重建标题中保留符合用户偏好与需求的描述词,这样可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。当然,在本申请的技术方案中,不限于从产品的标题中提取描述词。在其他实施例中,还可以从产品的描述信息中提取描述词。所述产品描述信息可以包括产品标题、产品简介、产品详情介绍等等。在具体处理过程中,产品简介和产品详情介绍中往往包含比产品标题更丰富的信息,因此,从更多的产品描述信息中提取到的描述词也更加丰富,最终经过步骤s303-s306的处理,得到更加准确的重建产品标题。在一个示例中,某装饰画的产品描述信息为“品牌:xx映画、幅数:三联以上、画芯材质:油画布、装裱方式:有框、外框材质:金属、颜色分类:a款-连香树叶b款-虎皮兰c款-虎皮兰d款-镜面草e款-龟背叶f款-梧桐叶g款-金星蕨h款-芭蕉叶i款-银边圆叶南洋参j款-云杉叶、风格:简约现代、工艺:喷绘、组合形式:独立单幅价格、图片形式:平面、图案:植物花卉、尺寸:40*60cm50*70cm60*90cm、外框类型:浅木色铝合金框黑色铝合金框、货号:0739”,并根据对用户历史数据的统计,设置所述装饰画的产品描述信息所对应的历史重建标题为“绿植北欧风格装饰画”。此后,可以利用与上述实施例相同的方式对所述产品描述信息以及所述历史重建标题进行深度学习。需要说明的是,在从所述产品的描述信息中提取描述词的过程中,可以去除产品描述信息中的冗余信息,并从所述产品描述信息中提取具有实际意义的关键词,如品牌词、材质描述词、核心词等等。例如,对于上述装饰画的产品描述信息,可以提取的描述词可以包括“三联”、“油画布”、“有框”、“金属外框”、“喷绘”、“平面”、“植物花卉”、“铝合金”等等。虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1