文案生成方法、文案优化方法、模型生成方法及计算设备与流程

文档序号:33713099发布日期:2023-04-01 01:06阅读:128来源:国知局
文案生成方法、文案优化方法、模型生成方法及计算设备与流程

1.本技术实施例涉及人工智能技术领域,尤其涉及一种文案生成方法、文案优化方法、模型生成方法及计算设备。


背景技术:

2.随着互联网技术的发展,使得人们可以采用线上形式使用资源来换取对象。在提供对象交换的一些线上系统中,为了方便用户了解对象进而进行对象交换,系统往往针对每个对象会提供对象描述信息,以详细介绍该对象的相关信息等,而实际应用中,为了更好地推广对象以提高对象交换率等,往往需要一些对象推广文案以在对象搜索结果页面、对象推荐页面等中进行显示,以通过对象推广文案实现对对象进行推广的目的。
3.由上文描述可知,如何生成优质的对象推广文案,成为提高对象推广效果的主要需要解决的技术问题。


技术实现要素:

4.本技术实施例提供一种文案生成方法、文案优化方法、模型生成方法及计算设备,用以解决现有技术中对象推广文案质量较差的问题。
5.第一方面,本技术实施例提供了一种文案生成方法,包括:
6.从目标对象的相关信息中,提取至少一个文本元素;
7.将所述至少一个文本元素组合生成待处理文本;
8.基于所述待处理文本,利用文案生成模型,生成目标对象推广文案;
9.其中,所述文案生成模型利用对象推广样本文案以及所述对象推广样本文案的乱序样本文本训练获得;所述乱序样本文本通过对所述对象推广样本文案切分获得的多个文本元素进行随机排序获得。
10.第二方面,本技术实施例提供了一种模型生成方法,包括:
11.获取对象推广样本文案;
12.将所述对象推广样本文案进行切分,获得多个文本元素;
13.对所述多个文本元素进行随机排序,生成乱序样本文本;
14.利用所述乱序样本文本以及所述对象推广样本文案,训练文案生成模型。
15.第三方面,本技术实施例提供了一种文案优化方法,包括:
16.从目标对象的原始对象推广文案中,提取至少一个文本元素;
17.将所述至少一个文本元素组合生成待处理文本;
18.基于所述待处理文本,利用文案生成模型,生成目标对象推广文案;
19.利用所述目标对象推广文案更新所述原始对象推广文案;
20.其中,所述文案生成模型利用对象推广样本文案以及所述对象推广样本文案的乱序样本文本训练获得;所述乱序样本文本通过对所述对象推广样本文案切分获得的多个文本元素进行随机排序获得。
21.第四方面,本技术实施例提供了一种文本处理方法,包括:
22.获取待处理的第一类文本;
23.基于所述第一类文本,利用文本处理模型生成第二类文本;
24.其中,所述文本处理模型利用第二类样本文本以及所述第二类样本文本转换生成的第一类样本文本训练获得;其中,所述第一类样本文本通过对所述第二类样本文本切换获得的多个文本元素进行随机排序而生成。
25.第五方面,本技术实施例提供了一种模型生成方法,包括:
26.获取第二类样本文本;
27.将所述第二类样本文本进行切换,获得多个文本元素;
28.对所述多个文本元素进行随机排序,生成第一类样本文本;
29.利用所述第一类样本文本以及所述第二类样本文本,训练文本处理模型。
30.第六方面,本技术实施例提供了一种计算设备,包括处理组件以及存储组件;所述存储组件存储一个或多个计算机指令;所述一个或多个计算机指令用于被所述处理组件调用并执行,以实现如上述第一方面所述的文案生成方法或者如上述第二方面所述的模型生成方法或者如上述第三方面所述的文本优化方法或者如上述第五方面所述的文本处理方法或者如上述第六方面所述的模型生成方法。
31.本技术实施例利用文案生成模型结合从相关信息中提取的文本元素组合而成的待处理文本,即可以生成优质的对象推广文案,且文案生成模型基于对象推广样本文案以及对对象推广样本文案进行随机排序生成的乱序样本文本训练获得,无需进行人工标注,既降低了训练成本,且可以不限制待处理文本的组合方式,既可以保证生成的文案质量,且保证了对象推广文案中最大保留了所提取的文本元素,实现了对对象的有效表达,进一步保证了对象推广文案的质量。
32.本技术的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
33.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
34.图1示出了本技术提供的一种文案生成系统一个实施例的结构示意图;
35.图2示出了本技术提供的一种文案生成方法一个实施例的流程图;
36.图3示出了本技术提供的一种模型生成方法又一个实施例的流程图;
37.图4示出了本技术提供的一种显示方法一个实施例的流程图;
38.图5a示出了对象搜索场景的场景交互示意图;
39.图5b示出了基于命中的多个对象的对象提示信息生成的搜索结果页面的显示示意图;
40.图6示出了本技术提供的一种模型生成方法一个实施例的流程图;
41.图7示出了本技术提供的一种文本处理方法一个实施例的流程图;
42.图8示出了本技术提供的一种文本优化方法一个实施例的流程图;
43.图9示出了本技术提供的一种文案生成装置一个实施例的结构示意图;
44.图10示出了本技术提供的一种模型生成装置一个实施例的结构示意图;
45.图11示出了本技术提供的一种显示装置一个实施例的结构示意图;
46.图12示出了本技术提供的一种模型生成装置一个实施例的结构示意图;
47.图13示出了本技术提供的一种文本处理装置一个实施例的结构示意图;
48.图14示出了本技术提供的一种计算设备一个实施例的结构示意图。
具体实施方式
49.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
50.在本技术的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
51.本技术实施例的技术方案可以应用于对象交换处理的应用场景中,比如目前的电子商务场景,用户可以使用货币购买有形物品,还可以购买如酒店住宿等无形服务,本文中所描述的对象也即可以是有形物品或者无形服务。该场景中,通常会在对象搜索结果页面、对象推荐页面等显示对象推广文案,以通过对象推广文案实现对对象进行推广的目的。而目前这些对象推广文案质量参差不齐,存在缺少对象核心要素、文案语句不通顺等问题,质量较差,难以充分体现对象的优势和特色。
52.为了提高对象推广文案的质量,发明人在实现本技术的过程中想到,可以抽取用户针对对象的评价作为对象推广文案,但是抽取的大多数文案同样存在缺少对象核心要素、语句不通顺等质量问题。发明人经过进一步研究,提出了本技术实施例的技术方案,在本技术实施例中,可以选择优质的对象推广文案,并将对象推广样本文案进行切分,将获得的多个文本元素进行随机排序获得的乱序样本文本,进而用来训练文案生成模型。利用该文案生成模型,可以从目标对象的相关信息中提取至少一个文本元素,由至少一个文本元素组合生成待处理文本,利用该文案生成模型即可以生成优质的目标对象推广文案,由于文案生成模型基于对象推广样本文案以及对对象推广样本文案进行随机排序生成的乱序样本文本训练获得,仅基于优质的对象推广文案样本训练文案生成模型无需进行人工标注,既降低了训练成本,且可以不限制文本元素的组合方式,即可以保证生成的文案质量,且保证了对象推广文案中最大保留了所提取的文本元素,实现了对对象的有效表达,进一步保证了对象推广文案的质量。
53.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
54.本技术实施例的技术方案可以适用于图1所示的文案生成系统中,实际应用中,该
文案生成系统例如可以为提供商品交易的网上交易系统,或者也可以是与网上交易系统连接的其他处理系统,从而可以将生成的对象推广文案在网上交易系统进行发布等。该文案生成系统可以包括用户端101以及服务端102。
55.其中,用户端101与服务端102之间通过网络建立连接。网络为用户端101与服务端102之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。可选地,服务端可通过移动网络和用户端通信连接,相应地,移动网络的网络制式可以为2g(gsm)、2.5g(gprs)、3g(wcdma、td-scdma、cdma2000、utms)、4g(lte)、4g+(lte+)、5g、wimax等中的任意一种。可选地,用户端也可以通过蓝牙、wifi、红外线等方式和服务端建立通信连接。
56.其中,用户端101可以为浏览器、app(application,应用程序)、或网页应用如h5(hypertext markup language5,超文本标记语言第5版)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,用户端101可以部署在电子设备中,需要依赖设备运行或者设备中的某些app而运行等,电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等客户终端等,为了便于理解,图1中主要以设备形象表示用户端。在电子设备中还可以配置各种其它类应用,如搜索类、即时通信类等。
57.服务端102可以包括提供各种服务的一个或多个服务器,也即其可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器,此外也可以为分布式系统的服务器,或者是结合了区块链的服务器,也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机等。
58.用户可以通过用户端101与服务端102实现交互,以接收或发送消息等,在本技术实施例中的应用场景中例如可以由服务端102将目标对象推广文案发送至用户端101,以供用户端101输出该目标对象推广文案。
59.本技术实施例中,对象推广文案可以在进行对象推广的对象推广页面中、或者在对象搜索场景下的搜索结果页面中,或者对象购买流程涉及的各种对象导购页面中进行显示等,以实现引导、激励用户购买对象目的。
60.本技术实施例的技术方案可以适用于各种行业的线上系统,例如旅游行业的酒店住宿线上预订系统,对象即可以是指酒店住宿服务等。当然,也可以适用于实体商品的线上购买系统,对象例如可以是衣服、日用品等。
61.需要说明的是,本技术实施例中提供的文案生成方法一般由服务端102执行,相应的文案生成装置一般设置于服务端102中。但是,在本技术的其它实施例中,用户端101也可以与服务端102具有相似的功能,从而执行本技术实施例所提供的文案生成方法。在其它实施例中,本技术实施例所提供的文案生成方法还可以是由用户端101与服务端102共同执行。
62.应该理解,图1中的用户端和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的用户端和服务端。
63.以下对本技术实施例的技术方案的实现细节进行详细阐述。
64.图2为本技术实施例提供的一种文案生成方法一个实施例的流程图,该方法可以包括以下几个步骤:
65.201:从目标对象的相关信息中,提取至少一个文本元素。
66.相关信息可以包括对象属性信息以及对象描述信息中的至少一种信息。
67.对象属性信息可以包括目标对象的至少一个属性的属性值,目标对象的至少一个属性例如可以包括对象的品类、材质、品牌名称等,例如对象的品类对应的属性值例如可以包括“女装”、“外套”等,对象的的品牌名称对应的属性值例如可以是“张三”或“李四”、对象的材质对应的属性值例如可以是“羊毛”或者“纯棉”等。对象属性信息可以由对象提供方预先设定等。
68.对象描述信息可以包括对象详情信息,和/或对象评价信息。如对象详情信息是用于描述对象的特点与风格的信息,可以由对象提供方提供,可以是对象标题名称或者在对象详情页面中的详细介绍信息等,例如“秋冬新款宽松版正装职场气质小西服”。对象评价信息是指对象获得者对对象的评价,可以是在对象详情页面中的买家评价信息等,例如“外套颜色漂亮,做工精致,面料好”。
69.文本元素可以是单字,也可以是多字构成的词语。由上述描述可知,相关信息可以包括对象属性信息以及对象描述信息中的至少一种信息。
70.作为一种可选方式,从目标对象的相关信息中,提取至少一个文本元素可以包括:从所述对象描述信息中提取至少一个关键词;将所述至少一个关键词以及所述对象属性信息中的至少一个目标属性的属性值,作为所述至少一个文本元素。例如“宽松女装”、“气质外套”等等。
71.作为另一种可选方式,从目标对象的相关信息中,提取至少一个文本元素可以包括:将从所述对象描述信息中提取的至少一个关键词作为所述至少一个文本元素,例如“气质”、“新款”等等。
72.作为又一种可选方式,从目标对象的相关信息中,提取至少一个文本元素可以包括:将从所述对象属性信息中的至少一个目标属性的属性值作为所述至少一个文本元素,例如“女装”、“棉”等等。
73.202:将所述至少一个文本元素组合生成待处理文本。
74.该至少一个文本元素可以是一个文本元素,也可以是多个文本元素,则将该至少一个文本元素组合生成的待处理文本可以仅包含一个文本元素,也可以包含多个文本元素。
75.此外,将至少一个文本元素组合生成待处理文本的组合方式可以有多种实现方式:
76.作为一种可选实现方式,可以是将至少一个文本元素进行随机排序,以组合生成待处理文本。将至少一个文本元素随机排序无需根据文本元素的内容按一定规则排序,可以提高生成待处理文本的效率。
77.作为另一种可选实现方式,可以是将至少一个文本元素按一定顺序组合生成待处理文本。例如可以根据文本元素的类型排序,优先排列属于对象类目信息的文本元素,然后排列属于对象参数信息的文本元素。
78.203:基于所述待处理文本,利用文案生成模型,生成目标对象推广文案。
79.该文案生成模型利用对象推广样本文案以及对象推广样本文案的乱序样本文本训练获得;所述乱序样本文本通过对所述对象推广样本文案切分获得的多个文本元素进行
随机排序获得。文案生成模型的具体生成方式会在下文实施例中进行详细描述。
80.本实施例基于从目标对象的相关信息中提取的文本元素,利用文案生成模型,生成优质的目标对象推广文案,由于该文案生成模型是基于对象推广样本文案以及对对象推广样本文案进行随机排序生成的乱序样本文本训练获得,仅基于对象推广文案样本训练文案生成模型无需进行人工标注,可以降低训练成本,进而降低实现本实施例方法的成本,还可以保证目标对象推广文案中最大保留所提取的文本元素,由于对象推广样本文案可以是优质的对象推广样本文案,且文案生成模型可以不限制文本元素的组合方式,可以保证生成的目标对象推广文案语序通顺,保证目标对象推广文案的质量,实现对对象的有效表达。
81.某些实施例中,从目标对象的相关信息中,提取至少一个文本元素可以是利用文本提取模型提取。其中,文本提取模型可以基于训练文本以及训练文本标注的关键词,训练获得。本技术对提取至少一个文本元素的方式不做具体限定。
82.此外,作为其它可选方式,也可以将相关信息与预先构建的词典进行匹配,通过词典匹配方式,将词典命中的字或词作为文本元素。
83.当然,也可以通过将相关信息涉及的所有文本进行切分,再利用打分模型对切分获得的文本元素进行打分,选择得分大于一定分值的至少一个文本元素等。
84.当然,也可以通过摘要提取算法,从相关信息提取摘要信息来作为至少一个文本元素等。
85.通过上述任一种方式,可以使得提取的至少一个文本元素可以充分有效表达目标对象,能够突出对象特点等。
86.某些实施例中,生成目标对象推广文案之后,可以响应于用户端发送的针对对象聚合页面的获取请求,在对象聚合页面对应有目标对象的情况下,将目标对象推广文案发送至用户端,以在对象聚合页面中所述目标对象的对象提示信息中显示所述目标对象推广文案。
87.例如可以是在对象聚合页面中目标对象的对象提示信息中显示目标对象推广文案。
88.其中,对象聚合页面可以包括对象推荐页面以及搜索结果页面等。对象推荐页面可以是指聚合多个对象的对象提示信息,以对多个对象进行推广的页面。
89.则生成目标对象推广文案之后,响应于用户端发送的针对对象聚合页面的获取请求,在所述对象聚合页面对应有所述目标对象的情况下,将所述目标对象推广文案发送至所述用户端可以包括:
90.响应于用户端发送的对象搜索请求,确定搜索结果中包括所述目标对象的情况下,将所述目标对象推广文案发送至所述用户端,以在搜索结果页面中显示所述目标对象推广文案。
91.例如,可以是在搜索结果页面中目标对象的对象提示信息中显示目标对象推广文案。
92.某些实施例中,生成目标对象推广文案之后,可以将目标对象推广文案发送至用户端以在目标对象的对象详情页面中更新目标对象推广文案,或者是将目标对象推广文案添加至目标对象的对象详情页面中。
93.某些实施例中,从目标对象的相关信息中,提取至少一个文本元素可以包括:响应
于文案生成任务,确定目标对象;从目标对象的相关信息中,提取至少一个文本元素。
94.该文案生成任务可以有多种实现方式:
95.作为一种可选方式,可以定期生成所述文案生成任务;则响应于文案生成任务,确定目标对象包括:响应于文案生成任务,将任一个对象作为目标对象。
96.作为另一种可选方式,可以基于对象提供方发送的文案生成请求,确定请求处理的目标对象;生成针对所述目标对象的文案生成任务。
97.对象提供方可以针对目标对象向服务端发送文案生成请求,服务端可以确定该目标对象,并针对该目标对象生成文案生成任务。
98.此外,生成目标对象推广文案之后,还可以将目标对象推广文案发送至对象提供方。
99.图3为本技术实施例提供的一种模型生成方法一个实施例的流程图,该方法可以包括以下几个步骤:
100.301:获取对象推广样本文案。
101.对象推广样本文案可以是预先配置的具有语句通顺、对仗工整等优点的优质文本。
102.302:将所述对象推广样本文案进行切分,获得多个文本元素。
103.可以采用分词或者分字方式,对对象推广样本文案进行切分。可选地,可以是对对象推广样本文案进行分词,则每个文本元素即为分词处理获得的词语。
104.303:对所述多个文本元素进行随机排序,生成乱序样本文本。
105.例如,假设对象推广样本文案为“新款炸街宽松女西装,面料挺括,厚度适中,版型好看,价格亲民,颜色百搭”,进行分词处理获得的多个文本元素包括“新款”、“炸街”、“宽松”、“女”、“西装”、“面料”、“挺括”、“厚度”、“适中”、“版型”、“好看”、“价格”、“亲民”、“颜色”、“百搭”,经过随机排序之后,获得的乱序样本文本为“宽松炸街亲民女好看新款颜色面料价格挺括版型西装厚度适中百搭”。
106.304:利用所述乱序样本文本以及所述对象推广样本文案,训练文案生成模型。
107.可以是将所述乱序样本文本作为模型输入数据,所述对象推广样本文案作为模型标签数据,以训练文案生成模型。
108.上述利用所述乱序样本文本以及所述对象推广样本文案,训练文案生成模型具体可以是:获取预训练模型;利用所述乱序样本文本以及所述对象推广样本文案训练所述预训练模型,以获得文案生成模型。
109.其中,预训练模型可以是基于现有数据集进行训练完成的模型,其可以是实现文本转换为文本的预训练模型,当然也可以是多模态预训练模型,可对单模态和多模态的数据进行统一预训练,可以实现文本转换为文本、图像转换为文本、以及文本转换为图像等。多模态预训练模型可以利用基于self-attention(自注意力机制)的transformer架构(一个利用注意力机制来提高模型训练速度,包含编解码组件的模型)实现的,当然本技术也不限定于此。
110.在一个实际应用中,该预训练模型可以为多模态大模型,其中,多模态是指融合多种信息,如文本、图像、视频、音频等,大模型是指模型参数多,通常包含上亿、上百亿、甚至上千亿的模型参数。多模态大模型通过多任务设置对模型进行预训练,包括文本到文本的
迁移、图像到文本的迁移和多模态到文本的迁移。可以处理不同模态的信息,并进行单模态和跨模态的理解和生成任务。基于多模态大模型作为预训练模型,经由乱序样本文本以及对应的对象推广样本文案进行再次训练,即可以生成文案生成模型,利用多模态大模型作为预训练模型,可以降低训练模型,提高模型精度,提高处理效率,使得训练得到的文案生成模型可以进一步保证文案生成质量,使得生成的文案语句更加通顺,优美等。
111.该多模态大模型例如可以采用m6(multimodality-to-multimodality multitask mega-transformer,多模态到多模态多任务大型transformer)等模型实现。
112.本实施例中,将对象推广样本文案进行切分,获得多个文本元素。对所述多个文本元素进行随机排序,生成乱序样本文本。利用该乱序样本文本以及该对象推广样本文案,训练文案生成模型。该文案生成模型仅基于对象推广文案样本训练生成,无需进行人工标注,可以降低训练成本,且可以保证生成的对象推广文案中最大保留所提取的文本元素,由于对象推广样本文案可以是具有语句通顺、对仗工整等优点的优质文本,且该文案生成模型不限制文本元素的组合方式,可以保证生成的目标对象推广文案语句通顺,保证目标对象推广文案的质量,实现对对象的有效表达。
113.某些实施例中,将所述对象推广样本文案进行切分,获得多个文本元素可以包括:
114.将所述对象推广样本文案进行切分,对切分结果执行提取满足核心要求的文本元素、新增至少一个第一目标元素、以及利用第二目标元素替换目标描述类型的文本元素中的至少一种操作,以获得多个文本元素。
115.下面分别对上述各个操作进行说明:
116.对于新增至少一个第一目标元素,该第一目标元素可以是预先设定的文本元素,例如可以是描述对象特征的文本元素或者可以增强语言表达效果的文本元素等。
117.对于利用第二目标元素替换目标描述类型的文本元素,该目标描述类型例如可以是方言描述类型、或口语化描述类型等,第二目标元素为对应的标准描述类型,则利用第二目标元素替换目标描述类型的文本元素例如可以是用对应的标准描述类型替换方言描述类型和/或口语化描述类型的文本元素。
118.对于对切分结果执行提取满足核心要求的文本元素,作为一种可选方式,该对切分结果执行提取满足核心要求的文本元素可以是从切分结果中,去除属于至少一个第一目标词性的文本元素,以获得满足核心要求的文本元素。也即该核心要求可以是指不属于至少一个第一目标词性。
119.例如词性的分类可以包括名词、动词、形容词、数词、量词、代词,副词、介词、连词、助词、叹词、拟声词等,则去除属于至少一个第一目标词性的文本元素例如具体可以是去除属于代词,副词、介词、连词、助词、叹词、拟声词的文本元素。从而利于训练获得的文案生成模型获得的目标对象推广文案中可以加入属于至少一个第一目标词性的文本元素,以增强目标对象推广文案的语言表达效果。
120.作为另一种可选方式,该对切分结果执行提取满足核心要求的文本元素可以是从切分结果中提取属于至少一个第二目标词性的文本元素。例如具体可以是提取属于名词、动词、形容词的文本元素。
121.也即核心要求是属于至少一个第二目标词性,可以采用从切分结果中选取属于至少一个第二目标词性的文本元素的方式来获得满足核心要求的文本元素,以保留对象推广
样本文案中能够表达关键内容的词语。
122.此外,本技术实施例还提供了一种显示方法,如图4中所示,该方法可以包括以下几个步骤:
123.401:获取对象聚合页面。
124.402:在对象聚合页面中显示目标对象的目标对象推广文案。
125.其中,对象聚合页面用以显示多个对象的对象提示信息。可选地,可以是将目标对象推广文案包含在对象提示信息中以在对象聚合页面中进行显示。
126.对象聚合页面在一个实际应用中可以是指搜索结果页面。该获取对象聚合页面可以包括:向服务端发送对象搜索请求;获取搜索结果页面。服务端基于对象搜索请求可以进行对象搜索,确定搜索结果,生成搜索结果页面;该搜索结果页面中可以包括多个对象的对象提示信息,目标对象推广文案可以包含在对象提示信息中以在对象聚合页面中进行显示。
127.其中,目标对象可以是指搜索结果中的任意一个对象,从而可以使得在搜索结果页面中分别显示每个对象对应的目标对象推广文案。
128.此外,对象聚合页面可以是指对象推荐页面,对象推荐页面可以是指聚合多个对象的对象提示信息,以对多个对象进行推广的页面,可以在对象推荐页面中目标对象对应的对象提示信息中显示目标对象推广文案。
129.为了便于理解,下面以对象搜索场景为例对本技术技术方案进行说明,参见图5a所示的场景交互示意图中。服务端501可以定期例如每天或者每周等,针对每个对象,按照本技术的技术方案,利用文案生成模型生成目标对象推广文案,具体生成方式详见前文相应实施例中所述,此处不再重复赘述。
130.用户端502响应于用户搜索操作,可以将对象搜索请求发送至服务端501。该对象搜索请求中可以包括搜索关键词,服务端501可以基于搜索关键词进行对象搜索,基于命中的多个对象的对象提示信息生成搜索结果页面,该对象提示信息中即可以包括每个对象的目标对象推广文案,当然还可以包括其它关键内容如对象图片、对象价格等,本技术对此不进行限定。
131.为了便于理解,图5b示出了基于命中的多个对象的对象提示信息生成的搜索结果页面的显示示意图。图5b中的搜索结果页面可以是响应于搜索关键词“连衣裙”生成,页面中的对象提示信息即包括每个对象的目标对象推广文案503、对象图片504、以及对象价格505。
132.服务端501将搜索结果页面发送至用户端502。用户端502即可以显示该搜索结果页面,并在搜索结果页面中显示每个对象所对应的目标对象推广文案。结合目标对象推广文案可以提高对象推广效果等。
133.上述实施例中主要以对象推广文案为例对本技术技术方案进行介绍,需要说明的是,本技术技术方案也可以适用于对其它文本处理场景中,如图6所示,本技术实施例还提供了一种模型生成方法,该方法可以包括以下几个步骤:
134.601:获取第二类样本文本。
135.第二类样本文本可以是预先配置的具有语句通顺、对仗工整等优点的优质文本。
136.602:将所述第二类样本文本进行切换,获得多个文本元素。
137.603:对所述多个文本元素进行随机排序,生成第一类样本文本。
138.604;利用所述第一类样本文本以及所述第二类样本文本,训练文本处理模型。
139.可以是将所述第一类样本文本作为模型输入数据,第二类样本文本作为模型标签数据,以训练文本处理模型。
140.上述利用所述第一类样本文本以及所述第二类样本文本,训练文本处理模型具体可以是:
141.获取预训练模型;
142.利用所述第一类样本文本以及所述第二类样本文本训练所述预训练模型,以获得文本处理模型。
143.该预训练模型可以是是基于现有数据集进行训练完成的模型,其可以是实现文本转换为文本的预训练模型,当然也可以是多模态预训练模型,可对单模态和多模态的数据进行统一预训练,可以实现文本转换为文本、图像转换为文本、以及文本转换为图像等。多模态预训练模型可以利用基于self-attention的transformer架构实现的,当然本技术也不限定于此。
144.本实施例中,将获取的第二类样本文本进行切换,获得多个文本元素,对多个文本元素进行随机排序,生成第一类样本文本,利用所述第一类样本文本以及所述第二类样本文本,训练文本处理模型。该文本处理模型仅基于第二类样本文本训练,无需进行人工标注,可以降低训练成本,进而降低实现本实施例文本处理方法的成本,由于第二类样本文本可以是具有语句通顺、对仗工整等优点的优质文本,且该文本处理模型不限制文本元素的组合方式,因此该模型用于文本处理时,可以保证生成的文本语句通顺,保证生成的文本的质量。
145.某些实施例中,将所述第二类样本文本进行切换,获得多个文本元素可以是所述第二类样本文本进行切分,获得多个文本元素。
146.可选地,还可以是将所述第二类样本文本进行切分后,执行提取满足核心要求的文本元素、新增至少一个第三目标元素、以及利用第四目标元素替换目标描述类型的文本元素中的至少一种操作,获得多个文本元素。
147.下面分别对上述各个操作进行说明:
148.对于新增至少一个第三目标元素,该第三目标元素可以是预先设定的文本元素,例如可以是描述对象特征的文本元素或者可以增强语言表达效果的文本元素等。
149.对于利用第四目标元素替换目标描述类型的文本元素,该目标描述类型例如可以是方言描述类型、或口语化描述类型等,第四目标元素为对应的标准描述类型,则利用第四目标元素替换目标描述类型的文本元素例如可以是用对应的标准描述类型替换方言描述类型和/或口语化描述类型的文本元素。
150.对于对切分结果执行提取满足核心要求的文本元素,作为一种可选方式,该对切分结果执行满足核心要求的文本元素可以是从切分结果中,去除属于至少一个第三目标词性的文本元素,以获得满足核心要求的文本元素;也即该核心要求可以是指不属于至少一个第三目标词性。
151.例如词性的分类可以包括名词、动词、形容词、数词、量词、代词,副词、介词、连词、助词、叹词、拟声词等,则去除属于至少一个第三目标词性的文本元素例如具体可以是去除
属于代词,副词、介词、连词、助词、叹词、拟声词的文本元素。从而利于训练获得的文本处理模型获得的第二类文本可以加入属于至少一个第三目标词性的文本元素,以增强第二类文本的语言表达效果。
152.作为另一种可选方式,该对切分结果执行提取满足核心要求的文本元素可以是从切分结果中提取属于至少一个第四目标词性的文本元素。例如具体可以是提取属于名词、动词、形容词的文本元素。
153.也即核心要求是属于至少一个第四目标词性,可以采用从从切分结果中选取属于至少一个第四目标词性的文本元素的方式来获得满足核心要求的文本元素,以保留对象推广样本文案中能够表达关键内容的词语。
154.为了便于理解,第二类样本文本例如“秋季相约秀美盘山,走在层林浸染的红叶之间,心情无比愉悦”,对第二类样本文本进行切分,可以抽取属于名词,形容词的文本元素,将多个文本元素随机排序生成的第一类样本文本例如可以是“盘山秋季心情层林浸染红叶秀美愉悦”。
155.图7为本技术实施例提供的一种文本处理方法一个实施例的流程图,该方法可以包括以下几个步骤:
156.701:获取待处理的第一类文本。
157.702:基于所述第一类文本,利用文本处理模型生成第二类文本。
158.该文本处理模型利用第二类样本文本以及所述第二类样本文本转换生成的第一类样本文本训练获得;其中,所述第一类样本文本通过对所述第二类样本文本切换获得的多个文本元素进行随机排序而生成。该文本处理模型的具体生成方式详见图6所示实施例中所述,此处不再重复赘述。
159.本实施例中,利用文本处理模型,可以将第一类文本处理生成第二类文本。该文本处理模型是基于第二类样本文本以及对第二类样本文本切分获得的多个文本元素随机排序生成的第一类样本文本训练获得,仅基于第二类样本文本训练文本处理模型无需进行人工标注,可以降低训练成本,进而降低实现本实施例文本处理方法的成本,由于第二类样本文本可以是具有语句通顺、对仗工整等优点的优质文本,且该文本处理模型不限制文本元素的组合方式,因此可以保证生成的第二类文本语句通顺,保证第二类文本的质量。
160.此外,在又一个实际应用中,本技术实施例的技术方案还可以适用于对目标对象的原始推广文案的优化场景,因此,作为又一个实施例,如图8所示,为本技术提供的一种文案优化方法一个实施例的流程图,该方法可以包括以下几个步骤:
161.801:从目标对象的原始对象推广文案中,提取至少一个文本元素。
162.该至少一个文本元素可以通过对原始对象推广文案进行分词处理获得。
163.802:将所述至少一个文本元素组合生成待处理文本。
164.可以是将所述至少一个文本元素进行随机排序,以组合生成待处理文本。
165.803:基于所述待处理文本,利用文案生成模型,生成目标对象推广文案。
166.804:利用目标对象推广文案更新原始对象推广文案。
167.其中,所述文案生成模型利用对象推广样本文案以及所述对象推广样本文案的乱序样本文本训练获得;所述乱序样本文本通过对所述对象推广样本文案切分获得的多个文本元素进行随机排序获得。
168.其中,可以是利用目标对象推广文案替换原始对象推广文案,从而实现文案优化目的。
169.需要说明的是,本实施例中,与图2所示实施例的不同之处是本实施例基于原始对象推广文案,得到待处理文本,其它相同或相似步骤可以详见图2所示实施例中所述,此处不再重复赘述。
170.图9为本技术实施例提供的一种文案生成装置一个实施例的结构示意图,该装置可以包括:
171.为本技术实施例提供的一种文本处理方法一个实施例的流程图,该方法可以包括以下几个步骤:
172.第一抽取模块901:用于从目标对象的相关信息中,提取至少一个文本元素;
173.第一组合模块902:用于将所述至少一个文本元素组合生成待处理文本;
174.第一生成模块903:用于基于所述待处理文本,利用文案生成模型,生成目标对象推广文案;
175.第一抽取模块从目标对象的相关信息中提取至少一个文本元素,可以有多种实现方式:
176.作为一种可选实现方式,可以是从所述对象描述信息中提取至少一个关键词;将所述至少一个关键词以及所述对象属性信息中的至少一个目标属性的属性值,作为所述至少一个文本元素。
177.作为另一种可选实现方式,可以是将从所述对象描述信息中提取的至少一个关键词作为所述至少一个文本元素。
178.作为又一种可选实现方式,可以是将从所述对象属性信息中的至少一个目标属性的属性值作为所述至少一个文本元素。
179.此外,第一抽取模块从目标对象的相关信息中提取至少一个文本元素可以是利用文本提取模型提取。
180.作为其它可选方式,也可以将相关信息与预先构建的词典进行匹配,通过词典匹配方式,将词典命中的字或词作为文本元素。
181.当然,也可以通过将相关信息涉及的所有文本进行切分,再利用打分模型对切分获得的文本元素进行打分,选择得分大于一定分值的至少一个文本元素等。
182.当然,也可以通过摘要提取算法,从相关信息提取摘要信息来作为至少一个文本元素等。
183.通过上述任一种方式,可以使得提取的至少一个文本元素可以充分有效表达目标对象,能够突出对象特点等。
184.此外,第一抽取模块从目标对象的相关信息中提取至少一个文本元素可以包括:响应于文案生成任务,确定目标对象;从目标对象的相关信息中,提取至少一个文本元素。
185.其中,文案生成任务可以由多种实现方式:
186.作为一种可选方式,可以定期生成所述文案生成任务;则响应于文案生成任务,确定目标对象包括:响应于文案生成任务,将任一个对象作为目标对象。
187.作为另一种可选方式,可以基于对象提供方发送的文案生成请求,确定请求处理的目标对象;生成针对所述目标对象的文案生成任务。
188.对象提供方可以针对目标对象向服务端发送文案生成请求,服务端可以确定该目标对象,并针对该目标对象生成文案生成任务。
189.此外,第一生成模块生成目标对象推广文案之后,还可以将目标对象推广文案发送至对象提供方。
190.第一组合模块将至少一个文本元素组合生成待处理文本的组合方式可以有多种实现方式:
191.作为一种可选实现方式,可以是将至少一个文本元素进行随机排序,以组合生成待处理文本。
192.作为另一种可选实现方式,可以是将至少一个文本元素按一定顺序组合生成待处理文本。
193.第一生成模块生成目标对象推广文案之后,可以在对象聚合页面中所述目标对象的对象提示信息中显示所述目标对象推广文案,还可以在目标对象的对象详情页面中显示所述目标对象推广文案。
194.其中,对象聚合页面例如可以包括对象推荐页面以及搜索结果页面等。
195.在对象聚合页面为搜索结果页面的情况下,某些实施例中,在对象聚合页面中所述目标对象的对象提示信息中显示所述目标对象推广文案可以包括:根据对象搜索请求,确定搜索结果中包括所述目标对象的情况下,在搜索结果页面中所述目标对象的对象提示信息中显示所述目标对象推广文案。
196.其中,对象推荐页面可以是指聚合多个对象的对象提示信息,以对多个对象进行推广的页面,对象推荐页面对应目标对象的情况下,可以在对象推荐页面中目标对象对应的对象提示信息中显示所述目标对象推广文案。
197.第一生成模块中所述文案生成模型利用对象推广样本文案以及所述对象推广样本文案的乱序样本文本训练获得;所述乱序样本文本通过对所述对象推广样本文案切分获得的多个文本元素进行随机排序获得。
198.图9所述的文案生成装置可以执行图2所示实施例所述的文案生成方法,其实现原理和技术效果不再赘述。对于上述实施例中的文案生成装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
199.图10为本技术实施例提供的一种模型生成装置一个实施例的结构示意图,该装置可以包括:
200.第一获取模块1001:用于获取对象推广样本文案;
201.第一切分模块1002:用于将所述对象推广样本文案进行切分,获得多个文本元素;
202.第一排序模块1003:用于对所述多个文本元素进行随机排序,生成乱序样本文本;
203.第二生成模块1004;用于利用所述乱序样本文本以及所述对象推广样本文案,训练文案生成模型。
204.第二生成模块可以是将所述乱序样本文本作为模型输入数据,所述对象推广样本文案作为模型标签数据,以训练文案生成模型。
205.此外,第二生成模块利用所述乱序样本文本以及所述对象推广样本文案,训练文案生成模型具体可以是:
206.获取预训练模型;
207.利用所述乱序样本文本以及所述对象推广样本文案训练所述预训练模型,以获得文案生成模型。
208.第一切分模块将所述对象推广样本文案进行切分,获得多个文本元素可以包括:将所述对象推广样本文案进行切分,对切分结果执行提取满足核心要求的文本元素、新增至少一个第一目标元素、以及利用第二目标元素替换目标描述类型的文本元素中的至少一种操作,以获得多个文本元素。其中,上述各个操作可以前文相应实施例中所述,此处不再重复赘述。
209.图10所述的模型生成装置可以执行图3所示实施例所述的模型生成方法,其实现原理和技术效果不再赘述。对于上述实施例中的模型生成装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
210.图11为本技术实施例提供的一种显示装置一个实施例的结构示意图,该装置可以包括:
211.第二获取模块1101:用于获取对象聚合页面;
212.第一显示模块1102:用于在对象聚合页面中显示目标对象的目标对象推广文案。
213.其中,第二获取模块获取的对象聚合页面用以显示多个对象的对象提示信息。可选地,可以是将目标对象推广文案包含在对象提示信息中以在对象聚合页面中进行显示。对象聚合页面例如可以包括对象推荐页面以及搜索结果页面等,对象推荐页面以及搜索结果页面的具体释义以前文相应实施例中所述,此处不再重复赘述。
214.图11所述的显示装置可以执行图4所示实施例所述的显示方法,其实现原理和技术效果不再赘述。对于上述实施例中的显示装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
215.图12为本技术实施例提供的一种模型生成装置一个实施例的结构示意图,该装置可以包括:
216.第三获取模块1201:用于获取第二类样本文本;
217.第一切换模块1202:用于将所述第二类样本文本进行切换,获得多个文本元素;
218.第二排序模块1203:用于对所述多个文本元素进行随机排序,生成第一类样本文本;
219.第三生成模块1204:用于利用所述第一类样本文本以及所述第二类样本文本,训练文本处理模型。
220.其中,第三获取模块获取的第二类样本文本可以是具有语句通顺、对仗工整等优点的优质文本。
221.第三生成模块可以是将所述第一类样本文本作为模型输入数据,所述第二类样本文本作为模型标签数据,以训练文本处理模型。
222.此外,第二生成模块利用所述乱序样本文本以及所述对象推广样本文案,训练文本处理模型具体可以是:
223.获取预训练模型;
224.利用第一类样本文本以及第二类样本文本训练预训练模型,以获得文本处理模型。
225.第一切换模块将所述第二类样本文本进行切换,获得多个文本元素可以是将所述
第二类样本文本进行切分,获得多个文本元素。
226.可选地,还可以是将所述第二类样本文本进行切分后,执行提取满足核心要求的文本元素、新增至少一个第三目标元素、以及利用第四目标元素替换目标描述类型的文本元素中的至少一种操作,获得多个文本元素。其中,上述各个操作可以前文相应实施例中所述,此处不再重复赘述。
227.图12所述的模型生成装置可以执行图6所示实施例所述的模型生成方法,其实现原理和技术效果不再赘述。对于上述实施例中的模型生成装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
228.图13为本技术实施例提供的一种文本处理装置一个实施例的结构示意图,该装置可以包括:
229.第四获取模块1301:用于获取待处理的第一类文本;
230.第四生成模块1302:用于基于所述第一类文本,利用文本处理模型生成第二类文本。
231.其中,第四生成模块中的文本处理模型是利用第二类样本文本以及所述第二类样本文本转换生成的第一类样本文本训练获得;其中,所述第一类样本文本通过对所述第二类样本文本切换获得的多个文本元素进行随机排序而生成。该文本处理模型的具体生成方式详见前文相应实施例中所述,此处不再重复赘述。
232.图13所述的文本处理装置可以执行图7所示实施例所述的文本处理方法,其实现原理和技术效果不再赘述。对于上述实施例中的文本处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
233.本技术实施例还提供了一种计算设备,如图14所示,该设备可以包括存储组件1401以及处理组件1402;
234.所述存储组件一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行,以实现如图2所示实施例的文案生成方法或图3所示实施例的模型生成方法或图6所示实施例的模型生成方法或图7所示实施例的文本处理方法或图8所示的文案优化方法。
235.当然,设备必然还可以包括其他部件,例如输入/输出接口、显示组件、通信组件等。在该计算设备中的处理组件用以实现如图4所示的信息显示方法的情况下,该计算设备还可以包括显示组件,以执行对应的显示操作。
236.输入/输出接口为处理组件和外围接口模块之间提供接口,上述外围接口模块可以是输出设备、输入设备等。通信组件被配置为便于计算设备和其他设备之间有线或无线方式的通信等。
237.其中,处理组件1302可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
238.存储组件1301被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程
只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
239.显示组件可以为电致发光(el)元件、液晶显示器或具有类似结构的微型显示器、或者视网膜可直接显示或类似的激光扫描式显示器。
240.需要说明的是,上述计算设备实现图2所示实施例的文案生成方法或图3所示实施例的模型生成方法或图6所示实施例的模型生成方法或图7所示实施例的文本处理方法或图8所示的文案优化方法的情况下,可以为物理设备或者云计算平台提供的弹性计算主机等。其可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。上述计算设备实现图4所示实施例的显示方法的情况下,其可以具体实现为电子设备,电子设备可以是指用户使用的,具有用户所需计算、上网、通信等功能的设备,例如可以是手机、平板电脑、个人电脑、穿戴设备等。
241.本技术实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现图2所示实施例的文案生成方法或图3所示实施例的模型生成方法或图4所示实施例的显示方法或图6所示实施例的模型生成方法或图7所示实施例的文本处理方法或图8所示的文案优化方法。该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
242.本技术实施例还提供了一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,所述计算机程序被计算机执行时可以实现如上述图2所示实施例的文案生成方法或图3所示实施例的模型生成方法或图4所示实施例的显示方法或图6所示实施例的模型生成方法或图7所示实施例的文本处理方法或图8所示的文案优化方法。
243.在这样的实施例中,计算机程序可以是从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被处理器执行时,执行本技术的系统中限定的各种功能。
244.前文相应实施例中所涉及的计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
245.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
246.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
247.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该
计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
248.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1