图像页面输出方法及装置的制造方法

文档序号：9750898阅读：1548来源：国知局

图像页面输出方法及装置的制造方法
【技术领域】
[0001 ]本公开涉及多媒体技术领域，特别涉及一种图像页面输出方法及装置。
【背景技术】
[0002]随着信息技术的不断发展，智能终端具备的功能越来越多。比如，通过智能终端可浏览页面中的图像。目前，图像的质量越来越精良，一张图像通常有几百K甚至几M的大小。这样在智能终端处于移动网络连接状态下，浏览页面中过的图像便会消耗掉大量数据流量。为此，智能终端还提供了一种无图浏览模式，即在显示页面时仅显示页面中的文字内容，不对页面中的图像进行显示。但是，仅有文本内容的页面对于用户来说无疑较为枯燥和单调，因此亟需一种图像页面输出方法，以解决上述耗费流量和缺乏生动性的问题。

【发明内容】

[0003]为克服相关技术中存在的问题，本公开提供一种图像页面输出方法及装置。
[0004]根据本公开实施例的第一方面，提供一种图像页面输出方法，所述方法包括:
[0005]接收对页面的获取请求；
[0006]在所述页面包括图像时，对所述图像进行内容识别，得到识别结果；
[0007]根据所述识别结果，生成对所述图像的内容进行描述的第一文本信息；
[0008]输出所述页面，所述页面包括所述第一文本信息。
[0009]可选地，所述根据所述识别结果，生成对所述图像的内容进行描述的第一文本信息，包括:
[0010]获取所述页面中与所述图像关联的第二文本信息；
[0011]根据所述第二文本信息对所述识别结果进行验证；
[0012]根据验证结果和所述识别结果，生成对所述图像的内容进行描述的第一文本信息。
[0013]可选地，所述方法还包括:
[0014]获取预先设置的至少一个屏蔽关键字；
[0015]若所述识别结果中包括任一屏蔽关键字，则将所述识别结果过滤掉;或，
[0016]若所述识别结果中所述屏蔽关键字的出现比例超过第一预设阈值，则将所述识别结果过滤掉。
[0017]可选地，所述对所述图像进行内容识别之前，所述方法还包括:
[0018]对多张包含预设目标物的样本图像进行目标物标注，得到第一类标注图像；
[0019]根据所述第一类标注图像进行模型训练，得到第一模型；
[0020]所述对所述图像进行内容识别，得到识别结果，包括:
[0021 ]利用所述第一模型对所述图像进行图像识别；
[0022]在所述图像中包括任一所述预设目标物时，得到用于描述所述图像中的目标物的第一关键字。
[0023]可选地，所述对所述图像进行内容识别之前，所述方法还包括:
[0024]对多张包含预设场景的样本图像进行场景标注，得到第二类标注图像；
[0025]根据所述第二类标注图像进行模型训练，得到第二模型；
[0026]所述对所述图像进行内容识别，得到识别结果，包括:
[0027]利用所述第二模型对所述图像进行图像识别；
[0028]在所述图像中包括任一所述预设场景时，得到用于描述所述图像中的场景的第二关键字。
[0029]可选地，所述对所述图像进行内容识别之前，所述方法还包括:
[0030 ]对多张样本图像进行文本标注，得到第三类标注图像；
[0031]根据所述第三类标注图像进行模型训练，得到第三模型；
[0032]所述对所述图像进行内容识别，得到识别结果，包括:
[0033]利用所述第三模型对所述图像进行图像识别；
[0034]在所述图像中包括文本时，得到用于描述所述图像中的文本的第三关键字。
[0035]可选地，所述识别结果中的每一个关键字对应一个识别置信度，所述根据所述第二文本信息对所述识别结果进行验证，包括:
[0036]对所述第二文本信息进行分词处理，得到多个分词；
[0037]对于识别结果中的每一个关键字，判断所述多个分词中是否包括所述关键字；
[0038]若所述多个分词中包括所述关键字，则按照预设规则增大所述关键字的识别置信度；
[0039]其中，所述识别置信度用于表征被正确识别的概率。
[0040]可选地，所述根据验证结果和所述识别结果，生成对所述图像的内容进行描述的第一文本信息，包括:
[0041]获取所述识别结果中识别置信度大于第二预设阈值的指定关键字；
[0042]利用RNN(Recurrent neural Network，多层反馈网络)模型将所述指定关键字组成一个语句，将所述语句作为所述第一文本信息。
[0043]根据本公开实施例的第二方面，提供一种图像页面输出装置，所述装置包括:
[0044]接收模块，被配置为接收对页面的获取请求；
[0045]识别模块，被配置为在所述页面包括图像时，对所述图像进行内容识别，得到识别结果；
[0046]生成模块，被配置为根据所述识别结果，生成对所述图像的内容进行描述的第一文本信息；
[0047]输出模块，被配置为输出所述页面，所述页面包括所述第一文本信息。
[0048]可选地，所述生成模块，被配置为获取所述当前浏览页面中与所述图像关联的第二文本信息;根据所述第二文本信息对所述识别结果进行验证;根据验证结果和所述识别结果，生成对所述图像的内容进行描述的第一文本信息。
[0049]可选地，所述装置还包括:
[0050]获取模块，被配置为获取预先设置的至少一个屏蔽关键字；
[0051]过滤模块，被配置为当所述识别结果中包括任一屏蔽关键字时，将所述识别结果过滤掉;或，当所述识别结果中所述屏蔽关键字的出现比例超过第一预设阈值时，将所述识别结果过滤掉。
[0052]可选地，所述装置还包括:
[0053]标注模块，被配置为对多张包括预设目标物的样本图像进行目标物标注，得到第一类标注图像；
[0054]训练模块，被配置为根据所述第一类标注图像进行模型训练，得到第一模型；
[0055]所述识别模块，被配置为利用所述第一模型对所述图像进行图像识别，在所述图像中包括任一所述预设目标物时，得到用于描述所述图像中的目标物的第一关键字。
[0056]可选地，所述装置还包括:
[0057]标注模块，被配置为对多张包括预设场景的样本图像进行场景标注，得到第二类标注图像；
[0058]训练模块，被配置为根据所述第二类标注图像进行模型训练，得到第二模型；
[0059]所述识别模块，被配置为利用所述第二模型对所述图像进行图像识别，在所述图像中包括任一所述预设场景时，得到用于描述所述图像中的场景的第二关键字。
[0060]可选地，所述装置还包括:
[0061]标注模块，被配置为对多张样本图像进行文本标注，得到第三类标注图像；
[0062]训练模块，被配置为根据所述第三类标注图像进行模型训练，得到第三模型；
[0063]所述识别模块，被配置为利用所述第三模型对所述图像进行图像识别，在所述图像中包括文本时，得到用于描述所述图像中的文本的第三关键字。
[0064]可选地，所述识别结果中的每一个关键字对应一个识别置信度，所述验证模块，被配置为对所述第二文本信息进行分词处理，得到多个分词;对于识别结果中的每一个关键字，判断所述多个分词中是否包括所述关键字;若所述多个分词中包括所述关键字，则按照预设规则增大所述关键字的识别置信度；
[0065]其中，所述识别置信度用于表征被正确识别的概率。
[0066]可选地，所述生成模块，被配置为获取所述识别结果中识别置信度大于第二预设阈值的指定关键字;利用RNN模型将所述指定关键字组成一个语句，将所述语句作为所述第一文本信息。
[0067]根据本公开实施例的第三方面，提供一种图像页面输出装置，包括:
[0068]处理器；
[0069]用于存储处理器可执行指令的存储器；
[0070]其中，所述处理器被配置为:接收对页面的获取请求;在所述页面包括图像时，对所述图像进行内容识别，得到识别结果;根据所述识别结果，生成对所述图像的内容进行描述的第一文本信息;输出所述页面，所述页面包括所述第一文本信息。
[0071]本公开的实施例提供的技术方案可以包括以下有益效果:
[0072]在接收到对页面的获取请求且判断在该页面包括图像时，对图像进行内容识别，并根据得到的识别结果生成对该图像的内容进行描述的第一文本信息，之后输出将包括第一文本信息的该页面，由于在不下载图像的情况下，提供了对当前浏览页面中每一张图像的文本描述，因此可帮助用户初步了解图像的内容，从而协助用户决定

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王百超;龙飞;汪平仄;
技术所有人：小米科技有限责任公司;
我是此专利的发明人

上一篇：模糊照片的处理方法以及处理系统的制作方法
上一篇：一种黄历对应的日期的显示方法、装置及电子设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。