货品处理方法及系统与流程

文档序号:13446875阅读:304来源:国知局
货品处理方法及系统与流程

本公开涉及仓储物流领域,更具体地,涉及一种货品处理方法及系统、一种计算机系统及一种计算机可读存储介质。



背景技术:

随着物流行业的快速发展,仓库中通常要存储大量的货品,经过简单分类后,会将货品放置在相应的储位中。但在实际工作中,需要经常盘点仓库中每个储位的货品数量,以更新数据库中的库存和确定是否需要补货等操作。

在实现本公开的过程中,发明人发现相关技术中至少存在如下问题:

使用传统的货品处理方案检测货品时检测精度难以符合实际要求。



技术实现要素:

有鉴于此,本公开提供了一种用于精确统计货品数量和定位的货品处理方法及系统。

本公开的一个方面提供了一种货品处理方法,包括获取多个待处理货品的第一图像特征;根据上述第一图像特征确定预选框,其中,上述预选框中包含上述多个待处理货品中的至少一个货品;对包含在上述预选框中的上述至少一个货品中的目标货品进行轮廓识别;以及根据轮廓识别结果确定上述预选框中包含的上述目标货品的数量和/或位置。

根据本公开的实施例,根据上述第一图像特征确定预选框包括根据上述第一图像特征与第一预定卷积核做卷积确定边框坐标;根据上述第一图像特征与第二预定卷积核做卷积判断上述边框坐标表征的区域中是否包含有上述至少一个货品,得到对应的判断结果;以及根据上述边框坐标和上述判断结果确定上述预选框。

根据本公开的实施例,对包含在上述预选框中的上述至少一个货品中的目标货品进行轮廓识别包括获取包含在上述预选框中的上述至少一个货品的第二图像特征;根据上述第二图像特征对包含在上述预选框中的上述至少一个货品进行掩模分类;以及根据掩模分类结果确定包含在上述预选框中的上述至少一个货品中的目标货品的轮廓。

根据本公开的实施例,上述货品处理方法包括根据上述第二图像特征对包含在上述预选框中的上述至少一个货品进行掩模分类包括根据上述第二图像特征对包含在上述预选框的像素进行分类,得到像素分类结果;以及根据掩模分类结果确定包含在上述预选框中的上述至少一个货品中的目标货品的轮廓包括通过上述像素分类结果确定包含在上述预选框中的上述至少一个货品中的目标货品的轮廓。

根据本公开的实施例,在根据上述边框坐标和上述判断结果确定上述预选框之后,上述货品处理方法还包括通过卷积操作和/或上述预选框中的上述至少一个货品的图像特征对上述预选框进行修正。

根据本公开的实施例,上述货品处理方法还包括在获取多个待处理货品的第一图像特征之前,获取展示有上述多个待处理货品的待处理图像;以及基于卷积神经网络获取上述多个待处理货品的第一图像特征。

本公开的另一个方面提供了一种货品处理系统,该货品处理系统包括第一获取模块、第一确定模块、识别模块和第二确定模块。第一获取模块用于获取多个待处理货品的第一图像特征;第一确定模块用于根据上述第一图像特征确定预选框,其中,上述预选框中包含上述多个待处理货品中的至少一个货品;识别模块用于对包含在上述预选框中的上述至少一个货品中的目标货品进行轮廓识别;以及第二确定模块用于根据轮廓识别结果确定上述预选框中包含的上述目标货品的数量和/或位置。

根据本公开的实施例,上述第一确定模块包括第一确定单元、判断单元和第二确定单元。第一确定单元用于根据上述第一图像特征与第一预定卷积核做卷积确定边框坐标;判断单元用于根据上述第一图像特征与第二预定卷积核做卷积判断上述边框坐标表征的区域中是否包含有上述至少一个货品,得到对应的判断结果;以及第二确定单元用于根据上述边框坐标和上述判断结果确定上述预选框。

根据本公开的实施例,上述识别模块包括第一获取单元、分类单元和第三确定单元。第一获取单元用于获取包含在上述预选框中的上述至少一个货品的第二图像特征;分类单元用于根据上述第二图像特征对包含在上述预选框中的上述至少一个货品进行掩模分类;以及第三确定单元用于根据掩模分类结果确定包含在上述预选框中的上述至少一个货品中的目标货品的轮廓。

根据本公开的实施例,上述货品处理系统包括:上述分类单元用于根据上述第二图像特征对包含在上述预选框的像素进行分类,得到像素分类结果;以及上述第三确定单元用于通过上述像素分类结果确定包含在上述预选框中的上述至少一个货品中的目标货品的轮廓。

根据本公开的实施例,上述货品处理系统还包括修正模块,用于在根据上述边框坐标和上述判断结果确定上述预选框之后,通过卷积操作和/或上述预选框中的上述至少一个货品的图像特征对上述预选框进行修正。

根据本公开的实施例,上述货品处理系统还包括第二获取模块和第三获取模块。第二获取模块用于在获取多个待处理货品的第一图像特征之前,获取展示有上述多个待处理货品的待处理图像;以及第三获取模块用于基于卷积神经网络获取上述多个待处理货品的第一图像特征。

本公开的另一方面提供了一种计算机系统,包括一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的货品处理方法。

本公开的另一方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现如上所述的货品处理方法。

根据本公开的实施例,由于通过待处理货品的图像特征确定预选框,并对预选框中的的目标货品进行轮廓识别,根据预选框中的目标货品的轮廓确定目标货品的数量和位置的技术手段,所以至少部分地克服了相关技术中的货品处理方案检测货品时检测精度难以符合实际要求的技术问题,进而达到了对货品数量的精确统计和定位的技术效果。

附图说明

通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:

图1示意性示出了根据本公开实施例的可以应用货品处理方法及系统的系统架构;

图2示意性示出了根据本公开实施例的货品处理方法的流程图;

图3a示意性示出了根据本公开实施例的根据第一图像特征确定预选框的流程图;

图3b示意性示出了根据本公开实施例的根据第一图像特征确定预选框的示意图。

图3c示意性示出了根据本公开实施例的对包含在预选框中的至少一个货品中的目标货品进行轮廓识别的流程图;

图3d示意性示出了根据本公开另一实施例的货品处理方法的流程图;

图3e示意性示出了根据本公开另一实施例的货品处理方法的示意图;

图4示意性示出了根据本公开实施例的货品处理系统的框图;

图5a示意性示出了根据本公开实施例的第一确定模块的框图;

图5b示意性示出了根据本公开实施例的识别模块的框图;

图5c示意性示出了根据本公开另一实施例的货品处理系统的框图;

图5d示意性示出了根据本公开另一实施例的货品处理系统的框图;以及

图6示意性示出了根据本公开实施例的适于实现货品处理方法的计算机系统的框图。

具体实施方式

以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“a或b”应当被理解为包括“a”或“b”、或“a和b”的可能性。

本公开的实施例提供了一种用于精确统计货品数量和定位的货品处理方法及系统。该货品处理方法包括获取多个待处理货品的第一图像特征;根据第一图像特征确定预选框,其中,预选框中包含多个待处理货品中的至少一个货品;对包含在预选框中的至少一个货品中的目标货品进行轮廓识别;以及根据轮廓识别结果确定预选框中包含的目标货品的数量和/或位置。

图1示意性示出了根据本公开实施例的可以应用货品处理方法及系统的系统架构。

如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是,本公开实施例所提供的货品处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的货品处理系统一般可以设置于服务器105中。本公开实施例所提供的货品处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的货品处理系统也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的货品处理方法也可以由终端设备101、102、或103执行,或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的货品处理系统也可以设置于终端设备101、102、或103中,或设置于不同于终端设备101、102、或103的其他终端设备中。

例如,待处理图像可以原本存储在终端设备101、102、或103中的任意一个(例如,终端设备101,但不限于此)之中,或者存储在外部存储设备上并可以导入到终端设备101中。然后,终端设备101可以在本地执行本公开实施例所提供的货品处理方法,或者将待处理图像发送到其他终端设备、服务器、或服务器集群,并由接收该待处理图像的其他终端设备、服务器、或服务器集群来执行本公开实施例所提供的货品处理方法。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的货品处理方法的流程图。

如图2所示,该货品处理方法可以包括操作s210~s240,其中:

在操作s210,获取多个待处理货品的第一图像特征。

在操作s220,根据第一图像特征确定预选框,其中,预选框中包含多个待处理货品中的至少一个货品。

在操作s230,对包含在预选框中的至少一个货品中的目标货品进行轮廓识别。

在操作s240,根据轮廓识别结果确定预选框中包含的目标货品的数量和/或位置。

根据本公开的实施例,由于不同货品的尺寸不同,形态也各不相同,当多个不同形态的货品挨得较近时,传统的算法检测不出来这些挨得近的货品。

根据本公开的实施例,采用多层的卷积神经网络对多个待处理货品进行处理,提取待处理货品的图像特征。卷积神经网络是局部连接网络,相对于全连接网络区别在于局部连接性和权值共享性。因为对一幅图像中的某个像素p来说,一般离像素p越近的像素对其影响也就越大(局部连接性)。另外,根据自然图像的统计特性,某个区域的权值也可以用于另一个区域(即权值共享性),可以认为是卷积核共享。对于一个卷积核将其与给定的图像做卷积就可以提取一类图像特征,不同的卷积核可以提取不同类别的图像特征,卷积神经网络越深,所能提取的特征表达越抽象。

根据本公开的实施例,在获取多个待处理货品的第一图像特征之前,获取展示有多个待处理货品的待处理图像,基于卷积神经网络获取多个待处理货品的第一图像特征。

根据本公开的实施例,采用多层卷积神经网络提取图像的特征,具体地,例如采用16层卷积神经网络,并将最后一个卷积层的输出作为输入图像的特征表达,即多个待处理货品的第一图像特征。

根据本公开的实施例,根据第一图像特征确定预选框的方式可以是将第一图像特征所对应的卷积图进行卷积处理后得到的。

根据本公开的实施例,由于通过待处理货品的图像特征确定预选框,并对预选框中的的目标货品进行轮廓识别,根据预选框中的目标货品的轮廓确定目标货品的数量和位置的技术手段,所以至少部分地克服了相关技术中的货品处理方案检测货品时检测精度难以符合实际要求的技术问题,进而达到了对货品数量的精确统计和定位的技术效果。

此外,本公开针对货品数据集进行训练神经网络,神经网络的结构以及参数都适应于货品数据集中的物体,可以直接用于储位中的货品检测。

下面参考图3a~图3e,结合具体实施例对图2所示的方法做进一步说明。

图3a示意性示出了根据本公开实施例的根据第一图像特征确定预选框的流程图。

在该实施例中,参考图2描述的操作s220(即根据第一图像特征确定预选框)可以包括操作s221~s223。如图3a所示,其中:

在操作s221,根据第一图像特征与第一预定卷积核做卷积确定边框坐标。

在操作s222,根据第一图像特征与第二预定卷积核做卷积判断边框坐标表征的区域中是否包含有至少一个货品,得到对应的判断结果。

在操作s223,根据边框坐标和判断结果确定预选框。

根据本公开的实施例,通过第一图像特征与卷积核做卷积得到预选框的边框坐标,可以确定预选框的实际大小和位置信息。并且,通过第一图像特征与卷积核做卷积还可以判断预选框中是否包含货品。

具体地,例如,图3b示意性示出了根据本公开实施例的根据第一图像特征确定预选框的示意图。

根据本公开的实施例,可以采用faster-rcnn算法生成预选框。如图3b所示,通过3*3*256的卷积进行降维,然后通过2个1*1*2*k和1*1*4*k的卷积,分别获得用于判断边框坐标表征的区域中是否包含有至少一个货品,得到对应的判断结果,以及相应的边框坐标。通过上述方式,避免了传统方法处理效率低的问题,通过卷积神经网络完成预选框的快速自动生成。

根据本公开的实施例,通过边框坐标可以确定预选框的区域,根据判断结果,可以确定预选框中是否有货品,根据边框坐标和判断结果可以确定包含货品的预选框,提高了统计效率。

图3c示意性示出了根据本公开实施例的对包含在预选框中的至少一个货品中的目标货品进行轮廓识别的流程图

在该实施例中,参考图2描述的操作s230(即对包含在预选框中的至少一个货品中的目标货品进行轮廓识别)可以包括操作s231~s233。如图3c所示,其中:

在操作s231,获取包含在预选框中的至少一个货品的第二图像特征。

在操作s232,根据第二图像特征对包含在预选框中的至少一个货品进行掩模分类。

在操作s233,根据掩模分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓。

根据本公开的实施例,在完成特征提取之后,将特征提取后得到的卷积图与不同卷积核做卷积,比如,通过1*1卷积操作,得到2k2(c+1)维的卷积层,其中k=3,c代表物体类别的个数;或者通过1*1卷积操作,将输入图像的特征图转化为4k2维的卷积图;在或者通过2个并行的1*1的卷积操作,将特征图转化为输入图像预选框的得分以及相应的边框坐标。

在完成特征提取以及预选框生成后,基于输入图像的特征图,还可以获取包含在预选框中的至少一个货品的第二图像特征,并根据第二图像特征对包含在预选框中的至少一个货品进行掩模分类,可以是对包含在预选框中的至少一个货品进行掩模预测,例如,通过计算特征图上每个像素位置inside和outside的两个分数,其中,inside就代表属于物体实例的前景,outside代表属于物体实例的背景。这两个分数值通过softmax(一种概率计算处理方式)处理变成概率,得到预选框里每个像素属于某一类的这个物体的前景部分的概率。例如,可以是得到预选框里每个像素属于有货品预选框中物体的前景部分的概率。根据有货品预选框中物体的前景部分的概率,进而可以确定包含在预选框中的至少一个货品中的目标货品的轮廓。

根据本公开的实施例,通过获取预选框中的货品的图像特征,达到了深度提取货品的图像特征的效果,通过对预选框中的货品进行掩模分类,可以精确区分预选框中的货品之间的边界,进而达到精确统计的效果。

图3d示意性示出了根据本公开另一实施例的货品处理方法的流程图。

在该实施例中,参考图3c描述的操作s232(即根据第二图像特征对包含在预选框中的至少一个货品进行掩模分类)可以包括操作s2321,操作s233(即根据掩模分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓)可以包括操作s2331。如图3d所示,其中:

在操作s2321,根据第二图像特征对包含在预选框的像素进行分类,得到像素分类结果。

在操作s2331,通过像素分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓。

根据本公开的实施例,根据第二图像特征对包含在预选框的像素进行分类可以是根据特征图上每个像素位置属于图片前景和背景的概率。属于图片前景和背景的概率值取最大值操作,得到每个像素属于某一类物体的似然(最大值操作的意义在于预选框里的每个像素都应该为类别做出贡献,不管它在物体里面还是外面,相当于融合全局的信息)。整个掩模分类的结果就是对所有像素位置取均值,得到这个预选框属于某一类物体的似然。通过概率计算可以获得掩模的类别。进而根据像素分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓。

图3e示意性示出了根据本公开另一实施例的货品处理方法的示意图。

如图3e所示,根据本公开的实施例,将特征提取后得到的卷积图与卷积核做1*1卷积操作,得到2k2(c+1)维的卷积层,其中k=3,c代表物体类别的个数。因此,将产生两组k*k个的特征图,每个特征是c+1维的,每个特征图表示一个像素在某个相对位置上属于某个类的某个物体实例且在物体边界内的似然,或者一个像素在某个相对位置上属于某个类的某个物体实例且在物体边界外的似然。

从2*(k*k)*(c+1)维的inside/outside特征图中,先确定一个预选框,假设是宽度和高度分别为w和h,可以在inside/outside特征图上找到预选框的对应部分,然后把预选框划分成k*k个子窗口,每个大小为w/k*h/k的子窗口直接从对应特征图上相同的子窗口复制数值,然后将这k*k个子窗口按照相对位置排列成w*h的窗口,得到的是两组(c+1)维的特征图,分别是inside和outside的特征图(inside代表属于物体内,outside代表属于物体外)。

例如,若要生成inside特征图左上角位置的特征,将第一组(k*k)*(c+1)维的特征图的第1个(c+1)维的特征图复制过来;若要生成inside特征图右上角位置的特征,将第一组(k*k)*(c+1)维的特征图第3个(c+1)维的特征图复制过来,以此类推。

根据本公开的实施例,基于第二图像特征对预选框的像素进行分类,并采用物体掩模获取货品的轮廓,实现了对预选框的二次检测,提高了图像中货品的检测率,进一步地,实现了对货品数量的精确统计。

根据本公开实施例,在根据边框坐标和判断结果确定预选框之后,方法还包括通过卷积操作和/或预选框中的至少一个货品的图像特征对预选框进行修正。

根据本公开的实施例,由于不同的卷积核可以提取不同的图像特征,根据不同的卷积操作对预选框进行修正,以及/或者根据确定的预选框中的至少一个货品的图像特征可以对预选框进行修正。

根据本公开的实施例,通过对预选框进行修正,可以精确确定预选框的坐标,提高统计效率。

根据本公开的实施例,通过确定包含货品的预选框,并对预选框内的像素进行了分类,获取了预选框内物体的轮廓,从而可以根据物体的轮廓获得包含物体面积的最小外接矩形。通过统计图像中矩形框的个数可以获取图像中商品的个数。

根据本公开的实施例,不管储位图片中商品处于什么样的形态,本公开可以获取包含货品的最小外界矩形,从而实现对货品位置的定位以及货品数量的精确统计。

图4示意性示出了根据本公开实施例的货品处理系统的框图。

如图4所示,货品处理系统400可以包括第一获取模块410、第一确定模块420、识别模块430和第二确定模块440。其中:

第一获取模块410,用于获取多个待处理货品的第一图像特征。

第一确定模块420,用于根据第一图像特征确定预选框,其中,预选框中包含多个待处理货品中的至少一个货品。

识别模块430,用于对包含在预选框中的至少一个货品中的目标货品进行轮廓识别。

第二确定模块440,用于根据轮廓识别结果确定预选框中包含的目标货品的数量和/或位置。

根据本公开的实施例,由于通过待处理货品的图像特征确定预选框,并对预选框中的的目标货品进行轮廓识别,根据预选框中的目标货品的轮廓确定目标货品的数量和位置的技术手段,所以至少部分地克服了相关技术中的货品处理方案检测货品时检测精度难以符合实际要求的技术问题,进而达到了对货品数量的精确统计和准确定位的技术效果。

图5a示意性示出了根据本公开实施例的第一确定模块的框图。

在该实施例中,参考图4中的第一确定模块420可以包括第一确定单元421、判断单元422和第二确定单元423。如图5a所示,其中:

第一确定单元421用于根据第一图像特征与第一预定卷积核做卷积确定边框坐标。

判断单元422用于根据第一图像特征与第二预定卷积核做卷积判断边框坐标表征的区域中是否包含有至少一个货品,得到对应的判断结果.

第二确定单元423用于根据边框坐标和判断结果确定预选框。

根据本公开的实施例,通过边框坐标可以确定预选框的区域,根据判断结果,可以确定预选框中是否有货品,根据边框坐标和判断结果可以确定包含货品的预选框,提高了统计效率。

图5b示意性示出了根据本公开实施例的识别模块的框图。

在该实施例中,参考图4中的识别模块430可以包括第一获取单元431、分类单元432和第三确定单元433。如图5b所示,其中:

第一获取单元431用于获取包含在预选框中的至少一个货品的第二图像特征。

分类单元432用于根据第二图像特征对包含在预选框中的至少一个货品进行掩模分类.

第三确定单元433用于根据掩模分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓。

根据本公开的实施例,通过获取预选框中的货品的图像特征,达到了深度提取货品的图像特征的效果,通过对预选框中的货品进行掩模分类,可以精确区分预选框中的货品之间的边界,进而达到精确统计的效果。

根据本公开的实施例,该货品处理系统还可以包括分类单元用于根据第二图像特征对包含在预选框的像素进行分类,得到像素分类结果;以及第三确定单元用于通过像素分类结果确定包含在预选框中的至少一个货品中的目标货品的轮廓。

根据本公开的实施例,基于第二图像特征对预选框的像素进行分类,并采用物体掩模获取货品的轮廓,实现了对预选框的二次检测,提高了图像中货品的检测率,进一步地,实现了对货品数量的精确统计。

图5c示意性示出了根据本公开另一实施例的货品处理系统的框图。

在该实施例中,该货品处理系统400除了可以包括上文参考图4和图5a描述的相应模块之外,还可以包括修正模块450。为了描述的简洁起见,这里省略对图4和图5a描述的相应模块的描述。

如图5c所示,该货品处理系统400还可以包括修正模块450,其中:

修正模块450用于在根据边框坐标和判断结果确定预选框之后,通过卷积操作和/或预选框中的至少一个货品的图像特征对预选框进行修正。

根据本公开的实施例,通过对预选框进行修正,可以精确确定预选框的坐标,提高统计效率。

图5d示意性示出了根据本公开另一实施例的货品处理系统的框图.

在该实施例中,该货品处理系统400除了可以包括上文参考图4描述的相应模块之外,还可以包括第二获取模块460和第三获取模块470。为了描述的简洁起见,这里省略对图4描述的相应模块的描述。

如图5d所示,该货品处理系统400还可以包括第二获取模块460和第三获取模块470,其中:

第二获取模块460用于在获取多个待处理货品的第一图像特征之前,获取展示有多个待处理货品的待处理图像。

第三获取模块470用于基于卷积神经网络获取多个待处理货品的第一图像特征。

可以理解的是,第一获取模块410、第一确定模块420、识别模块430、第二确定模块440、修正模块450、第二获取模块460和第三获取模块470可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,第一获取模块410、第一确定模块420、识别模块430、第二确定模块440、修正模块450、第二获取模块460和第三获取模块470中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一获取模块410、第一确定模块420、识别模块430、第二确定模块440、修正模块450、第二获取模块460和第三获取模块470中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。

需要说明的是,本公开的实施例中货品处理系统部分与本公开的实施例中货品处理方法部分是相对应的,货品处理系统部分的描述具体参考货品处理方法部分,在此不再赘述。

图6示意性示出了根据本公开实施例的适于实现货品处理方法的计算机系统的框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示,根据本公开实施例的计算机系统500包括处理器501,其可以根据存储在只读存储器(rom)502中的程序或者从存储部分508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行参考图2、图3a~图3e描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在ram503中,存储有计算机系统500操作所需的各种程序和数据。处理器501、rom502以及ram503通过总线504彼此相连。处理器501通过执行rom502和/或ram503中的程序来执行以上参考图2、图3a~图3e描述的各种操作。需要注意,所述程序也可以存储在除rom502和ram503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行以上参考图2、图3a~图3e描述的各种操作。

根据本公开的实施例,计算机系统500还可以包括输入/输出(i/o)接口505,输入/输出(i/o)接口505也连接至总线504。计算机系统500还可以包括连接至i/o接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。

根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

需要说明的是,本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom502和/或ram503和/或rom502和ram503以外的一个或多个存储器。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行:获取多个待处理货品的第一图像特征;根据第一图像特征确定预选框,其中,预选框中包含多个待处理货品中的至少一个货品;对包含在预选框中的至少一个货品中的目标货品进行轮廓识别;以及根据轮廓识别结果确定预选框中包含的目标货品的数量和/或位置。

以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1