一种过滤商品信息的方法及系统的制作方法

文档序号:6562359阅读:159来源:国知局
专利名称:一种过滤商品信息的方法及系统的制作方法
技术领域
本发明涉及计算机及通信领域,特别是过滤商品信息的方法及系统。
技术背景目前电子商务已得到广泛的应用,参与者越来越多,但网络市场没有一个 规范的市场秩序,每个个人或企业在网上发布商品信息时会根据自身情况比较 随意的定制商品Y介格,所以存在同一类型或型号的商品价格相差4艮大。而用户 总是希望能够购买到物美价廉的商品,所以用户就需要花费大量时间浏览网 页,以便了解同种商品可能出现的价格。同时存在一些个人或企业发布大量的虚假信息,利用超低价格吸引诱骗买家,导致网上交易的安全性降低;同时,大量的虚假信息也会消耗大量的网络资源。目前对于电子商务中信息的安全性审查多采用人工方式,工作量非常繁 重,并且在非工作时间发布的信息无法做安全性审查,存在安全隐患。发明内容本发明提供一种过滤商品信息的方法及系统,以提高网络信息的真实性和 提高网上业务的安全性。本发明提供以下技术方案 一种过滤商品信息的方法,包括步骤信息过滤系统根据每种商品的商品信息中指定的价格确定价格的分布范 围,并在该范围内划分多个价格区间段;根据各价格区间段中所述商品信息的分布数量占商品信息总数的比例,或 根据各价格区间段中所述商品分布数量占该商品总数的比例确定价格的控制
区间,其中所述价格的控制区间包括所述比例超过阈值的部分或全部价格区间段;所述信息过滤系统在接收到商品信息时,判断该商品信息中指定的商品价 格是否属于所述价格的控制区间,若是,则接受该商品信息,否则对该商品信 息进行过滤处理。确定价格的分布范围时,先将商品信息中指定的价格排序,根据一定的比 例去掉高端价格和低端价格及其对应的商品信息,然后根据剩余商品信息中指 定的价格确定价格的分布范围。划分多个价格区间段包括所述信息过滤系统根据所述价格的分布范围确定商品价格的平均值,并利 用分隔值除所述平均值得到价格间隔段;依据所述价格间隔段在所述分布范围内划分价格区间段,使每个价格区间 段的上、下限的差与所述价格间隔段相等。根据超过阈值的价格区间段确定基准价格区间,将该基准价格区间的上、 下限进行调整后确定所述价格的控制区间。存在多个超过阈值的价格区间段时,将该多个价格区间段进行筛选和/或合 并后确定所述基准价格区间。在接收到商品信息后,先对所述商品信息进行形式發汪,然后对發〖正通过 的商品信息做后续的价格判断。所述过滤处理包"^舌判断商品信息的归属类目是否正确,若不正确,则重新归类并对其价格是 否属于该类目下的价格控制区间进行判断,否则,进一步调整所述价格控制区 间,并判断商品信息中指定的价格是否属于调整后的价格控制区间,若是,则 接受该商品信息,否则拒绝接受该商品信息。将需要过滤处理的商品信息緩存到待检库,定期对待检库中的商品信息进 行过滤处理,并将处理后的商品信息从待检库中删除。
所述待;险库中的商品信息对发布者可见,对其他用户不可见。 通过数据仓库确定每种商品的商品信息或商品信息中商品的总数和每个 价格区间段中所述商品信息或商品的分部数量。
一种过滤商品信息的系统,包括
价格控制区间确定装置,用于根椐每种商品的商品信息中指定的价格确定 价格的分布范围,并在该范围内划分多个价格区间段;
价格控制区间确定装置,用于根据各价格区间段中所述商品信息的分布数 量占商品信息总数的比例,或根据根据各价格区间段中所述商品分布数量占该 商品总数的比例确定价格的控制区间,其中所述价格的控制区间包括所述比例 超过阈值的部分或全部价格区间段;
信息过滤装置,用于在接收到商品信息时,判断该商品信息中指定的商品 价格是否属于所述价格的控制区间,若是,则接受该商品信息,否则对该商品 信息进行过滤处理。
所述价格控制区间确定装置包括
区间划分模块,用于根据每种商品的商品信息中指定的价格确定价格的分 布范围,并在该范围内划分多个价格区间段;
确定模块,用于根据各价格区间段中所述商品信息的分布数量占商品信息 总数的比例,或根据根据各价格区间段中所述商品分布数量占该商品总数的比 例确定价格的控制区间,其中所述价格的控制区间包括所述比例超过阈值的部 分或全部价格区间段。
所述价格控制区间确定装置包括
数据仓库,用于确定每种商品的商品信息或商品的总数和每个价格区间段 中所述商品信息或商品的分部数量。 所述信息过滤装置包括 接收模块,用于在接收商品信息;
过滤模块,用于判断接收到的商品信息中指定的商品价格是否属于所述价格的控制区间,若是,则接受该商品信息,否则对该商品信息进行过滤处理。所述信息过滤装置还包括审核处理模块,用于判断不属于所述价格的控制区间的商品信息的归属类 目是否正确,若不正确,则重新归类并对其价格是否属于该类目下的价格控制 区间进行判断,否则,进一步调整所述价格控制区间,并判断商品信息中指定 的价格是否属于调整后的价格控制区间,若是,则接受该商品信息,否则拒绝 接受该商品信息。本发明有益效果如下1、 本发明通过确定价格控制区间对用户发布的信息进行过滤,将其价格 不属于价格控制区间的商品信息放入待检库做进一步核实,对属于该区间内的 商品信息准许发布;使价格虛假的商品信息不能被发布,维护了网上业务的安 全,减少用户上当的可能。2、 对待检库中的信息做进一步核实,可以使商品的归属类目更规范,也 可以发现信息安全仅由于类目不准确而被过滤掉的信息,并且较好的适应市场 价格的变化。3、 在规范价格的同时也使用户减少浏览信息的时间,降低用户的时间成本。4、 本发明自动对商品信息进行过滤,大幅度减少了人工操作,并且实现 了在非工作时间对信息进行有效的监控。


图1A为本实施例中过滤信息的系统示意图;图1B为本实施例中价格控制区间确定装置示意图;图2为本实施例中确定价格控制区间的方法流程图;图3为本实施例中信息过滤装置示意图;图4为本实施例中过滤信息的方法流程图。
具体实施方式
为了解决目前网络中存在虚假信息的问题,本发明通过确定价格控制区间 过滤出虚假信息,保证网络商品信息的真实。 本实施例以 一款商品为例进行说明。参见图1A,本实施例中信息过滤系统包括价格控制区间确定装置IO和信 息过滤装置11。该价格控制区间确定装置IO和信息过滤装置11可以是相互独 立的物理实体,也可以为同一物理实体。价格控制区间确定装置10对商品信息的分部划分区间,并根据每个区间 内商品信息的数量占总商品信息数量的比例确定价格区间波峰,对价格区间波 峰调整后确定价格控制区间。信息过滤装置11对接收到的商品信息进行基本验证,再根据价格控制区 间确定装置10确定的价格控制区间对验证通过的商品信息进行过滤,以及进 一步对过滤不合格的商品信息进行审核处理。参见图1B,本实施例中价格控制区间确定装置10包括区间划分模块101、 波峰确定模块102、价格控制区间模块103、数据仓库104和参数接收模块105。 可将波峰确定模块102和价格控制区间模块103的功能由确定模块完成。数据仓库104存储和分析关于各类商品的数据,包括商品信息或商品总量, 每个价格区间内的商品信息或商品数量。参数接收模块105接收各种参数信息。包括价格波峰的百分比、合并的 价格间隔段、下调的价格间隔段和上调的价格间隔段。和高端价格去掉,对剩下的基本价格段划分等间距的价格区间段。波峰确定模块102根据每个价格区间段内的商品信息数量占总商品信息数量的百分比,或商品数量占总商品数量的百分比确定某一个或某几个价格区间段为价格区间波峰。价格控制区间模块103根据价格区间波峰和合并的价格间隔段确定基准价
格区间段,根据下调的价格间隔段和上调的价格间隔段将调整后的基准价格区 间段确定为市场价格控制值(价格控制区间)。
参见图2,本实施例中确定^f介格控制区间的具体步骤如下
步骤201:首先使用数据仓库统计某类商品的信息数据量并判断该信息数 据量是否不小于基础数据量(可通过参数设定),若是,则在该信息数据量的 基础上确定基本价格段,否则该类商品不适用本方法。也可以根据商品信息中 的商品数量进行判断,本实施例只是提供一种较佳的方式。
确定基本价格段。使用数据仓库将商品信息中的价格进行排序,去掉高位 价格和低位价格,本实施例中去掉价格序列中两端的各1% ,(该1 %可通过参 数设定)。剩下的价格序列中的最高价格和最低价格所确定的范围就为基本价 格段。不同的商品可能有不同的基本价格段,本实施例中为100至100000。
步骤202:在基本价格段上划分价格区间,确定价格区间段。首先确定在 基本价格段内的所有出现的价格的中间值,本实施例中为平均值,如平均值为 1000;将平均值除以分隔值得到价格间隔段,本实施例中通过统计采样确定分 隔值为50,(可通过参数形式设定),即将平均值划分50个区间,那么1000 + 50 = 20,即价格间隔段为20,每个价格区间段的幅度为20。
步骤203:通过数据仓库分析和统计出该商品在每个价格区间段的分部数量。
步骤204:获取参数信息,将各参数值作为基础数据。参数包括价格波 峰的百分比、合并的价格间隔段、下调的价格间隔段和上调的价格间隔段。
价格波峰的百分比用于判断价格区间波峰,在某价格区间段内的商品数量 占总商品数量的百分比不小于价格波峰的百分比时确定该价格区间段为价格 区间波峰。本实施例中价格波峰的百分比为5%,即达到5%时就认为是价格 区间波峰。该参数通过数据分析热门和冷门的价格区间商品的数量分部情况, 确定合适的百分比。
合并的价格间隔段,判断在两个相邻价格区间波峰之间的间隔在价格间隔
段内时就可以将两个相邻价格区间波峰合并。
下调的价格间隔段N和上调的价格间隔段M在确定市场价格控制值时使 用,为了使最终确定的市场价格控制值能够适应短期(本实施例中为7天)内
市场价格的变化。
所述步骤204可以与步骤201 、 202和203同时进行。
步骤205:确定价格区间波峰。计算出每个价格区间段内的商品数量占总 商品数量的百分比,将每个价格区间段的数量百分比与价格波峰的百分比比 较,不小于价格波峰的百分比的价格区间段被确定为价格区间波峰。
如果没有一个价格区间段的数量百分大于或等于价格波峰的百分比时,说 明该商品不适用本方法,退出该流程。
步骤206:确定基准价格区间段。当只有一个价格区间波峰时,该价格区 间波峰即为基准价格区间段;当有多个价格区间波峰时,判断每两个相邻的价 格区间波峰的间隔是否不大于合并的^f介格间隔段,若是,则将这两个相邻的价 格区间波峰合并,作为基准价格区间段;否则,步骤202中所述平均值所在的 价格区间波峰作为基准价格区间段,或者将距离所迷平均值最近的两个价格区 间波峰合并,作为基准价格区间段。
步骤207:确定最终的市场价格控制值(包括市场最低价裆:控制值和市场 最高价格控制值),即价格控制区间。将基准价格区间段的下限根据N值再一 次下调N个价格区间段,得到市场最低价格控制值;将基准价格区间段的上限 根据M值再一次上调M个价格区间段,得到市场最高价格控制值,调整后的 基准价格区间段的上下限即为市场价格控制值。
本实施例将确定的市场价格控制值作为过滤信息的条件,检验卖家发布的 信息的安全性。
参见图3,本实施例中信息过滤装置11包括接收模块301、基本验证模块 302、过滤模块303、审核处理模块304和存储模块305。 接收模块301接收用户发布的信息。 基本验证模块302对用户发布的信息进行基本的验证,包括非法关键字验 证、信息非空验证以及数字正确性验证等。过滤模块303从价格控制区间确定装置10处获取市场价格控制值,将基 本验证模块302验证通过的信息根据价格控制区间确定装置确定的市场价格控 制值进行过滤,将过滤通过的信息在网上发布,使所有用户都可以查询到此信 息,不通过的信息存储到存储模块305里。审核处理模块304对存储模块305里的信息进一步审核,主要审核该商品 的价格和所属类目;检查用户指定的商品类目与商品的名称是否能够对应,可通过类目库进行判断,如果是由于类目错误,那么经过类目的调整再一次将该 信息送到过滤模块303进行过滤;可通过调整市场价格控制值再一次过滤信息, 判断信息中的价格是否属于调整后的市场价格控制值的范围内,如果是,则在 网上发布该信息,否则撤销该信息并通知该用户。存储模块305即待检库,存储过滤模块303过滤掉的信息,删除审核处理 模块304审核后的信息。参见图4,本实施例中过滤信息的方法的具体流程如下步骤401:接收用户发布的信息。步骤402:对用户发布的信息进行基本验证。根据非法关键字库验证用户 指定的关键字是否合法,并且验证用户指定的关键字是否与信息的标题一致; 检验信息中必须输入的字段是否为空;对用户输入的数字是否合法进行验证。步骤403:若上述验证均通过,则执行步骤404,做进一步的检验,否则 执行步骤410。步骤404:根据确定的市场价格控制值对用户发布的信息进行过滤,判断 该信息是否为安全信息。步骤405:判断信息中指定的价格是否在市场价^^空制值的范围内,若是, 则执行步骤409,否则执行步骤406。步骤406:将过滤掉的信息放入待检库,等待下一步审核。待检库中的信
息只有发布者可以看到。步骤407:对待检库里的信息进行审核,验证该信息的所属类目和价格, 进一 步判断该信息是否为安全信息。步骤408:若用户将信息归属的类目准确,并且通过调整市场价格控制值 后信息中的价格在调整后的市场价格控制值内,则执行步骤409,否则执行步 骤410。步骤409:信息通过验证,该信息为安全信息,发布该信息。步骤410:信息没有通过验证,不能在网上发布,通知发布者拒绝发布的原因。本实施例可以通过参数进一步控制应用本方法的商品,并且可以在用户发 布消息的过程中提示用户可指定的价格范围,可不限定价格的上限。本发明通过确定价格控制区间对用户发布的信息进行过滤,将不属于价格 控制区间的价格的信息放入待检库做进一步核实,对属于该区间内的信息准许 发布;使价格虚假的信息不能被发布,维护了网络安全,减少用户上当的可能, 并且在规范价格的同时也使用户减少浏览信息的时间。对待检库中的信息做进 一步核实,可以使商品的归属类目更规范,也可以发现信息安全仅由于类目不 准确而被过滤掉的信息。并且本发明可灵活控制对哪类商品应用本发明。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求 及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1、一种过滤商品信息的方法,其特征在于,包括以下步骤信息过滤系统根据每种商品的商品信息中指定的价格确定价格的分布范围,并在该范围内划分多个价格区间段;根据各价格区间段中所述商品信息的分布数量占商品信息总数的比例,或根据各价格区间段中所述商品分布数量占该商品总数的比例确定价格的控制区间,其中所述价格的控制区间包括所述比例超过阈值的部分或全部价格区间段;所述信息过滤系统在接收到商品信息时,判断该商品信息中指定的商品价格是否属于所述价格的控制区间,若是,则接受该商品信息,否则对该商品信息进行过滤处理。
2、 如权利要求1所述的过滤商品信息的方法,其特征在于,确定价格的 分布范围时,先将商品信息中指定的价格排序,根据一定的比例去掉高端价格 和低端价格及其对应的商品信息,然后根据剩余商品信息中指定的价格确定价 格的分布范围。
3、 如权利要求2所述的过滤商品信息的方法,其特征在于,划分多个价 格区间段包括所述信息过滤系统根据所述价格的分布范围确定商品价格的平均值,并利 用分隔值除所述平均值得到价格间隔段;依据所述价格间隔段在所述分布范围内划分价格区间段,使每个价格区间 段的上、下限的差与所述价格间隔段相等。
4、 如权利要求1所述的过滤商品信息的方法,其特征在于,根据超过阈 值的价格区间段确定基准价格区间,将该基准价格区间的上、下限进行调整后 确定所述价格的控制区间,
5、 如权利要求4所述的过滤商品信息的方法,其特征在于,存在多个超 过阈值的价格区间段时,将该多个价格区间段进行筛选和/或合并后确定所述基准^介格区间。
6、 如权利要求1所述的过滤商品信息的方法,其特征在于,在接收到商品信息后,先对所述商品信息进行形式上的验证,然后对验证通过的商品信息 做后续的价格判断。
7、 如权利要求1至6中任一项所述的过滤商品信息的方法,其特征在于, 所述过滤处理包括判断商品信息的归属类目是否正确,若不正确,则重新归类并对其价格是 否属于该类目下的价格控制区间进行判断,否则,进一步调整所述价格控制区 间,并判断商品信息中指定的价格是否属于调整后的价格控制区间,若是,则 接受该商品信息,否则拒绝接受该商品信息。
8、 如权利要求7所述的过滤商品信息的方法,其特征在于,将需要过滤 处理的商品信息援存到待检库,定期对待检库中的商品信息进行过滤处理,并 将处理后的商品信息从4争检库中删除。
9、 如权利要求8所述的过滤商品信息的方法,其特征在于,所述待检库 中的商品信息对发布者可见,对其他用户不可见。
10、 如权利要求1所述的过滤商品信息的方法,其特征在于,通过数据仓 库确定每种商品的商品信息或商品信息中商品的总数和每个价格区间段中所 述商品信息或商品的分部^t量。
11、 一种过滤商品信息的系统,其特征在于,包括价格控制区间确定装置,用于根据每种商品的商品信息中指定的价格确定 价格的分布范围,并在该范围内划分多个价格区间段;价格控制区间确定装置,用于根据各价格区间段中所述商品信息的分布数 量占商品信息总数的比例,或根据根据各价格区间段中所述商品分布数量占该 商品总数的比例确定价格的控制区间,其中所述价格的控制区间包括所述比例 超过阈值的部分或全部价格区间段;信息过滤装置,用于在接收到商品信息时,判断该商品信息中指定的商品价格是否属于所述价格的控制区间,若是,则接受该商品信息,否则对该商品 信息进行过滤处理。
12、 如权利要求11所述的过滤商品信息的系统,其特征在于,所迷价格 控制区间确定装置包括区间划分模块,用于根据每种商品的商品信息中指定的价格确定价格的分 布范围,并在该范围内划分多个价格区间段;确定才莫块,用于根据各价格区间l^中所述商品信息的分布数量占商品信息 总数的比例,或根据根据各价格区间段中所述商品分布数量占该商品总数的比 例确定价格的控制区间,其中所述价格的控制区间包括所述比例超过阈值的部 分或全部价格区间段。
13、 如权利要求12所述的过滤商品信息的系统,其特征在于,所述价格 控制区间确定装置包括数据仓库,用于确定每种商品的商品信息或商品的总数和每个价格区间段 中所述商品信息或商品的分部数量。
14、 如权利要求11所述的过滤商品信息的系统,其特征在于,所迷信息 过滤装置包括接收it块,用于在接收商品信息;过滤模块,用于判断接收到的商品信息中指定的商品价格是否属于所述价 格的控制区间,若是,则接受该商品信息,否则对该商品信息进行过滤处理。
15、 如权利要求14所述的过滤商品信息的系统,其特征在于,所述信息 过滤装置还包括审核处理模块,用于判断不属于所述价格的控制区间的商品信息的归属类 目是否正确,若不正确,则重新归类并对其价格是否属于该类目下的价^"控制 区间进行判断,否则,进一步调整所述价格控制区间,并判断商品信息中指定 的价格是否属于调整后的价格控制区间,若是,则接受该商品信息,否则拒绝 接受该商品信息。
全文摘要
本发明公开了一种过滤信息的方法及系统,以提高网络信息的真实性和提高网上业务的安全性。本发明中信息过滤系统根据每种商品的商品信息中指定的价格确定价格的分布范围,并在该范围内划分多个价格区间段;根据各价格区间段中所述商品信息的分布数量占商品信息总数的比例,或根据各价格区间段中所述商品分布数量占该商品总数的比例确定价格的控制区间,其中所述价格的控制区间包括所述比例超过阈值的部分或全部价格区间段;所述信息过滤系统在接收到商品信息时,判断该商品信息中指定的商品价格是否属于所述价格的控制区间,并做相应的处理。该系统包括价格控制区间确定装置和信息过滤装置。
文档编号G06Q90/00GK101154287SQ20061014065
公开日2008年4月2日 申请日期2006年9月29日 优先权日2006年9月29日
发明者刘云辉 申请人:阿里巴巴公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1