基于网络化运营的产品布局分析系统的制作方法

文档序号:9788028阅读:273来源:国知局
基于网络化运营的产品布局分析系统的制作方法
【技术领域】
:
[0001]本发明涉及产品网络化运营技术领域,具体地说是一种能够有效提取现有信息,并根据现有信息给出相对精确的预测结果的基于网络化运营的产品布局分析系统。
【背景技术】
:
[0002]复杂产品的运营过程中,前期需要对产品进行投资规划,投资规划的设定需要根据市场占有率以及用户偏好制定,现有的市场可行性报告通过工作人员人工统计后,推算获得,随着科技的发展,互联网得到了大规模应用,Web网页在存在大量有价值的信息的同时也存在大量诸如导航、版权、广告等与正文无关的噪声信息。噪声信息的存在使得后续信息服务的数据质量无法保证。从网页中提取有价值的内容来保证数据质量无疑可以为后续的网页信息处理应用奠定基础。在信息搜索、信息过滤、文本分类、文本聚类、文摘等应用中,去除掉网页中的噪声信息,提取网页的内容是非常重要的一步。比如在信息搜索中,在去除掉噪声信息的网页内容基础上建立索引可以有效地提高搜索的准确率;而在信息过滤、文本分类、文本聚类和网页自动摘要等应用中,准确的网页内容对系统的性能有很大的提升作用。

【发明内容】

:
[0003]本发明针对现有技术中存在的缺点和不足,提出了一种能够有效提取现有信息,并根据现有信息给出相对精确的预测结果的基于网络化运营的产品布局分析系统。
[0004]本发明可以通过以下措施达到:
[0005]—种基于网络化运营的产品布局分析系统,其特征在于设有信息处理中心服务器,所述信息处理中心服务器中设有数据提取单元、数据预处理单元、数据挖掘单元以及数据输出单元,其中所述数据提取单元包括用于获取现有用户数以及用户指标特征的现有用户数据提取单元、用于获取某一区域用户偏好的潜在用户数据提取单元,所述潜在用户数据提取单元设有文本类数据处理单元以及图像类数据处理单元,所述图像类数据处理单元设有对图片进行视觉布局分析的布局块生成单元、对每个布局块进行光学字符识别,以生成所述布局块的识别文本的文本生成模块、对所述网页进行分析,以建立所述网页的文档对象模型树的文档对象模型树模块、利用所述文档对象模型树中的文本节点的真实文本与所述布局块的识别文本之间的对应关系,将所述文档对象模型树中的每个文本节点映射到所述布局块之一中的文本映射模块。
[0006]本发明所述现有用户数据提取单元包括数据获取模块、数据预处理模块、数据挖掘模块以及数据输出模块,所述数据获取模块用于获取某地区一段时间内的用户数,以及业务中对于用户数有影响的5个指标,包括:市场占有率、产品普及率、每月节假日天数、居民可支配收入及常驻人口数;所述数据预处理模块用于对数据获取模块采集的数据进行归一化处理。
[0007]本发明所述潜在用户数据提取单元中的文本类数据处理单元包括字符串接收单元、相关性特征值计算单元和相关性特征值拟合单元,其中:字符串接收单元,用于接收第一字符串和第二字符串;相关性特征值计算单元,用于计算第一字符串与第二字符串的文本相关性特征值以及第一字符串与第二字符串的语义相关性特征值;相关性特征值拟合单元,用于基于逻辑回归模型将所述文本相关性特征值与语义相关性特征值拟合成第一字符串与第二字符串的相关性特征值。
[0008]本发明所述潜在用户数据提取单元中的图像类数据处理单元也包括字符串接收单元、相关性特征值计算单元和相关性特征值拟合单元,其中:字符串接收单元,用于接收第一字符串和第二字符串;相关性特征值计算单元,用于计算第一字符串与第二字符串的文本相关性特征值以及第一字符串与第二字符串的语义相关性特征值;相关性特征值拟合单元,用于基于逻辑回归模型将所述文本相关性特征值与语义相关性特征值拟合成第一字符串与第二字符串的相关性特征值。
[0009]本发明所述数据挖掘单元中设有神经网络模型,包括四层,第一层有I个神经元,第二层有I个神经元,第三层有6个神经元,第四层有I个神经元;第一层的神经元为时间序列,第二层的神经元为网络参数初始值,第三层6个神经元为第一层时间序列中对应时间的用户数以及对应5个指标,第四层为输出的预测的用户数;其中第一层次中,对时间序列进行建模,将时间序列数据转化为微分方程。
[0010]本发明与现有技术相比,能够对大量的现有数据进行抓取、分析,进而给出某一复杂产品的市场预估结果,具有估算准确、效率高等显著的优点。
【附图说明】
:
[0011]附图1是本发明的系统框图。
[0012]附图标记:信息处理中心服务器1、数据提取单元2、数据预处理单元3、数据挖掘单元4、数据输出单元5。
【具体实施方式】
:
[0013]下面结合附图对本法明作进一步的说明。
[0014]如附图所示,本发明提出了一种基于网络化运营的产品布局分析系统,其特征在于设有信息处理中心服务器I,所述信息处理中心服务器中设有数据提取单元2、数据预处理单元3、数据挖掘单元4以及数据输出单元5,其中所述数据提取单元2包括用于获取现有用户数以及用户指标特征的现有用户数据提取单元、用于获取某一区域用户偏好的潜在用户数据提取单元,所述潜在用户数据提取单元设有文本类数据处理单元以及图像类数据处理单元,所述图像类数据处理单元设有对图片进行视觉布局分析的布局块生成单元、对每个布局块进行光学字符识别,以生成所述布局块的识别文本的文本生成模块、对所述网页进行分析,以建立所述网页的文档对象模型树的文档对象模型树模块、利用所述文档对象模型树中的文本节点的真实文本与所述布局块的识别文本之间的对应关系,将所述文档对象模型树中的每个文本节点映射到所述布局块之一中的文本映射模块。
[0015]本发明所述现有用户数据提取单元包括数据获取模块、数据预处理模块、数据挖掘模块以及数据输出模块,所述数据获取模块用于获
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1