一种从实际应用数据中提取潜在可用知识的方法与流程

文档序号：13983044阅读：137来源：国知局

本发明设计数据提取技术领域，特别涉及一种从实际应用数据中提取潜在可用知识的方法。

背景技术：

internet在世界范围内普及的同时，人们在互联网上各个方面的需求也越来越大，基于web的商业交易成为电子商务迅猛发展的重要因素，海量的web页面也蕴含了大量反映用户需求的知识，而web数据挖掘也将大有用武之地，web数据挖掘技术在电子商务中的应用将极大地提高电商企业的竞争能力，数以亿计的web页面及其链接和服务器日志中蕴藏着有意义的用户访问模式和相关的潜在用户群知识，充分运作挖掘到的这些知识，从中提取商业决策支持的关键性数据，改进web站点设计，能够更好地开展电子商务活动。

技术实现要素：

获取竞争对手和客户信息。web不仅由页面组成，而且还包含了从一个页面指向另一个页面的超链接。一个web页面的作者建立指向另一个页面的指针，就可以看作是作者对另一页面的认可。把另一页面的来自不同作者的注解收集起来，就可以用来反映该页面的重要性，并可以很自然地用于权威页面的发现。另外一种重要的web页面是一个或多个web页面，它提供了指向权威页面的链接集合，称为hub。hub页面本身可能并不突出，或者说可能没有几个链接指向它们，但是hub页面却提供了指向就某个话题而言最为突出的站点的链接。通过分析这类信息，企业可以获得零售商、中间商、合作商以及竞争对手的信息。

发现用户访问模式。通过分析和探究web日志记录中的规律，可以识别电子商务的潜在客户，提高对最终用户的服务质量，并改进web服务器系统的性能。web日志记录数据库提供了有关web动态的，基于url、时间、ip地址和web页面内容的丰富信息，对它们进行分析，有助于发现潜在客户、用户和市场,有助于聚类用户并将用户分门别类，以实现个性化的市场服务。

反竞争情报活动。反竞争情报是企业竞争情报活动的重要组成部分。忽视竞争对手的竞争情报活动、低估竞争对手搜集竞争情报的能力势必导致企业失去已有的竞争优势。web站点是企业与外界进行交流的窗口，同时也是竞争对手获取竞争情报的一个重要信息源。在竞争情报计算机系统中，可以充分利用web挖掘技术，通过运用分析访问者的ip地址、客户端所属域、信息访问路径，统计敏感信息访问率等方法识别竞争对手，保护企业敏感性信息。

技术特征：

技术总结
本申请公开了一种从实际应用数据中，提取潜在可用知识的方法，该方法包括：Web内容挖掘，对Web文档内容或其描述的数据进行挖掘，一般以文本内容的挖掘居多，主要包括HTML、XML等结构性标记语言，是Internet环境中跨平台的、依赖内容的技术，Web内容挖掘常用的方法有Web OQL和Ahoy以及基于软件Agent的分类器方法；Web使用挖掘，通过分析服务器端用户访问记录抽取用户的兴趣和习惯，保留用户访问日志，记录每位登录用户的访问和交互信息，分析这些信息可用于对用户行为进行预测，从而改进Web站点结构，以便提供个性化的产品信息和服务。本申请保证了商业决策支持的关键性数据的充分提取，改进了Web站点设计，有利于企业更好地开展电子商务活动。

技术研发人员：余漫游
受保护的技术使用者：湖南移商动力网络技术有限公司
技术研发日：2016.09.12
技术公布日：2018.03.20

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：余漫游
技术所有人：湖南移商动力网络技术有限公司
我是此专利的发明人

上一篇：一种小口径大功率的超重低音喇叭的制作方法
上一篇：喇叭组件和电子设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。