智能网站系统的制作方法

文档序号:12464883阅读:481来源:国知局
智能网站系统的制作方法与工艺

本发明一种智能网站系统。



背景技术:

随着计算机技术的发展,为了能够适应开放动态的网络环境,融合异构的硬件资源以及满足不断变化的用户需求,要求网站系统能够在运行时自主地感知自身和环境的变化,并随着这种变化按照功能指标和性能指标进行动态调整和演化,从而提供高质量、可持续的服务,进而满足用户的需求。具备这种能力的网站也叫智能网站,一个自适应周期包括感知、决策和执行环节,三个环节分别要求实现情境空间与目标系统的数据融合,智能的决策以及系统在线动态演化。

同时,网站个性化信息服务也正在由基于用户当前浏览页面的信息推荐服务方式向基于信息结构自适应调整的敏捷服务方式发展。太原理工大学计算机与软件学院的余雪丽教授在其全国教育科学“十五”规划国家重点课题《信息化进程中的教育技术发展研究》子课题研究报告(基于XML和学习对象技术的e-Learning系统平台研究)中,研究了个性化智能e-learning系统平台及其构建理论、方法和技术,并且提出了从需求到软件体系结构的映射的模型,丁博、王怀民等人在“构造具备自适应能力的软件”一文中提出,软件自适应的实现技术跨越了软件监控、上下文敏感计算、决策和控制理论、软件演化和维护等多个学科分支,从自适应软件构造与实现这一角度出发,以“感知-决策-执行”软件自适应基本周期为主线,对已有的研究和实践进行综述,给出软件自适应的概念内涵,概述软件自适应活动在感知、决策、执行各环节上的特征分类,阐述面向自适应软件构造、关注程度较高的一系列使能技术,给出自适应软件构造领域的未来主要研究趋势。

近来,人们越来越认识到在整个软件开发生命周期内需求的变化是不可避免的。正是这种认识导致了开始对动态软件体系结构(Dynamic Software Architecture)、软件开发框架(Software Development Frameworks)及自适应软件(Self-adapting Software)等领域的研究。

一般的自适应软件(或动态体系结构网站)采用了一种映射机制,也就是解决需求分析到体系结构的映射问题。一个系统除了从需求方面描述外,还要从它的静态结构、动态行为以及实现上来描述。需求模型、结构模型、行为模型和实现模型就构成了系统的不同视图,从不同的视图观察系统可得到不同的结论。因此,动态软件体系结构也可由一组彼此内在联系的视图来表示,每一个视图反映软件体系结构的某个方面。四个模型并不是孤立的,而是相互依赖、相互约束的。在描述系统软件体系结构中尤其如此。只有分析清楚各个模型间映射关系,才能使得开发人员准确、一致地理解体系结构,从而有利于系统的开发。

但是由于该映射机制过于复杂,而且比较适合大型软件体系结构的描述,是一项庞大的系统工程,需要遵循大型、软件密集型复杂系统的开发原则进行。对于一般的动态结构的网站显得不太适合。



技术实现要素:

本发明的目的是提供一种更轻型的更实用的智能网站系统

为了达到上述目的,本发明的技术方案是提供了一种智能网站系统,包括浏览器及与浏览器进行信息交互的Web服务器,其特征在于,还包括:

Web用户信息挖掘单元,用于从Web服务器日志文档中挖掘用户兴趣模型,保存到数据库服务器;

Web结构控制器,用于读取用户兴趣模型数据,依据用户兴趣模型数据调增网站信息结构中的内容结构后动态合成页面,用户通过浏览器访问Web服务器后获取页面;

网站页面分为栏目页、主题页和文档页三种类型,栏目页由链接着下级栏目页和主题页的导航条区和直接链接文档页的链接区组成,主题页没有下级栏目页,只有直接链接文档的链接区,文档页主要显示原始信息,则动态合成页面包括以下步骤:

步骤1、应用服务器的导航条区生成器从网站形式结构库中取出其下级栏目数据,生成栏目页的导航条区;

步骤2、链接区生成器依据用户兴趣模型数据确定栏目页下属各栏目在链接区中显示区域的大小和位置,然后使用数据过滤器依据用户兴趣模型数据所反映的用户兴趣度顺序筛选的信息,在各子栏目相应的区域内组织指向原始文档的链接;

当用户申请主题页时,链接区生成器使用数据过滤器依据用户兴趣度顺序优先筛选的信息,在页面上组织指向原始文档的链接,连续使用前后链接着的多个页面连续组织链接。

优选地,所述用户兴趣模型通过以下方法生成:

统计用户浏览历史的每一个特征词的词频,并结合该特征词出现的位置和浏览的时间长短、时间先后的新近度,对每一个特征词赋予一个兴趣权值,表示用户行为中对该特征词的兴趣程度,得到该用户兴趣模型。

优选地,所述网站信息结构包括形式结构Sf以及内容结构Sct,其中:

所述形式结构Sf是该网站内容的分类体系结构Scl在网站上的一个映射G(Scl),Sf=G(Scl);

所述内容结构Sct是当前用户的兴趣偏好P(t)在网站的一个映射,Sct=F(P(t)),F为基于用户偏好的网站结构调整机制;

网站t时刻的信息结构为St,St=H(F(P(t)),G(Scl)),H为网站的自适应信息结构模式。

本发明吸收已有的信息推荐等技术,互相结合、互为补充,便于用户拓展兴趣空间。

附图说明

图1为智能网站的结构模型;

图2为网站内容分类体系;

图3为智能网站的概念模型;

图4为虚拟网站结构;

图5为网站结构合理性示意图。

具体实施方式

为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。

本发明提供的一种智能网站系统基于如下定义:

【定义1】:网站的信息结构,是网站依托网页链接结构而进行信息展示的信息元间的位置关系。

据此定义,信息结构可分解为两层,一层是信息展示所依托的网页链接结构,称之为形式结构。另一层是网页链接结构中不同结点位置上的不同信息元组成的信息关系,称之为内容结构。

【定义2】:垂直网站的形式结构Sf是该网站内容的分类体系结构Scl在网站上的一个映射G(Scl)。

Sf=G(Scl)

【定义3】:垂直网站的内容结构Sct是当前用户(群)的兴趣偏好P(t)在网站的一个映射。

Sct=F(P(t))

其中,F:基于用户偏好的网站结构调整机制,P(t)即为t时刻上的兴趣快照。

【定义4】:设用户兴趣为P(t),垂直网站的内容的分类体系结构为Scl,则垂直网站t时刻的信息结构St为:

St=H(F(P(t)),G(Scl))

上式表示,垂直网站的信息结构是由分类体系决定的(静态的)形式结构和适应用户兴趣变化而动态调整的(动态的)内容结构所构成的。我们把这种结构构成机制H,叫做垂直网站的自适应信息结构模式。

【定义5】:网站上网页间的距离:

1、两直接相连的网页间的距离为2。间接相连的网页间的距离为相连路径上的网页数之和。

2、网页到自身的距离为1。

3、网页到主页的最短距离为该网页的中心距离。

【定义6】:网站信息的显现度是该信息“易被浏览到的程度”。网站信息的显现度由信息所在页的中心距离和信息在页内所处的位置、显示方式确定。

信息的显现度与该网页中心距离成反比例关系。

【定义7】:兴趣度是用户对信息感兴趣的程度。

用户兴趣就是垂直网站特征空间或主题空间的一个向量。该向量在主题空间各维(轴)上的分量,即为用户对该主题的兴趣度。用户对某栏目或子栏目的兴趣度为该栏目或子栏目下属各主题兴趣度之和。

本发明中基于用户行为分析的智能网站信息结构调整模型如图1所示。在该模型中:

1)Web用户信息挖掘单元。从Web服务器日志文档中挖掘用户模式,保存到数据库服务器。

2)Web结构控制器。读取用户兴趣模型数据、构建与之相适应的网站信息结构控制信息、并根据此控制信息刷新网站,实现结构调整。

我们统计用户浏览历史的每一个特征词的词频,并结合该特征词出现的位置和浏览的时间长短、时间先后的新近度,对每一个特征词赋予一个兴趣权值Wi,表示用户行为中对该特征词的兴趣程度,得到该用户兴趣描述模型:

P(w1,w2,w3,…,wn)

对于网站内容(信息元、栏目等)也使用相同空间上的向量表示,便于将用户的兴趣和网站的内容进行比较运算。垂直网站上,除了定义特征空间,还可以定义主题空间。

在本发明中,垂直网站内容的粒度与主题分别定义如下:

1)垂直网站内容的粒度:垂直网站根据信息聚集的程度大小分为栏目和多级子栏目。栏目级次越低的子栏目,栏目主题范围越窄,粒度越小。网站内容的分类体系如图2。

2)垂直网站的主题:定义不再设置下级类目的子类(叶子类)为垂直网站的主题。主题可包含多篇文档,文档是网站内容粒度最小的单位。

在本发明中,智能网站的信息结构动态调整的概念模型包含如下内容:

智能网站的信息结构的调整对象是信息内容结构。智能网站信息结构调整的目标是根据用户的兴趣,在虚拟网站不同层次的页面中合理安排链接信息,以最大限度地适应用户的兴趣偏好。

1.1智能网站的信息结构动态调整的概念模型

网站所要展示的全部信息,以文件系统或数据库系统的存储形式保存在服务器。其中元数据存储的结构包括原始文档的标题、作者、URL、文档类型、所属主题(分类体系中的主题),产生、修改时间等等,智能网站的概念模型如图3。

网站形式结构是网站结构的基本框架,不作为自动调整对象。保存在形式结构库中,数据字段主要有:栏目(主题)名称,上级栏目、页面生成程序名等等。

[XML描述]

每个用户的兴趣偏好数据保存在用户兴趣模型库。该库的数据字段包括:用户标识、兴趣向量、IP地址等。

1.2智能网站信息结构调整机制

1)虚拟网站结构与页面类型

动态生成的虚拟网站结构如图4所示。网站页面分为栏目页(或子栏目页)、主题页和文档页三种类型。

2)各类型页面的框架结构

栏目页由链接着下级栏目页和主题页的“导航条区”和直接链接文档页的“链接区”组成。有时候在页面较大(较长)时,链接区中插入导航点,作为方便导航的一种补充。

主题页由于没有下级栏目页,只有直接链接文档的“链接区”。

文档页主要显示原始信息。

3)虚拟网站的动态生成--结构调整算法

当用户申请栏目页(含主页)时,页面生成的算法步骤如下:

步骤1、应用服务器的“导航条区生成器”从网站形式结构库中取出其下级栏目数据,生成栏目页的导航条区。

步骤2、“链接区生成器”依据用户兴趣度确定栏目页下属各栏目在链接区中显示区域的大小和位置,然后使用“数据过滤器”依据用户兴趣度顺序筛选的信息,在各子栏目相应的区域内组织指向原始文档的链接。

当用户申请主题页时,“链接区生成器”使用“数据过滤器”依据用户兴趣度顺序优先筛选的信息,在页面上组织指向原始文档的链接。可以连续使用前后链接着的多个页面连续组织链接。

“数据过滤器”的功能是,将网站上各主题范围内的文档,按用户兴趣度排序,供“链接区生成器”从高到低选用。

1.3栏目页链接区的布局算法

为了方便研究,作如下约定:

1)链接区版面根据下属子栏目数多少分为1-3列,各列宽度均等。

2)链接区按下属各子栏目集中组织超连接,分别构成不可分割的矩形链接块。

3)栏目页链接区的链接块数即为该栏目下属的子栏目数。

4)各子栏目的面积大小由该子栏目的用户兴趣度和本链接区的总面积确定。

5)由于宽度相同,面积由矩形的高度来表示,单位是“行”。

6)布局时,靠近屏幕顶端的位置具有较高的显现度。分两栏的链接区,在布局高度相同时,左边具有较高显现度;分三栏的链接区,显现度按中、左、右的顺序排列。

算法:

1、各子栏目在链接区的布局按其面积由大到小的顺序依次进行。

2、每个子栏目布置在当前具有较高显现度的位置。

智能网站信息结构调整的评价标准是:在网站各主题上的信息显现度分布是否与用户的兴趣度分布趋于一致,也就是信息结构调整后的各主题的显现度构成的曲线和用户兴趣度曲线相重合(或平行),如图5所示。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1