一种互联网文内关键字广告的生成和投放方法

文档序号:6459613阅读:166来源:国知局
专利名称:一种互联网文内关键字广告的生成和投放方法
技术领域
本发明涉及互联网上的一种智能信息发布技术,特别是一种互联 网文内关键字广告的生成和投放方法。
技术背景1997年3月,CHINABYTE网站上出现了第一条商业性网络广告, 标志着中国网络广告的诞生。经过9年多的发展,中国网络广告市场 规模至2007年已经达到106. 1亿元人民币。当前流行的网络广告主 要有网页广告、搜索引擎广告、电子邮件广告、在线游戏广告、软件 广告等几大类别。纵观上述传统技术,存在共同问题是都占有固定现 有广告位。而文内关键字广告技术,不但不占有广告位,而且形式更 加多样、投放更加精准,己经成为互联网广告行业发展的巨大动力。 目前市场上有多种类似的广告技术出现,但由于技术上的原因,无法 处理某些需要登录才能访问的页面,例如论坛等;其次是其覆盖范围 只有放置其代码的网站,没有放置代码的网站就无能为力了;最后就 是投放效率不高,投资回报不明显的问题。 发明内容本发明的目的是为了克服上述现有技术存在的不足,提供一种不 占有固定广告位的文内关键字广告投放技术。本发明一种互联网文内 关键字广告的生成和投放方法(如附图l、 2所示)第一步网民浏览已加载了本发明标定的代码的网页;装本发明客户端软件,则自动加载本发明标 定的代码。第二步网民从本发明标定的服务器获取完整的和当前网页相关的广告脚本(Java Script语言),并加载运行。第三步广告脚本判断当前网民浏览的页面是否需要登录才能正 常访问,如果需要登录,则直接获取页面的正文内容,即Content字 段;如果不需要登录,那么Content字段留空。第四步客户端广告脚本将用户信息,当前网页网址以及网页内 容的数据传送到本发明标定的服务器。第五步如果服务器从客户端接收的Content字段为空,则转到 第六步;如果不为空,则转到第八步。第六步根据网址获取网页的源代码。第七步从网页的源代码当中提取网页的编码信息和正文内容, 过滤掉链接等无用的标签。第八步针对提取的网页正文内容,做中文分词,直接得到有广 告投放的关键字,动态生成分词的词库。第九步针对每个广告关键字动态搜索广告内容。第十步将格式化成Java Script脚本的广告内容回传给客户^山顺。第十一步客户端根据接收到的广告内容即Java Script脚本,给关键字划线,如果用户触发,即弹出相应的广告。 关于本发明涉及的相关技术的说明本发明所述的中文分词技术,就是把中文的汉字序列切分成有意 义的词,例如我是一个学生,分词的结果是"我是""一个""学 生"。中文分词系统主要是两大部分,即分词算法部分和分词词库部 分;对词库部分做了两大改进动态生成词库和由广告商购买的广告 关键字组成词库。本发明所述的动态索引是指动态建立广告数据索引数据库,由索 引程序对广告商信息、广告投放数据、网站主信息和网站数据进行分 析和计算,得到每一个广告关键字与购买过此关键字的广告的相关度 (或重要性),然后用这些相关信息建立广告数据索引数据库。本发明所述的缓存优化是通过缓存系统来优化整个系统的效率, 缓存系统可以在系统的多个步骤中实施,包括针对某个具体页面的广 告投放数据、针对某个具体页面的正文内容以及针对某个具体网站上 特定关键字的广告数据。本发明具有以下技术创新提供了需要登录的页面,也可以获取页面正文内容,并且投放广 告的功能。提供了用户可以自助的设置广告投放区域,行业等属性和选择具 体的网站的技术以及高度的定制化功能,即可以选择自己的广告框, 广告弹出时的表现形式等,自助的上传并且编辑图片,视频等。提供的广告形式,不强制网民浏览,由用户触发而弹出。非常强的兼容性,支持IE6.0, 7.0, Firefox, Opera, Netscape 以及Safari等各种主流浏览器。提供了 IE浏览器插件技术,使用户访问所有的页面都可以看到 广告。尤其是采用了包括"中文分词技术"、"缓存系统"和"动态建立 广告数据索引数据库"以及"结合关键字,文章主题,用户兴趣爱好 分析"等多种核心技术极大地提高系统的整体效率,以达到精准投放 的目标。在投放方式上,有效地整合网民、广告商和网站媒体,由网民自 主地选择广告的显示。在投放流程上,更加高效、稳定。


图1为本发明的一个实施实例的流程框图; 图2为本发明的另一个实施实例的流程框图。
具体实施方式
以下结合附图对本发明作进一步描述一种互联网文内关键字广告的生成和投放方法,其步骤是(如附 图1、 2所示)第一步网民浏览加载过本发明标定的"群视"代码的网页,或 者当前电脑上安装了 "群视"的网吧客户端软件,这是"群视"文内 广告的两种不同的投放途径,网吧的客户端软件使得所有安装了此客户端的电脑打开所有的页面都会自动加载"群视"的广告代码。第二步从本发明标定的"群视"的服务器获取完整的"群视"广告脚本(Java Script语言),并加载运行。第三步判断网民当前浏览的页面是否是需要登录才能正常访 问。如果需要登录,那么直接获取页面的正文内容(Content字段为 正文内容),以解决在群视的服务器上不能访问这类页面的问题;如 果不需要登录,那么Content字段留空。第四步将网站或者网吧的用户信息,以及网页内容等数据传送 到本发明标定的"群视"的服务器。第五步如果从客户端接收的Content字段为空,则转到第六步; 如果不为空,则转到第八步。第六步根据网址获取网页的源代码。第七步通过网络蜘蛛,从合作网站网页的源代码当中提取网页 的编码信息和正文内容,过滤掉非正文内容的无用标签,进行预先抓 取。第八步启动中文分词程序,根据当前广告商购买的关键字动态 生成分词词库,对提取的网页正文内容进行中文分词,直接得到有广 告投放的关键字。第九步启动搜索程序,针对每个广告关键字搜索广告内容,并 将相应的广告数据格式化。第十步将格式化的广告内容(已经是Java Script脚本)回传给客户端。第十一步客户端根据接收到的广告内容(JavaScript脚本), 给关键字划线,如果用户触发的话,弹出相应的广告。 本发明的一个实施实例一种互联网络文内关键字广告的生成和投放方法,其中,中文分 词程序,包括分词算法和分词词库,所述的分词算法是把中文的汉字 序列切分成有意义的词;所述的分词词库是动态生成的,且由广告商 购买的广告关键字组成。所述的动态索引是指动态建立广告数据索引数据库,由索引程序 对广告商信息,广告投放数据,网站主信息,网站数据进行分析,根 据一定的相关度算法进行大量复杂计算,得到每一个广告关键字针对 购买过此关键字的广告的相关度、重要性,然后用这些相关信息建立 广告数据索引数据库。所述的缓存优化是通过缓存系统来优化整个系统的效率,缓存系 统可以在系统的多个步骤中实施,包括针对某个具体页面的广告投放 数据、针对某个具体页面的正文内容和针对某个具体网站上特定关键 字的广告数据。本发明的主要优势在于第一、通过在客户端获取网页正文内容的方法来处理需要登录后 才能访问的页面的广告投放。第二、"群视"特有的网吧IE浏览器插件技术使得安装有"群视" 客户端的每台电脑,打开每个网页的时都会自动加载"群视"的广告 代码,并生成和投放"群视"的文内关键字广告效果。第三、投放性能的优化(1) 动态生成中文分词程序的词库,其内容是广告商购买的广告关键字集合;(2) 动态索引广告数据,将广告数据格式化存放在嵌入式文件 数据库中;(3) 通过网络蜘蛛,对合作网站的页面内容进行预先的抓取;(4) 通过缓存系统的优化,使得广告投放和检索的效率更高。 综上所述,本发明的文内关键字广告技术,在投放方式上,有效地整合网民、广告商、网站媒体。在投放流程上,更加高效,稳定。 为广告商提供精准广告服务和网络整合营销方案,使投入的回报效果 最大化。
权利要求
1.一种互联网文内关键字广告的生成和投放方法,其特征是,第一步网民浏览已加载有本发明标定的代码的网页;如果当前电脑上已安装本发明客户端软件,则自动加载本发明标定的代码;第二步网民从本发明标定的服务器获取完整的和当前网页相关的广告脚本——Java Script语言,并加载运行;第三步广告脚本判断当前网民浏览的页面是否需要登录才能正常访问;如果需要登录,则直接获取页面的正文内容,即Content字段;如果不需要登录,那么Content字段留空;第四步客户端广告脚本将用户信息,当前网页网址以及网页内容的数据传送到本发明标定的服务器;第五步如果服务器从客户端接收的Content字段为空,则转到第六步;如果不为空,则转到第八步;第六步根据网址获取网页的源代码;第七步从网页的源代码当中提取网页的编码信息和正文内容,过滤掉链接无用的标签;第八步针对提取的网页正文内容,做中文分词,直接得到有广告投放的关键字,动态生成分词的词库;第九步针对每个广告关键字动态搜索广告内容;第十步将格式化成Java Script脚本的广告内容回传给客户端;第十一步客户端根据接收到的广告内容即Java Script脚本,给关键字划线;如果用户触发,即弹出相应的广告。
2. 如权利要求1所述的一种互联网文内关键字广告的生成和投 放方法,其特征是,所述的中文分词程序,包括分词算法和分词词库; 所述的分词算法是把中文的汉字序列切分成有意义的词;所述的分词 词库是动态生成的,且由广告商购买的广告关键字组成。
3. 如权利要求1或2所述的一种互联网文内关键字广告的生成和 投放方法,其特征是,所述的动态索引是指动态建立广告数据索引数 据库,由索引程序对广告商信息,广告投放数据,网站主信息,网站 数据进行分析和计算,得到每一个广告关键字与购买过此关键字的广 告的相关度、重要性,然后用这些相关信息建立广告数据索引数据库。
4. 如权利要求1-3中任一所述的一种互联网文内关键字广告的 生成和投放方法,其特征是,所述的缓存优化是通过缓存系统实施, 缓存系统可以在系统的多个步骤中实施,包括针对某个具体页面的广 告投放数据、针对某个具体页面的正文内容和针对某个具体网站上特 定关键字的广告数据。
5. 如权利要求1-4中任一所述的一种互联网文内关键字广告的 生成和投放方法,其特征是,包含支持IE6. 0、 IE7. 0、Firefox、0pera、 Netsc即e和Safari主流浏览器,以及以IE为内核的浏览器,MyIE、 遨游、腾讯TT。
全文摘要
本发明涉及互联网上的一种智能信息发布技术领域,特别是一种互联网文内关键字广告的生成和投放方法。其内容从网民浏览、获取广告脚本(Java Script语言),将用户信息回传至服务器及提取编码信息和正文内容、过滤无用的标签等,通过中文分词技术动态生成有广告投放的关键字词库,到将格式化成Java Script脚本的广告回传给客户端等。具有提供用户可自助设置广告投放区域、行业等属性和选择具体的网站的技术以及高度的定制化功能,选择自己的广告框、广告弹出时的表现形式,上传及编辑图片、视频等功能,集结合关键字、文章主题、用户兴趣爱好分析等多种核心技术及强大的兼容性,极大地提高系统的效率。
文档编号G06Q30/00GK101324890SQ20081004099
公开日2008年12月17日 申请日期2008年7月25日 优先权日2008年7月25日
发明者徐国荣, 胡英航, 蒋文安, 轶 金 申请人:上海群视信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1