一种广告信息管理方法

文档序号:8319299阅读:199来源:国知局
一种广告信息管理方法
【技术领域】
[0001] 本发明涉及一种信息管理的方法,特别是一种广告信息管理方法。
【背景技术】
[0002] 现阶段各媒体对于广告信息的管理多为人工操作,但随着媒体广告信息量的增 加,客户的要求越来越高,传统的人工管理的弊端也逐渐显现出来,例如人工分类效率低、 不准确,无法精确检索,对以发布的广告信息不能进行精确的考核评分。

【发明内容】

[0003] 本发明的目的在于提供一种广告信息管理方法,运用该方法可以通过使用向量空 间模型的建模方法将非结构化的文本数据转换成可计算的结构化数据,然后利用文本间的 相似度进行聚类分析,热点分析,自定义关键词自动搜索以及考核统计平台来实现纸媒、网 站等各媒体的广告业务管理。
[0004] 实现本发明目的的技术方案是:一种广告信息管理方法,其特征在于:包括以下 步骤: 1.1.将非结构化的广告信息文本数据转换成可计算的结构化数据,把文档的语义通过 构成文档的词项来表达,将η篇文档的每篇文档表示成m维的向量dl,d2,···,dn,构造成 一个mXn的特征文档矩阵,m表示文档词项总数量; 1. 2.将文档分词; 1. 3.将文档去停用词; 1.4.计算词条在文档中的最终权重值,公式如下:
【主权项】
1. 一种广告信息管理方法,其特征在于:包括以下步骤: 1.1.将非结构化的广告信息文本数据转换成可计算的结构化数据,把文档的语义通过 构成文档的词项来表达,将η篇文档的每篇文档表示成m维的向量dl,d2,···,dn,构造成 一个mXn的特征文档矩阵,m表示文档词项总数量; 1. 2.将文档分词; 1. 3.将文档去停用词; 1.4.计算词条在文档中的最终权重值,公式如下:
将词项在一篇文档中出现的次数,定义为,表示词项t在文档d中出现的次数; 逆文档率是指词项出现在所有文档中的次数的倒数,定义为E
,其中D表 示文档集合的大小,DF (t)表示文档集合中包含词项t的文档的数目;' 1. 5.选维,采用以下公式计算文档中的词项t与文档类别c的互信息MI:
MI度量的是词的存在与否给类别c带来的信息量,其中Nxy表示x=et和y=ec情况下 对应的文档数目,当文档包含词项t时,et=l,否则et=0 ;当文档属于类别c时,ec=l,否则 ec=0; 1.6. 最终生成VSM矩阵(向量空间模型)表示为:
1.7. 根据生成的VSM文档矩阵(文档矩阵就是词以及词在文档中的权重值组成的队 列,按照权重值的大到小排序),每个文档中权重较高的词便可表达广告的主题,选出3~ 10个权重较高的词做为广告的类别,再比较广告的类别,将类别相似度较高的广告划分为 同一类别,便于检索。
2. 根据权利要求1所述的一种广告信息管理方法,其特征在于:每条信息都有一定 的关注度的统计,每当有人浏览这篇文章,关注度就会加1,设定一个热点新闻关注度的阀 值,将达到关注度阀值的文章内容设定为热点,热点有标签可以区分,并根据热度的不同用 不同颜色进行标注。
3. 根据权利要求1所述的一种广告信息管理方法,其特征在于:用户可自定义设置关 键字对全媒体汇聚中心的数据进行检索,设置完成后系统对数据进行检索,并按照不同的 类别(数字报、网站、成品库、资料库)自动列出与关键字有关的最新文章,这里关键词的搜 索可采用正则表达式来实现,进行关键词和文章特征匹配,如果匹配到相应关键词就列出 相应文章。
4.根据权利要求1所述的一种广告信息管理方法,其特征在于:具有考核统计平台, 首选查出新报道与已有事件的相似度,然后找出相似度文件(相应的收藏率、点击率、转载 率、文字评论也会自动统计出来),最后参考已有评价数据对新报道进行评分,其中新报道 与已有事件类之间的相似度被定义如下:
m 其中,Wlk、W2k分别表示文本D1D2第K个特征项的权值,l〈=k〈=N。
【专利摘要】一种信息管理的方法,特别是一种广告信息管理方法,运用该方法可以通过使用向量空间模型的建模方法将非结构化的文本数据转换成可计算的结构化数据,然后利用文本间的相似度进行聚类分析,热点分析,自定义关键词自动搜索以及考核统计平台来实现纸媒、网站等各媒体的广告业务管理。本发明的独到之处在于:无需人工操作,聚类分析准确率高,考核与评价准确、客观。
【IPC分类】G06Q30-02, G06F17-30
【公开号】CN104636487
【申请号】CN201510088375
【发明人】蒋大可, 何俊, 莫燕峰
【申请人】湖北光谷天下传媒股份有限公司
【公开日】2015年5月20日
【申请日】2015年2月26日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1