一种基于广播信道传输内容标引的系统及方法

文档序号:7696279阅读:104来源:国知局
专利名称:一种基于广播信道传输内容标引的系统及方法
技术领域
本发明涉及广播电视网络技术,尤其涉及一种基于广播信道传输内容标S1 的系统及方法。
背景技术
随着网络视频成为数据通信的最大驱动力,美国思科公司预计,2007至 2012年,全球互联网流量将增长五倍。网络视频占互联网总流量的比例将从 2005年的5%增加到今年底的30%,到2012年将进一步增至50%。据估计, 目前全球互联网每月流量为7EB ( 70亿GB ),相当于20亿张DVD的容量。 到2012年这一数据将达到44EB。预计两年内,网络视频将超过文件共享在总 流量中的比重。如此丰富的信息给人们带来的不仅是知识和资讯的大繁荣,同 时也是人们对于海量信息的迷茫。Google、 Yahoo以及百度给人们带来的方便 的检索工具,但是它们搜索出的结果很大一部分并不是我们想要的,人们仍然 需要从它们提供的结果一一寻找。今天的WEB搜索通常会找到数不清的毫不 相关的"结果",需要大量的手工过滤工作。目前的WEB检索主要是依靠关键 字对内容标题进行搜索,而不是对其内容本身。标题很难全面的对其内容进行 揭示。
互联网的传输模式是一种点到点的传输,及保证数据能够准确的从源地址 传输到目的地址,所以IP包结构中只有源地址和目的地址信息。没有任何所 负载的内容信息,计算机无法识别其内容。无论是潦草的草稿,还是精致的作 品,无论是商业信息还是学术内容,无论何种文化和语言,网络对它们都是一 视同仁的。这样造成了完全相同内容会在完全相同节点之间亳无意义重覆传 输,浪费网络带宽。
互联网上针对非法内容的监管一直是一个难点。不仅是因为互联网上传输 信息量非常大,同时也是因为缺乏快速及准确识别的方法。分组交换技术将源 内容拆解成了大量的小数据包,这些小数据包通过不同的路由到达目的地址。 这样造成了每个数据包携带的传输内容是不完整的,同时也很难捕获到所有相 关的小数据包。即使捕获到了一些非法内容的IP数据包,也无法分析出IP包 携带的是否是非法内容,也无法确定是谁在传输,它利用什么协议在进行传播。 这就给控制网络非法信息传播,造成了很大的困难。尤其是近年来互联网P2P
业务蓬勃发展,其流量已占到网络总流量的60%以上,在如此大量的P2P流量 中充斥着反动、色情、暴力等有害信息,其传播范围之广、传播速度之快是传 统互联网无法比拟的,对其强化监管已经迫在眉睫。
在互联网信息传输过程中,缺乏对信息提供者和信息类别认证机制,是造 成互联网不安全的一个重要原因。用户无法识别其接受信息的来源及数据类 型,更加无法判读接收数据是否安全,不少不法分子利用这一点,对非法程序 进行伪装植入用户系统,对用户个人信息进行窃取,谋取非法所得。目前,对 非法入侵和病毒的识别,主要在获取已知的入侵行为特征及病毒特征上,对网 络信息进行对比判断。而对于越来越多的新型攻击方式和病毒,计算机用户4艮 难在第一时间进行防御。
标引是对内容进行特征提取和标识引导的过程,.它的目的是揭示内容特 征,便于集中同类的内容,区分不同的内容,为相关内容建立联系。通过标引 可提高资源的管理和利用率。标引把对内容的检索转变为对结构化数据的检 索,提高计算机检索的质量。
传统标引是基于关键字的,即通过词频统计提取关键字,然后根据关键字 对文档进行索引。这种方式已广泛用于各种商业搜索引擎。基于关键字的标引 方式是建立在一些假设的基础上,如关键字之间彼此独立、关键字不具有二义 性等,这些假设使得处理过程大大简化,却也使标引方式停留在关键字的字面 异同的逻辑层面上。不同的语境中,相同的关键字可能表示不同的含义,而不同的关键字也可能表达同一种意思。关键字之间往往也并非毫无关系。基于关 键字的标引忽略了概念层面或语义层面的含义,是导致检索效果不够理想的关 键因素。

发明内容
本发明提供一种基于广播信道传输内容标引的系统及方法,通过将每天互 联网与广播电视上的热点内容打上标引,利用广播电视网或者卫星主动推送到 离用户的代理服务器上,使用户可以随时就近获取丰富的节目内容。
本发明所述技术方案如下
一种基于广播信道传输内容标引的系统,包括标引生成发送前端、代理服 务器和用户终端,其中,
标引生成发送前端,用于根据源内容生成内容标引,并对内容标引进行编 码生成标引编码,将源内容、内容标引、标引编码及三者之间的对应关系数据 表通过广播信道广播给多个代理服务器;
代理服务器,用于对接收到的源内容进行IP封装,将该源内容对应的标 引编码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将 接收到的源内容、内容标? 1及标引编码的对应关系数据表发送给用户终端;
用户终端,用于根据用户欲获取的内容信息生成内容标引,并将该内容标 引翻译成相应的标引编码,将该标引编码与接收到的IP数据包中嵌入的标引 编码进行比较,保存匹配的IP数据包。
进一步地,所述系统进一步包括
监管服务器,用于实时获取代理服务器发出的IP数据包,判断IP数据包 中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包, 并将该非法数据包的信息予以上报。
一种基于广播信道传输内容标引的方法,包括步骤
A、标引生成发送前端根据源内容生成内容标引,并对其进行编码,将生
成的标引编码、源内容、内容标引及三者之间的对应关系数据表通过广播信道
广播给多个代理服务器;
B、 代理服务器对接收到的源内容进行IP封装,将该源内容对应的标引编 码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将接收 到的标引编码、源内容及内容标引的对应关系数据表发送给用户终端;
C、 用户终端根据用户输入的欲获取的内容信息生成内容标引,并将该内 容标引翻译为标引编码,将该标引编码与代理服务器发送来的IP数据包中嵌 入的标引编码进行比较,接收其中匹配的IP数据包。
进一步地,所述内容标引中包含所述源内容的来源、类型、播出策略、分 类码、特征值、传输者信息码、提供方式及传输格式信息。
进一步地,所述步骤B中还包括代理服务器对接收到的标引编码、源内容、 标引内容及三者之间的对应关系数据表予以保存的步骤。
进一步地,所述步骤C中,用户终端在接收到的标引编码、源内容及内容 标引的对应关系数据表中对用户欲获取的内容信息对应的内容标S1进行匹配, 将匹配项中的标引编码作为翻译结果。
进一步地,所述步骤C后还包括步骤
用户终端从所述匹配的IP数据包中解析出标引编码,根据该标引编码对 应的内容标引中包含的播出策略信息判断IP数据包中的源内容是否为紧急广 播,若是,则从该匹配的IP数据包中解析出源内容并予以显示,否则,执行 下一步骤;
用户终端判断该内容标引与本地已保存的内容标引是否重复,若是,则放 弃保存该匹配的IP数据包,否则,从该匹配的IP数据包中解析出源内容并予 以显示。
进一步地,所述步骤B后还包括步骤
监管服务器实时获取代理服务器发出的IP数据包,判断IP数据包中是否 携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包,并将
该非法数据包的信息予以上报。
本发明有益效果如下
本发明将互联网的存储转发思想带入到广播电视传输中,通过广播电视网 的不间断的实时推送能力,将带标引的内容主动推送到用户的代理服务器上。 用户通过内容标引指定自己有兴趣的内容,代理服务器将这些内容主动下载到 用户终端。利用标引技术可以大大提高目前音视频信息在互联网上的传输效率 和信息的利用率,同时节省带宽。并在精确搜索、舆情分析、实时监管传输信 息及主动服务实现技术突破。
本发明中标引是嵌入到IP包中,与IP协议完全兼容,使得带有标引信息 的数据包可以在互联网上畅通无阻。通过本发明,利用广播电视网来传输热点 内容到用户身边,有效的解决了用户在互联网上收看视频节目内容不畅,信息 孤岛、主动服务以及监管困难等方面的问题,实现互联网与广播电视网的互补


图1为本发明中提出的内容标引的层次结构示意图; 图2为本发明所述基于广播信道传输内容标引的系统的原理图; 图3为本发明中将标引编码嵌入到封装后的IP数据包的位置示意图; 图4为本发明所述基于广播信道传输内容标引的系统在具体实现中的系统 部署图5为本发明中内容标引传输模型示意图; 图6为本发明中标引生成发送前端生成及发送内容标S1的流程图; 图7为本发明中代理服务器接收、解析及播发内容标引的流程图; 图8为本发明中用户终端从接收到的数据包中获取用户感兴趣的内容的流 程图9为本发明中监管服务器对代理服务器发出的IP数据包进行合法性判
断的流程图。
具体实施例方式
本发明所述技术方案的主要技术构思是将互联网的存储转发思想带入到 广播电视传输中,通过广播电视网的不间断的实时推送能力,将带标引的内容 主动推送到用户的代理服务器上。用户通过内容标引指定自己有兴趣的内容, 代理服务器将这些内容主动下载到用户终端。利用标引技术可以大大提高目前 音视频信息在互联网上的传输效率和信息的利用率,同时节省带宽。并在精确 搜索、舆情分析、实时监管传输信息及主动服务实现技术突破。利用现有的覆 盖全国的广播电视网将热点信息直接传输到离用户最近的代理服务器上,用户 可以在仅用几跳的范围内来获取数据,那么将大大提高用户的服务体验。这种
且建设成本很低。同时互联网实施边缘存储后,流量的一半甚至大半将由广播 结构分流,共享视频引入的带宽冲突随之化解,不仅在线视频流畅,端对端结 构的个案交流功能也会如释重负,倍感轻松。
下面将结合各个附图对本发明的具体实现过程做进一步详细的说明。 请参阅图1,该图为本发明中提出的内容标引的层次结构示意图,本发明
中内容标引的层次结构分为属性层及传输层,其中各个字段的含义如下 来源用于标明该内容的提供者;
子目用于标明传输的内容的类型(如网页、音频广播或是视频广播), 便于与其他内容相近的文件自动聚类。
播出策略,用来区分内容传输及播出的优先级。
分类码根据已经颁发的国家和行业相关标准为基础,对信息进行分类标识。
内容特征码用于对传输的节目内容按照一定的算法提取出内容的特征值。
传输者信息码用于标识出内容传输者的身4分信息。
服务方式用于说明内容提供方式。
传输格式信息用于说明节目内容编码格式及封装信息。
请参阅图2,该图为本发明所述基于广播信道传输内容标引的系统的原理 图,由图中可见,本发明所述基于广播信道传输内容标引的系统主要包括标引 生成发送前端、代理服务器和用户终端,其中,
标引生成发送前端,用于根据源内容生成内容标引,并釆用预先确定的编 码算法(如哈希算法、B编码等)对内容标引进行编码生成标引编码,同时生 成源内容、内容标引及标引编码三者之间的对应关系数据表,将源内容、内容 标引、标引编码及三者之间的对应关系数据表通过广播电视网中的广播信道广 播给代理服务器;
代理服务器,用于接收标引生成发送前端通过广播电视网主动推送来的源 内容、内容标引、标引编码及三者之间的对应关系数据表,对接收到的源内容 进行IP封装,同时如图3所示,将该源内容对应的标引编码嵌入到封装后的 IP数据包的option字段中广播给用户终端,以及每间隔预设时长(如5秒)将 接收到的源内容、内容标引及标引编码的对应关系数据表发送给用户终端;
用户终端,用于接收用户通过界面输入的欲获取的内容信息,根据标引层 次结构形成生成内容标引,在接收到的源内容与标引编码之间的对应关系数据 表中对用户欲获取的内容信息对应的内容标引进行模糊匹配,记录匹配项中的 标引编码,将匹配项中的标引编码作为过滤规则,对每个接收到的IP数据包 中嵌入的标引编码进行比较,保存匹配的IP数据包。
本发明所述系统中还可以进一 步包括
监管服务器,用于实时获取代理服务器发出的IP数据包,判断IP数据包 中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包, 并将该非法数据包的信息予以上报,实现了对IP数据包的合法性判断。
请参阅图4,该图为本发明所述基于广播信道传输内容标引的系统在具体
实现中的系统部署图,由图中可见,标引生成发送前端将源内容、内容标引、 标引编码及三者之间的对应关系数据表通过广播卫星和有线电视广播网广播
给多个代理服务器;代理服务器采用单向的广播方式对用户终端进行内容传 输,用户终端一直在接收数据,但是只是保留了标引匹配的数据内容。
相应于本发明上述系统,本发明进而提出了一种基于广播信道传输内容标 引的方法,请参阅图5,该图为本发明中内容标引传输模型示意图,由图中可 见本发明中内容标引传输的主要流程包括以下步骤
1) 标引生成及嵌入根据源内容生成内容标引,并对内容标引进行编码 生成标引编码,同时生成源内容、内容标引及标引编码三者之间的对应关系数 据表,将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播 电视网进行推送。每当编辑一个内容标引时,系统自动生成发送引擎需要的IP 数据包,内容按照指定格式组织, 一个内容标引只占用整数个IP数据包,两 个内容标引不能同在一个IP数据包中。
2) 标引接收、解析及播发接收广播电视网主动推送来的源内容、内容 标引、标引编码及三者之间的对应关系数据表,将其保存到指定位置,对接收 到的源内容进行IP封装,同时将该源内容对应的标引编码嵌入到封装后的IP 数据包的option字段中广播给用户终端,以及每间隔预设时长(如5秒)将接 收到的源内容、内容标S1及标引编码的对应关系数据表发送给用户终端;
3) 内容获取用户终端接收用户通过界面输入的欲获取的内容信息,根 据标引层次结构形成生成内容标引,在接收到的源内容与标引编码之间的对应 关系数据表中对用户欲获取的内容信息对应的内容标? 1进行模糊匹配,记录匹 配项中的标引编码,将匹配项中的标引编码作为过滤规则,对每个接收到的IP 数据包中嵌入的标引编码进行比较,保存匹配的IP数据包。
请参阅图6、该图为本发明中标引生成发送前端生成及发送内容标引的流 程图,其主要包括步骤
步骤IO、标引生成发送前端根据源内容生成内容标引,并对其进行编码,
同时利用预设的算法(如哈希算法、B编码等)生成标引编码、源内容及内容
标引三者之间的对应关系数据表;
所述内容标引的层次结构如图1所示,其中包含所述源内容的来源、类型、 播出策略、分类码、特征值、传输者信息码、提供方式及传输格式信息。
步骤ll、标引生成发送前端将生成的标引编码、源内容、内容标引及三者 之间的对应关系数据表通过广播电视网中的广播信道广播给多个代理服务器。
请参阅图7、该图为本发明中代理服务器接收、解析及播发内容标引的流 程图,其主要包括步骤
步骤12、代理服务器接收标引生成发送前端通过广播电视网主动推送来的 数据。
步骤13、代理服务器从接收到的数据中解析出标引编码、标引内容、源内 容以及三者之间的对应关系数据表,将其保存到指定的位置。
步骤14、代理服务器对接收到的源内容进行IP封装。
步骤15、代理服务器将标引编码嵌入到封装后形成的每个IP数据包的 option段中。
步骤16、代理服务器持续广播推送携带有标引编码的IP数据包,同时每 间隔预设时长推送一次标引编码、源内容及内容标引三者之间的对应关系数据 表。
请参阅图8、该图为本发明中用户终端从接收到的数据包中获取用户感兴 趣的内容的流程图,其主要包括步骤
步骤17、用户终端根据用户输入的欲获取的内容信息,按照标引层次结构 生成内容标引。
步骤18、用户终端接收代理服务器推送的标引编码、源内容及内容标引的 对应关系数据表。
步骤19、用户终端在接收到的标引编码、源内容及内容标引的对应关系数 据表中对用户欲获取的内容信息对应的内容标? 1进行模糊匹配,将匹配项中的标引编码作为过滤规则。
数据包中嵌入的标引编码进行比较,保存其中匹配的IP数据包。
步骤21、用户终端从所述匹配的IP数据包中解析出标引编码,根据该标 引编码对应的内容标引中包含的播出策略信息判断IP数据包中的源内容是否
为紧急广播,若是,执行步骤22,否则,执行步骤23。
步骤22、用户终端从该匹配的IP数据包中解析出源内容并予以强制显示。 步骤23、用户终端判断该内容标引与本地已保存的内容标引是否重复,若
是,执行步骤24,否则,执行步骤25。
步骤24、用户终端放弃保存该匹配的IP数据包。
步骤25、用户终端从该匹配的IP数据包中解析出源内容并添加到显示队 列中等待排队显示。
请参阅图9,该图为本发明中监管服务器对代理服务器发出的IP数据包进 行合法性判断的流程图,其主要实现过程为
步骤30、获取代理服务器发出的IP数据包;
步骤31 、根据IP协议分析IP数据包包头的结构;
步骤32、判断IP数据包的包头中是否携带有标引编码,若是,则确定该 IP数据包为合法数据包,否则,将没有携带标引编码的IP数据包确定为非法 数据包,并将该非法数据包的信息予以上报。
明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及 其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1、一种基于广播信道传输内容标引的系统,其特征在于,包括标引生成发送前端、代理服务器和用户终端,其中,标引生成发送前端,用于根据源内容生成内容标引,并对内容标引进行编码生成标引编码,将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播信道广播给多个代理服务器;代理服务器,用于对接收到的源内容进行IP封装,将该源内容对应的标引编码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将接收到的源内容、内容标引及标引编码的对应关系数据表发送给用户终端;用户终端,用于根据用户欲获取的内容信息生成内容标引,并将该内容标引翻译成相应的标引编码,将该标引编码与接收到的IP数据包中嵌入的标引编码进行比较,保存匹配的IP数据包。
2、 如权利要求l所述的系统,其特征在于,所述系统进一步包括 监管服务器,用于实时获取代理服务器发出的IP数据包,判断IP数据包中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包, 并将该非法数据包的信息予以上报。
3、 一种基于广播信道传输内容标引的方法,其特征在于,包括步骤A、 标引生成发送前端根据源内容生成内容标引,并对其进行编码,将生 成的标引编码、源内容、内容标引及三者之间的对应关系数据表通过广播信道 广播给多个代理服务器;B、 代理服务器对接收到的源内容进行IP封装,将该源内容对应的标引编 码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将接收 到的标引编码、源内容及内容标? 1的对应关系数据表发送给用户终端;C、 用户终端根据用户输入的欲获取的内容信息生成内容标引,并将该内 容标引翻译为标引编码,将该标引编码与代理服务器发送来的IP数据包中嵌 入的标引编码进行比较,接收其中匹配的IP数据包。
4、 如权利要求2所述的方法,其特征在于,所述内容标引中包含所述源 内容的来源、类型、播出策略、分类码、特征值、传输者信息码、提供方式及 传输格式信息。
5、 如权利要求2所述的方法,其特征在于,所述步骤B中还包括代理服 务器对接收到的标引编码、源内容、标引内容及三者之间的对应关系数据表予 以保存的步骤。
6、 如权利要求2所述的方法,其特征在于,所述步骤C中,用户终端在 接收到的标引编码、源内容及内容标引的对应关系数据表中对用户欲获取的内 容信息对应的内容标《1进行匹配,将匹配项中的标引编码作为翻译结果。
7、 如权利要求2或5所述的方法,其特征在于,所述步骤C后还包括步骤用户终端从所述匹配的IP数据包中解析出标引编码,根据该标引编码对 应的内容标引中包含的播出策略信息判断IP数据包中的源内容是否为紧急广 播,若是,则^v该匹配的IP数据包中解析出源内容并予以显示,否则,执行 下一步骤;用户终端判断该内容标引与本地已保存的内容标引是否重复,若是,则放 弃保存该匹配的IP数据包,否则,从该匹配的IP数据包中解析出源内容并予 以显示。
8、 如权利要求2所述的方法,其特征在于,所述步骤B后还包括步骤 监管服务器实时获取代理服务器发出的IP数据包,判断IP数据包中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包,并将该非法数据包的信息予以上报。
全文摘要
本发明公开了一种基于广播信道传输内容标引的系统及方法,本发明中,标引生成发送前端根据源内容生成内容标引,并对其进行编码,将标引编码、源内容、内容标引及三者的对应关系表广播给代理服务器,代理服务器对收到的源内容进行IP封装,将该源内容对应的标引编码嵌入到封装后的IP包中发送给用户终端,并每间隔预设时长将所述对应关系表发送给用户终端,用户终端根据用户欲获取的内容信息生成内容标引,并根据所述对应关系表将其翻译为标引编码,将该标引编码与代理服务器发送来的IP包中嵌入的标引编码比较,保存其中匹配的IP数据包。本发明提高了信息在互联网上的传输效率和利用率,同时提高了广播电视网的服务能力。
文档编号H04L12/56GK101345595SQ20081011891
公开日2009年1月14日 申请日期2008年8月26日 优先权日2008年8月26日
发明者勇 夏, 敏 袁 申请人:国家广播电影电视总局广播科学研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1