一种影视剧分析专用知识库的建立方法及剧本分析方法

文档序号:6339873阅读:292来源:国知局
专利名称:一种影视剧分析专用知识库的建立方法及剧本分析方法
技术领域
本发明涉及将计算机信息处理技术应用于影视剧剧本分析,分析剧本中具有商业 宣传价值的道具和场景,使用户了解剧本的商业价值;本发明也可以实现对剧本各场次中 出现的角色、道具和场景进行自动识别,实现对影视剧产品制作流程的智能管理。本发明使 用了自然语言处理技术和本体论知识描述方法。
背景技术
影视剧植入式广告是一种新的广告宣传方式,已在国内外影视剧作品中广泛采 用,进行影视剧植入广告制作需要认真分析剧本,目前只能采用人工阅读的方式,效率低, 特备是阅读疲劳还经常会引起广告植入点的疏漏,在人工方式下,查找剧本中的道具、场景 和人物等信息也很费时。另外,目前影视剧制作过程中,涉及角色、道具和场景的管理也是 采用人工管理方式,缺少信息化的辅助手段。

发明内容
本发明公布的方法可以利用计算机实现对剧本的自动分析,改变影视剧制作者人 工处理剧本的传统方式,提高他们分析影视剧剧本的效率和效果,提高其植入广告的制作 水平。本发明具有运算速度快,性能稳定,适用面广等特点。本发明包括两部分,第一是影 视剧分析专用知识库的建立方法;第二是利用影视剧分析专用知识库对剧本进行分析的方法。一种影视剧分析专用知识库的建立方法,包括步骤①建立专用知识库的本体概念定义,专用知识库是由一个个概念组成的,每一个 概念对应于一个商品名称,每一个概念由概念名称和属性组成,所述的属性包括概念级别、 上层概念、下层概念、同义词、推荐广告方式和联想广告;②搜集有商业价值的商品名称,每一个商品名称对应一个概念,针对每一个概念, 按照本体概念的各个属性明确其属性值;③编写软件程序,利用软件将搜集到概念逐个录入到数据库中,一个概念对应一 条数据库记录,最终专用知识库存储在一个数据库中;完成影视剧分析专用知识库的建立。其中,专用知识库中的概念分为三个层级,第一层概念是顶层概念;第二层概念处 于知识库体系的中间层;第三层概念是底层概念。其中,概念级别指的是概念的层级;上层概念指的是当前概念的上层概念;下层 概念指的是当前概念包含哪些下层概念;同义词指的是当前概念的其它称谓;推荐广告方 式就当前概念提供一些在影视剧作品中进行广告植入的方式;联想广告指的是由当前概念 所指的商品可以联想到的其它产品。一种利用影视剧分析专用知识库对剧本进行分析的方法,包括步骤①剧本预处理,识别原始剧本中由于人为错误出现的场次序号缺号、重号、号码样式不统一的现象,提示用户修改;②抽取剧本角色特征,剧本角色特征包括剧本中出现的角色;③按场次分割剧本,在原始剧本中各个场次是连在一起的,为了随后抽取场次特 征的需要,把剧本中出现的各个场次分割切分出来,切分出来的每一个场次由场次标题和 内容组成;④抽取场次特征,利用影视剧分析专用知识库以及自然语言处理技术挖掘出剧本 各个场次中出现的人物、道具和场所,并统计其出现次数以及与主要角色的关系;完成对剧本的分析。本发明与现有技术相比有以下优点影视剧分析专用知识库采用本体论概念描述 方法,解决了知识的组织问题,另外,每个概念的联想广告属性可以扩展剧本的广告植入范 围,充分挖掘剧本的商业价值。按照剧本分析方法对剧本进行分析之后,就可以针对剧本的特征(场景、道具、角 色、场次标题)开展查询,查询服务可以帮助用户快速定位他所关心的剧本场景。


图1是影视剧分析专用知识库构成单元“概念”的属性特征集合。图2是本发明的影视剧植入广告分析过程的流程图。
具体实施例方式影视剧分析专业数据库的建立方法由以下技术方案实现①建立专用知识库的本体概念定义,专用知识库是由一个个概念组成的,一个概 念对应于一个商品名称,每一个概念由概念名称和若干相关属性组成,如图1所示,这些属 性包括,概念级别,上层概念,下层概念,同义词,推荐广告方式,联想广告。概念级别指的是概念的层级;上层概念指的是当前概念的上层概念;下层概念指的是当前概念包含哪些下层概念;同义词指的是当前概念的其它称谓;推荐广告方式就当前给出一些供参考的植入方式;联想广告指的是由当前概念所指的商品可以联想到的其它产品。联想广告可以扩 展剧本的广告植入种类。专用知识库中的概念分为三个层级,上一层的概念包含若干个下层概念,专用知 识库具有可扩展性,方便日后添加新的概念。②搜集有商业价值的商品名称,每一个商品名称对应一个概念,针对每一个概念, 按照本体概念的各个属性明确其属性值。确定三个层次中各包含哪些概念,其中,第一层概念是顶层概念;第二层概念处于 知识库体系的中间层;第三层概念是底层概念,属于叶子节点,每一个概念是一个具体的商 品名称。第一层包括23个概念,如,医药卫生、生活服务、体育运动等。第二层包括56个概念,如,药品,医疗机构,生活用品,日常服务,运动服装,运动场所。第三层包括1200个概念,如,肠虫清,丹参滴丸,北京三博医院,北京儿童医院,牙 膏、洗发液,票务中心,酒店,运动服,运动鞋,体育馆,体育场。下面是一个第三层概念一 “桶装水”的例子,概念桶装水概念级别三级概念上层概念生活用品下层概念无同义词纯净水联想广告饮水机推荐广告方式作为背景道具使用。联想广告属性可以充分挖掘剧本的商业价值,比如,剧本中出现了 “桶装水”但没 有“饮水机”,通过联想属性可以挖掘出“饮水机”作为广告卖点。③编写软件程序,利用软件将搜集到概念逐个录入到数据库中,一个概念对应一 条数据库记录,最终专用知识库存储在一个数据库中。完成影视剧分析专用知识库的建立。—种利用影视剧分析专用知识库对剧本进行分析的方法,包括步骤①剧本预处理;原始剧本中经常出现场次缺号、重号导致序号不连贯的现象,这些错误会影响剧 本场次的分割;常见的场次标题表达模式有以下几种,“第一场客厅”“一场客厅”“1场客厅”“一 客厅”“1 客厅”“1、客厅”根据剧本所采用的标题表达模式,基于正则表达式技术构建不同的表达式模式,
如,“第,,'+中文数字+“客厅”
中文数字+ ‘‘场客厅”
阿拉伯数字_+ “场客厅
中文数字+ ‘‘客厅”
阿拉伯数字_+ “客厅”
阿拉伯数字_+ “、客厅”让上述阿拉伯数字或中文数字从1开始递增,每次增加1,生成一系列的表达式实 例,让这些实例去匹配原始剧本中的内容,若发生匹配,则说明存在该场次标题;若未发生 匹配,则说明可能存在缺号或号码样式不统一的情况,这时将该处的上下文提示给用户,用 户可以根据上下文迅速在剧本中定位该处。②抽取剧本角色特征,剧本角色特征包括剧本中出现的角色。利用自然语言处理 技术发现剧本中的人物角色名称,人物角色名称会在文本中出现多次,并通常会出现在动词之前,中文常见姓氏较为固定,也可以作为识别角色名称的提示信息,基于上述认识实现 了剧本特征抽取。首先,对剧本进行中文分词处理,然后找出所有“姓名” + “动词”的搭配, 从这些搭配中抽取“姓名”部分,再对这些“姓名”进行筛选,只保留那些在剧本原文出现两 次以上的“姓名”,这样做的目的是只保留最重要的角色,以及过滤掉那些由于分词错误产 生的并非真正的姓名。③按场次分割剧本,在原始剧本中各个场次是前后连在一起的,为了更好地理解 剧本需要了解道具、场景和角色在各个场次的分布情况,一方面,这些分布信息方便用户定 位道具、场景和角色,方便用户安排制定拍摄计划;另一方面,这些信息对评估各个场次的 广告价值有帮助。剧本中每一个场次都由场次标题和场次内容组成。每个场次都由场次标题开头, 以场次内容结束。通过分析剧本场次标题表达模式,抽取其中潜在的模式构成搜索表达式, 基于搜索表达式,找到剧本中的各个场次的开始位置和结束位置,根据开始位置和结束位 置分割出各个场景。对于下属“第一场客厅”“一场客厅”“1场客厅”“一 客厅”“1 客厅”“1、客厅”对应的搜索表达式分别是,“第[一-十]+ 场·*”“ [一-十]+ 场·*”“
+场·*”“第 W-9] +场·*,,“ [一-十]+·*”“ [一-十]+、·*”其中“[一-十]+”表示一个由一个或多个中文数字(一、二、三、四、五、六、七、八、 九、十)构成的数字;“ W-9]+”表示一个由一个或多个阿拉伯数字(0、1、2、3、4、5、6、7、8、9) 构成的数字;“.*”表示任意字符,它对应场次标题中紧随场次序号之后出现的标题文字。利用这些搜索表达式可以发现剧本中所有场次标题的位置,在两个相邻标题之间 的文字就是场次内容。④抽取场次特征,基于权力要求1中的专用知识库以及自然语言处理技术挖掘出 剧本各个场次中出现的具有植入广告价值的道具和场所。统计它们的出现次数以及与主要 角色的关系。首先对剧本进行分词处理,然后让分词结果中的每一个名词与权力要求1中的专 用知识库的每一个概念进行匹配,把匹配到的词提取出来作为广告卖点,然后统计各个广 告卖点在整个剧本中出现的次数,以及在各个场次与哪些角色共现。⑤剧本特征查询,基于先前挖掘出来的剧本特征和场次特征为用户提供查询服务。用户可以利用这一功能定位相关剧本场景,系统提供单条件简单检索以及多条件组合 检索,多条件组合检索指的是一个以上条件的联合检索,比如,检索某一道具,某一角色在 哪些场次中出现。
权利要求
1.一种影视剧分析专用知识库的建立方法,其特征在于包括步骤①建立专用知识库的本体概念定义,专用知识库是由一个个概念组成的,每一个概念 对应于一个商品名称,每一个概念由概念名称和属性组成,所述的属性包括概念级别、上层 概念、下层概念、同义词、推荐广告方式和联想广告;②搜集有商业价值的商品名称,每一个商品名称对应一个概念,针对每一个概念,按照 本体概念的各个属性明确其属性值;③编写软件程序,利用软件将搜集到概念逐个录入到数据库中,一个概念对应一条数 据库记录,最终专用知识库存储在一个数据库中;完成影视剧分析专用知识库的建立。
2.根据权利要求1所述的一种影视剧分析专用知识库的建立方法,其特征在于专用 知识库中的概念分为三个层级,第一层概念是顶层概念;第二层概念处于知识库体系的中 间层;第三层概念是底层概念。
3.根据权利要求1所述的一种影视剧分析专用知识库的建立方法,其特征在于概念 级别指的是概念的层级;上层概念指的是当前概念的上层概念;下层概念指的是当前概念 包含哪些下层概念;同义词指的是当前概念的其它称谓;推荐广告方式就当前概念提供一 些在影视剧作品中进行广告植入的方式;联想广告指的是由当前概念所指的商品可以联想 到的其它产品。
4.一种利用权利要求1所述的影视剧分析专用知识库对剧本进行分析的方法,包括步骤①剧本预处理,识别原始剧本中由于人为错误出现的场次序号缺号、重号、号码样式不 统一的现象,提示用户修改;②抽取剧本角色特征,剧本角色特征包括剧本中出现的角色;③按场次分割剧本,在原始剧本中各个场次是连在一起的,为了随后抽取场次特征的 需要,把剧本中出现的各个场次分割切分出来,切分出来的每一个场次由场次标题和内容 组成;④抽取场次特征,利用影视剧分析专用知识库以及自然语言处理技术挖掘出剧本各个 场次中出现的人物、道具和场所,并统计其出现次数以及与主要角色的关系;完成对剧本的分析。
全文摘要
本发明公开了一种影视剧分析专用知识库的建立方法及利用影视剧分析专用知识库对剧本进行分析的方法。它涉及将信息处理技术应用于影视剧制作过程。它能够对影视剧剧本进行自动分析,依据一个专用知识库从剧本文本中找出其中适合于进行商业产品宣传的道具、场景和角色(广告卖点),使用户了解剧本的潜在商业价值;此方法还能够自动抽取剧本中的场次以及每个场次涉及的角色、场景、道具,从而支持按照场次、道具、场景和角色进行单条件及多条件查询,本发明能够改变影视剧制作过程中传统的人工阅读和分析剧本的工作方式,方便影视剧制作人员了解剧本的剧情及其商业价值。
文档编号G06F17/27GK102063481SQ20101060552
公开日2011年5月18日 申请日期2010年12月24日 优先权日2010年12月24日
发明者乔宏章, 李艳茹, 王炳翮, 陈勇 申请人:中国电子科技集团公司第五十四研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1