接收装置、接收方法、传输装置和传输方法与流程

文档序号：13809851阅读：199来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本技术涉及一种接收装置、接收方法、传输装置和传输方法，并且更具体地，涉及例如在视频上叠加和显示字幕和图形的接收装置。

背景技术：

传统上，例如，在位图数据中传输字幕数据的管理已经在诸如数字视频广播(dvb)等广播中执行。近来，已经提出了在文本的字符代码中(即，以文本为基础)传输关于字幕的信息(参见专利文献1)。

引用列表

专利文件

专利文献1：日本专利申请公开号2012-169885

技术实现要素：

本发明要解决的问题

传输字幕(标题)的常规方法是在以下前提下：根据作为背景的视频的分辨率，精确地发送数据，并且因此根据该前提，执行显示。希望可以在接收侧，基于显示器屏幕的尺寸或观看者的观看位置，来校正叠加并显示在视频上的字幕的位置和尺寸。

本技术的目的是使字幕(图形)能够叠加并显示在视频上。

问题的解决方案

根据本技术的概念，一种接收装置包括：接收单元，被配置为接收预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；以及控制单元，被配置为控制对视频流进行解码以获取视频数据的视频解码处理、对字幕流进行解码以获取字幕的位图数据的字幕解码处理、对字幕的位图数据执行校正字幕的尺寸和字幕的显示位置中的至少一个的处理的字幕处理、以及在视频数据上叠加对其执行了处理的字幕的位图数据的视频叠加处理。

根据本技术，接收单元接收预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流。控制单元控制视频解码处理、字幕解码处理、字幕处理和视频叠加处理。在视频解码处理中，视频流被解码，以获取视频数据。在字幕解码处理中，字幕流被解码，以获取字幕的位图数据。

在字幕处理中，对字幕的位图数据执行校正字幕的尺寸和字幕的显示位置中的至少一个的处理。另外，在视频叠加处理中，在视频数据上叠加对其执行了处理的字幕的位图数据。

根据本技术，以这种方式，可以对字幕的位图数据执行校正字幕的尺寸和字幕的显示位置中的至少一个的处理，使得字幕能够有利地叠加并显示在视频上。

注意，根据本技术，例如，在所述字幕处理中，基于观看位置信息和显示器尺寸信息，自动校正所述字幕的尺寸和所述字幕的显示位置中的至少一个。以这种方式执行自动校正，使得字幕的尺寸或显示位置可以被用户(例如，观看者)带入适当的状态，而不需要执行耗时的操作。

在这种情况下，例如，可以进一步提供获取观看位置信息的信息获取单元。另外，在这种情况下，例如，在字幕处理中，可以计算以下表达式：r＝d/(m_h*f)，d表示观看距离，m_h表示显示器的高度，f表示取决于视频的分辨率的值，当r小于第一阈值时对字幕的尺寸执行缩小校正，并且当r大于比所述第一阈值大的第二阈值时对字幕的尺寸执行放大校正。

另外，在这种情况下，例如，在字幕处理中，当观看水平位置存在于显示字幕的区域在水平方向上的端点之外时，根据从端点到观看水平位置的距离，该区域的位置沿水平方向移动到观看水平位置，以自动校正字幕的显示位置。另外，在这种情况下，例如，在字幕处理中，当观看垂直位置存在于显示字幕的区域在垂直方向上的端点之外时，根据从端点到观看垂直位置的距离，区域的位置沿垂直方向移动到观看垂直位置，以自动校正字幕的显示位置。

另外，根据本技术，例如，在字幕处理中，可以基于用户操作来校正所述字幕的尺寸和所述字幕的显示位置中的至少一个。在这种情况下，诸如观看者等用户可以将字幕的尺寸或显示位置带入期望的状态。

另外，根据本技术，例如，在字幕处理中，字幕的尺寸和显示位置中的至少一个的校正可以被限制在容许范围内。以这种方式校正被限制在容许范围内，从而可以避免执行过度校正。

在这种情况下，例如，可以进一步提供信息提取单元，该信息提取单元从字幕流的层提取关于校正的容许范围信息，所述关于校正的容许范围信息插入到字幕流的层中。在所述字幕处理中，可以基于已经提取的容许范围信息，校正被限制在容许范围内。在这种情况下，使用插入在字幕流的层中的容许范围信息，使得可以适当地执行字幕的尺寸校正或显示位置校正的限制。

另外，根据本技术的不同概念，一种传输装置包括：传输单元，被配置为传输预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；以及信息插入单元，被配置为将表示字幕的尺寸校正的容许范围的一条信息和表示字幕的显示位置校正的容许范围的一条信息中的至少一条插入到字幕流的层中。

根据本技术，传输单元传输预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流。信息插入单元将表示字幕的尺寸校正的容许范围的一条信息和表示字幕的显示位置校正的容许范围的一条信息中的至少一条插入到字幕流的层中。

根据本技术，以这种方式，关于字幕的尺寸或显示位置的校正容许范围信息插入到字幕流的层中。因此，在接收侧，可以利用校正容许范围信息来适当地限制字幕的尺寸校正或显示位置校正。

另外，根据本技术的不同概念，一种接收装置包括：接收单元，被配置为接收预定格式的容器，所述容器包括具有视频数据的视频流和具有图形数据的图形流；以及控制单元，被配置为控制对视频流进行解码以获取视频数据的视频解码处理、对图形流进行解码以获取图形的位图数据的图形解码处理、对图形的位图数据执行校正图形的尺寸和图形的显示位置中的至少一个的处理的图形处理、以及在视频数据上叠加对其执行了处理的图形的位图数据的视频叠加处理。

另外，根据本技术的不同概念，一种传输装置包括：传输单元，被配置为传输预定格式的容器，所述容器包括具有视频数据的视频流和具有图形数据的图形流；以及信息插入单元，被配置为将表示图形的尺寸校正的容许范围的一条信息和表示图形的显示位置校正的容许范围的一条信息中的至少一条插入到图形流的层中。

本发明的效果

根据本技术，字幕可以有利地叠加并显示在视频上。注意，在本说明书中描述的效果是但不限于示例，因此可以提供附加的效果。

附图说明

图1是根据实施例的传输和接收系统的示例性配置的方框图；

图2是传输装置的示例性配置的方框图；

图3是ttml结构的表格；

图4示出了存在于ttml结构的报头(head)中的元数据(metadata)、样式(styling)和布局(layout)的相应元素的示例性结构；

图5是用于描述区域的起始位置和结束位置的示图；

图6是ttml结构中的主体(body)的示例性结构的表格；

图7是页面组成段的示例性结构的表格；

图8是区域组成段的示例性结构的表格；

图9是clut定义段的示例性结构的表格；

图10示出了示例性结构中的其中插入了表示字幕的尺寸校正和显示位置校正的容许范围的信息的区域缩放段的示例性结构的表格以及主要信息的描述的表格；

图11是其中插入了表示字幕的尺寸校正和显示位置校正的容许范围的信息的样式(tts)的示例性结构的表格；

图12是用于描述在接收侧的区域的位置(字幕的显示位置)的自动校正的示图；

图13是显示器m_h的观看距离d和高度的示图；

图14是用于描述在接收侧的区域的位置(字幕的显示位置)的自动校正的示图；

图15是传输流ts的示例性配置的示图；

图16是接收装置的示例性配置的方框图；

图17示出了用于描述获取观看位置信息的配置的示图；

图18示出了用于描述字幕的尺寸和显示位置的校正的示图；

图19是在尺寸/位置转换单元中的字幕的尺寸的示例性自动校正处理的流程图；

图20是基于用户操作的尺寸/位置转换单元中的字幕的尺寸的示例性校正处理的流程图；

图21是在尺寸/位置转换单元中的字幕的显示位置的示例性自动校正处理的流程图；

图22是基于用户操作的尺寸/位置转换单元中的字幕的显示位置的示例性校正处理的流程图。

具体实施方式

下面将描述用于执行本发明的模式(在下文中，称为“实施例”)。注意，将按以下顺序给出描述。

1、实施例

2、修改

<1、实施例>

【传输和接收系统的示例性配置】

图1示出了根据该实施例的传输和接收系统10的示例性配置。传输和接收系统10包括传输装置100和接收装置200。

传输装置100生成mpeg2的传输流ts，作为容器，将传输流ts配置在广播波或者网的分组上，以便传输该传输流ts。传输流ts包括具有视频数据(图像数据)的视频流。

另外，传输流ts包括具有字幕数据(字幕数据captiondata)的字幕流。此处，字幕数据包括关于预定格式的字幕的文本信息或字幕的位图数据。表示字幕的尺寸校正和显示位置校正的容许范围的信息插入到字幕流的层中。

接收装置200接收从传输装置100传输的传输流ts。接收装置200对视频流执行解码处理，以获取视频数据，并且另外对字幕流执行解码处理，以获取字幕的位图数据。

接收装置200对字幕的位图数据执行校正字幕的尺寸和显示位置的处理。接着，接收装置200将进行了尺寸校正和显示位置校正的处理的字幕的位图数据叠加在视频数据上，以便获取显示视频数据。

接收装置200基于观看位置信息和显示器尺寸信息自动执行校正处理。另外，接收装置200基于例如观看者的用户操作来执行校正处理。接收装置200将字幕的尺寸和显示位置的校正限制在容许范围内。

接收装置200从字幕流的层提取表示字幕的尺寸校正和显示位置校正的容许范围的信息，并使用该信息来执行限制。当不能从字幕流的层提取校正容许范围信息时，接收装置200使用默认设置的信息。

【传输装置的示例性配置】

图2示出了传输装置100的示例性配置。传输装置100包括控制单元101、相机102、视频光电转换单元103、rgb/ycbcr转换单元104、视频编码器105、字幕生成单元106、文本格式转换单元107、字幕编码器108、系统编码器109和传输单元110。

注意，在传输作为字幕数据的字幕的位图数据，而不是作为字幕数据的关于字幕的文本信息的情况下，传输装置100包括位图数据生成单元111和字幕编码器113，而不包括文本格式转换单元107和字幕编码器108。

控制单元101包括中央处理单元(cpu)，并且基于控制程序来控制传输装置100的每个单元的操作。相机102拍摄被摄体，以输出视频数据(图像数据)。视频光电转换单元103对由相机102获取的视频数据执行光电转换，以获取传输视频数据v1。

rgb/ycbcr转换单元104将传输视频数据从rgb域转换为ycbcr(亮度/色度)域。例如，视频编码器105对变换为ycbcr域的传输视频数据v1进行mpeg4-avc、hevc等编码，以便生成包括编码后的视频数据的视频流(pes流)vs。

字幕生成单元106生成作为字幕信息的文本数据(字符码)dt。文本格式转换单元107接收文本数据dt，以便以预定格式获取关于字幕的文本信息，即本实施例中的定时文本标记语言(ttml)。

图3示出了示例性定时文本标记语言(ttml)结构。以xml为基础描述ttml。在所示示例中，在根容器(根容器)的位置处用“tts：extent”指定字幕显示当前区域。例如，元数据(metadata)、样式(styling)和布局(layout)的相应元素存在于标题(头部)中。图4(a)示出元数据(ttm：ttml元数据)的示例性结构。元数据包括关于元数据标题的信息和关于版权的信息。

图4(b)示出了样式(tts：ttml样式)的示例性结构。除了标识符(id)之外，样式还包括诸如区域(region)的位置和尺寸、颜色(颜色)、字体(fontfamily)、字体尺寸(fontsize)和文本对齐(textalign)等信息。

“tts：origin”以像素数指定作为字幕的显示区域的区域(region)的起始位置。在该示例中设置“tts：origin'480px600px'”，如图5所示，以(480、600)表示起始位置。另外，“tts：extent”用从水平方向和垂直方向的起始位置的偏移像素数来指定该区域的结束位置。在该示例中设置“tts：extent'560px350px”，结束位置用(480+560、600+350)表示。此处，偏移像素数对应于该区域的水平和垂直尺寸。

“tts：opacity＝'1.0'”表示字幕(caption)和背景视频的混合比。例如，“1.0”表示字幕占100％，背景视频占0％，“0.1”表示字幕(caption)占0％，背景视频占100％。在所示的示例中设置“1.0”。

图4(c)示出了布局(ttml布局)的示例性结构。除了设置字幕的区域的标识符(id)之外，布局还包括诸如偏移(填充)、背景颜色(backgroundcolor)和对齐(displayalign)等信息。注意，关于区域(region)的位置和尺寸的信息可能包含在布局中。

图6示出了主体(body)的示例性结构。关于包括字幕1(subtitle1)、字幕2(subtitle2)和字幕3(subtitle3)的三个字幕的信息包括在所示示例中。每个字幕描述了显示起始时间和显示结束时间，并且另外描述了文本数据。例如，对于字幕1(subtitle1)，显示起始时间被设置为“0.76s”，显示结束时间被设置为“3.45s”，并且文本数据被设置为“似乎是矛盾的，但不是，(itseemsaparadox,doesitnot,)”。

返回参见图2，字幕编码器108将由文本格式转换单元107获取的ttml转换成各个段，并且生成包括pes分组的字幕流ss，该pes分组包括设置在有效载荷中的段。

另外，位图数据生成单元111接收由字幕生成单元106生成的文本数据dt，以生成字幕的位图数据。字幕编码器113将字幕的位图数据和显示控制信息转换成各个段，并且生成包括pes分组的字幕流ss，该pes分组包括设置在有效载荷中的段。

在这种情况下，页面组成段(page_composition_segment)包括关于作为字幕的显示区域的区域(region)的起始位置的信息。图7示出了传统上已知的页面组成段的示例性结构(syntax)。“region_horizontal_address”的字段和“region_vertical_address”的字段指示区域(region)的起始位置。

另外，在这种情况下，区域组成段(region_composition_segment)包括指示区域的水平和垂直尺寸的信息。图8示出了传统已知的区域组成段的示例性结构(syntax)。“region_width”字段和“resion_height”字段表示该区域的水平和垂直尺寸。

另外，在这种情况下，clut定义段(clut_definition_segment)包括表示字幕(字幕caption)和背景视频的混合比的信息。图9示出了传统上已知的clut定义段的示例性结构(syntax)。“t值”字段表示字幕和背景视频的混合比。

返回参见图2，系统编码器109生成包括由视频编码器105生成的视频流vs和由字幕编码器108或字幕编码器113生成的字幕流ss的传输流ts。传输单元110将传输流ts设置在广播波或网络的分组上，以便将传输流ts传输到接收装置200。

此处，传输装置100如上所述将表示字幕的尺寸校正和显示位置校正的容许范围的信息插入到字幕流ss的层中。在字幕的位图数据作为字幕数据传输的情况下，即，在传输流ts包括由字幕编码器113生成的字幕流ss的情况下，例如，包括表示字幕的尺寸校正和显示位置校正的容许范围的信息的段插入到字幕流ss的层中。

图10(a)示出了要新定义的区域缩放段(region_scaling_segment)的示例性结构(syntax)，并且图10(b)示出了示例性结构中的主要信息的描述(semantics)。该段包括关于存在的“sync_byte”、“segment_type”、“page_id”、“segment_length”、“region_id”、“scale_up_factor”、“scale_down_factpor”、“positioning_horizontal_factor”和“positioning_vertical_factor”的信息。

“segment_type”的8位字段指示段类型，并且在此处指示区域缩放段。“segment_length”的8位字段指示段的长度(尺寸size)。“region_id”的8位字段表示识别该区域的标识符。

“scale_up_factor”的8位字段指示区域放大因子的容许最大值。“scale_down_factpor”的8位字段指示区域缩小因子的容许最小值。关于“scale_up_factor”和“scale_down_factpor”的信息包括在表示字幕的尺寸校正的容许范围的信息中。

“positioning_horizontal_factor”的8位字段指示区域水平定位因子的容许最大值。“positioning_vertical_factor”的8位字段指示区域垂直定位因子的容许最大值。关于“定位水平因子”和“定位垂直因子”的信息包括在表示字幕的显示位置校正的容许范围的信息中。

另外，在关于字幕的文本信息作为字幕数据传输的情况下，即，在传输流ts包括由字幕编码器108生成的字幕流ss的情况下，例如，表示字幕的尺寸校正和显示位置校正的容许范围的信息与样式(tts)的元素一起插入。

图11示出了这种情况下的样式(tts)的示例性结构。“tts：scale_up_factor”指示区域放大因子的容许最大值。所示的示例指示容许最大值是“aa％”。“tts：scale_down_factor”指示区域缩小因子的最小容许值。所示的示例指示容许最大值是“bb％”。

“tts：positioning_horizontal_factor”指示区域水平定位因子的容许最大值。所示的示例指示容许最大值是“cc％”。“tts：positioning_vertical_factor”指示区域垂直定位因子的容许最大值。所示的示例指示容许最大值是“dd％”。

注意，在省略详细描述的情况下，在关于字幕的文本信息作为字幕数据传输的情况下，认为表示字幕的尺寸校正和显示位置校正的容许范围的信息与布局的元素一起插入，而不是如上所述使用样式(tts)的元素。

此处将描述接收侧的区域的位置的(即字幕的显示位置的)自动校正。此处将描述在水平方向上的自动校正。图12示出了观看位置a处的观看角度e(观看水平位置)是显示器尺寸m_w或更小的示例性情况。此处，显示器尺寸m_w表示从原始位置o到显示器左侧的端部在水平方向上的宽度，原始位置o是该区域在水平方向上的原始显示位置的中心。

以水平方向上的观看位置侧的区域的原始显示位置的结束部分作为参考点p，计算以下表达式：q＝(e-p)/2。当观看距离d是适当的观看距离(＝3*m_h)或更大时，该区域不移动并且保持显示位置的参考点p。同时，当观看距离d小于适当的观看距离时，该区域根据观看距离d移动，使得显示位置的参考点p位于q和e之间。在这种情况下，随着观看距离d减小，e更接近。注意，m_h是如图13所示的显示器的高度。

图12所示的示例示出了观看位置a在水平方向上的位置在原始位置o的左侧的情况。省略了详细描述，同样，甚至观看位置a在水平方向上的位置在原始位置o的右侧的情况下，也自动校正该区域的位置。

另外，图14示出了在观看位置b的观看角度e(观看水平位置)大于显示器尺寸m_w的示例性情况。此处，显示器尺寸m_w示出了从原始位置o到显示器右侧的端部在水平方向上的宽度，原始位置o是该区域在水平方向上的原始显示位置的中心。

以水平方向上的观看位置侧的区域的原始显示位置的端部作为参考点p，计算以下表达式：q＝(m_w-p)/2。当观看距离d是适当的观看距离(＝3*m_h)或更大时，该区域不移动并且保持显示位置的参考点p。同时，当观看距离d小于适当的观看距离时，该区域根据观看距离d移动，使得显示位置的参考点p位于q和m_w之间。在这种情况下，随着观看距离d减小，m_w更接近。

图14所示的示例示出了观看位置b在水平方向上的位置在原始位置o的右侧的情况。省略了详细描述，同样，甚至观看位置b在水平方向上的位置在原始位置o的左侧的情况下，也自动地校正该区域的位置。

如图12所示，在观看位置a处的视角e小于显示器尺寸m_w的情况下，指示参考点p的水平定位因子是0％，指示位置q的水平定位因子是50％，指示位置e的水平定位因子是100％。另外，如图14所示，在观看位置b处的视角e大于显示器尺寸m_w的情况下，指示参考点p的水平定位因子是0％，指示位置q的水平定位因子是50％，指示位置m_w的水平定位因子为100％。

区域水平定位因子的容许最大值例如指示以这种方式定义的水平定位因子容许最大值。在这种情况下，区域水平定位因子的容许最大值可以具有最小值0％和最大值100％。

注意，在省略详细描述的情况下，类似于上述水平方向的情况，执行垂直方向上的区域的位置，即字幕的显示位置的自动校正。另外，区域垂直定位因子的容许最大值指示与上述水平定位因子类似地定义的垂直定位因子允许的最大值。

注意，认为区域水平定位因子被定义为该区域相对于显示器在水平方向上的尺寸的定位量。在这种情况下，区域水平定位因子的容许最大值表示由以这种方式定义的水平定位因子所允许的最大值。类似地，认为区域垂直定位因子被定义为该区域相对于显示器在垂直方向上的尺寸的定位量。在这种情况下，区域垂直定位因子的容许最大值表示由以这种方式定义的垂直定位因子所允许的最大值。区域水平定位因子的容许最大值和区域垂直定位因子的容许最大值不受观察位置的限制。

【传输流ts的示例性配置】

图15示出了传输流ts的示例性配置。在示例性配置中存在用pid1标识的视频流的pes分组“视频pes1”。另外，在示例性配置中存在用pid2标识的字幕流的pes分组“字幕pes2”。

每个pes分组包括pes报头(pesheader)和pes有效载荷(pespayload)。视频流的pes分组包括插入到pes有效载荷中的视频编码流。另外，字幕流的pes分组包括表示字幕的尺寸校正和显示位置校正的容许范围的信息，插入ttml结构的报头或者区域缩放段中存在的样式(tts)的元素中。

另外，传输流ts包括作为节目特定信息(psi)的节目映射表(pmt)。psi包括描述传输流中包括的每个基本流所属的节目的信息。pmt包括节目循环(programloop)，用于描述与所有节目有关的信息。

另外，pmt包括包含与存在的每个基本流有关的信息的基本流循环。示例性配置包括对应于视频流的视频基本流循环(视频es循环)和对应于字幕流的字幕基本流循环(字幕es循环)。

视频基本流循环(视频es循环)包括响应于视频流设置的信息，例如，流类型和分组标识符(pid)，并且另外包括描述设置的与视频流有关的信息的描述符。视频流的“stream_type”的值被设置为例如指示hevc视频流的值，并且pid信息指示提供给视频流的pes分组“视频pes1”的pid1。

字幕基本流循环(字幕es循环)包括响应于字幕流设置的信息，例如，流类型和pid(分组标识符)，并且另外包括描述设置的与字幕流相关的信息的描述符。字幕流的“stream_type”的值被设置为例如指示私有流的值，pid信息指示提供给字幕流的pes分组“subtitlepes2”的pid2。

将简单描述图2中所示的传输装置100的操作。由相机102捕获并获取的视频数据(图像数据)提供给视频光电转换单元103。视频光电转换单元103对由相机获取的视频数据执行光电转换102，以获取传输视频数据v1。

由视频光电转换单元103获取的传输视频数据v1被rgb/ycbcr转换单元104从rgb域转换成ycbcr(亮度/色度)域，以便提供给视频编码器105。视频编码器105对传输视频数据v1执行诸如mpeg4-avc或hevc等编码，以便生成包括编码视频数据的视频流(pes流)vs。

字幕生成单元106生成文本数据(字符代码)dt，作为字幕信息。在字幕的文本信息作为字幕数据传输的情况下，文本数据dt提供给文本格式转换单元107。

文本格式转换单元107基于文本数据dt(参考图3)对包括显示定时(即ttml)的字幕的文本信息进行转换。ttml提供给字幕编码器108。

字幕编码器108将由文本格式转换单元107获取的ttml转换成各个段，并且生成包括pes分组的字幕流ss，该pes分组包括设置在有效载荷中的段。

另外，在字幕的位图数据被作为字幕数据传输的情况下，由字幕生成单元106生成的文本数据dt提供给位图数据生成单元111。

位图数据生成单元111基于文本数据dt生成字幕的位图数据。将字幕的位图数据提供给字幕编码器113。字幕编码器113将传输位图数据m1和显示控制信息转换成各个段，并且生成包括pes分组的字幕流ss，该pes分组包括设置在有效载荷中的段。

由视频编码器105产生的视频流vs提供给系统编码器109。由字幕编码器108或字幕编码器113产生的字幕流ss提供给系统编码器109。系统编码器109产生传输流ts，包括视频流vs和字幕流ss。传输单元110将传输流ts设置到广播波或网络的分组上，以将传输流ts传输到接收装置200。

另外，传输装置100将表示字幕的尺寸校正和显示位置校正的容许范围的信息插入到字幕流ss的层中。在字幕的位图数据作为字幕数据传输的情况下，包括表示字幕的尺寸校正和显示位置校正的容许范围的信息的新定义的区域缩放段插入到字幕流ss(参考图10)。另外，在关于字幕的文本信息作为字幕数据传输的情况下，例如，表示字幕的尺寸校正和显示位置校正的容许范围的信息插入到样式的元素(tts)(参见图11)。

【接收装置的示例性配置】

图16示出了接收装置200的示例性配置。接收装置200包括控制单元201、接收单元202、系统解码器203、视频解码器204、字幕解码器206、字体扩展单元207、rgb/ycbcr转换单元208和字幕解码器209。

另外，接收装置200包括尺寸/位置转换单元210、尺寸/位置转换单元211、视频叠加单元212、ycbcr/rgb转换单元213、电光转换单元214、显示映射单元215、ce显示器216、用户操作单元231和图像传感器232。

控制单元201包括中央处理单元(cpu)，并且基于控制程序来控制接收装置200的每个单元的操作。用户操作单元231包括例如开关、触摸面板和遥控器传输单元，诸如观看者等用户使用该单元执行各种操作。如图17(a)所示，图像传感器232设置在接收装置200的前侧，并且获取包括显示器前方的观看者的图像，以便将图像发送到控制单元201。

图像传感器232与控制单元201一起包括在获取观看位置信息的信息获取单元中。控制单元201分析由图像传感器232获取的图像并检测观看者，以获取观看位置信息(观看距离d和观看角度e)。注意，获取观看位置信息的配置不限于图像传感器232以这种方式的配置。例如，如图17(b)所示，在具有gps的位置获取功能的智能手机用作遥控器的情况下，认为使用通过智能手机的位置获取功能获取的位置信息。

接收单元202接收从传输装置100传输的传输流ts，该传输流ts设置在广播波或网络的分组上。系统解码器203从传输流ts中提取视频流vs和字幕流ss。

视频解码器204对由系统解码器203提取的视频流vs执行解码处理，以输出传输视频数据v1。另外，视频解码器204提取插入到包括在视频流vs中的每个存取单元中的参数集和sei消息，以将参数集和sei消息传输到控制单元201。

字幕解码器206在关于字幕的文本信息作为字幕数据传输的情况下操作。字幕解码器206执行解码处理，以对字幕流ss中包括的每个区域的数据进行分段，以获取每个区域的文本数据和控制代码。控制代码包括也存在的关于字幕和背景视频的混合比信息(混合数据)。

另外，字幕解码器206提取插入到字幕流ss中的表示字幕的尺寸校正和显示位置校正的容许范围的信息，以将信息发送到控制单元201。在这种情况下，已经插入了信息以及样式(tts)元素。利用这种配置，控制单元201识别区域放大因子的最大容许值、区域缩小因子的容许最小值、区域水平定位因子的容许最大值以及区域垂直定位因子的容许最大值。

字体扩展单元207基于由字幕解码器206获取的每个区域的文本数据和控制代码来执行字体扩展，以获取每个区域的位图数据。在rgb域中获取字幕的位图数据。rgb/ycbcr转换单元208将由字体扩展单元207获取的字幕的位图数据从rgb域转换为ycbcr(亮度/色度)域。

字幕解码器209在字幕的位图数据作为字幕数据传输的情况下操作。在这种情况下，包括在字幕流ss中的数据传输到clut。字幕解码器209对字幕流ss执行解码处理，以获取字幕的位图数据以及关于字幕和背景视频的混合比信息(混合数据)。

另外，字幕解码器209提取插入到字幕流ss中的表示字幕的尺寸校正和显示位置校正的容许范围的信息，以将信息发送到控制单元201。在这种情况下，该信息已插入到区域缩放段。利用这种设置，控制单元201识别区域放大因子的最大容许值、区域缩小因子的容许最小值、区域水平定位因子的容许最大值以及区域垂直定位因子的容许最大值。

尺寸/位置转换单元210对从rgb/ycbcr转换单元208或字幕解码器209输出的字幕的位图数据执行校正字幕的尺寸和显示位置。

在控制单元201的控制下，尺寸/位置转换单元210基于观看位置信息和显示器尺寸信息自动执行校正处理。另外，尺寸/位置转换单元210基于例如观看者的用户操作来执行校正处理。在这种情况下，尺寸/位置转换单元210在进行自动校正之后还接收用户操作的校正。

或者，尺寸/位置转换单元210可以通过用户操作使自动校正进入停止状态，并且在这种情况下仅接收用户操作的校正。另外，或者，尺寸/位置转换单元210可以使用户操作的校正进入拒绝状态，并且在这种情况下，仅执行自动校正。

尺寸/位置转换单元210将字幕的尺寸和显示位置的校正限制在容许范围内。此处，基本上使用从字幕流ss中提取的指示容许范围的信息。然而，当指示容许范围的信息未从字幕流ss中提取时，使用默认设置的信息。

图18(a)示出了在显示器的尺寸小的情况下屏幕上的字幕(caption)的示例性显示状态。图18(b)示出了在显示器的尺寸大的情况下屏幕上的字幕(caption)的示例性显示状态。示例中没有执行字幕的尺寸校正。在这种情况下，字幕的尺寸与显示器的尺寸成比例地增加。因此，当从观看者到显示器的距离(即，观看距离)短时，字幕的尺寸过大，使观看者感到烦恼。另外，在这种情况下，如果观看者的前方位置过分偏离字幕的显示位置，则观看者难以自然地观看字幕。

图18(c)示出了在显示器的尺寸大的情况下屏幕上的字幕的示例性显示状态。已经对该示例中的字幕的尺寸执行了缩小校正，并且因此提供了甚至在观看距离较短时也不会使观看者烦恼的状态。另外，在该示例中，已经执行定位校正，以使得字幕的显示位置接近观看者的前方位置，使得观看者自然地容易地观看字幕。

【字幕的尺寸校正处理的描述】

将描述尺寸/位置转换单元210中的字幕的尺寸校正处理。首先，将描述自动校正处理。在显示器上的视频的分辨率是hd的情况下，观看适当距离由到显示器的距离与显示器的高度的比率表示，并且其值适当地为“3”。但是，人们认为在视频的分辨率是uhd的情况下，该值是变化的。即，这个值小，即可以在更近的距离上进行观看。

在处于允许自动校正的模式的情况下，考虑到这一点，尺寸/位置转换单元210执行字幕尺寸的自动校正处理。尺寸/位置转换单元210首先用以下数学公式(1)计算r，包括d表示观看距离，m_h表示显示器的高度，并且f表示取决于视频的分辨率的值。注意，随着视频分辨率的增加，f值会变大。

r＝d/(m_h*f)...(1)

接下来，尺寸/位置转换单元210根据r的尺寸对阈值进行字幕的尺寸校正(放大或缩小)。字幕的尺寸校正对应于该区域的范围的尺寸校正。尺寸/位置转换单元210对字幕的位图数据执行插值处理，以执行字幕的尺寸校正。

当r小于阈值th1时，尺寸/位置转换单元210对字幕的尺寸执行缩小校正，并且当r大于比阈值th1大的阈值th2时，对字幕的尺寸执行放大校正。在这种情况下，尺寸/位置转换单元210将字幕的尺寸校正限制在容许范围内。

图19的流程图示出了尺寸/位置转换单元210中的字幕尺寸的示例性自动校正处理。注意，此处，控制单元201中的相关处理也将被描述为尺寸/位置转换单元210的处理。

尺寸/位置转换单元210首先在步骤st1开始处理。接下来，在步骤st2，尺寸/位置转换单元210获取观看距离d、显示器m_h的高度以及关于视频的分辨率的信息。然后，在步骤st3，尺寸/位置转换单元210计算具有上述数学公式(1)的r。

接下来，尺寸/位置转换单元210在步骤st4确定是否满足以下表达式：r<th1。当确定未满足以下表达式：r<th1时，尺寸/位置转换单元210在步骤st5确定是否满足以下表达式：r>th2。当确定未满足以下表达式：r>th2时，尺寸/位置转换单元210完成步骤st6的处理。即，在这种情况下，尺寸/位置转换单元210使得字幕的尺寸保持不变，而没有校正。

当尺寸/位置转换单元210在步骤st5确定满足以下表达式：r>th2时，处理进行到步骤st7。在步骤st7，尺寸/位置转换单元210以预设的因子放大字幕的尺寸。不用说，放大因子被限制在容许范围内。在步骤st7的处理之后，尺寸/位置转换单元210完成步骤st6的处理。

另外，在步骤st4中，当尺寸/位置转换单元210确定满足以下表达式：r<th1时，处理进行到步骤st8。在步骤st8，尺寸/位置转换单元210以预设的因子缩小字幕的尺寸。不用说，缩小因子被限制在容许范围内。在步骤st8的处理之后，尺寸/位置转换单元210完成步骤st6的处理。

接下来，将描述基于用户操作的尺寸/位置转换单元210中的字幕的尺寸校正处理。在这种情况下，用户操作单元231将关于字幕尺寸的放大或缩小的操作信息提供给控制单元201。尺寸/位置转换单元210基于来自控制单元201的命令，执行对应于用户操作的字幕的尺寸校正。

图20的流程图示出了基于用户操作的尺寸/位置转换单元210中的字幕的尺寸的示例性校正处理。该流程图对应于用户的单位操作，并且在连续执行操作的情况下重复该流程图的处理。

尺寸/位置转换单元210在步骤st11开始处理。接下来，在步骤st12，尺寸/位置转换单元210确定来自控制单元201的命令是字幕尺寸的放大命令还是缩小命令。当确定放大命令时，在步骤st13，尺寸/位置转换单元210在没有达到上限因子时将字幕的尺寸放大预定因子。

即，在这种情况下，在通过自动校正处理或基于先前用户操作的校正处理，字幕尺寸的放大因子已经达到容许最大值的情况下，尺寸/位置转换单元210在步骤st13不执行放大处理。注意，在这种情况下，ce显示器216可以基于控制单元201的控制向用户显示不可能执行放大处理的通知。

在步骤st13的处理之后，尺寸/位置转换单元210在步骤st14完成处理。

另外，当在步骤st12确定缩小命令时，在步骤st15，尺寸/位置转换单元210在没有达到下限因子时将字幕的尺寸缩小预定因子。

即，在这种情况下，在通过自动校正处理或基于先前用户操作的校正处理，字幕尺寸的缩小因子已经达到容许最小值的情况下，尺寸/位置转换单元210在步骤st15不执行缩小处理。注意，在这种情况下，ce显示器216可以基于控制单元201的控制向用户显示不可能执行缩小处理的通知。

在步骤st15的处理之后，尺寸/位置转换单元210步骤st14完成处理。

【字幕的显示位置校正处理的描述】

将描述尺寸/位置转换单元210中的字幕的显示位置校正处理。首先，将描述自动校正处理。在这种情况下，在处于允许自动校正的模式的情况下，尺寸/位置转换单元210自动执行字幕的显示位置校正，如图12和14所述。

图21的流程图示出了尺寸/位置转换单元210中的字幕的显示位置的示例性自动校正处理。注意，此处，控制单元201中的相关处理也将被描述为尺寸/位置转换单元210的处理。

尺寸/位置转换单元210首先在步骤st21开始处理。接下来，在步骤st22，尺寸/位置转换单元210获取观看距离d、观看角度e、显示器的高度m_h、显示器的宽度m_w和关于视频的分辨率的信息。然后，尺寸/位置转换单元210在步骤st23中获取观看位置侧的区域的原始显示位置的结束部分，作为参考点p。在这种情况下，当执行字幕的尺寸校正处理时，区域的原始显示位置是尺寸校正处理之后的显示位置。

接下来，在步骤st24，尺寸/位置转换单元210确定视角e是否是显示器尺寸m_w或更小。当确定视角e是显示器尺寸m_w或更小时，尺寸/位置转换单元210在步骤st25利用以下数学公式(2)计算q。

q＝(e-p)/2...(2)

接下来，在步骤st26，尺寸/位置转换单元210确定观看距离d是否是适当的观看距离(＝3*m_h)或更大。当确定观看距离d是适当的观看距离或更大时，在步骤st27，尺寸/位置转换单元210使得显示位置的参考点p保持不移动该区域。在步骤st27的处理之后，尺寸/位置转换单元210在步骤st28完成处理。

另外，当尺寸/位置转换单元210在步骤st26确定观看距离d小于适当的观看距离时，处理进行到步骤st29。在步骤st29，尺寸/位置转换单元210根据观看距离d移动区域，使得显示位置的参考点p位于q和e之间。在这种情况下，随着观看距离d减小，e更接近。在步骤st29的处理之后，尺寸/位置转换单元210在步骤st28完成处理。

另外，当在步骤st24中，尺寸/位置转换单元210确定视角e大于显示器尺寸m_w时，处理进行到步骤st30。在步骤st30，尺寸/位置转换单元210利用以下数学公式(3)计算q。

q＝(m_w-p)/2...(3)

接下来，在步骤st31，尺寸/位置转换单元210确定观看距离d是否是适当的观看距离(＝3*m_h)或更大。当确定观看距离d是适当的观看距离或更大时，在步骤st32，尺寸/位置转换单元210使得显示位置的参考点p保持不移动该区域。在步骤st32的处理之后，尺寸/位置转换单元210在步骤st28完成处理。

另外，当尺寸/位置转换单元210在步骤st31中确定观看距离d小于适当的观看距离时，处理进行到步骤st33。在步骤st33，尺寸/位置转换单元210根据观看距离d移动该区域，使得显示位置的参考点p根据观看距离d位于q和m_w之间。在这种情况下，随着观看距离d减小，m_w更接近。在步骤st33的处理之后，尺寸/位置转换单元210完成步骤st28的处理。

接下来，将描述基于用户操作的尺寸/位置转换单元210中的字幕的显示位置校正处理。在这种情况下，用户操作单元231将关于字幕在水平方向或垂直方向上的显示位置的定位操作信息提供给控制单元201。注意，定位操作信息包括关于定位方向的信息，即，表示在水平方向的右或左的信息和表示在垂直方向的上或下的信息。尺寸/位置转换单元210基于来自控制单元201的命令来执行与用户操作对应的字幕的显示位置校正。

图22的流程图示出了基于用户操作的尺寸/位置转换单元210中的字幕的显示位置的示例性校正处理。该流程图对应于用户的单位操作，并且在连续执行操作的情况下重复该流程图的处理。

尺寸/位置转换单元210在步骤st41开始处理。接下来，在步骤st42，尺寸/位置转换单元210确定来自控制单元201的命令是在水平方向(h方向)上的定位命令还是在垂直方向(v方向)上的定位命令，用于字幕的显示位置。

当在h方向上确定定位命令时，在步骤st43，尺寸/位置转换单元210在定位因子不超过容许最大值的范围内沿指定方向(右或左)移动区域。尺寸/位置转换单元210可以在步骤st13不执行定位处理。注意，在这种情况下，ce显示器216可以基于控制单元201的控制向用户显示定位处理不可能执行的通知。

在步骤st43的处理之后，尺寸/位置转换单元210在步骤st44完成处理。

另外，在步骤st42中，当尺寸/位置转换单元210在v方向上确定定位命令时，在步骤st45中，尺寸/位置转换单元210在定位因子不超过容许最大值的范围内沿指定方向(上或下)移动区域。尺寸/位置转换单元210可以在步骤st45不执行定位处理。注意，在这种情况下，ce显示器216可以基于控制单元201的控制向用户显示定位处理不可能执行的通知。

在步骤st45的处理之后，尺寸/位置转换单元210在步骤st44完成处理。

返回参见图16，尺寸/位置转换单元211对从字幕解码器209输出的混合比信息(混合数据)执行与尺寸/位置转换单元211中的字幕的尺寸和显示位置的校正处理相似的校正处理。

视频叠加单元212将尺寸/位置转换单元210已经对其进行了尺寸和显示位置的校正处理的字幕的位图数据叠加在由视频解码器204获取的传输视频数据v1上。在这种情况下，视频叠加单元212以由混合比信息(混合数据)指示的混合比来混合字幕的位图数据。

在这种情况下，当关于字幕的文本信息作为字幕数据从传输侧传输时，使用由字幕解码器206获取的混合比信息(混合数据)。同时，当字幕的位图信息作为字幕数据从传输侧传输时，使用尺寸/位置转换单元211已经对其执行了尺寸和显示位置的校正处理的混合比信息(混合数据)。

ycbcr/rgb转换单元213将其上叠加了字幕的位图数据的传输视频数据v1'从ycbcr(亮度/色度)域转换为rgb域。电光转换单元214向转换到rgb域的传输视频数据v1'应用与应用于传输视频数据v1'的光电转换特性对应的电光转换特性，以便执行电光转换，以便获取用于显示图像的显示视频数据。

显示映射单元215对显示视频数据执行与例如ce显示器216的最大亮度显示性能对应的显示亮度调整。ce显示器216基于显示视频数据显示图像。ce显示器216包括例如液晶显示器(lcd)或有机电致发光显示器(有机el显示器)。

将简单描述图16中所示的接收装置200的操作。接收单元202接收从传输装置100传输的传输流ts，该传输流ts设置在广播波或网络的分组上。传输流ts提供给系统解码器203。系统解码器203从传输流ts中提取视频流vs和字幕流ss。

由系统解码器203提取的视频流vs提供给视频解码器204。视频解码器204对视频流vs执行解码处理，以获取传输视频数据v1。另外，视频解码器204提取插入到包括在视频流vs中的每个存取单元中的参数集和sei消息，以将参数集和sei消息发送到控制单元201。

在关于字幕的文本信息作为字幕数据传输的情况下，由系统解码器203提取的字幕流ss提供给字幕解码器206。字幕解码器206对包括在字幕流ss中的每个区域的段数据执行解码处理，以获取每个区域的文本数据和控制代码。控制代码还包括关于字幕和背景视频的混合比信息(混合数据)。

另外，字幕解码器206提取插入到字幕流ss中的表示字幕的尺寸校正和显示位置校正的容许范围的信息，以将信息发送到控制单元201。在这种情况下，已经插入了该信息以及样式(tts)的元素。利用这种设置，控制单元201识别区域放大因子的最大容许值、区域缩小因子的容许最小值，区域水平定位因子的容许最大值以及区域垂直定位因子的容许最大值。

由字幕解码器206获取的每个区域的文本数据和控制代码提供给字体扩展单元207。字体扩展单元207基于每个区域的文本数据和控制代码来执行字体扩展，以获取每个区域的位图数据。rgb/ycbcr转换单元208将由字体扩展单元207获取的每个区域的位图数据从rgb域转换为ycbcr(亮度/色度)域。

另外，在字幕的位图数据作为字幕数据传输的情况下，由系统解码器203提取的字幕流ss提供给字幕解码器209。字幕解码器209对字幕流ss执行解码处理，以获取字幕的位图数据以及关于字幕和背景视频的混合比信息(混合数据)。

从rgb/ycbcr转换单元208或字幕解码器209输出的字幕的位图数据提供给尺寸/位置转换单元210。尺寸/位置转换单元210向字幕的位图数据执行校正字幕的尺寸和显示位置的处理。在这种情况下，在控制单元201的控制下(参见图19至图22)，自动地或者根据用户操作来执行校正处理。在容许范围内进行校正。

由视频解码器204获取的传输视频数据v1提供给视频叠加单元211。另外，尺寸/位置转换单元210已经对其进行了尺寸和显示位置的校正处理的字幕的位图数据提供给视频叠加单元211。此外，由字幕解码器206获取的混合比信息(混合数据)或尺寸/位置转换单元211已经对其执行了尺寸和显示位置的校正处理的混合比信息(混合数据)提供给视频叠加单元211。

视频叠加单元212基于诸如显示器尺寸和观看位置等信息或者根据用户操作，在传输视频数据v1上叠加已经自动执行了尺寸和显示位置的校正的字幕的位图数据。其上叠加了位图数据的传输视频数据v1'提供给ycbcr/rgb转换单元213。

ycbcr/rgb转换单元213将传输视频数据v1'从ycbcr(亮度/色度)域转换到rgb域，以便将传输视频数据v1'提供给电光转换单元214。电光转换单元214向传输视频数据v1'应用与应用于传输视频数据v1'的光电转换特性对应的电光转换特性，以执行电光转换，使得获取显示视频数据。

将显示视频数据提供给显示映射单元215。显示映射单元215对显示视频数据执行与例如ce显示器216的最大亮度显示性能对应的显示亮度调整。以这种方式已经对其进行了显示亮度调整的显示视频数据提供给ce显示器216。ce显示器216基于显示视频数据显示图像。

如上所述，在图1所示的传输和接收系统10中，接收装置200向字幕的位图数据执行校正字幕的尺寸和显示位置的处理。因此，例如，甚至当在大屏幕的显示器上执行显示并且观看距离短时，字幕可以有利地叠加并显示在视频上。

另外，在图1所示的传输和接收系统10中，接收装置200基于观看位置信息和显示器尺寸信息自动校正字幕的尺寸和字幕的显示位置。因此，字幕的尺寸和显示位置可以被用户(例如，观看者)带入适当的状态，而不需要执行耗时的操作。

另外，在图1所示的传输和接收系统10中，接收装置200基于用户操作来校正字幕的尺寸和字幕的显示位置。因此，诸如观看者等用户可以使字幕的尺寸和显示位置进入期望的状态。

另外，在图1所示的传输和接收系统10中，接收装置200将字幕的尺寸和显示位置的校正限制在容许范围内。因此，可以避免过度的校正。

另外，在图1所示的传输和接收系统10中，接收装置200从字幕流的层中提取校正容许范围信息，以便基于容许范围信息将字幕的尺寸和显示位置的校正限制在容许范围内。因此，可以适当地限制字幕的尺寸校正和显示位置校正。

另外，在图1所示的传输和接收系统10中，传输装置100在字幕流的层中插入关于字幕的尺寸和显示位置的校正容许范围信息，以传输校正容许范围信息。因此，字幕的尺寸校正和显示位置校正可以在接收侧用校正容许范围信息适当地限制。

<2、修改>

注意，根据上述实施例，已经给出了可以校正字幕的尺寸和显示位置的示例。设置在图形或其他类似信息叠加并显示在视频上的情况下，也可以类似地应用本技术，因此可以有利地校正图形或其他类似信息的尺寸和显示位置。

另外，根据上述实施例，已经给出了容器是mpeg-2ts的示例。然而，本技术不限于作为容器的mpeg-2ts，因此可以同样应用于诸如isobmff和mmt等其他分组。

另外，本技术可以具有以下配置。

(1)一种接收装置，包括：

接收单元，被配置为接收预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；以及

控制单元，被配置为控制对视频流进行解码以获取视频数据的视频解码处理、对字幕流进行解码以获取字幕的位图数据的字幕解码处理、对字幕的位图数据执行校正字幕的尺寸和字幕的显示位置中的至少一个的处理的字幕处理、以及在视频数据上叠加对其执行了处理的字幕的位图数据的视频叠加处理。

(2)根据上述(1)所述的接收装置，其中，在所述字幕处理中，基于观看位置信息和显示器尺寸信息，自动校正所述字幕的尺寸和所述字幕的显示位置中的至少一个。

(3)根据上述(2)所述的接收装置，还包括：

信息获取单元，被配置为获取观看位置信息。

(4)根据上述(2)或(3)所述的接收装置，其中，在所述字幕处理中，计算以下表达式：r＝d/(m_h*f)，d表示观看距离，m_h表示显示器的高度，f表示取决于视频的分辨率的值，当r小于第一阈值时对字幕的尺寸执行缩小校正，并且当r大于比所述第一阈值大的第二阈值时对字幕的尺寸执行放大校正。

(5)根据上述(2)到(4)中任一项所述的接收装置，其中，在所述字幕处理中，当观看水平位置存在于显示字幕的区域在水平方向上的端点之外时，根据从端点到观看水平位置的距离，该区域的位置沿水平方向移动到观看水平位置，以自动校正字幕的显示位置。

(6)根据上述(2)到(4)中任一项所述的接收装置，其中，在所述字幕处理中，当观看垂直位置存在于显示字幕的区域在垂直方向上的端点之外时，根据从端点到观看垂直位置的距离，区域的位置沿垂直方向移动到观看垂直位置，以自动校正字幕的显示位置。

(7)根据上述(1)到(6)中任一项所述的接收装置，其中，在所述字幕处理中，基于用户操作来校正所述字幕的尺寸和所述字幕的显示位置中的至少一个。

(8)根据上述(1)到(7)中任一项所述的接收装置，其中，在所述字幕处理中，所述字幕的尺寸的校正和所述字幕的显示位置的校正中的至少一个被限制在容许范围内。

(9)根据上述(8)所述的接收装置，还包括：

信息提取单元，被配置为从字幕流的层提取关于校正的容许范围信息，所述关于校正的容许范围信息插入到字幕流的层中，

其中，在所述字幕处理中，基于已经提取的关于校正的容许范围信息，校正被限制在容许范围内。

(10)一种接收方法，包括：

接收步骤，通过接收单元接收预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；

视频解码步骤，对视频流执行解码处理，以获取视频数据；

字幕解码步骤，对字幕流执行解码处理，以获取字幕的位图数据；

字幕处理步骤，对字幕的位图数据执行校正字幕的尺寸和字幕的显示位置中的至少一个的处理；以及

视频叠加步骤，在视频数据上叠加对其执行了处理的字幕的位图数据。

(11)一种传输装置，包括：

传输单元，被配置为传输预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；以及

信息插入单元，被配置为将表示字幕的尺寸校正的容许范围的一条信息和表示字幕的显示位置校正的容许范围的一条信息中的至少一条插入到字幕流的层中。

(12)一种传输方法，包括：

传输步骤，通过传输单元传输预定格式的容器，所述容器包括具有视频数据的视频流和具有字幕数据的字幕流；以及

信息插入步骤，将表示字幕的尺寸校正的容许范围的一条信息和表示字幕的显示位置校正的容许范围的一条信息中的至少一条插入到字幕流的层中。

(12)一种接收装置，包括：

接收单元，被配置为接收预定格式的容器，所述容器包括具有视频数据的视频流和具有图形数据的图形流；以及

控制单元，被配置为控制对视频流进行解码以获取视频数据的视频解码处理、对图形流进行解码以获取图形的位图数据的图形解码处理、对图形的位图数据执行校正图形的尺寸和图形的显示位置中的至少一个的处理的图形处理、以及在视频数据上叠加对其执行了处理的图形的位图数据的视频叠加处理。

(13)一种传输装置，包括：

传输单元，被配置为传输预定格式的容器，所述容器包括具有视频数据的视频流和具有图形数据的图形流；以及

信息插入单元，被配置为将表示图形的尺寸校正的容许范围的一条信息和表示图形的显示位置校正的容许范围的一条信息中的至少一条插入到图形流的层中。

本技术的主要特征是校正了字幕(图形)的尺寸和显示位置的处理单元已经提供给字幕(图形)的位图数据，使得字幕(图形)可以有利地叠加并显示在视频上(参见图18)。

附图标记列表

10传输和接收系统

100传输装置

101控制单元

102相机

103视频光电转换单元

104rgb/ycbcr转换单元

105视频编码器

106字幕生成单元

107文本格式转换单元

108字幕编码器

109系统编码器

110传输单元

111位图数据生成单元

113字幕编码器

200接收装置

201控制单元

202接收单元

203系统解码器

204视频解码器

206字幕解码器

207字体扩展单元

208rgb/ycbcr转换单元

209字幕解码器

209ycbcr/rgb转换单元

210、211尺寸/位置转换单元

212视频叠加单元

213ycbcr/rgb转换单元

214电光转换单元

215显示映射单元

216ce显示器

231用户操作单元

232图像传感器

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：塚越郁夫
技术所有人：索尼公司
我是此专利的发明人

上一篇：用于交互式视频体验的分层交互式视频平台的制作方法
上一篇：用于显示图像的设备及其操作方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。