157
{{thumb}}
0
从事彩色图像拍摄、显示及处理系统开发工作的小伙伴们,对 YCBCR 或 YUV 一定不陌生(注:YUV 是模拟电视的技术术语,用来描述 PAL/SECAM 制式全电视信号的三个色彩分量,对应的数字化分量应使用 YCBCR 来表示,使用 YUV 描述数字图像的色彩分量是不严谨的)。在相关的工程技术中,常将 Y 称作亮度分量,而 CBCR 或 UV 则称作色度分量。众所周知,在 CIE(国际照明委员会)于 1931 年定义的 XYZ 色空间中,Y 也表征亮度。那么,YCBCR 的 Y 究竟是不是 CIE XYZ 的 Y 呢?对于许多从业者来说,这可能是一个因过于显而易见故不曾认真思考过的概念问题。本着追本溯源的精神,今天我们就与大家一起来学习一下。
色空间与色空间变换
由向量空间的概念可知,任意一组线性无关的向量均可形成向量空间,这组向量称为该空间的基,基的元素称为基向量(也称单位向量)。色空间的本质为三维向量空间,因此,任意三种相互独立的颜色(即三色之中的任意一者均不能由另外两者相加混合得到)皆可视为一组基色,从而定义一个色空间。因此,在不同色空间中,用不同的基色表示同一种颜色,会产生不同的坐标。将同一颜色的坐标从一个色空间转换到另一个色空间的过程,称作色空间变换,而这种变换的本质为基的变化引发的坐标变换。在本文中,我们以数字高清晰度电视的全球信源标准 ITU-R BT.709 建议书(以下简称 BT.709)定义的色空间为例,进行分析。
BT.709 RGB 色空间
表1 BT.709 定义的基色及基准白的 xy 色品坐标:
BT.709 定义了显示用红、绿、蓝三基色与基准白的色品坐标,该定义也被后来的 sRGB 标准(IEC 61966-2-1)采用。在 CIE 1931 XYZ 色空间中观察,BT.709 定义的三个基向量的方向由 [R]、[G]、[B] 三基色的色品坐标确定,而三个基向量的长度则由基准白的色品坐标决定,并由亮度方程给出,即 Y = 0.2126 R + 0.7152 G + 0.0722 B。根据亮度方程以及色品坐标之和为 1(即 x+y+z=1)的属性,可得到 XYZ 与 RGB 间的坐标变换关系。
BT.709 定义的 YCBCR 色空间
除 RGB 色空间外,BT.709 还定义了彩色电视信号传送用色差分量 CB、CR 的表达式,我们可据此写出 YCBCR 与 RGB 间的坐标变换关系。实际上,YCBCR 可视为一组传送基色,而 RGB 则是一组显示基色,两者各自形成色空间。
BT.709 YCBCR 与 CIE XYZ 的关系
对比以上两式,Y 与 RGB 的关系都来自亮度方程,因此,两个 Y 值相等,均表征亮度。这是一个看似简单而确定的结论,而故事并未就此完结。继续观察以上两式,不难发现,在 BT.709 RGB 色空间中,坐标为 (1, 1, 1) 的颜色,在 CIE XYZ 色空间的坐标为 (0.9505, 1, 1.0891),而在 YCBCR 色空间中的坐标为 (1, 0, 0)。回忆基向量的定义,在 YCBCR 色空间中,坐标 (1, 0, 0) 对应基向量 [Y]。换言之,YCBCR 色空间的基向量 [Y] 在 CIE XYZ 色空间中可由 0.9505 份基色 [X]、1 份基色 [Y] 与 1.0891 份基色 [Z] 相加混合而成。显然,虽然这两个基向量有着相同的符号 [Y],然而它们却指向两个截然不同的方向。为方便区分,在下文中我们将 YCBCR 的 Y 替换为 W。
图1 CIE 1931 xy 色品图。(图片来源:https://en.wikipedia.org/wiki/SRGB#/media/File:SRGB_chromaticity_CIE1931.svg)
在图 1 所示的 xy 色品图中,可以清晰地看到,基向量 [Y] 位于 y 轴上,坐标为 (0, 1),而基向量 [W] 位于系统基准白的位置,坐标为 (0.3127, 0.3290)。其实,这完全在意料之中,因为基向量 [Y] 是物理上不可实现的、虚拟的基色;而彩色图像的亮度分量 W 实际上是一幅灰度图像,因此基向量 [W] 必须是物理上客观存在的、可显示的。
图2 彩色图像(上图)对应的 W 分量(中图)与 Y 分量(下图)。注:由于 [Y] 基色无法在物理世界呈现,因此下图为示意图。(彩色图片来源:https://r0k.us/graphics/kodak/)
假如色品图仍然不够直观的话,我们再来观察一副图像。如图 2 所示,我们将一副彩色图像(上图)由 BT.709 RGB 色空间分别转换到 BT.709 WCBCR 及 CIE XYZ 色空间,并分别观察 W 分量与 Y 分量图像。与刚刚在 xy 色品图中观察到的现象相同, 基色 [W] 实际上是 CIE D65 标准照明体的白色,因此,W 分量图像为灰度图像(中图),而基色 [Y] 可想象为较人眼能感知的绿色更为饱和的超级绿色(本来它是无法在物理世界呈现的,但为了给大家一个直观的视觉体验,我们对图像做了一些处理),因此 Y 分量图像看起来是绿油油的。
图3 任一颜色 C 的 W 坐标以及 Y 坐标的确定
那么,问题来了,既然 [W] 与 [Y] 是两个不同的基向量,为什么 W 值与 Y 值又是相同的呢?如在 CIE XYZ 色空间中稍作观察,便不难发现,基向量 [Y] 在 Y 轴上,而基向量 [W] 相对 Y 轴是倾斜的,如图 3 所示。然而,由于基向量 [W] 的 Y 坐标为 1(即亮度为 1),因此在图中 [W] 与 [Y] 等高,[W] 稍长于 [Y]。此外,由于 [CB]、[CR] 两个基色均无亮度(各位小伙伴可自行证明),故两者皆位于 XZ 平面内。很明显,[W][CB][CR] 这组基向量在 CIE XYZ 色空间中并不是正交的。不过,任一颜色 C 的 Y 坐标与 W 坐标均可借助过 C 点且平行于 XZ 的平面与 W 轴及 Y 轴的交点而确定,又考虑到 [W] 与 [Y] 两个基向量等高,因此,任一颜色 C 的 W 坐标与 Y 坐标相等。
结论
同一颜色在 YCBCR 色空间中的 Y 坐标与在 CIE 1931 XYZ 色空间中的 Y 坐标相同,也即这两个 Y 值相同,均表征亮度。然而,由于两者对应的基向量(坐标轴)的方向不同,故两者的物理意义并不相同,YCBCR 的基色 [Y] 是可见的,而 CIE 1931 XYZ 的基色 [Y] 是不可见的。以下为上述结论的绕口令版:此 Y 即彼 Y,而此 [Y] 非彼 [Y]。
以上结论适用于 YCC 类空间。不过,值得注意的是,以上仅是从色度学视角对 YCBCR 色空间进行了分析,而色度计算均建立在颜色的相加混合满足格拉斯曼定律的前提之上,即颜色的相加混合是线性的。然而,在实际的静态或运动图像的拍摄或生成过程中,一般会先对图像的 RGB 分量进行非线性处理(称为伽马、对数或光电转换函数),导致其后的色空间转换结果与色度学计算结果出现差异,在这种情况下得到的 Y 分量图像将混入色度信息,不再单纯表征亮度,上述结论中的 “此 Y 即彼 Y” 亦不能成立(R=G=B 时除外)。
{{CommentDatavv.name+' '+(CommentDatavv.to_user_id!=CommentDatav.user_id?('回复'+CommentDatavv.to_name):'')}}: