我们看看半导体技术发展的进程,半导体的进程已经从50纳米发展到60纳米,这使大规模高速处理已经成为可能。随着IT技术也取得迅猛发展,我们CPU的性能进步,计算机可以进行更复杂的处理,而且更高图象质量的利用也已经成为可能。在这儿,想探讨一下,在这样一些技术的进步的发展过程中,对今后高拍摄制作使用的图象压缩技术我们应该有怎样的认识。
在这儿,对今后图象压缩所追求的目标,我们进行一下归纳和总结,在这儿归纳的内容都是从中央电视台和制作公司的客户那儿听取他们的意见总结归纳而成的。
第一点,是与多数的厂家能够技术共享,便于搭建设备和系统,在集成IT网络中,众多的厂商往往是以合力协作的形式共同推进,因此需要国际标准规格,而且容易利用编解码的系统环境。第二点,可以得到与被摄场景无关的高清图象,比如体育、音乐等节目,这是专业的基本要求。第三,是希望节目内容制作中能够保持高的图象质量,不会出现图象略化和损失的现象。第四点,目前的半导体技术可以实现实时编解码,而且相对过去的技术效率提高至少两倍以上,并且具有前瞻性的技术。第五,CPU可以实现软件处理的发展,今后软件处理将会越来越重要。
基于以上的观点,我想我们应该选择什么样的图象压缩技术,并且推动它的发展。我们在进入具体的讨论之前,先把图象压缩技术基本工具进行一下分析和整理。图象压缩技术大体上可以分为帧内压缩和GOP压缩。在这儿我们给出压缩工具整个的信号处理的一个框图,浅红色的是通用工具,我们过去的压缩工具就是根据这个而来的。预测编码分为两种,分别是在图象内预测图象的帧内预测,以及多个画面进行补偿的预测。这些压缩技术每年都有更新和改进。
在选择帧内压缩和GOP压缩上,怎样得到高水平质量的画面是我们应该考虑的问题,当然还有软件性能等等方面。在达到此前所要求的目的方面,我们对帧内和GOP各自的优点来做下比较。帧内压缩方面,它是对每个画面进行处理,利用画面中的纵向和横向象素关联来进行压缩,而在GOP压缩方面,它是把多个帧放在一起进行处理,在纵向和横向的基础上又引入了时间轴概念来进行压缩处理,也就是说,即使拍摄对象移动,只要将移动的方向加以传送,在接收端就可以复原这一过程。
因此,GOP从专业级应用观点来看,存在着很多难以解决的问题,我们知道摄像机拍摄的视频图象总是在变化,在闪光交织的报道现场和动作剧烈的体育视频,依靠GOP无法进行预测,而图象也会因此出现损失。
另外我们从编辑的一程度和保持画面的质量角度出发,帧内压缩只需要通过数据排列就可以,而GOP中,长GOP的结构发生变化后,需要重新的压缩,结果必然导致图象质量的变化,这是长GOP自身原理上本身固有的问题。在CPU发展的适应性方面,能不能很容易进行并行处理,也就是是否能在电脑中进行流畅的视频编辑也是很重要的一个方面。通过以上的分析,我们可以得出结论,帧内压缩是适合编辑素材的压缩方法,而长GOP的压缩是适用于允许失帧的低码率的压缩手法。
下面是我要谈的第二个选择方面,针对帧内压缩方面,包括了很多压缩方式可以供我们选择,但是哪种压缩方式最合适,下面我来加以论证。我们选择帧内压缩的时候,一般提到目标里面的第一第四第五作为我们选择的重点。
最后我们来总结一下AVC帧内的一些特点,首先采用了多种改善手法,达到了与原有的压缩图象质量相比两倍的效率,和被摄物体场景无关的图象略化很小,并且形成了实用化,具有符合高清演播室规格的100兆的模式,此外基于软件的非线编辑也已经成为可能。
今天为了满足众多客户迫切希望了解今后图象压缩的需要,我对相应的压缩图象技术进行了说明,面向中国广播电视事业的数字化,高清化的需要,为了迎接明年北京奥运会的成规举办,松下电气将不断扩充图象压缩机器的性能。