영상/음성 압축 기술 share

today 2010-02-13 face Posted by appkr turned_in Learn & Think forum 0

멀티미디어는 인터넷보다 더 오래된 화두이다. 1990 년 마이크로소프트를 중심으로 MPC (Multimedia PC) 레벨 1 을 발표했다. 사실상 CD-ROM 하나 달랑 달아놓고 멀티미디어 PC 라고 우기는 것처럼 보인다. 이후에 1993 년에 발표된 MPC 레벨 2 에서는 ‘Video for Window’와 그것을 기반으로 하는 ‘640×480×16비트’ 컬러의 동영상 재생과 16 비트 음원 재생 조건을 명시한다. 10년이라는 세월은 1920×1080×30fps 의 HD 영상과 5.1~7.1 채널의 고음질 멀티미디어 시대로 바꾸어 놓았다. 여기서는 이 시대의 PC를 위주로 한 멀티미디어 재생 환경과 포맷에 대해 얘기해 보겠다.

DivX 전성시대

공룡의 전성시대는 중생대 쥬라기이다. 21 세기 현대 인터넷은 DivX 라는 공룡의 시대이다. 아마 DVD, 공중파 HDTV 보다 DivX 로 영화를 보는 사람이 많을지도 모른다. MPEG-2 를 기반으로 하는 DVD 보다 MPEG-4 를 기반으로 하는 DivX 는 압축률이 높기 때문에 CD 1~3 장 정도의 분량에 DVD 영화와 크게 차이나지 않는 화질과 음질로 저장할 수 있는 큰 매력이 있다. 정품 DVD 시장이 불법 DivX 영상 때문에 황폐해진다는 영화와 음반 산업계의 경고가 DivX 영화를 하루아침에 사라진 공룡처럼 초토화시켜 버릴지도 모르겠다. 하지만 점차 고화질, 고음질로 고품질화되는 멀티미디어 파일에 DivX 라는 기술과 여기에 사용되는 DivX, DIVX, AC3, DTS 등의 용어의 의미와 이유를 짚어보자.

DIVX 와 DivX

DivX 의 어원(?)은 DIVX이다. 현재 사용되고 있는 DivX 라는 이름은 DIVX (DIgital Video eXpress의 약자) 에서 따온 것이다. 그러나 DIVX 와 DivX 는 이름만 같은 뿐, 전혀 관련이 없는 것이다. 하지만 DivX 의 이름을 DIVX 에서 따온 것에는 이유가 있고 역사를 되짚어 보는 것도 재미있으니 DIVX 에 대해 먼저 알아보자.

DIVX 는 1997 년에 미국 최대의 전자유통 회사 중 하나인 서킷 시티 (Circuit City) 와 할리우드 영화 판권 중계업을 하는 지프렌 (Ziffren), 브리텐햄 (Brittenham), 밴카&피셔 (Banca&Fischer) 의 3 개사가 공동으로 출자한 디지털 비디오 익스프레스 (Digital Video Express) 가 개발한 DVD 형식의 디스크를 위한 비디오 영화 대여 시스템이었다.

DIVX 를 이용하려면 300~500 달러 정도의 모뎀, 암호화 마이크로칩, 그리고 플래시 메모리 등 DIVX 가 장착된 DVD 플레이어를 구입해야 했다. 그 후 DIVX 디스크를 넣고 DVD 플레이어에 붙어 있는 재생 단추를 누르면 만 48 시간 동안만 그 디스크를 재생해 비디오 영화를 볼 수 있었다. 반환하지 않는 대여 디스크인 셈이다. 첩보영화에 나오는 자동파괴 디스크와 개념적으로 흡사하다고 할 수 있다. 그리고 추가로 그 비디오 영화를 더 보고 싶을 때는 전화선과 연결된 모뎀을 통해 시청 시간을 연장할 수 있었다.

기존 DVD 타이틀이 1 편 당 20∼30 달러이며 대부분 구입한 타이틀을 2 번 이상 반복해서 보지 않는다는 점을 감안할 때, 5 달러 이하에 DIVX 용 DVD 타이틀을 살 수 있다는 점과 불법복제를 차단할 수 있는 장점 때문에 관련 업계로부터 상당한 호응을 얻었다. 장비 제조업체 중 미국의 제니스 (LG전자가 인수) 와 톰슨, 일본의 마쓰시타는 이 기술을 수용하겠다는 입장을 표명했으며, 메이저 영화사에서는 그때까지 DVD 타이틀 제작에 미온적인 반응을 보여왔던 디즈니를 필두로 파라마운트, 유니버설, 드림웍스가 이 기술을 지지하고 나섰다. 그러나 여러 DVD 업체와 시민단체들의 반발이 계속되면서 소비자들이 외면하게 되었고 1999년 6 월 16 일 DIVX 의 회장은 이 새로운 포맷이 시장에서 실패했고 2 년 후 업계에서 완전히 철수할 것이라고 공식적으로 발표했다.

DivX의 탄생

맥스모리스 (MaxMorice) 라는 닉네임을 가진 프로그래머가 마이크로소프트가 ASF 파일 형식을 위해서 만든 MPEG-4 코덱에 걸려 있는 제한을 바이너리를 조작, 변경 가능하게 하고 음성은 MP3 로 대체한 코덱을 ‘DivX’ 라는 이름으로 발표했다. 이 DivX 는 발표되자마자 순식간에 인터넷을 통해 전 세계로 퍼져나가게 되었는데, 그 이유는 DeCSS 를 이용해 DVD 를 복제한 후 DivX 라는 동영상 형식으로 만든 영화는 거의 DVD 와 비슷한 화질을 보여주면서도 CD 한두 장 분량에 충분히 들어가므로 인터넷이나 PC 통신의 영화 동호회를 중심으로 엄청난 속도로 퍼져나갈 수 있었기 때문이었다.

실제로 DivX 를 유명하게 만든 것은 ‘DivX ;-) 3.11 alpha’ 이다. 불과 얼마 전까지만 해도 대부분의 DivX 는 이 언더그라운드 포맷인 DivX 3.11 로 만들어졌다. 얼굴이 알려지지 않은 수많은 사람들과 그룹들이 DivX 로 만들어진 고화질의 영화를 계속해서 쏟아냈고 수많은 네티즌들이 이를 다운로드해서 보곤 했다. 그래서인지 와레즈과 같은 언더그라운드에서 사용하는 것과 같이 대소문자를 섞어 쓰는 표기법을 이용해 초기의 DIVX 와는 다르게 ‘DivX’ 라고 표기를 하고 윙크하는 이모티콘 ;-) 을 붙여 사용했다. DivX ;-) 3.11 alpha 와는 별도로 여러 가지 시험용 코덱들이 개발되었는데 그중에 Project Mayo 그룹에서 개발한 DivX 4.X (4.12까지 발표되었음) 도 있다. DivX 4.X 는 기본적으로는 DivX 3.X 와 호환성을 가지고 있으나 실제 업그레이드 버전이 아니라 별도로 만들어진 코덱이기 때문에 많은 문제를 일으켰다.

얼마 전에는 DivX 의 개발자 중 한 명인 프로그래머 제로미 로타는 조던 그린홀과 공동으로 DivX 네트웍스를 설립하고, DivX 5.0 를 출시했다. DivX 네트웍스는 많은 네티즌의 비판에도 불구하고 DivX 상용화에 박차를 가하고 있다. DivX 5.0 을 기존의 DivX 와 달리 상용화된 제품인 것이다. 이러한 DivX 의 상용화에 반발해 XviD 라는 새로운 코덱이 개발됐다. DIVX 에서 DivX 의 이름을 따 왔듯이 XviD 는 DivX 를 거꾸로 쓴 이름이다. 최근에 DivX 동영상이라고 하면 대부분 DivX 5.0 또는 XviD 코덱으로 압축된 것들이다.

영상 부분은 기술적으로 많이 발전하고 변화했지만, 겉보기로는 큰 차이를 못 느끼는 경우가 많다. 하지만 음성 부분은 초기에는 스테레오 (MP3) 가 대부분이었지만 이제는 5.1 채널 입체음향 (AC3) 이 대세를 이루고 있다. 대부분 한 장이었던 DivX 가 최근에는 두세 장 이상으로 늘어난 이유는 멀티 채널 사운드 때문이다. 좁은 의미에서 DivX 파일은 영상 압축에 DivX 코덱을 이용해서 만든 동영상 파일을 의미하지만 넓은 의미에서 DivX 뿐만 아니라 그와 유사한 XviD, MP4, DX50 등을 이용해서 모든 동영상 파일을 의미한다.

코덱은 컨테이너가 아니다

대부분의 사람들이 알고 있는 영상 파일의 확장자인 AVI, WMV, ASF, MOV 등은 그 자체만으로 이뤄진 것이 아니다. 내부에 많은 다른 형식의 데이터로 이뤄져 있으며 이것들을 제어하는 헤더가 동영상 파일에 대한 전체 정보를 담고 있는 것이다. 하나의 AVI 파일 안에는 압축된 동영상 (DivX, Xvid, VP6 등의 코덱으로 압축된 영상 데이터) 과 사운드 (MP3, OGG, WMA 등의 음성 데이터) 가 계층을 이뤄 포함되어 있고 이 두 개의 트랙을 감싸는 식의 컨테이너 (container) 형식으로 AVI 가 존재하게 된다. 이 컨테이너는 나중에 동영상을 재생할 때 플레이어에게 그 영상의 데이터를 알려주는 역할을 하게 된다. 내부의 동영상과 음성의 데이터 량이 같다고 할 때 이 데이터들을 잘 제어하고 유지하는 기능이 컨테이너 포맷의 핵심 기능이다. 동영상을 담기 위한 컨테이너 포맷은 크게 마이크로소프트의 AVI 와 ASF, 애플 퀵타임의 MOV 가 있다.

AVI 컨테이너

AVI 는 90 년대 초반에 마이크로소프트에서 제안한 형식이다. 이 형식은 비디오와 오디오 압축 데이터를 담는 매우 유연한 포맷으로 최근까지 사용되고 있다. 초기부터 AVI 형식은 VFW (Video for Windows) 프레임워크를 기반으로 컨테이너로서 뿐만 아니라 API 와 연동돼 프로그래밍할 수 있도록 설계되었다. 하지만 VFW 프레임워크는 최근의 오디오와 비디오 형식에 수반되는 많은 개선된 기능들을 지원하지 못한다. 예를 들어 VBR (Variable Bitrate Audio), VFR (Variable Framerate Video) 등은 AVI 컨테이너는 지원하지 못한다. 이런 단점을 보완하고자 90년대 중후반에 Open DML AVI 형식이 발표되었으나 이 역시 최대 파일 크기 2GB 의 한계를 가지고 있고 그 이후에는 특별한 개선을 위한 노력은 없다고 할 수 있다.

MOV

MOV 는 애플의 퀵타임 동영상 포맷으로서 퀵타임 무비 플레이어를 설치해 재생이 가능하다. 퀵타임 포맷은 AVI 포맷에 비해 압축률이 뛰어나며 화질도 나은 것으로 알려져 있다. 원래는 매킨토시용으로 나왔으나 그 뛰어난 성능으로 많은 사람들의 관심을 끌자 ‘QuickTime for Windows’ 라는 이름으로 윈도우용이 나오게 되었다. 퀵타임 규약의 특징은 압축 방식의 다양함에 있는데 애플은 퀵타임 규약을 설계할 때 다른 회사들이 마음 놓고 새로운 압축/해제 방식을 추가할 수 있도록 했다. 이 때문에 같은 MOV 확장자를 가진 퀵타임 동영상 파일이라고 해도 실제로는 다른 압축/해제 방식을 사용하는 파일일 수 있다.

ASF

ASF 는 ‘Advanced Streaming Format’ 의 약자로 마이크로소프트가 내놓은 스트리밍이 가능한 컨테이너 형식이다. 마이크로소프트는 어도비, 인텔, 리얼네트웍스, 바이보 (Vivo) 와 함께 AVI 의 인터넷 확장판으로 볼 수 있는 ASF 라는 새로운 멀티미디어 파일 표준을 공동 개발했다. ASF 는 통합 멀티미디어 파일로 파일 안에는 오디오, 비디오, 이미지, URL, 심지어는 실행 프로그램까지 들어 있다. ASF 파일의 장점은 스트리밍, 즉 인터넷에서 파일을 다운로드하면서 동시에 재생이 가능하다는 점으로 고성능 전용선이 아니더라도 56Kbps 모뎀 정도면 부드럽게 재생된다. 윈도우 미디어 플레이어에서 이 파일을 지원한다. 그리고 사용되는 인코더의 버전에 따라 확장자가 달라진다. 윈도우 미디어 인코더 4.1 에서는 asf 로 확장자가 정해지며 이후 버전에서는 비디오는 wmv, 오디오에는 wma로 쓰인다.

[그림 유실]

코덱

코덱 (Codec) 은 ‘Compression/DECompression’ 이라는 압축/해제의 약자로서 영상 혹은 음성의 아날로그 신호를 디지털 신호로 변환하는 인코더 (encoder) 와 디지털 신호를 음성이나 영상으로 바꾸어 주는 디코더 (decoder) 의 합성어이다. 음성 정보를 비롯해 영상 정보 등 많은 정보가 아날로그 신호로 돼 있는데 이들 전기 신호를 디지털 전송로를 통해 반송하기 위해 아날로그 신호로부터 디지털 신호로, 또 반송된 디지털 신호를 아날로그 신호로 변환하는 것을 변복조 또는 부호화/복호화라고 하며 그 기능을 가진 장치를 코덱이라고 한다. 영상정보가 기록된 장치를 컴퓨터에서 구동시키기 위해서는 코덱 파일을 설치하여 해당 정보를 볼 수 있도록 해주어야 한다. 코덱 파일이 없다면 영상 파일을 볼 수 없기 때문이다.

윈도우 98 SE 이상에 설치된 윈도우 미디어 플레이어가 있다면 대부분 영상 정보를 디지털화해 볼 수 있도록 기본적으로 코덱이 설치되어 있다. 그러나 최근에 나오는 코덱으로 이뤄진 영상을 보려면 해당 코덱을 설치해야 하는데, Divx 라는 코덱으로 이뤄진 영상을 보려면 반드시 Divx 코덱을 윈도우에 설치해 줘야 한다. 만일 DivX 코덱을 설치하지 않고 영상을 플레이하면 음성밖에 나오지 않는 등의 오류가 생기고 영상은 볼 수 없게 된다.

윈도우의 다이렉트쇼 필터

아래 그림은 마이크로소프트 다이렉트X 의 하부 시스템인 다이텍트쇼 (DirectShow) 기반의 코덱 작동을 테스트할 수 있는 그래프에디트 (GraphEdit) 라는 프로그램을 통해 동영상 파일이 어떻게 재생되는지 테스트해 보는 장면이다. 마치 전자 회로도를 연상시키는 비주얼한 다이어그램으로 보여준다.

[그림 유실]

  • DivX Movie.avi : 프로그램에서 불러올 동영상 파일이다.
  • AVI Splitter : AVI 소스 필터이다. 앞에서 설명했듯이 AVI 압축 형식이 아니고 압축된 영상, 음성의 데이터를 담는 그릇에 해당하는 컨테이너이다. AVI Splitter 를 통해 압축된 영상과 음성 데이터가 추출된다. 여기서는 Stream 00 으로 영상 스트림이, Stream 01 로는 음성 스트림이 나온다. 경우에 따라서는 여러 개의 음성 스트림이 포함될 수 있다.
  • ffdshow MPEG-4 Video Decoder : 오픈소스로 개발되고 있는 DivX 코덱이다. DivX뿐만 아니라 XviD 등 다양한 압축 형식을 디코딩할 수 있다.
  • Video Renderer : 화면에 표시해 주기 위해서 디스플레이 드라이버와 연결된다. 시스템 설정에 따라서 Overlay 나 VMR Renderer 가 연결되기도 한다.
  • ACM Wrapper : 실제 음성 코덱과 연결시키기 위한 Audio Codec Manager 이다.
  • AC3Filter : AC3 (Dolby Digital) 멀티채널 오디오를 디코딩하기 위한 코덱이 연결되었다.
  • Default DirectSound Device : 음성 재생을 위한 사운드카드 드라이버와 연결되는 지점이다.

동영상 파일로부터의 다이렉트쇼 필터 (DirectShow Filter) 형태로 만들어진 코덱의 연결은 자동으로 이뤄지는데, 그 연결 상태를 보면 현재 시스템에 재생을 위한 코덱이 정상적으로 설치가 되어 있는지, 원하는 코덱으로 디코딩 가능한지 살펴볼 수 있다. 그런데 여기서 동영상 제작에 쓰인 코덱의 형태에 따라서 자동으로 연결된다는 것이 좋은 점도 있지만 문제를 만들기도 한다. 왜냐하면 통합 코덱의 설치 등으로 시스템에 여러 가지 종류의 코덱이 설치되어 있을 때 서로 충돌이 일어나서 제대로 연결이 안 되거나 엉뚱한 코덱이 연결될 수 있기 때문이다. 따라서 이러한 문제를 해결하기 위해서 내장된 코덱을 우선적으로 연결하는 방식으로 호환성을 확보하는 동영상 플레이어도 있다.

동영상 압축 코덱

요즘 동영상 압축에 많이 사용되는 코덱이 어떤 것이 있는지 살펴보자. 크게 최초의 마이크로스프트의 MPEG-4 코덱을 해킹한 DivX 3.x 와 DivX 네트웍스의 DivX 4.x/5.x 그리고 오픈소스 진영의 XviD가 있다.

  • DivX 3.x : 가장 널리 우리에게 알려진 코덱 형식이다. DivX ;-) 라는 이름으로도 많이 알려진 코덱으로 마이크로소프트의 MPEG-4 V3 를 기반으로 해서 제작된 코덱이다. 다루기가 쉽다는 장점이 있으며 DivX 4 에 비해서 약간 속도가 빠르다.
  • DivX 4 : DivX 네트웍스에 의해서 DivX 3.x 와는 별개로 새롭게 개발된 코덱이지만 곧 이은 DivX 5 의 개발로 많이 쓰이지는 않는 코덱이다.
  • DivX 5 : DivX 4 에 비해서 많은 기능과 높은 수준의 영상을 보여주는 코덱이다. 또한 합법적으로 사용할 수 있으며 개인 용도로는 자유롭게 사용할 수 있다. 특히 이전 DivX 버전과 호환성을 가지고 있으며 가장 발전된 MPEG-4 기능들을 제공하는 코덱이다.
  • XviD : 현재는 아쉽게도 개발이 중단된 상태지만 최근 혜성처럼 등장한 새로운 코덱이다. DivX와 마찬가지로 MPEG-4 를 기반으로 하는 코덱이며, 합법적으로 사용할 수 있다는 장점이 있다. 알파 버전에서도 상당히 뛰어난 결과를 보여준다. 특히 오픈 소스를 내세우는 코덱이기 때문에 누구나 개발을 통해서 더 나은 코덱으로 발전시킬 수 있는 장점이 있다.
  • WMV : 마이크로소프트에서 MPEG-2/MPEG-4 에 대응하고 스트리밍을 위해 만든 압축 방식이다. 윈도우에 최적화되어 있고 비디오카드의 도움받아 재생시 CPU 의 부담을 줄일 수 있다.

아래 표는 마이크로소프트에서 제공한 WMV와 MPEG-2와의 성능 비교이다.

비디오 데이터 MPEG-2 Bitrate WMV Bitrate 압축 절약율
D1 @24fps(progressive) 4.6 Mbps 1.32Mbps 3:01
D1 @24fps(interlace) 6.8Mbps 2.4Mbps 2~3:1
720p @24fps 19Mbps 5~8Mbps 2.4~2.8:1

동영상 압축 기반 기술

DivX, XviD 등은 정확히 말하면 코덱 개발자들이 붙인 코덱의 명칭이다. 내부적으로 사용된 기술은 MPEG-4 를 기반으로 하는 표준 및 기술이 있었기 때문에 가능하다. 관련된 중요한 표준을 알아보자

H.261

H.261은 P 가 64kbit/sec 의 배수를 나타내는 정수가 있는 P×64 로 알려져 있다. H.261 은 화상회의 애플리케이션을 목표로 했고 특히 일대일 비디오 애플리케이션을 통한 비디오 전송을 목표로 하고 있다. 실제 인코딩 알고리즘은 MPEG 알고리즘과 호환되지 않지만 유사하다. H.261 은 실시간 인코딩을 위해 MPEG 보다 적은 CPU 점유율이 필요하다. 알고리즘은 동화상에 대한 대역폭 사용을 최적화하는 장치를 포함하므로 빠른 화면 전환에서 상대적으로 정지 화상보다는 화질이 나빠지게 된다. 이렇게 사용되는 H.261 은 화질 유지, 가변 비트레이트 인코딩보다는 일정한 비트레이트 인코딩를 유지하게 된다.

H.263

H.263 은 낮은 비트레이트 통신을 위해 설계된 ITU-T 표준의 초안이다. 이 표준은 낮은 베트레이트의 애플리케이션만이 아니라 광범위한 비트레이트에 사용된다. H.263 은 여러 애플리케이션에서 H.261 을 대체할 것으로 기대가 되는데, H.263 의 코딩 알고리즘은 H.261 과 유사하긴 하지만 성능 개선과 에러 보상을 위해 일부 개선되고 변경됐다. H.263 은 다섯 가지 해상도를 지원한다. H.261 이 지원하는 QCIF 와 CIF 외에 SQCIF, 4CIF, 16CIF 가 있다. SQCIF 는 QCIF 의 해상도의 약 절반 정도이다. 4CIF 와 16CIF 는 CIF 해상도의 4 배와 16 배이다. 4CIF 와 16CIF 를 지원한다는 것은 MPEG 표준과 같은 고비트레이트 표준과 비견된다는 것을 의미한다.

MPEG-2

MPEG-2 는 고해상도 비디오와 성능이 개선된 오디오를 지원하는 것을 포함해 MPEG-1 을 확장한 것이다. MPEG-2 의 목표 비트레이트는 방송용 화질의 풀스크린 비디오를 제공하는 4~15Mbits/s 이다. MPEG-2 의 초안 표준은 확장성을 제공하는 것이다. MPEG-1 과 비교해 인코드/디코드에 더 고가의 하드웨어가 필요하다. 또한 MPEG-1 과 같은 이유로 손실에 의한 화질 저하가 되기 쉽다. MPEG-1 은 CD-ROM 에서 재생하는 데 적합하고 MPEG-2 는 고화질로 저장된 애플리케이션과 TV 방송용 애플리케이션에 적합하다. 위성방송의 경우 MPEG-2 는 현재 하나의 아날로그 채널이 사용하는 것과 같은 대역폭으로 화질의 손상 없이 5 개 이상의 디지털 채널을 인코딩할 수 있다. 이런 주요한 이점에 비하면 인코딩 비용이 많이 들어가는 것은 사실 중요한 것이 아니다. 그러나 현재의 컴퓨터나 인터넷 인프라스트럭처용으로는 MPEG 기반의 솔루션은 비용이 너무 많이 들고 많은 대역폭이 필요하다. 이는 인터넷을 염두에 두고 설계된 것이 아니기 때문이다.

MPEG-4

MPEG-4 는 매우 높은 압축 효율을 얻음으로써 매우 낮은 비트률로 전송하기 위한 것이다. 예를 들면 64Kbps 이하 비트레이트의 화상회의를 위해 적합한 압축 형태를 제공하기 위한 것이다. MPEG-4 는 시청각 화면을 서로 다른 네트워크에서의 다중 전송을 가능하게 하는 AVOs 또는 Audio/Visual Objects 로 분할하는 데 기반을 둔 것이다. MPEG-4 의 구조는 현재 MSDL(MPEG-4 Syntactic Description Language) 라는 언어에 초점을 맞춰 개발 중이다. MSDL 을 사용해 애플리케이션을 더 기본적인 컴포넌트로 구성하고 인터넷에서 이런 컴포넌트를 쉽게 다운받을 수 있도록 새로운 코덱으로 구성할 수 있다.

음성 압축 코덱

컴퓨터에서 재생되는 모든 소리는 아날로그 신호가 디지털화된 것이며 우리가 자주 볼 수 있는 Wav 파일은 이런 디지털 음향 파일의 본보기이다. 44.100KHz, 16 비트, 스테레오 채널로 디지털화된 Wav 파일은 분당 10MB 이상을 차지하는 고용량이 된다. 따라서 실용적으로는 작은 용량의 파일이 필요하다. 이런 요구에 발맞춰 고음질, 저용량의 파일 압축 방식이 개발됐고 이에 따라 탄생하게 된 것이 MP3 와 같은 오디오 압축 파일이다.

MP3

MPEG-1 Layer 3 의 줄임말인 MP3는 고품질, 고능률 스테레오 부호화를 위해 MPEG (Moving Picture Experts Group) 에서 동영상 부호화와 병행해 표준화한 압축 포맷으로, 가장 애용되고 있는 디지털 포맷이다. MP3의 경우 최근 나오고 있는 다른 디지털 포맷과 달리 복제 방지에 대한 규제 장치가 특별히 없다. 압축 코덱도 공개되어 있고 인코더와 디코더도 쉽게 구할 수 있기 때문에 오디오 압축의 표준으로 자리잡고 있다. CD 포맷이 44.100KHz, 16비트, 스테레오 채널을 따르기 때문에 MP3 도 CD 수준의 음질을 얻기 위해서는 128Kps/s, 44.100KHz, 스테레오 채널 혹은 조인트 채널로 압축해야 한다. 현재 MP3는 대부분의 음악 재생 프로그램에서 지원하고 있다. 대부분의 MP3 파일은 128Kbps 의 정도의 품질로 압축된다.

MPEG-2 AAC

MPEG-2 AAC 포맷은 국내에서는 MP4 라고 알려져 있는데 MP3 의 상위 개념으로 이해되기 위해서 그렇게 이름지어진 것으로 보인다. 정식 명칭은 MPEG-2 AAC (Advanced Audio Coding) 이다. 또는 MPEG-2 NBC(Non Backwards Compatibility) 라고도 부른다. MPEG-2 AAC 는 MPEG-2 MP3 와는 달리 프레임 단위로 데이터를 저장하며 그로 인해 최대 30% 까지 용량이 줄어들고 양자화 보정 기술인 TNS와 보정 수치 기억 기술인 예측 (pridiction) 기법을 통해 향상된 음질을 제공한다. 결정적으로 MP3 는 저작권 문제를 해결하지 않고 대중화되어 음반 업계의 골칫덩이가 되고 있지만 MP4 는 처음부터 저작권 복제방지 시스템을 채택해 저작권 문제를 해결했다. 어느 일본의 디지털 위성 방송의 음성 압축 코덱으로 사용된다.

RA

MP3 와 비견될 만한 대표적인 음악 압축 포맷인 RA 는 인터넷 미디어 스트리밍 분야에서 두각을 나타내고 있는 리얼네트웍스에서 발표한 음향 압축 스트리밍 파일이다. RA 의 경우 고압축율을 우선시하기 때문에 MP3와 달리 고 음질을 얻을 수 없다. 따라서 최근에 인터넷 속도가 급속도로 빨라짐에 따라 고압축률보다는 고음질을 선호하는 사용자들의 기호 변화에 따라서 사양길에 들어선 포맷이라고 할 수 있다. RA 를 만들 수 있는 프로그램은 CD Streamer 와 Real Encoder 등이 있다.

AC3

AC3 는 기존의 MP3 나 AAC 와는 다른 개념의 오디오 포맷이다. MP3 나 AAC 의 경우 2 채널에 기반을 둔 압축 포맷이지만 AC3 의 경우 돌비연구소에서 개발한 5.1 채널을 기반으로 하는 입체음향 지원 포맷이다. 기존의 4 채널 서라운드 시스템이 좌우, 중앙, 후방에 총 4 개의 스피커를 사용하는 것에 비해 AC3 는 전후, 좌우, 중앙에 설치하는 5 개의 스피커와 중저음대역 전용의 서브 우퍼 스피커를 포함한 총 6 개의 스피커 시스템을 지원한다. AC3 가 기존 아날로그 방식의 서라운드 시스템에 대해 가지는 가장 큰 차이점은 각 채널이 완전히 분리되어 신호간섭이 없이 깨끗한 소리를 전달할 수 있다는 것이다. 그러나 AC3 는 각 채널 하나하나의 음질이 현재의 CD 보다 떨어지는 단점을 갖고 있다. 이 때문에 돌비연구소에서도 AC3 를 음악용보다는 영화의 사운드 트랙용으로 권하고 있다. AC3 는 레이저디스크 플레이어 (LDP) 와 DVD 등 디지털 매체의 표준 포맷으로 되어 있으며, DVD 의 영화를 입체감 있게 보려면 AC3 기능이 내장된 오디오 기기를 연결해야 한다. 사실 AC3 의 정식명칭은 돌비 디지털 (Dolby Digital) 이지만 개발 프로젝트명인 AC3를 아직도 혼용해서 쓰고 있다.

DTS

DTS는 ‘Digital Theater Systems’ 의 약자로서 원래는 극장용 포맷으로 개발되어 스티븐 스필버그의 ‘쥬라기 공원’ 에서 처음으로 선보였으며 현재 전 세계 18,000 개 극장에 DTS 시스템이 설치되어 있을 정도로 시장에서 어느 정도 성공을 거두었다. DTS 음향시스템은 돌비 디지털처럼 다운믹싱을 통한 기존 스테레오 시스템과의 호환성은 없다.

DTS 와 Dolby Digital (AC3) 의 차이

두 포맷간의 가장 큰 차이는 데이터 압축율이다. 돌비디지털은 평균적으로 384kbps 의 전송율을 가지며 DTS 는 1.4Mbps 의 전송율을 갖는다. DTS 가 돌비 디지털보다 압축율이 4 배 정도 낮은데 이것은 DTS 시스템이 저장 매체의 공간을 많이 차지한다는 측면에서는 단점일 수 있지만, SNR (Signal/Noise 비, 품질 척도) 가 높은 재생이 가능하고 다이내믹 레인지가 넓고 분리도가 좋다는 것 등 치밀하고 웅대한 공간 표현이 가능하다. 그러나 DTS 사운드가 DD나 MP3 사운드보다 무조건 좋다는 편견은 잘못되었다. 모든 미디어에는 원본 불변의 법칙이 적용되기 때문에 얼마나 좋은 소스를 얼마나 잘 인코딩했는가에 따라서 더 큰 차이가 있다. 재생 환경이 얼마나 최적화되어 있는가에 따라서도 큰 차이가 있다. 하지만 심리적으로는 DTS 가 DD 보다 좋아 이는 것이 사실이기 때문에 최근에는 DVD 로부터 DivX 를 만들 때 DTS 를 포함해서 많이 만들고 있다.

WMA

마이크로소프트에서 MP3 와 돌비 디지털에 대응하고 스트리밍을 위해 만든 압축방식이다. 무손실 압축도 지원하기 때문에 CD의 음질을 손상시키지 않고 적은 용량으로 압축할 수 있으며 손실 압축시에도 동일한 용량에서의 MP3보다 더 좋은 음질을 지닌다. 최근에는 5.1 또는 7.1 채널을 지원하기 때문에 HD WMV 에 멀티 채널 WMA 를 이용해서 고품질의 HD 급 동영상 컨텐츠 제작에 사용될 수 있다.

다음은 마이크로소프트에서 제공한 성능 비교이다.

오디오 데이터 기타 Codec Bitrate WMA (Pro) Bitrate 압축 절약율
2 ch x 48KHz x 20bits 220Kbps @ DD2.0 128Kbps 1.7:1
6 ch x 48KHz x 20bits 384Kbps @ DD5.1 192~256Kbps 1.5~2:1
6 ch x 48KHz x 24bits 1,536Kbps @ DTS5.1 768Kbps 2:1

MPEG 기술을 둘러싼 특허 이슈

DivX 의 출발 자체가 마이크로소프트의 MPEG-4 코덱 파일의 해킹으로부터 시작됐고 MPEG-4 기술이라는 것이 아직도 개발 중이고 특허권 역시 분산되어 있다. 따라서 소프트웨어 개발 업계에서는 DivX 라든가 MPEG-4 의 특허료에 대해서는 무신경한 것이 사실이다. 그러나 MPEG 기반 기술의 특허권과 라이선스를 대행하는 MPEGLA 가 지난 5월 MPEG4 AVC(H.264) 특허료를 확정했다. 그 내용은 세트 장비 업체는 앞으로 MPEG4 AVC 를 사용하는 특허료로 대당 0.20 달러, 컨텐츠 제공업체는 동영상 개당 가격의 2% 를 특허료로 지불해야 한다.

또 방송 사업자는 엔코더당 2,500 달러를 특허료로 제공해야 한다. 이 결정 내용에 따르면 미국 MPEGLA 는 MPEG4 AVC 를 사용하는 모든 재생 장치와 압축 장치는 물론, PPV·VOD 를 비롯한 동영상 컨텐츠, 유무료 방송에 이르기까지 광범위한 영역에 걸친 로열티로 대당 금액 및 부과 비율을 정해놓고 있다. 이에 따라 MPEG4 AVC 를 사용하는 장비 제조업체는 물론 인터넷, 모바일 컨텐츠 제공업체, 위성 및 케이블 서비스 업체 등 서비스 매체들도 모두 로열티 부과 대상이 될 전망이다.

국내에서는 방송·통신 융합 매체인 위성 디지털 멀티미디어방송 (DMB) 과 지상파 DMB 가 동영상 압축 기술로 MPEG4 AVC 를 채택하고 있으며 향후 인터넷을 포함한 다수의 매체가 사용할 계획이다. 우선 세트 제조업체의 경우 MPEG4 AVC 관련한 인코더/디코더 및 이를 포함하는 제품의 로열티로 연간 판매 대수를 기준으로 각각 무료 (10만대 이하), 0.20달러 (10만∼500만대), 0.10달러 (500만대 이상) 를 지불해야 한다. 즉, MPEG4 AVC 가 들어간 모든 하드웨어가 적용 대상인 셈이다. 세트 제조업체에 대한 로열티는 내년 1 월부터 적용되며 로열티는 업체당 연간 최대 350 만 달러 (2005∼2006년), 425만 달러 (2007∼2008년), 500만 달러 (2009∼2010년) 를 넘을 수 없다.

눈길을 끄는 부분은 서비스 업체에 대한 로열티다. MPEGLA 측은 유료 컨텐츠·서비스 제공업체가 VOD, PPV, 다운로드 서비스 등의 형태로 사용자에게 동영상을 제공할 시 개당 가격의 2% 나 동영상 컨텐츠당 0.02 달러를 지불하도록 정했다. 단, 12 분 이하인 동영상은 무료다. 또한 개당 컨텐츠 판매가 아닌 가입자를 위한 정액 서비스를 하는 경우에는 연간 단위로, 각각 무료 (가입자 수 10만명 이하), 2만 5000달러 (10만∼25만 명), 5만 달러 (25만∼50만 명), 7만 5000달러 (50만∼100만), 10만 달러 (100만 이상)를 지불해야 한다.

무료 방송에 MPEG4 AVC 를 사용하는 방송국은 초기 방송 시스템 구축시 구매한 인코더 수량 대당 2500 달러를 일시불로 지불할 수 있다. 연간 지불을 택할 경우 2500달러 (시청 가능 수신기 보급 10만∼50만 미만), 5000달러 (50만∼100만 미만), 1만 달러 (100만 이상)를 지불해야 다. 단지, 무료 인터넷 방송의 경우 2010 년까지 로열티를 부과하지 않을 방침이다. 서비스업체에 대한 로열티는 2006년 1월부터 적용되며 연간 350만 달러 (2006년∼2007년), 425만 달러 (2008년∼2009년), 500만 달러 (2010년)를 넘을 수 없다.

따라서 조만간 오픈소스로 개발되고 있는 MPEG-4 기반의 각종 코덱과 그것을 사용하는 소프트웨어와 하드웨어에도 MPEG 라이선스료를 생각하지 않을 수 없을 것이다. 물론 아직 비상용 소프트웨어에 대한 MPEG 라이선스에 대한 어떠한 것도 정립된 단계는 아니지만, MPEGLA 가 강경하게 나온다면 지금은 공짜로 사용할 수 있는 동영상 플레이어를 유료로 구입해야 할지도 모른다. 또한 서두에 언급한 것처럼 컨텐츠를 제작하고 배급하는 회사로부터의 DivX 영화에 대한 강력한 규제가 현실화된다면 DivX 라는 공룡이 멸종될지도 모르겠다. 그러나 공룡이 멸종한 후에 인류가 탄생했듯이 디지털 멀티미디어의 세상은 영원할 것이다.

주)

  • 1870 년에 알렉산터 벨과 엘리샤 그레이가 각각 독립적으로 전기를 통해 인간의 목소리를 전달할 수 있는 최초의 기계를 발명했다.
  • 1895 년 루이 뤼미에르와 오귀스트 뤼미에르 형제는 에디슨이 발명한 영사기인 키네토스코프에 대한 부친의 열정을 물려 받아 시네마토그라프라는 기기를 발명하였다.
  • 1800 년대 후반 라디오의 하인리히 헤르츠와 같은 물리학자들의 연구성과에 힘입어 라디오가 발명되었고, 1920 년대에 RCA 에 의해 상업화 되었다.
  • 1939 년 RCA 는 뉴욕 세계 박람회에서 라디오의 뒤를 잇는 다음 단계의 의사소통 매체로 텔레비전을 선보였다. RCA 의 회장 데이비드 사르노프는 이렇게 선언했다. “이제 우리는 소리에 화면을 추가합니다. 이 순간 나는 겸허한 마음으로, 앞으로 모든 사회 분야에 영향을 미치게 될 중대하고 새로운 예술의 탄생을 선포합니다. 이것은 혼란한 세상을 횃불처럼 밝혀줄 것입니다.” 

텔레비전이 상업화에 성공한 후, 시인 엘리엇은 이렇게 말했다. ”그것은 수맥만 명의 사람들이 같은 시간에 같은 농담을 보고 들으면서도 여전히 고독을 느끼게 만드는 매체이다.” 

상당한 시간이 흘렀다. ARPANET 으로 시작된 인터넷은 그 확산과 더불어 가히 혁명적인 진보를 가지고 왔다. 시장과 기술은 여전히 빠르게 변화하고 있다. 산업 사회에서 지식정보화 사회로의 진전은 육체노동자에서 지식노동자의 수요를 끌어 냈듯이, 대중매체와 인터넷과 디지털화의 발전은 공동체 사회에서 개인화된 사회로의 변혁을 촉진하고 있다. 이런 흐름에 발 맞추어, 불과 몇 년 전만해도 내가 속해 있는 Embedded System 산업에서 소위 잘 팔리는 엔지니어는 코덱 엔지니어였던 것 같다. 물론 영상과 음성 영역에서 품질과 압축률이란 2 가지 양립할 수 없는 가치를 쫓아 새로운 표준화들이 시도되고 있지만, 예전 만큼 코덱 엔지니어들의 가치가 있다고 볼 수는 없다. 필자가 생각하는 Embedded System 에서의 최근 Buzz Word 는 “User Experience (화려한 2D/3D UI)”, “Android 를 포함한 Open OS”, “(Mobile) Internet 을 포함한 Digitally Connected World” 가 아닌가 싶다.

참고문헌

comments powered by Disqus
keyboard_arrow_up