오디오 포맷은 소리를 저장하고 재생하는 방법으로, 청취자의 경험을 향상시키기 위해 다양한 채널 구성과 공간적 특성을 제공합니다. 이 카테고리에는 이머시브, 서라운드, 스테레오, 모노와 같은 다양한 오디오 형식이 포함되어 있으며, 각 포맷은 특정 용도와 환경에 맞춰 최적화되어 있습니다. 예를 들어, 스테레오는 두 개의 채널을 사용해 입체감을 제공하고, 서라운드는 평면 음장을 제공하여 다양한 방향에서 소리를 들을 수 있는 경험을 제공합니다. 반면 이머시브 포맷은 입체 음장을 제공하여 현실감 있는 청취 경험을 구현합니다. 이러한 다양한 포맷들은 음악, 영화, 게임 등 여러 분야에서 중요한 역할을 합니다.
스테레오는 모노와는 달리 왼쪽 채널과 오른쪽 채널을 사용하는 오디오 포맷이다.
좌, 우의 스피커의 지향각에 의해 가상의 팬텀 이미지가 생성되고, 이것을 스테레오 이미지라고 한다. 이 스테레오 이미지를 통하여 소리는 스테레오 이미지 공간 안에 입체적으로 배치 될 수 있게 된다. 즉 소리의 정위감을 생성하게 된다. 두 개의 독립적인 채널을 사용함으로써 우리 인간이 두 귀로 소리를 듣는 것처럼 다양한 방향에서 들리는 소리를 만들어 낼 수 있다. 사실 굳이 쿼드나 서라운드가 아니더라도 스테레오만으로도 평면 음장의 대부분이 구현이 가능하다.
Immersive, 입체음향
이머시브 오디오(Immersive Audio)는 청취자를 사운드 환경의 깊숙한 곳으로 끌어들이는 오디오 체험을 제공하는 기술 및 음향 형식을 나타냅니다. 이러한 기술은 공간 감각, 입체감, 현실감을 증강시켜 일반적인 오디오 청취 경험을 뛰어넘어 더 몰입적인 환경을 제공합니다. 이머시브 오디오는 다양한 분야에서 사용되며, 주로 영화, 비디오 게임, 가상 현실(VR), 환경 소리 설계, 음악 프로덕션 등에서 활용됩니다.
이머시브 오디오의 핵심 요소와 특징은 다음과 같습니다:
이머시브 오디오는 다양한 분야에서 오디오 체험을 혁신하고 확장시키는 중요한 기술 중 하나로 간주되며, 기술의 발전과 함께 더욱 현실적이고 몰입감 있는 사운드 환경을 제공할 것으로 예상됩니다.
앰비소닉은 3차원 공간에 대한 이머시브 오디오 포맷이다.1)
스피커의 재생 방법에 대해서는 결정되어 있지 않고, B-format 이라는 방식을 통해 청취자가 사용하는 스피커 레이아웃2)으로 소리를 디코딩하는 방법을 사용한다. 따라서 앰비소닉으로 제작된 트랙이나, 앰비소닉으로 녹음된 트랙은 청취자가 어떤 포맷의 청취 환경을 가지고 있더라도 모두 재생할 수 있는 유연성을 가진다.
앰비소닉은 1970년대에 영국 British National Research Development Corporation에 의해 만들어졌지만, A-format 을 B-format 으로 컨버팅하는 장치도 필요하고, B-format을 재생하는 스피커 시스템에 맞춰 디코딩하는 장치도 추가되야 하는 비용적, 기술적 추가 요구사항이 많아 당시에는 각광 받지 못했다.3) 하지만 근래에 들어 VR이나 입체음향의4) 수요가 증가하고, DSP 나 CPU를 이용하여 소프트웨어를 통한 컨버팅, 디코딩이 쉬워지고 구현 비용이 줄어듦에 따라 다시 주목 받고 있다.
기존의 평면 음장인 서라운드에서 한단계 더 발전하여 입체음향(이머시브 오디오)를 구현한다. 또한 기존의 Channel based 방식에 Object based5)방식이 추가되어 동작한다.
Dolby Atmos 스피커 레이아웃은 기존 5.1 채널이나 7.1 채널에 해당하는 Dolby 서라운드 스피커 레이아웃에 천정에 스피커6)를 추가하는 형식을 말한다. 따라서 소리의 전후 좌우에 대한 음장에 소리의 높이에 대한 음장이 추가 된다. 청취자는 이머시브 오디오를 들을 수 있다.
스피커 레이아웃에는 7.1 서라운드에 천정 스피커 2개를 추가 하면 7.1.2 와 같이 부르게 되며, 베이직 Dolby Atmos 스피커 레이아웃(5.1.2 & 7.1.2), 레퍼런스 Dolby Atmos 스피커 레이아웃(5.1.4 & 7.1.4), 대형 Dolby Atmos 스피커 레이아웃(9.1.4)이 있다.
Dolby Atmos는 헤드폰 바이노럴 컨버팅에 대한 내용이 포함되어 있어 일반 스테레오 헤드폰/이어폰으로 Dolby Atmos를 재생하면, 이머시브 오디오를 일반 스테레오 헤드폰/이어폰으로 듣는 것이 가능하다. 주로 게임에서 사운드 플레이 용으로도 많이 쓰인다.
Object Oriented, 객체 지향 → Object based, 오브젝트 기반8)
기존의 Dolby Digital 5.1 채널, Dolby Digital Plus 7.1 채널은 소스 채널 갯수가 스피커 레이아웃과 일치하는 Channel based이다.
Dolby Atmos는 ADM 파일 포맷을 사용하며 이 안의 128개의 트랙을 통해 BED 채널과 Object 채널을 담는다.
Dolby Atmos는 다운믹스 기능이 있어서, 스피커 레이아웃에 대한 하위 호환성을 지원한다. 즉 Dolby Atmos로 제작된 컨텐츠는 일반 서라운드 시스템에서도 동작하고, 일반 스테레오 스피커 시스템에서도 동작하며, 심지어 헤드폰에서는 이머시브 오디오를 재현 가능한 바이노럴 재생을 지원한다. 하지만, 일반 서라운드나 스테레오로 재생되는 다운믹스는 천정 스피커가 없기 때문에 입체음향(이머시브 오디오)을 재현하지는 못한다.
각각의 방식으로 인코딩된 최대 12채널(11.1) 또는 16채널(15.1) 데이터는 다시 Dolby Atmos 재생기기에 내장된 렌더러를 통해 다양한 스피커 포맷(모노, 스테레오,서라운드, Atmos)이나 바이노럴(스테레오 헤드폰)으로 렌더링되어 출력된다.
대부분의 컨슈머 기기들에서는 보통 16 채널이 전송 가능한 HDMI eARC 연결을 통해 Dolby Atmos 사운드바나 Dolby Atmos 호환 리시버(돌비 시네마 프로세서 등)의 다양한 포맷(스테레오, 서라운드, Dolby Atmos)에 맞게 다운믹스되어 재생된다.
보통 Dolby Atmos 영상 미디어는 사운드바를 통해서 재생하는 경우가 많고, 음악 청취는 헤드폰 바이노럴을 통해서 재생하는 경우가 많다. 컨슈머 환경에서 Dolby Atmos를 듣는 방법은 사운드바, 헤드폰 또는 Dolby Atmos를 지원하는 리시버15) 이외에는 알려진 수단이 거의 없다.16)
Blu-Ray 디스크는 Dolby TrueHD17)를 사용하여 Dolby Atmos를 제공한다. 하지만 Dolby Atmos의 128(Object, BED) 채널이 전부 담겨 있는 것은 아니다. 최대 16 채널의 채널로 사전에 렌더링된 TrueHD 코덱으로 인코딩된 미디어가 제공된다. Dolby Atmos를 지원하는 리시버 또는 사운드바는 이 16 채널 소스를 자신의 스피커 레이아웃에 맞게 다운믹스하여 재생한다.
Dolby TrueHD는 최대 15.1 채널의 오디오 채널이 가능하고, 24-bit 192kHz의 해상도까지 지원된다. 무손실 압축 오디오 코덱이며, 최대 전송률은 18,000kbps이다.
하지만, Blu-Ray를 통한 음원의 유통은 거의없다.
방송 및 스트리밍 서비스는 주로 Dolby Digital Plus를 사용하여 Dolby Atmos를 제공한다.
애플 뮤직의 경우 스트리밍 서버에서 먼저 스트리밍 받는 재생기기의 Dolby Atmos 스피커 레이아웃의 정보를 읽는다. 그리고 나서 스트리밍 서버에 내장된 DSP 서버의 Dolby Atmos 렌더러를 이용하여 128개의 오브젝트가 담긴 ADM 파일을 최대 12채널(11.1) 또는 16채널(15.1)의 E-AC-3 코덱18)으로 인코딩하여 재생기기로 스트리밍한다. 재생기기는 자체 스피커 포맷에 맞게 다운믹스하여 재생한다.
Dolby Atmos 헤드폰의 경우는 스트리밍 서버에서 바이노럴(2 채널)로 사전 렌더링하여 스트리밍한다.
Dolby Digital Plus의 코덱인 E-AC-3 는 최대 15.1 채널의 오디오 채널이 가능하다. 손실 압축 오디오 코덱이며, 최대 전송률은 6144kbps 이다.19)
이러한 이유로 Dolby Atmos 사운드바나 스피커 시스템으로 16채널 렌더링 데이터를 스트리밍하는 경우는 손실률이 높을 수 있다. 2 채널 전송인 Dolby Atmos 바이노럴 헤드폰인 경우에는 손실률은 높지 않다. 이러한 음질 손실 문제가 최근 크게 문제되고 있다. 오히려 Dolby Atmos 는 헤드폰 바이노럴로 듣는 것이 훨씬 더 좋을 수 있다. 같은 비트레이트 제한으로 16 채널을 전송하는 것보다 2 채널을 전송하는 것이 음질의 충실도가 높기 때문이다.