사용자 도구

사이트 도구


음향:media:digital_music_file:start
[공지]회원 가입 방법
[공지]글 작성 및 수정 방법

음원

음원음악 데이터를 디지털 미디어로 저장한 것을 말합니다. 이러한 파일들은 컴퓨터 및 디지털 장치에서 사용되며, 디지털 형식으로 저장되어 있어 복사, 전송 및 수정 등의 다양한 디지털 기능을 활용할 수 있습니다. 파일 형식에는 FLAC, MP3, WAV 등이 있으며, 각 파일 형식은 해당하는 미디어 유형을 나타내고, 해당 파일 형식에 맞는 응용 프로그램을 사용하여 열람하거나 수정할 수 있습니다.

Digital music file

A digital music file refers to a digital representation of musical information. These files are used on computers and digital devices, allowing for various digital functions such as copying, transferring, and editing. File formats include FLAC, MP3, WAV, and others, each representing a specific type of media. Users can view or modify these files using corresponding applications designed for each file format.

WAV

오디오 파형PCM방식으로 디지털 데이터화 한 파일 형식

WAV 파일의 형식은 아닐로그 오디오 신호PCM 방식으로 디지털 데이터화1)한 것이다.

16-bit 44.1kHz

Wave 파일 16-bit 44.1kHz 포맷을 지칭

CD디지털 포맷이 16-bit, 44.1kHz 였다.

1644 Wav파일의 Bitrate

스테레오 16-bit 의 data 가 1초에 44100번 = 2(스테레오)*16*44100 = 1411200 = 1411kbps

24-bit 48kHz

Wave 파일 24-bit 48kHz 를 지칭

2448 Wav파일의 Bitrate

스테레오 24-bit의 data 가 1초에 48000번 = 2(스테레오)*24*48000 = 2304000 = 2304kbps

24-bit 96kHz

Wave 파일 24-bit 96kHz 를 지칭

2496 Wav파일의 Bitrate

스테레오 24-bit의 data 가 1초에 96000번 = 2(스테레오)*24*96000 = 4608000 = 4608kbps

AIFF

Audio Interchange File Format

1985 년 Electronic arts 사에 의해서 만들어진 오디오 파일 포맷, 다양한 여러가지 전혀 다른 기기(게임기, PC, 신디사이저)에서 전부 호환되는 오디오 파일 포맷으로 사용하기 위해 개발된 형식.

비압축, 무손실 포맷.

주로 애플 사의 컴퓨터나 소프트웨어에서 사용된다.

MP3

MPEG audio layer-3 포맷, 손실 압축 방식.
원래는 동영상 포맷인 MPEG-1, 및 MPEG-2 에 사용되는 오디오 압축 형식이다.

독일 Fraunhofer Society 에서 연구 개발.

128kbps, 192kbps, 320kbps 등은 비트레이트, bps(bit per seconds), 즉 초당 bit 전송률을 이야기 하는 것으로, 높은 숫자일수록 파일 용량이 크며 음질 손실이 덜하다. WAV 파일들의 비트레이트가 1411kbps(16-bit 44.1kHz) 나 4600kbps(24-bit 48kHz) 정도 하는 것에 비해 MP3비트레이트는 그의 1/10~20의 수준인 192kbps, 320kbps 등으로 매우 용량이 작다. 아주 많이 손실 압축함을 알 수 있다.

손실

MP3의 손실 압축 기법은 심리음향 분석 및 인간의 청각 인지 능력에 의해서 일반적으로 사람이 들을 수 없는, 또는 청취가 힘들다고 예상되는 오디오 정보를 삭제하여, 용량을 줄이게 된다.

이에 따라, CD의 음질인 16-bit 44.1kHz 스테레오에 비하여 용량을 75%~95%까지 줄이는 것이 가능해진다.(예를 들면 CD의 1411kbps → 128kbps)

크리티컬 밴드

1933년 Bell Labs의 Harvey Fletcher는 피치에 대한 인간의 민감도, 마스킹마스킹사운드주파수마스킹 사운드주파수와의 관계를 이해하는 데 도움이 되는 방법으로 임계 대역 지정을 제안 했습니다.

사람은 소리의 대역폭에 따라 각기 다른 소리의 크기로 받아들이는데, 소리의 대역폭이 크면 클수록 소리도 크게 느껴지게 된다. 하지만, 그 대역폭이 작아지면 작아질수록 소리가 작게 느껴지게 되는데, 어느 한계점 이상으로 작아지게 되면 그 변화를 느끼지 못한다. 즉 인간이 인지 가능한 대역폭의 최소 한계이다. 그러한 최소의 대역폭을 크리티컬 밴드라고 한다.

MP3 인코딩에서는 마스킹 되는 소리를 삭제하기 위해 사전에 대역폭을 각 주파수 별로 크리티컬 밴드로 나눈다.

ERB filter bank

Critical bandwidth

People perceive sound at different loudness levels depending on the bandwidth of the sound. When the bandwidth of sound is wider, it tends to be perceived as louder. However, as the bandwidth decreases, the sound is perceived as quieter. There is a certain point beyond which further reductions in bandwidth go unnoticed by humans. This point represents the minimum bandwidth that humans can perceive, and it is referred to as the critical bandwidth.

In MP3 encoding, the critical bandwidth is used to divide the frequency spectrum into different critical bandwidths to remove masked sounds beforehand.

청각 마스킹

어떤 한 주파수소리가 크면 그 인근의 작은 주파수는 잘 들리지 않는 현상. 따라서 MP3에서는 이러한 잘 들리지 않는 주파수는 삭제하여 데이터를 줄인다.

크리티컬 밴드중에 어느 하나의 소리가 크고 바로 옆 인근의 크리티컬 밴드소리가 작으면 소리가 작은 크리티컬 밴드의 데이터는 삭제한다.

Brick Wall LPF

가청 주파수는 일반적으로 20Hz~20kHz 라고 정의 되지만,

일반인 사람의 경우 16kHz 이상의 주파수는 청각적으로 인지되기 힘들기 때문에, 특정 kbps 이하의 MP3에서는 16kHz 이상의 주파수를 제거한다.

하지만 16kHz 이상의 주파수 성분에는 소리트랜지언트 구간의 정보가 많이 들어있기 때문에, 트랜지언트의 재생에 영향을 끼칠 수 있다.


128kbps에서 iTunes MP3인코딩된 핑크 노이즈


128kbps의 LAME MP3

128kbps의 iTunes AAC

손실 압축의 부작용

손실 압축의 방식은 주파수 대역을 각각의 크리티컬 대역으로 필터를 통해 나누고, 여러가지 오디오 데이터에 손실을 가하는 형식이므로, 인코딩 알고리즘에 따라 조금씩 다르지만, 약간의 노이즈를 생성하기도 한다.

그런 대표적인 노이즈를 Swirlies 라고 한다.

이러한 Swirlies의 발생 정도를 측정해 보면 MP3인코딩 방식보다 AAC인코딩 방식이 우수한 것으로 보인다.

원음
원음

128kbps CBR MP3}\\
128kbps CBR MP3}</WRAP>

<WRAP centeralign box>{{:음향:media:file:20220816-170735.png|128kbps CBR AAC}\\
128kbps CBR AAC}</WRAP>

<WRAP centeralign box>{{:음향:media:file:20220816-170755.png|320kbps CBR MP3
320kbps CBR MP3

320kbps CBR AAC
320kbps CBR AAC

메타데이터

MP3 파일에는 음악의 제목, 아티스트, 앨범, 트랙번호 , 파일 내용에 대한 기타 정보를 같이 저장할 수 있다.

MP3 의 메타데이터 형식에는 ID3v1, ID3v2 가 있고, 최근에는 APEv2 라는 데이터 형식도 사용한다.

Cubase Export ID3 tag

FLAC

Free Lossless Audio Codec

https://Xiph.org 에서 개발한 무손실 오디오 압축 포맷, MP3, AAC, OGG Vorbis 등과는 달리 오디오 손실이 없다.

FLAC를 통해 압축한 오디오는 원래 크기의 50-70%로 축소될 수 있다.

MP3AAC오디오의 용량을 줄이기 위하여 오디오의 데이터를 일부 삭제하는 손실 압축 방식을 사용하는 것에 비하여 FLAC는 무손실로 용량을 줄이는 것이 가능하다.

일반적인 파일 압축 방식으로 오디오 데이터를 압축하면 원래 크기의 80~90%까지 밖에 줄이지 못하지만, FLAC오디오 데이터의 특성에 맞추어서 압축을 하므로 오디오 데이터를 효과적으로 줄일 수 있다.

Compression Level

0-8 까지 지정할 수 있으며, 숫자가 낮을수록 인코딩/디코딩시 CPU 부하가 낮아지고 속도가 빨라지며, 숫자가 높아질수록 압축률이 높아진다.

FLAC을 사용하는 이유?

FLAC 이 압축 파일 형식의 일종이면 왜 굳이 FLAC을 쓸까? 그냥 일반적인 압축 파일 형식인 ZIP와 같은 것을 쓰면 안될까?

그 이유는 ZIP 와 같은 일반 압축에 비해서 오디오 전용으로 만들어진 압축 코덱이기 때문에 오디오 압축을 더 효과적으로 할 수 있어서 용량이 더 크게 줄어든다.

또한, 스트리밍으로 음원을 재생해도 FLAC 은 실시간으로 압축을 해제하면서 오디오를 재생이 가능하다. 일반 압축 파일은 전송을 전부 한 다음 압축을 해제해야 하기 때문에 실시간 스트리밍이 힘들다.

OGG

OGG vorbis

https://Xiph.Org 라는 단체에서 공개한 무료 오픈 소스 음원 압축 형식. 손실형 압축 방식.

낮은 비트레이트에서의 음질이 우수한 것으로 알려져있다. 높은 비트레이트에서는 다른 손실형 오디오 압축 코덱들과 비슷한 수준.

Cubase Export

AAC

Advanced Audio Coding 포맷, 손실 압축 방식.

오디오 파일로는 .aac 와 같은 확장자를 가진다. MP3 코덱의 개선된 버전이기 때문에 .MP4 확장자를 사용하면 좋았었을 뻔 했으나 이미 .MP4 확장자는 동영상 파일의 확장자로 사용되고 있기 때문에 .AAC 확장자를 사용한다. 그래도, 동영상 포맷인 MP42)오디오 데이터 형식이긴 하다.

Fraunhofer IIS, AT&T Bell Laboratories, Dolby, Sony Corporation, and Nokia 들이 협력하여 개발하였다.

동일 비트레이트에서 AACMP3보다 음질이 우수하다.

AACMP3 파일에 대한 개선된 후속 형식으로 설계되었기 때문에, MP3에 비해 다음과 같은 장점이 있다.

HE-AAC

HE-AAC v2

스트리밍

음원, 영상 등을, 사용자의 기기로 통신망을 통해 전송하여 재생 하는 기술,

스트리밍네트워크 망의 전송 상태에 따라 비트레이트를 실시간으로 조절하는 기술 등이 들어간다.

따라서, 네트워크 망이 좋지 않거나, 사용자가 많이 몰리면, 재생 퀄리티에 영향을 받을 수 있다.

스트리밍은 재생 장치의 재생 스펙에 맞춰서 컨텐츠를 전송한다. 예를 들어 재생 장치의 해상도가 1080p인 경우에는 영상을 1080p로 실시간 인코딩하여 전송하며, 스마트폰 등의 작은 화면에 전송하는 경우, 그에 따라 화면의 해상도를 작게 인코딩하여 전송한다.4)

커피샵이나 대형 매장등에서 재생하는 음반 스트리밍의 경우에는 저작재산권공연권 이용과 전송권 이용에 해당하기 때문에, 일반 스트리밍 서비스와 요금이 다르다.

https://maily.so/kimlou/posts/cc1908

Streaming

Streaming is a technology that transmits audio, video, and other content to users' devices over a communication network for playback. Streaming involves real-time bitrate adjustment based on the transmission status of the network. Therefore, if the network conditions are poor or there is a high user demand, it may impact the playback quality.

Streaming tailors the transmission of content to match the playback specifications of the playback device. For example, if the playback device has a resolution of 1080p, the video is encoded in real-time at 1080p for transmission. When streaming to smaller screens like smartphones, the resolution of the content is encoded smaller to reduce data transmission volume.

In cases of music streaming in coffee shops or large stores, where performance and transmission rights related to copyright are involved, the fees may differ from regular streaming services.

음원 플랫폼 별 스트리밍 음량

LUFS reference

음원스트리밍으로 재생하는 플랫폼에서는 해당 스트리밍 플랫폼의 사용자가 스트리밍 이용할 때에 계속 곡마다 다른 볼륨으로 재생되면 볼륨을 계속 오르락 내리락 조절해야 하는 문제가 발생한다. 그래서, 각자의 표준 음량을 정해서 모든 음원을 해당 음량 값으로 재조정하여 스트리밍하는 기술을 적용한다.5)

이것을 오해하여 각 스트리밍 플랫폼에 맞도록 각기 다른 라우드니스마스터링해야 한다는 잘못된 인식이 있기도 하다.6)

마스터링 라우드니스는 클라이언트가 생각하는 목표하는 라우드니스마스터링하면 됩니다. 라우드니스가 큰 음원음원 플랫폼에서 자체 라우드니스 기준에 맞게 낮춰 재생합니다.

그렇기 때문에, 각 플랫폼라우드니스에 맞춘 여러가지 마스터링본을 만들 필요는 없다.

이러한 기술스트리밍 플레이어 앱이나 소프트웨어에서 Loudness Normalization 기능을 켜거나 끌 수 도 있다.

주요 플랫폼별 reference

LUFS 값중에서 기준값으로 사용되는 값은 Integrated(Program) LUFS 입니다.
예시) 이 곡은 -10LUFS 입니다.(전체 구간 재생에 대한 Integrated LUFS 값이 -10LUFS 라는 뜻.)

Platform 레퍼런스 레벨(LUFS) 레퍼런스 레벨(LU) 비고
EBU R1287) -23LUFS 0LU ±1LU8)
대한민국9) -24LUFS -1LU ±2LU10)
Itunes -16LUFS 7LU
Tidal -14LUFS 9LU
Spotify -14LUFS 9LU
YouTube -14LUFS 9LU

2020-9-06 기준

국내 업체별 LUFS reference

아직 특별한 업체별 기준 없음.

변동사항 제보바람.

2)
mpeg-4
3)
MP3 는 16kHz 이상을 제거함.
4)
그래야 전송 데이터량을 줄일 수 있다.
5)
이와 비슷한 개념으로 앨범 단위의 마스터링에서는 한 음반을 들을 때 청취자가 볼륨을 조절하면서 들을 필요 없도록 모든 곡별 볼륨 및 라우드니스를 적절하게 조절하는 과정이 마스터링에 포함된다.
6)
일단 디스트리뷰터는 하나의 라우드니스마스터링 본만 받는다. 여러 플랫폼에 해당하는 각각의 마스터링 본을 받지 않는다.
8) , 10)
허용
로그인하면 댓글을 남길 수 있습니다.
검색
[홈레코딩 필독서]"모두의 홈레코딩"구매링크


음향/media/digital_music_file/start.txt · 마지막으로 수정됨: 2024/03/28 저자 127.0.0.1