목차
MP3
MPEG audio layer-3 포맷, 손실 압축 방식.
원래는 동영상 포맷인 MPEG-1, 및 MPEG-2 에 사용되는 오디오 압축 형식이다.
독일 Fraunhofer Society 에서 연구 개발.
128kbps, 192kbps, 320kbps 등은 비트레이트, bps(bit per seconds), 즉 초당 bit 전송률을 이야기 하는 것으로, 높은 숫자일수록 파일 용량이 크며 음질 손실이 덜하다. WAV 파일들의 비트레이트가 1411kbps(16-bit 44.1kHz) 나 4600kbps(24-bit 48kHz) 정도 하는 것에 비해 MP3의 비트레이트는 그의 1/10~20의 수준인 192kbps, 320kbps 등으로 매우 용량이 작다. 아주 많이 손실 압축함을 알 수 있다.
손실
MP3의 손실 압축 기법은 심리음향 분석 및 인간의 청각 인지 능력에 의해서 일반적으로 사람이 들을 수 없는, 또는 청취가 힘들다고 예상되는 오디오 정보를 삭제하여, 용량을 줄이게 된다.
이에 따라, CD의 음질인 16-bit 44.1kHz 스테레오에 비하여 용량을 75%~95%까지 줄이는 것이 가능해진다.(예를 들면 CD의 1411kbps → 128kbps)
크리티컬 밴드
1933년 Bell Labs의 Harvey Fletcher는 피치에 대한 인간의 민감도, 마스킹과 마스킹된 사운드의 주파수 및 마스킹 사운드의 주파수와의 관계를 이해하는 데 도움이 되는 방법으로 크리티컬 밴드 지정을 제안 했습니다.
사람은 소리의 대역폭에 따라 각기 다른 소리의 크기로 받아들이는데, 소리의 대역폭이 크면 클수록 소리도 크게 느껴지게 된다. 하지만, 그 대역폭이 작아지면 작아질수록 소리가 작게 느껴지게 되는데, 어느 한계점 이상으로 작아지게 되면 그 변화를 느끼지 못한다. 즉 인간이 인지 가능한 대역폭의 최소 한계이다. 그러한 최소의 대역폭을 크리티컬 밴드라고 한다.
MP3 인코딩에서는 마스킹 되는 소리를 삭제하기 위해 사전에 대역폭을 각 주파수 별로 크리티컬 밴드로 나눈다.
Critical bandwidth
People perceive sound at different loudness levels depending on the bandwidth of the sound. When the bandwidth of sound is wider, it tends to be perceived as louder. However, as the bandwidth decreases, the sound is perceived as quieter. There is a certain point beyond which further reductions in bandwidth go unnoticed by humans. This point represents the minimum bandwidth that humans can perceive, and it is referred to as the critical bandwidth.
In MP3 encoding, the critical bandwidth is used to divide the frequency spectrum into different critical bandwidths to remove masked sounds beforehand.
크리티컬 밴드 차트
Critical Band No. | Frequency Range (Hz) | Bandwidth (Hz) |
---|---|---|
1 | 20 ~ 100 | 80 |
2 | 100 ~ 200 | 100 |
3 | 200 ~ 300 | 100 |
4 | 300 ~ 400 | 100 |
5 | 400 ~ 510 | 110 |
6 | 510 ~ 630 | 120 |
7 | 630 ~ 770 | 140 |
8 | 770 ~ 920 | 150 |
9 | 920 ~ 1080 | 160 |
10 | 1080 ~ 1270 | 190 |
11 | 1270 ~ 1480 | 210 |
12 | 1480 ~ 1720 | 240 |
13 | 1720 ~ 2000 | 280 |
14 | 2000 ~ 2320 | 320 |
15 | 2320 ~ 2700 | 380 |
16 | 2700 ~ 3150 | 450 |
17 | 3150 ~ 3700 | 550 |
18 | 3700 ~ 4400 | 700 |
19 | 4400 ~ 5300 | 900 |
20 | 5300 ~ 6400 | 1100 |
21 | 6400 ~ 7700 | 1300 |
22 | 7700 ~ 9500 | 1800 |
23 | 9500 ~ 12000 | 2500 |
24 | 12000 ~ 15500 | 3500 |
25 | 15500 ~ 20000 | 4500 |
청각 마스킹
어떤 한 주파수의 소리가 크면 그 인근의 작은 주파수는 잘 들리지 않는 현상. 따라서 MP3에서는 이러한 잘 들리지 않는 주파수는 삭제하여 데이터를 줄인다.
크리티컬 밴드중에 어느 하나의 소리가 크고 바로 옆 인근의 크리티컬 밴드의 소리가 작으면 소리가 작은 크리티컬 밴드의 데이터는 삭제한다.
Brick Wall LPF
가청 주파수는 일반적으로 20Hz~20kHz 라고 정의 되지만,
일반인 사람의 경우 16kHz 이상의 주파수는 청각적으로 인지되기 힘들기 때문에, 특정 kbps 이하의 MP3에서는 16kHz 이상의 주파수를 제거한다.
하지만 16kHz 이상의 주파수 성분에는 소리의 트랜지언트 구간의 정보가 많이 들어있기 때문에, 트랜지언트의 재생에 영향을 끼칠 수 있다.
손실 압축의 부작용
손실 압축의 방식은 주파수 대역을 각각의 크리티컬 대역으로 필터를 통해 나누고, 여러가지 오디오 데이터에 손실을 가하는 형식이므로, 인코딩 알고리즘에 따라 조금씩 다르지만, 약간의 노이즈를 생성하기도 한다.
그런 대표적인 노이즈를 Swirlies 라고 한다.
이러한 Swirlies의 발생 정도를 측정해 보면 MP3 의 인코딩 방식보다 AAC 의 인코딩 방식이 우수한 것으로 보인다.
메타데이터
MP3 파일에는 음악의 제목, 아티스트, 앨범, 트랙번호 , 파일 내용에 대한 기타 정보를 같이 저장할 수 있다.
MP3 의 메타데이터 형식에는 ID3v1, ID3v2 가 있고, 최근에는 APEv2 라는 데이터 형식도 사용한다.
Cubase Export ID3 tag
[공지]회원 가입 방법
[공지]글 작성 및 수정 방법