사용자 도구

사이트 도구


acoustics:psychoacoustics:loudness:critical_band

크리티컬 밴드

크리티컬 밴드(Critical Band, 임계 대역)는 인간의 청각 기관이 주파수를 인지하고 처리하는 독립적인 최소 대역폭 격자를 의미한다. 1933년 벨 연구소(Bell Labs)의 하비 플레처(Harvey Fletcher)가 인간이 피치를 인지하는 민감도마스킹(Masking) 현상을 연구하던 중 처음으로 제안하였다.

사람은 소리대역폭에 따라 음량의 크기를 다르게 받아들인다. 소리의 총 물리적 에너지(레벨)가 같더라도 대역폭이 넓어지면 소리가 더 크게 느껴지지만, 대역폭이 좁아지다 못해 어느 한계점 이하로 작아지게 되면 더 이상 대역폭 축소에 따른 음량 변화를 느끼지 못한다. 즉, 인간이 단일 채널로 인지하는 대역폭의 최소 한계가 존재하며 이를 크리티컬 밴드라고 부른다.

생리적 원리

소리가 귀를 거쳐 달팽이관 내부로 전달되면, 기저막(Basilar Membrane)의 물리적·구조적 특성으로 인해 주파수별로 최대 공명이 일어나는 위치가 달라진다. 고음은 달팽이관 입구 부근에서, 저음은 안쪽 끝에서 공명한다. 이때 기저막의 특정 지점과 그 주변 유모세포들이 하나의 단위로서 함께 반응하는 물리적 영역이 바로 크리티컬 밴드의 실체이다.

ERB filter bank

바크 스케일

Bark Scale

1961년 독일의 음향학자 Eberhard Zwicker 박사는 하비 플레처가 발견한 크리티컬 밴드 개념을 발전시켜, 인간의 가청 주파수 영역($20\text{ Hz} \sim 20\text{ kHz}$)을 임계 대역의 크기에 맞춰 총 24개의 구간으로 정밀하게 규격화하였다. 이 24 채널의 생물학적 필터 뱅크 격자를 수치화한 심리음향학적 주파수 척도를 Bark 스케일이라고 부른다. ※ 명칭은 츠비커 박사의 스승이자 음향학자인 Heinrich Barkhausen의 이름을 땄다.

  • 물리적 환산: 1 Bark는 달팽이관 기저막 위에서 대략 $1.3\text{ mm}$의 물리적 길이에 해당하는 주파수 영역과 매칭된다.

Bark Scale그림 1

헤르츠(Hz)와의 차이점

물리적 주파수 단위인 헤르츠($\text{Hz}$)는 선형적 척도이지만, 바크 스케일은 인간의 실제 주파수 분해능을 반영하므로 고음역으로 갈수록 대역폭의 폭이 넓어지는 가변적 특성을 가진다.

  • 저음역대 ($500\text{ Hz} 이하$): 인간은 저음 변화에 민감하므로 1 Bark의 폭이 대략 $100\text{ Hz}$ 단위로 촘촘하다.
  • 고음역대 ($500\text{ Hz} 이상$): 고음으로 갈수록 분별 능력이 둔해지므로 1 Bark의 폭이 해당 중심 주파수의 약 $20\%$ 수준으로 넓어진다. ($10\text{ kHz}$ 주변에서의 1 Bark 폭은 $2\text{ kHz}$를 상회함)
핵심 개념: 물리적($\text{Hz}$) 관점에서는 고음역의 폭이 훨씬 넓어 보이지만, 인간의 달팽이관과 뇌의 입장에서는 저음의 $100\text{ Hz}$ 대역폭이나 고음의 $2\text{ kHz}$ 대역폭이나 똑같은 '1 칸(1 Bark)'짜리 정보 용량을 가질 뿐이다.

전체 24개 가청 임계 대역

가청 주파수대역을 가로로 완전히 눕혀 시각화한 바크 스케일 상세 데이터 매칭표이다. 가독성을 위해 12대역씩 분할 배치하였다.

바크 (Bark) 1 2 3 4 5 6 7 8 9 10 11 12
중심 주파수 (Hz) 50 150 250 350 450 570 700 840 1000 1170 1370 1600
차단 주파수 (Hz) 1001) 200 300 400 510 630 770 920 1080 1270 1480 1720
대역폭 (Hz) 80 100 100 100 110 120 140 150 160 190 210 240
바크 (Bark) 13 14 15 16 17 18 19 20 21 22 23 24
중심 주파수 (Hz) 1850 2150 2500 2900 3400 4000 4800 5800 7000 8500 10500 13500
차단 주파수 (Hz) 2000 2320 2700 3150 3700 4400 5300 6400 7700 9500 12000 15500
대역폭 (Hz) 280 320 380 450 550 700 900 1100 1300 1800 2500 3500

※ 24번 대역의 상한 차단 주파수 이후($15,500\text{ Hz} \sim 20,000\text{ Hz}$) 영역은 인간 초고역대 특성상 통상 하나의 확장 밴드(25번 임계 대역폭 약 $4,500\text{ Hz}$)로 취급되기도 한다.

오디오 공학 및 디지털 코덱에서의 활용

츠비커 라우드니스 미터 (Zwicker Loudness Meter)

츠비커 미터입력오디오 신호를 24개의 바크 필터 뱅크(크리티컬 밴드)에 통과시킨 뒤 연산을 시작한다. 특정 채널의 에너지가 비정상적으로 높을 경우, 인접한 채널의 에너지를 감쇄하거나 합산에서 제외하는 동시 마스킹(Simultaneous Masking) 알고리즘의 절대적인 연산 가이드라인이 된다.

지각 오디오 코딩 (MP3, AAC 등 손실 압축)

인간의 귀가 인지하는 주파수리드크리티컬 밴드 기반이라는 점을 이용한 오디오 코덱 압축 기술이다. 인코더는 디지털 오디오 신호를 각 주파수크리티컬 밴드로 사전 분할한 뒤, 강력한 신호가 들어온 밴드 주변의 미세한 주파수 성분(마스킹되어 어차피 인간이 듣지 못하는 데이터)을 과감히 삭제함으로써 음질 저하는 최소화하면서 데이터 용량을 극적으로 줄여낸다.

1)
20Hz~
로그인하면 댓글을 남길 수 있습니다.

[공지]회원 가입 방법
[공지]글 작성 및 수정 방법

acoustics/psychoacoustics/loudness/critical_band.txt · 마지막으로 수정됨: 저자 정승환