사용자 도구

사이트 도구


음향:industrial_standards:itu:itu-r_bs_1770

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
음향:industrial_standards:itu:itu-r_bs_1770 [2025/08/25] 정승환음향:industrial_standards:itu:itu-r_bs_1770 [2026/05/03] (현재) – [3. 상세 설명] 정승환
줄 1: 줄 1:
 ======ITU-R BS.1770====== ======ITU-R BS.1770======
 +
 +=====요약=====
 +
 +Algorithms to measure audio **programme loudness** and **True-peak** audio level
 +
 +LUFS 미터는 소리 크기의 범위 및 True-peak를 표기 하도록 만들어진 라우드니스 미터입니다. LUFS 미터의 작동에 대한 알고리즘 및 세부 사항은 ITU-R BS.1770 에서 정의되어 있습니다.
 +
 +사람이 청감상 인지하는 소리 크기, 즉 라우드니스를 수치로 **최대한 비슷하게 현실화**하기 위해서 K-weighted 가중치를 고려한 필터를 사용하고, RMS 값을 측정하여 dBFS로 결과를 내어서, 단위는 LUFS, 또는 LU로 표기합니다.
 +
 +{{ 20250602-105730.png }}
 +
 +====이름과 단위====
 +
 +ITU-R BS.1770은 다음과 같은 명명 규칙 및 단위 규칙을 제안합니다. 기준 레벨과 관련된 값인 Loudness Unit(1LU 는 1dB)과 같은 상대 측정 값입니다.
 +
 +  * LUFS: 절대값, **L**oudness **U**nit Relative to **F**ull **S**cale  
 +  * LU : 상대값((ex)0LU=-23LUFS)), **L**oudness **U**nit
 +  * 1LU = 1dB의 레벨 증감과 동일합니다.
 +
 +>LUFS((Loudness units relative to full scale))와 LKFS((Loudness, K-weighted, relative to full scale))는 같은 단위입니다. 원래 명칭은 LKFS였으나, LUFS로 바꿔서 부르도록 권장하고 있습니다.
 +
 +====k-weighting====
 +
 +K-weighting filter는 인간의 청각 특성을 반영해 설계된 주파수 가중치 필터로, 사람이 잘 듣는 주파수(특히 1~4kHz 대역)를 강조하고, 저음과 고음 등 상대적으로 덜 민감한 영역을 감쇠시킵니다. 이 필터는 ITU-R BS.1770 표준에 따라 라우드니스(LUFS, LKFS) 측정의 핵심 요소로 사용되며, 단순한 물리적 신호 세기가 아닌 실제 사람이 느끼는 음량을 더 정확하게 평가할 수 있게 해줍니다.
 +
 +<WRAP group centeralign>
 +<WRAP half column>
 +{{20250602-110035.png}}\\
 +Pre-filter
 +</WRAP>
 +<WRAP half column>
 +{{20250602-110049.png}}\\
 +RLB filter
 +</WRAP>
 +</WRAP>
 +
 +{{ 20250602-110445.png }}
 +
 +
 +
 +====Integrated Loudness====
 +
 +Integrated Loudness는 곡의 시작부터 끝까지, 즉 전체 재생 구간에 걸쳐 소리 크기의 평균을 계산한 값을 LUFS(라우드니스 유닛 풀 스케일) 단위로 표기합니다. 이 값은 곡의 전반적인 소리 크기(라우드니스)를 대표하며, 실제로 사람이 곡을 들을 때 느끼는 평균적인 볼륨에 가까운 수치입니다.
 +게이트 알고리즘이 적용되어 있어, 무음 구간이나 매우 조용한 부분은 측정에서 제외됩니다. 예를 들어, 곡의 클라이맥스 부분만 측정하면 평소보다 훨씬 큰 값이 나올 수 있으므로, 전체 구간을 기준으로 측정하는 것이 중요합니다.
 +>실제 마스터링이나 방송, 스트리밍 플랫폼에서 권장되는 기준값은 Integrated(Program) LUFS 값입니다. 예를 들어, “이 곡은 -10LUFS입니다”라고 하면 곡 전체의 평균 라우드니스가 -10LUFS임을 의미합니다
 +
 +====Short-Term Loudness====
 +
 +Short-Term Loudness는 곡의 특정 구간(보통 3초) 동안의 평균 소리 크기를 매 1초마다 표기한 값입니다. 이 방식은 곡의 중간중간, 예를 들어 인트로, 벌스, 코러스 등에서 소리의 크기가 어떻게 변하는지 확인할 때 유용합니다.
 +최고값이 미터의 왼쪽에 표기되며, 곡의 다이내믹 변화나 균형을 체크할 때 참고할 수 있습니다.
 +>즉, 곡 전체의 평균(Integrated)과 달리, 짧은 구간에서의 음량 변화를 실시간으로 볼 수 있습니다.
 +
 +{{음향:meter:lufs_meter:pasted:20220113-000704.png}}
 +
 +====Momentary Loudness====
 +
 +Momentary Loudness는 400ms(0.4초) 동안의 순간적인 소리 크기를 100ms마다 측정한 값의 최대값을 표기합니다. 이 값은 아주 짧은 시간 동안의 음량 변화를 파악할 때 사용됩니다.
 +예를 들어, 드럼의 강한 한 박, 신스의 짧은 하이라이트 등 순간적으로 소리가 커지는 부분을 측정할 때 유용합니다.
 +Momentary Loudness는 전체 곡의 평균이나 3초 단위의 Short-Term과 달리, 순간순간의 소리 크기를 빠르게 확인할 수 있습니다.
 +
 +====Loudness Range====
 +
 +**Loudness Range(라우드니스 레인지, LRA)**는 곡 전체에서 소리가 가장 큰 부분과 가장 조용한 부분 사이의 차이를 LU(라우드니스 유닛)로 표기합니다. 이 값은 곡의 다이내믹 레인지를 의미하며, 곡이 얼마나 다양한 소리 크기를 가지고 있는지 알 수 있습니다.
 +측정 시, 가장 조용한 부분의 상위 10%와 가장 큰 부분의 상위 5%는 제외되어, 극단적인 값이 결과에 영향을 주지 않도록 합니다.
 +>즉, Loudness Range는 곡의 전체적인 소리 크기 변화 폭을 보여주며, 다이내믹한 곡인지, 아니면 일정한 볼륨을 유지하는 곡인지 판단할 수 있습니다.
 +
 +====True-peak====
 +
 +{{page>음향:level:true_peak&noheader}}\\
 +
 +----
 +======참조======
 +
 +  * https://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-5-202311-I!!PDF-E.pdf
 +
 +{{tag>라우드니스 미터}}
 +
 +======ITU-R BS.1770(실제 문서)======
  
 **Algorithms to measure audio programme loudness and true-peak audio level** **Algorithms to measure audio programme loudness and true-peak audio level**
줄 41: 줄 119:
  
 >참고 1 – 사용자는 측정된 라우드니스가 주관적 라우드니스의 추정치이며, 청취자, 오디오 자료, 청취 환경에 따라 어느 정도의 불확실성이 존재함을 인지해야 한다. >참고 1 – 사용자는 측정된 라우드니스가 주관적 라우드니스의 추정치이며, 청취자, 오디오 자료, 청취 환경에 따라 어느 정도의 불확실성이 존재함을 인지해야 한다.
 +
 >참고 2 – 본 권고에 따라 미터의 적합성 시험을 위해, ITU-R BS.2217 보고서에 기술된 세트의 테스트 자료를 사용할 수 있다. >참고 2 – 본 권고에 따라 미터의 적합성 시험을 위해, ITU-R BS.2217 보고서에 기술된 세트의 테스트 자료를 사용할 수 있다.
  
줄 74: 줄 153:
 {{ 20250825-231755.png }} {{ 20250825-231755.png }}
  
-{{ 20250825-231829.png }}+Filter coefficients for stage 1 of the pre-filter to model a spherical head  
 +<WRAP tablewidth 100%> 
 +| | | $b_0$ | 1.53512485958697 | 
 +| $a_1$ | -1.69065929318241| $b_1$ | -2.69169618940638 |  
 +| $a_2$ | 0.73248077421585 | $b_2$ | 1.19839281085285 | 
 +</WRAP>
  
 이 필터 계수는 48 kHz 샘플링 속도에 해당한다. 다른 샘플링 속도에서 구현할 경우, 해당 샘플링 속도에 맞게 동일한 주파수 응답을 제공하도록 계수 값을 달리 선택해야 한다. 이 계수 값들은 사용 가능한 하드웨어의 내부 정밀도 때문에 양자화되어야 할 수도 있다. 테스트 결과 알고리즘 성능은 이 계수 값들의 작은 변화에 민감하지 않은 것으로 나타났다. 이 필터 계수는 48 kHz 샘플링 속도에 해당한다. 다른 샘플링 속도에서 구현할 경우, 해당 샘플링 속도에 맞게 동일한 주파수 응답을 제공하도록 계수 값을 달리 선택해야 한다. 이 계수 값들은 사용 가능한 하드웨어의 내부 정밀도 때문에 양자화되어야 할 수도 있다. 테스트 결과 알고리즘 성능은 이 계수 값들의 작은 변화에 민감하지 않은 것으로 나타났다.
줄 81: 줄 165:
 {{ 20250825-231934.png }} {{ 20250825-231934.png }}
  
-{{ 20250825-231950.png }}+Filter coefficients for the second stage weighting curve  
 +<WRAP tablewidth 100%> 
 +| | | $b_0$ | 1.0 | 
 +| $a_1$ | -1.99004745483398 | $b_1$ | -2.0 | 
 +| $a_2$ | 0.99007225036621 | $b_2$ | 1.0 | 
 +</WRAP> 
  
 여기서 측정 간격 T 내에 필터링된 입력 신호의 평균 제곱값, 즉 파워는 다음과 같이 측정된다: 여기서 측정 간격 T 내에 필터링된 입력 신호의 평균 제곱값, 즉 파워는 다음과 같이 측정된다:
  
-{{ 20250825-232050.png }}+$$z_i = \frac{1}{T\int_{0}^{T} y_{i}^{2\,dt$$
  
 여기서 y<sub>i</sub>는 위에서 설명한 2단계 사전 필터를 통과한 입력 신호이며, i∈I이고 I={L,R,C,Ls,Rs}, 즉 입력 채널들의 집합이다. 측정 구간 T 동안의 라우드니스는 다음과 같이 정의된다: 여기서 y<sub>i</sub>는 위에서 설명한 2단계 사전 필터를 통과한 입력 신호이며, i∈I이고 I={L,R,C,Ls,Rs}, 즉 입력 채널들의 집합이다. 측정 구간 T 동안의 라우드니스는 다음과 같이 정의된다:
  
-{{ 20250825-232337.png }}+$$\text{Loudness, } L_K = -0.691 + 10 \log_{10\sum_{i} G_i \cdot z_i \quad \text{LKFS}$$
  
 여기서 Gi는 개별 채널에 대한 가중치 계수이다. 게이티드 라우드니스 측정을 계산하기 위해, 측정 구간 T는 중첩되는 게이팅 블록 간격들의 집합으로 나뉜다. 게이팅 블록은 인접한 오디오 샘플들의 집합이며, 길이는 가장 가까운 샘플 단위로 400 ms(Tg=400 ms)이다. 여기서 Gi는 개별 채널에 대한 가중치 계수이다. 게이티드 라우드니스 측정을 계산하기 위해, 측정 구간 T는 중첩되는 게이팅 블록 간격들의 집합으로 나뉜다. 게이팅 블록은 인접한 오디오 샘플들의 집합이며, 길이는 가장 가까운 샘플 단위로 400 ms(Tg=400 ms)이다.
줄 95: 줄 185:
 측정 구간 T 내의 i번째 입력 채널의 j번째 게이팅 블록의 파워(평균 제곱값)는 다음과 같다: 측정 구간 T 내의 i번째 입력 채널의 j번째 게이팅 블록의 파워(평균 제곱값)는 다음과 같다:
  
-{{ 20250825-232521.png }}+$$z_{ij} = \frac{1}{T_g\int_{T_g \cdot j \cdot step}^{T_g \cdot (j \cdot step + 1)} y_{i}^{2} \,dt \quad \text{where} \quad step = 1 - overlap$$
  
 +$$\text{and} \quad j \in \left\{ 0, 1, 2, \dots, \frac{T - T_g}{T_g \cdot step} \right\}$$
 j번째 게이팅 블록 라우드니스는 다음과 같이 정의된다: j번째 게이팅 블록 라우드니스는 다음과 같이 정의된다:
  
-{{ 20250825-232645.png }}+$$l_j = -0.691 + 10 \log_{10\sum_{i} G_i \cdot z_{ij}$$
  
 게이팅 임계값 Γ에 대해, 게이팅 블록 라우드니스가 임계값을 초과하는 게이팅 블록 지수들의 집합 Jg ={j:lj >Γ}가 정의된다. 게이팅 임계값 Γ에 대해, 게이팅 블록 라우드니스가 임계값을 초과하는 게이팅 블록 지수들의 집합 Jg ={j:lj >Γ}가 정의된다.
 Jg 의 원소 개수는∣Jg∣이다. 측정 구간 T의 게이티드 라우드니스는 다음과 같이 정의된다: Jg 의 원소 개수는∣Jg∣이다. 측정 구간 T의 게이티드 라우드니스는 다음과 같이 정의된다:
  
-{{ 20250825-232825.png }}+$$\text{Gated loudness, } L_{KG} = -0.691 + 10 \log_{10\sum_{i} G_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij\right) LKFS$$
  
 게이티드 측정은 두 단계 과정으로 수행된다. 게이티드 측정은 두 단계 과정으로 수행된다.
줄 111: 줄 202:
 상대 임계값 Γr 는 절대 임계값 Γa=−70 LKFS를 사용하여 라우드니스를 측정하고, 그 결과에서 10을 뺌으로써 계산된다. 즉: 상대 임계값 Γr 는 절대 임계값 Γa=−70 LKFS를 사용하여 라우드니스를 측정하고, 그 결과에서 10을 뺌으로써 계산된다. 즉:
  
-{{ 20250825-232944.png }}+$$\Gamma_r = -0.691 + 10 \log_{10\sum_{iG_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij} \right) - 10 \quad LKFS$$
  
 여기서: 여기서:
  
-{{ 20250825-233029.png }}+$$J_g = \j : l_j > \Gamma_a \}$$ 
 + 
 +$$\Gamma_a = -70 \quad LKFS$$
  
 게이팅된 라우드니스는 다음과 같이 Γr 를 사용하여 계산할 수 있다: 게이팅된 라우드니스는 다음과 같이 Γr 를 사용하여 계산할 수 있다:
  
-{{ 20250825-233115.png }}+$$\text{Gated loudness, } L_{KG} = -0.691 + 10 \log_{10\sum_{i} G_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij\right) LKFS$$
  
 여기서: 여기서:
  
-{{ 20250825-233137.png }}+$$J_g = \j : l_j > \Gamma_r \textand l_j > \Gamma_a \}$$
  
 이 측정에서 생성되는 주파수 가중치는 사전 필터에 의한 것으로, 1단계 필터는 머리의 음향 효과를 보상하기 위해 설계된 필터이며, 2단계 필터는 RLB 가중치 필터이다. 이 두 필터의 결합은 K-가중치로 지정된다. 이 측정에서 생성되는 주파수 가중치는 사전 필터에 의한 것으로, 1단계 필터는 머리의 음향 효과를 보상하기 위해 설계된 필터이며, 2단계 필터는 RLB 가중치 필터이다. 이 두 필터의 결합은 K-가중치로 지정된다.
줄 135: 줄 228:
 각 채널에 대한 가중치 계수는 표 3에 나와 있다. 각 채널에 대한 가중치 계수는 표 3에 나와 있다.
  
-{{ 20250825-233255.png }}+^ Channel ^ Weighting, $G_i$ ^ 
 +| Left ($G_L$) | 1.0 (0 dB) | 
 +| Right ($G_R$) | 1.0 (0 dB) | 
 +| Centre ($G_C$) | 1.0 (0 dB) | 
 +| Left surround ($G_{Ls}$) | 1.41 (~ +1.5 dB) | 
 +| Right surround ($G_{Rs}$) | 1.41 (~ +1.5 dB) |
  
 이 알고리즘은 방송 콘텐츠에 전형적인 오디오 프로그램에 대해 효과적인 것으로 입증되었으나, 일반적으로 순수 음(pure tones)의 주관적 라우드니스를 추정하는 데 적합하지 않다는 점을 주목할 필요가 있다. 이 알고리즘은 방송 콘텐츠에 전형적인 오디오 프로그램에 대해 효과적인 것으로 입증되었으나, 일반적으로 순수 음(pure tones)의 주관적 라우드니스를 추정하는 데 적합하지 않다는 점을 주목할 필요가 있다.
줄 192: 줄 290:
 Leq는 다음과 같이 정의된다: Leq는 다음과 같이 정의된다:
  
-{{ 20250825-234433.png }}+$$Leq(W) = 10 \log_{10} \left[ \frac{1}{T} \int_{0}^{T} \frac{x_{W}^{2}}{x_{Ref}^{2}} \,dt \right] \quad \text{dB}$$
  
 여기서: 여기서:
줄 276: 줄 374:
 이 알고리즘은 시간 영역에서 저렴한 하드웨어로 쉽게 구현할 수 있는 매우 기본적인 신호 처리 블록들로만 구성되어 있다. 이 알고리즘은 시간 영역에서 저렴한 하드웨어로 쉽게 구현할 수 있는 매우 기본적인 신호 처리 블록들로만 구성되어 있다.
 또 다른 주요 장점은 확장성이다. 각 채널에 적용되는 처리가 동일하므로, 1채널에서 N채널까지 어떤 수의 채널이든 수용할 수 있는 미터를 구현하는 것이 매우 간단하다. 또 다른 주요 장점은 확장성이다. 각 채널에 적용되는 처리가 동일하므로, 1채널에서 N채널까지 어떤 수의 채널이든 수용할 수 있는 미터를 구현하는 것이 매우 간단하다.
-또한, 개별 채널의 기여도가 신호 레벨이 아니라 라우드니스 값으로서 합산되므로, 알고리즘은 채널 간 위상이나 상관계에 의존하지 않는다.+또한, 개별 채널의 기여도가 신호 레벨이 아니라 라우드니스 값으로서 합산되므로, 알고리즘은 채널 간 위상이나 상관계에 의존하지 않는다.
 이로 인해 제안된 라우드니스 측정법은 훨씬 더 범용적이고 견고하다. 이로 인해 제안된 라우드니스 측정법은 훨씬 더 범용적이고 견고하다.
  
줄 319: 줄 417:
 ======Annex 2====== ======Annex 2======
  
 +**Guidelines for accurate measurement of “true-peak” level**
 +
 +이 부속서는 단일 채널 선형 PCM 디지털 오디오 신호 내에서 실제 피크 레벨을 추정하는 알고리즘을 설명한다. 다음 설명은 48 kHz 샘플링 주파수를 전제로 한다.
 +실제 피크 레벨은 연속 시간 도메인에서 신호 파형의 최대 (양수 또는 음수) 값이며, 이 값은 48 kHz 시간 샘플링 도메인의 최대 샘플 값보다 더 클 수 있다.
 +
 +=====1. 요약=====
 +처리 단계는 다음과 같다:
 +
 +  - 감쇠: 12.04 dB 감쇠
 +  - 4배 오버샘플링
 +  - 저역통과 필터
 +  - 절대값 처리
 +  - dB TP(실제 피크)로 변환
 +
 +=====2. Block diagram=====
 +
 +{{ 20250826-001932.png }}
 +
 +=====3. 상세 설명=====
 +첫 번째 단계는 12.04 dB(2비트 시프트)의 감쇠를 가하는 것이다.
 +이 단계의 목적은 후속 신호 처리에서 정수 연산을 사용할 경우를 대비한 여유 공간을 제공하는 것이다.
 +부동 소수점 계산 시에는 이 단계가 필요하지 않다.
 +4배 오버샘플링 필터는 신호 샘플링 주파수를 48 kHz에서 192 kHz로 증가시킨다.
 +이 고샘플링 신호는 오디오 샘플로 표현된 실제 파형을 더 정확히 나타낸다.
 +더 높은 샘플링 주파수와 오버샘플링 비율이 선호된다(이 부속서 부록 1 참조).
 +더 높은 샘플링 주파수를 가진 입력 신호는 상대적으로 더 적은 오버샘플링이 필요하다(예: 96 kHz 신호는 2배 오버샘플링으로 충분).
 +이 요구사항을 만족하는 한 세트 필터 계수(차수 48, 4상, FIR 보간 필터)는 다음과 같다:
 +
 +<WRAP tablewidth 100%>
 +^ Phase 0 ^ Phase 1 ^ Phase 2 ^ Phase 3 ^
 +| 0.0017089843750 | -0.0291748046875 | -0.0189208984375 | -0.0083007812500 |
 +| 0.0109863281250 | 0.0292968750000 | 0.0330810546875 | 0.0148925781250 |
 +| -0.0196533203125 | -0.0517578125000 | -0.0582275390625 | -0.0266113281250 |
 +| 0.0332031250000 | 0.0891113281250 | 0.1015625000000 | 0.0476074218750 |
 +| -0.0594482421875 | -0.1665039062500 | -0.2003173828125 | -0.1022949218750 |
 +| 0.1373291015625 | 0.4650878906250 | 0.7797851562500 | 0.9721679687500 |
 +
 +^ Phase 0 ^ Phase 1 ^ Phase 2 ^ Phase 3 ^
 +| 0.9721679687500 | 0.7797851562500 | 0.4650878906250 | 0.1373291015625 |
 +| -0.1022949218750 | -0.2003173828125 | -0.1665039062500 | -0.0594482421875 |
 +| 0.0476074218750 | 0.1015625000000 | 0.0891113281250 | 0.0332031250000 |
 +| -0.0266113281250 | -0.0582275390625 | -0.0517578125000 | -0.0196533203125 |
 +| 0.0148925781250 | 0.0330810546875 | 0.0292968750000 | 0.0109863281250 |
 +| -0.0083007812500 | -0.0189208984375 | -0.0291748046875 | 0.0017089843750 |
 +</WRAP>
 +
 +샘플의 절대값은 음수 값 샘플을 반전시켜 취한다; 이 시점에서 신호는 단극성이며, 음수 값이 같은 크기의 양수 값으로 대체된다.
 +감쇠, 오버샘플링, 필터링, 절대값 처리의 네 단계를 거친 후의 결과는 원래 샘플 값과 동일한 도메인(예: 24비트 정수)에 속하는 수치이다.
 +이후에 초기 12.04 dB 감쇠를 보상할 필요가 있다.
 +이 보상은 전체 처리의 이득을 정상화하여 1배가 되게 한다.
 +감쇠된 값을 12.04 dB(2비트 왼쪽 시프트) 증폭하는 것은, 일반적으로 원래 형식의 전체 스케일 범위보다 높은 값을 표현할 수 있는 수치 형식으로의 변환을 요구할 수 있다.
 +부동 소수점 형식으로 계산 단계를 수행하면 이 요구를 충족시킨다.
 +결과를 증폭하는 대신, 미터 스케일을 적절히 보정하는 방법도 있다.
 +이 가이드라인을 따르고 최소 192 kHz 오버샘플링 샘플링 레이트를 사용하는 미터는 결과를 dB TP 단위로 표시해야 하며, 결과를 로그 스케일로 변환한다.
 +이는 감쇠, 오버샘플링, 필터링, 절대값 처리된 신호의 “20log10”을 계산하고 12.04 dB를 더하는 것으로 달성할 수 있다.
 +“dB TP” 표기는 100% 풀 스케일 대비 실제 피크 측정을 나타내는 데시벨 단위임을 의미한다.
  
 +{{tag>"LUFS"}}

[공지]회원 가입 방법
[공지]글 작성 및 수정 방법

음향/industrial_standards/itu/itu-r_bs_1770.1756133913.txt.gz · 마지막으로 수정됨: 저자 정승환