음향:industrial_standards:itu:itu-r_bs_1770
차이
문서의 선택한 두 판 사이의 차이를 보여줍니다.
| 양쪽 이전 판이전 판다음 판 | 이전 판 | ||
| 음향:industrial_standards:itu:itu-r_bs_1770 [2025/08/25] – 정승환 | 음향:industrial_standards:itu:itu-r_bs_1770 [2026/05/03] (현재) – [3. 상세 설명] 정승환 | ||
|---|---|---|---|
| 줄 1: | 줄 1: | ||
| ======ITU-R BS.1770====== | ======ITU-R BS.1770====== | ||
| + | |||
| + | =====요약===== | ||
| + | |||
| + | Algorithms to measure audio **programme loudness** and **True-peak** audio level | ||
| + | |||
| + | LUFS 미터는 소리 크기의 범위 및 True-peak를 표기 하도록 만들어진 라우드니스 미터입니다. LUFS 미터의 작동에 대한 알고리즘 및 세부 사항은 ITU-R BS.1770 에서 정의되어 있습니다. | ||
| + | |||
| + | 사람이 청감상 인지하는 소리 크기, 즉 라우드니스를 수치로 **최대한 비슷하게 현실화**하기 위해서 K-weighted 가중치를 고려한 필터를 사용하고, | ||
| + | |||
| + | {{ 20250602-105730.png }} | ||
| + | |||
| + | ====이름과 단위==== | ||
| + | |||
| + | ITU-R BS.1770은 다음과 같은 명명 규칙 및 단위 규칙을 제안합니다. 기준 레벨과 관련된 값인 Loudness Unit(1LU 는 1dB)과 같은 상대 측정 값입니다. | ||
| + | |||
| + | * LUFS: 절대값, **L**oudness **U**nit Relative to **F**ull **S**cale | ||
| + | * LU : 상대값((ex)0LU=-23LUFS)), | ||
| + | * 1LU = 1dB의 레벨 증감과 동일합니다. | ||
| + | |||
| + | > | ||
| + | |||
| + | ====k-weighting==== | ||
| + | |||
| + | K-weighting filter는 인간의 청각 특성을 반영해 설계된 주파수 가중치 필터로, 사람이 잘 듣는 주파수(특히 1~4kHz 대역)를 강조하고, | ||
| + | |||
| + | <WRAP group centeralign> | ||
| + | <WRAP half column> | ||
| + | {{20250602-110035.png}}\\ | ||
| + | Pre-filter | ||
| + | </ | ||
| + | <WRAP half column> | ||
| + | {{20250602-110049.png}}\\ | ||
| + | RLB filter | ||
| + | </ | ||
| + | </ | ||
| + | |||
| + | {{ 20250602-110445.png }} | ||
| + | |||
| + | |||
| + | |||
| + | ====Integrated Loudness==== | ||
| + | |||
| + | Integrated Loudness는 곡의 시작부터 끝까지, 즉 전체 재생 구간에 걸쳐 소리 크기의 평균을 계산한 값을 LUFS(라우드니스 유닛 풀 스케일) 단위로 표기합니다. 이 값은 곡의 전반적인 소리 크기(라우드니스)를 대표하며, | ||
| + | 게이트 알고리즘이 적용되어 있어, 무음 구간이나 매우 조용한 부분은 측정에서 제외됩니다. 예를 들어, 곡의 클라이맥스 부분만 측정하면 평소보다 훨씬 큰 값이 나올 수 있으므로, | ||
| + | >실제 마스터링이나 방송, 스트리밍 플랫폼에서 권장되는 기준값은 Integrated(Program) LUFS 값입니다. 예를 들어, “이 곡은 -10LUFS입니다”라고 하면 곡 전체의 평균 라우드니스가 -10LUFS임을 의미합니다 | ||
| + | |||
| + | ====Short-Term Loudness==== | ||
| + | |||
| + | Short-Term Loudness는 곡의 특정 구간(보통 3초) 동안의 평균 소리 크기를 매 1초마다 표기한 값입니다. 이 방식은 곡의 중간중간, | ||
| + | 최고값이 미터의 왼쪽에 표기되며, | ||
| + | >즉, 곡 전체의 평균(Integrated)과 달리, 짧은 구간에서의 음량 변화를 실시간으로 볼 수 있습니다. | ||
| + | |||
| + | {{음향: | ||
| + | |||
| + | ====Momentary Loudness==== | ||
| + | |||
| + | Momentary Loudness는 400ms(0.4초) 동안의 순간적인 소리 크기를 100ms마다 측정한 값의 최대값을 표기합니다. 이 값은 아주 짧은 시간 동안의 음량 변화를 파악할 때 사용됩니다. | ||
| + | 예를 들어, 드럼의 강한 한 박, 신스의 짧은 하이라이트 등 순간적으로 소리가 커지는 부분을 측정할 때 유용합니다. | ||
| + | Momentary Loudness는 전체 곡의 평균이나 3초 단위의 Short-Term과 달리, 순간순간의 소리 크기를 빠르게 확인할 수 있습니다. | ||
| + | |||
| + | ====Loudness Range==== | ||
| + | |||
| + | **Loudness Range(라우드니스 레인지, LRA)**는 곡 전체에서 소리가 가장 큰 부분과 가장 조용한 부분 사이의 차이를 LU(라우드니스 유닛)로 표기합니다. 이 값은 곡의 다이내믹 레인지를 의미하며, | ||
| + | 측정 시, 가장 조용한 부분의 상위 10%와 가장 큰 부분의 상위 5%는 제외되어, | ||
| + | >즉, Loudness Range는 곡의 전체적인 소리 크기 변화 폭을 보여주며, | ||
| + | |||
| + | ====True-peak==== | ||
| + | |||
| + | {{page> | ||
| + | |||
| + | ---- | ||
| + | ======참조====== | ||
| + | |||
| + | * https:// | ||
| + | |||
| + | {{tag> | ||
| + | |||
| + | ======ITU-R BS.1770(실제 문서)====== | ||
| **Algorithms to measure audio programme loudness and true-peak audio level** | **Algorithms to measure audio programme loudness and true-peak audio level** | ||
| 줄 41: | 줄 119: | ||
| >참고 1 – 사용자는 측정된 라우드니스가 주관적 라우드니스의 추정치이며, | >참고 1 – 사용자는 측정된 라우드니스가 주관적 라우드니스의 추정치이며, | ||
| + | |||
| >참고 2 – 본 권고에 따라 미터의 적합성 시험을 위해, ITU-R BS.2217 보고서에 기술된 세트의 테스트 자료를 사용할 수 있다. | >참고 2 – 본 권고에 따라 미터의 적합성 시험을 위해, ITU-R BS.2217 보고서에 기술된 세트의 테스트 자료를 사용할 수 있다. | ||
| 줄 74: | 줄 153: | ||
| {{ 20250825-231755.png }} | {{ 20250825-231755.png }} | ||
| - | {{ 20250825-231829.png }} | + | Filter coefficients for stage 1 of the pre-filter to model a spherical head |
| + | <WRAP tablewidth 100%> | ||
| + | | | | $b_0$ | 1.53512485958697 | | ||
| + | | $a_1$ | -1.69065929318241| $b_1$ | -2.69169618940638 | | ||
| + | | $a_2$ | 0.73248077421585 | $b_2$ | 1.19839281085285 | | ||
| + | </ | ||
| 이 필터 계수는 48 kHz 샘플링 속도에 해당한다. 다른 샘플링 속도에서 구현할 경우, 해당 샘플링 속도에 맞게 동일한 주파수 응답을 제공하도록 계수 값을 달리 선택해야 한다. 이 계수 값들은 사용 가능한 하드웨어의 내부 정밀도 때문에 양자화되어야 할 수도 있다. 테스트 결과 알고리즘 성능은 이 계수 값들의 작은 변화에 민감하지 않은 것으로 나타났다. | 이 필터 계수는 48 kHz 샘플링 속도에 해당한다. 다른 샘플링 속도에서 구현할 경우, 해당 샘플링 속도에 맞게 동일한 주파수 응답을 제공하도록 계수 값을 달리 선택해야 한다. 이 계수 값들은 사용 가능한 하드웨어의 내부 정밀도 때문에 양자화되어야 할 수도 있다. 테스트 결과 알고리즘 성능은 이 계수 값들의 작은 변화에 민감하지 않은 것으로 나타났다. | ||
| 줄 81: | 줄 165: | ||
| {{ 20250825-231934.png }} | {{ 20250825-231934.png }} | ||
| - | {{ 20250825-231950.png }} | + | Filter coefficients for the second stage weighting curve |
| + | <WRAP tablewidth 100%> | ||
| + | | | | $b_0$ | 1.0 | | ||
| + | | $a_1$ | -1.99004745483398 | $b_1$ | -2.0 | | ||
| + | | $a_2$ | 0.99007225036621 | $b_2$ | 1.0 | | ||
| + | </ | ||
| 여기서 측정 간격 T 내에 필터링된 입력 신호의 평균 제곱값, 즉 파워는 다음과 같이 측정된다: | 여기서 측정 간격 T 내에 필터링된 입력 신호의 평균 제곱값, 즉 파워는 다음과 같이 측정된다: | ||
| - | {{ 20250825-232050.png | + | $$z_i = \frac{1}{T} \int_{0}^{T} y_{i}^{2} \,dt$$ |
| 여기서 y< | 여기서 y< | ||
| - | {{ 20250825-232337.png }} | + | $$\text{Loudness, } L_K = -0.691 + 10 \log_{10} \sum_{i} G_i \cdot z_i \quad \text{LKFS}$$ |
| 여기서 Gi는 개별 채널에 대한 가중치 계수이다. 게이티드 라우드니스 측정을 계산하기 위해, 측정 구간 T는 중첩되는 게이팅 블록 간격들의 집합으로 나뉜다. 게이팅 블록은 인접한 오디오 샘플들의 집합이며, | 여기서 Gi는 개별 채널에 대한 가중치 계수이다. 게이티드 라우드니스 측정을 계산하기 위해, 측정 구간 T는 중첩되는 게이팅 블록 간격들의 집합으로 나뉜다. 게이팅 블록은 인접한 오디오 샘플들의 집합이며, | ||
| 줄 95: | 줄 185: | ||
| 측정 구간 T 내의 i번째 입력 채널의 j번째 게이팅 블록의 파워(평균 제곱값)는 다음과 같다: | 측정 구간 T 내의 i번째 입력 채널의 j번째 게이팅 블록의 파워(평균 제곱값)는 다음과 같다: | ||
| - | {{ 20250825-232521.png | + | $$z_{ij} = \frac{1}{T_g} \int_{T_g \cdot j \cdot step}^{T_g \cdot (j \cdot step + 1)} y_{i}^{2} \,dt \quad \text{where} \quad step = 1 - overlap$$ |
| + | $$\text{and} \quad j \in \left\{ 0, 1, 2, \dots, \frac{T - T_g}{T_g \cdot step} \right\}$$ | ||
| j번째 게이팅 블록 라우드니스는 다음과 같이 정의된다: | j번째 게이팅 블록 라우드니스는 다음과 같이 정의된다: | ||
| - | {{ 20250825-232645.png }} | + | $$l_j = -0.691 + 10 \log_{10} \sum_{i} G_i \cdot z_{ij}$$ |
| 게이팅 임계값 Γ에 대해, 게이팅 블록 라우드니스가 임계값을 초과하는 게이팅 블록 지수들의 집합 Jg ={j:lj >Γ}가 정의된다. | 게이팅 임계값 Γ에 대해, 게이팅 블록 라우드니스가 임계값을 초과하는 게이팅 블록 지수들의 집합 Jg ={j:lj >Γ}가 정의된다. | ||
| Jg 의 원소 개수는∣Jg∣이다. 측정 구간 T의 게이티드 라우드니스는 다음과 같이 정의된다: | Jg 의 원소 개수는∣Jg∣이다. 측정 구간 T의 게이티드 라우드니스는 다음과 같이 정의된다: | ||
| - | {{ 20250825-232825.png }} | + | $$\text{Gated loudness, } L_{KG} = -0.691 + 10 \log_{10} \sum_{i} G_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij} \right) LKFS$$ |
| 게이티드 측정은 두 단계 과정으로 수행된다. | 게이티드 측정은 두 단계 과정으로 수행된다. | ||
| 줄 111: | 줄 202: | ||
| 상대 임계값 Γr 는 절대 임계값 Γa=−70 LKFS를 사용하여 라우드니스를 측정하고, | 상대 임계값 Γr 는 절대 임계값 Γa=−70 LKFS를 사용하여 라우드니스를 측정하고, | ||
| - | {{ 20250825-232944.png }} | + | $$\Gamma_r = -0.691 + 10 \log_{10} \sum_{i} G_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij} \right) - 10 \quad LKFS$$ |
| 여기서: | 여기서: | ||
| - | {{ 20250825-233029.png }} | + | $$J_g = \{ j : l_j > \Gamma_a \}$$ |
| + | |||
| + | $$\Gamma_a = -70 \quad LKFS$$ | ||
| 게이팅된 라우드니스는 다음과 같이 Γr 를 사용하여 계산할 수 있다: | 게이팅된 라우드니스는 다음과 같이 Γr 를 사용하여 계산할 수 있다: | ||
| - | {{ 20250825-233115.png }} | + | $$\text{Gated loudness, } L_{KG} = -0.691 + 10 \log_{10} \sum_{i} G_i \cdot \left( \frac{1}{|J_g|} \cdot \sum_{J_g} z_{ij} \right) LKFS$$ |
| 여기서: | 여기서: | ||
| - | {{ 20250825-233137.png | + | $$J_g = \{ j : l_j > \Gamma_r \text{ and } l_j > \Gamma_a \}$$ |
| 이 측정에서 생성되는 주파수 가중치는 사전 필터에 의한 것으로, 1단계 필터는 머리의 음향 효과를 보상하기 위해 설계된 필터이며, | 이 측정에서 생성되는 주파수 가중치는 사전 필터에 의한 것으로, 1단계 필터는 머리의 음향 효과를 보상하기 위해 설계된 필터이며, | ||
| 줄 135: | 줄 228: | ||
| 각 채널에 대한 가중치 계수는 표 3에 나와 있다. | 각 채널에 대한 가중치 계수는 표 3에 나와 있다. | ||
| - | {{ 20250825-233255.png }} | + | ^ Channel ^ Weighting, $G_i$ ^ |
| + | | Left ($G_L$) | 1.0 (0 dB) | | ||
| + | | Right ($G_R$) | 1.0 (0 dB) | | ||
| + | | Centre ($G_C$) | 1.0 (0 dB) | | ||
| + | | Left surround ($G_{Ls}$) | 1.41 (~ +1.5 dB) | | ||
| + | | Right surround ($G_{Rs}$) | 1.41 (~ +1.5 dB) | | ||
| 이 알고리즘은 방송 콘텐츠에 전형적인 오디오 프로그램에 대해 효과적인 것으로 입증되었으나, | 이 알고리즘은 방송 콘텐츠에 전형적인 오디오 프로그램에 대해 효과적인 것으로 입증되었으나, | ||
| 줄 192: | 줄 290: | ||
| Leq는 다음과 같이 정의된다: | Leq는 다음과 같이 정의된다: | ||
| - | {{ 20250825-234433.png | + | $$Leq(W) = 10 \log_{10} \left[ \frac{1}{T} \int_{0}^{T} \frac{x_{W}^{2}}{x_{Ref}^{2}} \,dt \right] \quad \text{dB}$$ |
| 여기서: | 여기서: | ||
| 줄 276: | 줄 374: | ||
| 이 알고리즘은 시간 영역에서 저렴한 하드웨어로 쉽게 구현할 수 있는 매우 기본적인 신호 처리 블록들로만 구성되어 있다. | 이 알고리즘은 시간 영역에서 저렴한 하드웨어로 쉽게 구현할 수 있는 매우 기본적인 신호 처리 블록들로만 구성되어 있다. | ||
| 또 다른 주요 장점은 확장성이다. 각 채널에 적용되는 처리가 동일하므로, | 또 다른 주요 장점은 확장성이다. 각 채널에 적용되는 처리가 동일하므로, | ||
| - | 또한, 개별 채널의 기여도가 신호 레벨이 아니라 라우드니스 값으로서 합산되므로, | + | 또한, 개별 채널의 기여도가 신호 레벨이 아니라 라우드니스 값으로서 합산되므로, |
| 이로 인해 제안된 라우드니스 측정법은 훨씬 더 범용적이고 견고하다. | 이로 인해 제안된 라우드니스 측정법은 훨씬 더 범용적이고 견고하다. | ||
| 줄 319: | 줄 417: | ||
| ======Annex 2====== | ======Annex 2====== | ||
| + | **Guidelines for accurate measurement of “true-peak” level** | ||
| + | |||
| + | 이 부속서는 단일 채널 선형 PCM 디지털 오디오 신호 내에서 실제 피크 레벨을 추정하는 알고리즘을 설명한다. 다음 설명은 48 kHz 샘플링 주파수를 전제로 한다. | ||
| + | 실제 피크 레벨은 연속 시간 도메인에서 신호 파형의 최대 (양수 또는 음수) 값이며, 이 값은 48 kHz 시간 샘플링 도메인의 최대 샘플 값보다 더 클 수 있다. | ||
| + | |||
| + | =====1. 요약===== | ||
| + | 처리 단계는 다음과 같다: | ||
| + | |||
| + | - 감쇠: 12.04 dB 감쇠 | ||
| + | - 4배 오버샘플링 | ||
| + | - 저역통과 필터 | ||
| + | - 절대값 처리 | ||
| + | - dB TP(실제 피크)로 변환 | ||
| + | |||
| + | =====2. Block diagram===== | ||
| + | |||
| + | {{ 20250826-001932.png }} | ||
| + | |||
| + | =====3. 상세 설명===== | ||
| + | 첫 번째 단계는 12.04 dB(2비트 시프트)의 감쇠를 가하는 것이다. | ||
| + | 이 단계의 목적은 후속 신호 처리에서 정수 연산을 사용할 경우를 대비한 여유 공간을 제공하는 것이다. | ||
| + | 부동 소수점 계산 시에는 이 단계가 필요하지 않다. | ||
| + | 4배 오버샘플링 필터는 신호 샘플링 주파수를 48 kHz에서 192 kHz로 증가시킨다. | ||
| + | 이 고샘플링 신호는 오디오 샘플로 표현된 실제 파형을 더 정확히 나타낸다. | ||
| + | 더 높은 샘플링 주파수와 오버샘플링 비율이 선호된다(이 부속서 부록 1 참조). | ||
| + | 더 높은 샘플링 주파수를 가진 입력 신호는 상대적으로 더 적은 오버샘플링이 필요하다(예: | ||
| + | 이 요구사항을 만족하는 한 세트 필터 계수(차수 48, 4상, FIR 보간 필터)는 다음과 같다: | ||
| + | |||
| + | <WRAP tablewidth 100%> | ||
| + | ^ Phase 0 ^ Phase 1 ^ Phase 2 ^ Phase 3 ^ | ||
| + | | 0.0017089843750 | -0.0291748046875 | -0.0189208984375 | -0.0083007812500 | | ||
| + | | 0.0109863281250 | 0.0292968750000 | 0.0330810546875 | 0.0148925781250 | | ||
| + | | -0.0196533203125 | -0.0517578125000 | -0.0582275390625 | -0.0266113281250 | | ||
| + | | 0.0332031250000 | 0.0891113281250 | 0.1015625000000 | 0.0476074218750 | | ||
| + | | -0.0594482421875 | -0.1665039062500 | -0.2003173828125 | -0.1022949218750 | | ||
| + | | 0.1373291015625 | 0.4650878906250 | 0.7797851562500 | 0.9721679687500 | | ||
| + | |||
| + | ^ Phase 0 ^ Phase 1 ^ Phase 2 ^ Phase 3 ^ | ||
| + | | 0.9721679687500 | 0.7797851562500 | 0.4650878906250 | 0.1373291015625 | | ||
| + | | -0.1022949218750 | -0.2003173828125 | -0.1665039062500 | -0.0594482421875 | | ||
| + | | 0.0476074218750 | 0.1015625000000 | 0.0891113281250 | 0.0332031250000 | | ||
| + | | -0.0266113281250 | -0.0582275390625 | -0.0517578125000 | -0.0196533203125 | | ||
| + | | 0.0148925781250 | 0.0330810546875 | 0.0292968750000 | 0.0109863281250 | | ||
| + | | -0.0083007812500 | -0.0189208984375 | -0.0291748046875 | 0.0017089843750 | | ||
| + | </ | ||
| + | |||
| + | 샘플의 절대값은 음수 값 샘플을 반전시켜 취한다; 이 시점에서 신호는 단극성이며, | ||
| + | 감쇠, 오버샘플링, | ||
| + | 이후에 초기 12.04 dB 감쇠를 보상할 필요가 있다. | ||
| + | 이 보상은 전체 처리의 이득을 정상화하여 1배가 되게 한다. | ||
| + | 감쇠된 값을 12.04 dB(2비트 왼쪽 시프트) 증폭하는 것은, 일반적으로 원래 형식의 전체 스케일 범위보다 높은 값을 표현할 수 있는 수치 형식으로의 변환을 요구할 수 있다. | ||
| + | 부동 소수점 형식으로 계산 단계를 수행하면 이 요구를 충족시킨다. | ||
| + | 결과를 증폭하는 대신, 미터 스케일을 적절히 보정하는 방법도 있다. | ||
| + | 이 가이드라인을 따르고 최소 192 kHz 오버샘플링 샘플링 레이트를 사용하는 미터는 결과를 dB TP 단위로 표시해야 하며, 결과를 로그 스케일로 변환한다. | ||
| + | 이는 감쇠, 오버샘플링, | ||
| + | “dB TP” 표기는 100% 풀 스케일 대비 실제 피크 측정을 나타내는 데시벨 단위임을 의미한다. | ||
| + | {{tag>" | ||
[공지]회원 가입 방법
[공지]글 작성 및 수정 방법
음향/industrial_standards/itu/itu-r_bs_1770.1756133913.txt.gz · 마지막으로 수정됨: 저자 정승환
