목차
ITU-R BS.1116
오디오 시스템에서 미세한 손상에 대한 주관적 평가 방법
서문
무선통신 부문의 역할은 모든 무선통신 서비스(위성 서비스를 포함)가 전파 주파수 스펙트럼을 합리적이고, 공평하며, 효율적이고, 경제적으로 사용할 수 있도록 보장하는 것입니다. 또한, 주파수 범위에 제한 없이 연구를 수행하며, 그 결과에 따라 권고안을 채택합니다. 무선통신 부문의 규제 및 정책 기능은 세계 및 지역 무선통신 회의와 스터디 그룹의 지원을 받는 무선통신 총회에서 수행됩니다.
범위
이 권고는 실험 조건을 엄격하게 통제하고 적절한 통계 분석을 수행하지 않으면 감지할 수 없을 정도로 작은 손상을 일으키는 시스템을 평가하기 위해 사용됩니다. 상대적으로 크고 쉽게 감지 가능한 손상을 일으키는 시스템에 이 권고를 사용할 경우 과도한 시간과 노력이 소모될 뿐만 아니라, 더 간단한 시험보다 신뢰성이 낮은 결과를 초래할 수 있습니다. 이 권고는 추가적인 특별 조건이나 이 권고에 포함된 요구 사항 완화가 포함될 수 있는 다른 권고들의 기본 참조 기준을 형성합니다.
키워드
오디오 품질; 미세한 손상; 주관적 평가; 청취 테스트; 오디오 코딩; 고품질 오디오; 청취실
ITU 전파통신 총회는
- 표준화된 방법 사용이 시험 데이터의 교환, 호환성 및 올바른 평가에 중요하며;
다음과 같이 권고한다.
권고
부록 1에 제시된 시험, 평가 및 보고 절차를 멀티채널 사운드 시스템(영상 포함 또는 미포함을 가리지 않음)을 포함한 오디오 시스템의 미세 손상 주관적 평가에 사용하라.
추가 권고
고급 음향 시스템을 위한 청취실 및 재생 장치 특성에 대한 추가 연구가 필요하며, 연구 완료 후 본 권고를 갱신해야 한다.
1. 일반 내용
2. 실험 설계
과학적 관심 분야에서 신뢰할 수 있는 정보를 수집하기 위해 다양한 연구 전략이 사용됩니다. 오디오 시스템의 미세한 손상에 대한 주관적 평가에서는 가장 엄격한 실험 방법이 사용되어야 합니다. 주관적 실험은 첫째로 실험 조건의 실제 제어 및 조작, 둘째로 인간 관찰자로부터 얻은 정량적 데이터를 특징으로 합니다. 세심한 실험 설계와 계획이 필요하며, 이로써 통제되지 않은 요인들이 청취 테스트에 영향을 미쳐 애매모호함을 초래하지 않도록 해야 합니다. 예를 들어, 모든 피험자에게 동일한 오디오 항목 순서가 적용된다면, 평가가 손상의 레벨보다는 순서에 의한 것인지 확신할 수 없습니다. 따라서 시험 조건은 독립 변수들의 효과만을 명확히 드러내도록 배열되어야 합니다. 잠재적 손상이나 기타 특성이 청취 테스트 전체에 균일하게 분포될 것으로 예상되는 경우, 진정한 무작위 배치가 적용되어야 합니다. 비균일성이 예상되는 경우에는 이 점을 고려해 시험 조건을 배치해야 합니다. 예를 들어, 평가할 자료의 난이도가 다양할 경우 자극의 제시 순서는 세션 내외 모두 무작위로 분포되어야 합니다. 또한 청취 테스트는 피험자가 너무 과부하되어 정확한 판단 능력이 떨어지지 않도록 설계되어야 합니다. 음향과 영상 간의 관계가 중요한 경우를 제외하고는, 오디오 시스템 평가는 영상 없이 수행하는 것이 바람직합니다. 주요 고려사항 중 하나는 적절한 대조 조건의 포함입니다. 일반적으로 대조 조건은 손상되지 않은 오디오 자료의 제시를 포함하며, 이는 피험자가 예측할 수 없는 방식으로 제공됩니다. 대조 자극과 잠재적 손상 자극 간 평가 차이가 바로 손상의 실제 평가임을 나타냅니다. 이후 문서에서는 이러한 고려사항 일부를 추가로 다룹니다. 실험 설계, 실행, 통계 분석 주제는 복잡하기 때문에 이 권고서에서는 가장 일반적인 지침만 제시됩니다. 따라서 청취 테스트 계획 초기에 실험 설계와 통계 전문가를 상담하거나 참여시킬 것을 권고합니다.
3. 청취 패널 선정
3.1 전문가 청취자
오디오 시스템의 미세한 손상을 평가하는 청취 테스트에서 얻은 데이터는 이러한 미세 손상을 감지하는 전문 지식을 가진 피험자에게서만 나와야 합니다. 평가 대상 시스템의 품질이 높을수록 전문가 청취자가 더 중요합니다.
3.2 피험자 선정 기준
선택된 청취자 그룹을 사용한 작은 손상의 오디오 시스템 주관적 테스트 결과는 일반 대중에게 외삽하기 위한 것이 아닙니다. 일반적으로 목표는 특정 조건 하에 전문가 청취자 그룹이 상대적으로 미묘한 품질 저하를 인지할 수 있는지 조사하고, 평가된 손상의 양을 정량적으로 추정하는 것입니다. 이 시험 절차의 까다로운 성격은, 시스템이 소비자에게 도입된 후 실제 환경에서 발생할 수 있는 다양한 조건에서의 장기간 노출 시 드러날 수 있는 문제를 찾아내기 위함입니다. 경우에 따라 실제 시험 전에(사전 선별) 또는 후에(사후 선별) 거부 기법을 도입할 필요가 있습니다. 때로는 두 가지 모두 사용되기도 합니다. 거부는 특정 피험자의 모든 판단을 제외하는 과정을 의미합니다. 신중하게 분석되지 않고 적용된 거부 기법은 편향된 결과를 초래할 수 있으므로, 데이터가 제외될 경우 시험 보고서에 적용된 기준을 명확히 기술해 독자가 스스로 판단할 수 있도록 해야 합니다.
3.2.1 사전 선별 절차
청력 검사, 이전 경험 및 이전 시험 성과를 바탕으로 한 피험자 선별, 사전 시험의 통계 분석에 따른 피험자 제외 등의 방법이 포함됩니다. 교육 절차도 사전 선별 도구로 사용될 수 있습니다. 사전 선별 기법 도입의 주요 목적은 청취 테스트 효율성을 높이기 위함입니다. 그러나 결과의 적합성을 지나치게 제한할 위험과 균형을 맞춰야 합니다.
3.2.2 사후 선별
사후 선별 방법은 대체로 두 가지로 나뉩니다. 하나는 평균 결과와의 불일치를 기준으로 하는 방법이고, 다른 하나는 피험자가 올바른 식별을 수행하는 능력에 근거하는 방법입니다. 첫 번째 방법은 정당화되지 않습니다. 이 권고서에서 권장하는 시험 방법으로 주관적 청취 테스트를 수행하면 두 번째 방법에 필요한 정보가 자동으로 확보됩니다. 제안된 통계 방법은 부록 1에 기술되어 있습니다. 사후 선별은 적절한 구분 능력이 없는 피험자를 제거하는 데 주로 사용됩니다. 사후 선별 적용은 시험 결과에서 경향을 명확히 할 수 있으나, 피험자마다 인지 민감도가 다름을 감안하여 주의가 필요합니다.
3.3 청취 패널 크기
청취 패널의 적절한 크기는 분산이 추정될 수 있고 시험에서 요구되는 해상도가 알려져 있을 때 예측할 수 있습니다. 시험 조건이 기술적 및 행동적 측면에서 엄격히 통제될 경우, 20명의 피험자 데이터가 적절한 결론 도출에 충분함이 경험적으로 입증되었습니다. 데이터 분석을 시험 진행 중 수행할 수 있다면, 통계적으로 유의미한 수준이 도달했을 때 추가 피험자는 필요하지 않습니다. 테스트 대상 시스템이 거의 투명한 경우, 사후 선별을 통과하는 충분한 수의 피험자를 확보하기 위해 더 많은 피험자가 필요합니다. 엄격한 실험 제어가 불가능한 경우 요구되는 해상도를 얻기 위해 더 많은 피험자가 필요할 수 있습니다. 청취 패널 크기는 단지 원하는 해상도의 문제가 아닙니다. 이 권고서에서 다루는 실험 유형의 결과는 원칙적으로 시험에 실제로 참여한 전문가 청취자 그룹에만 유효합니다. 따라서 청취 패널 크기를 늘리면 결과가 더 일반적인 전문가 청취자 그룹에 적용될 수 있어 때때로 더 설득력 있는 결과로 인정될 수 있습니다. 또한, 피험자가 다양한 손상 유형에 대해 민감도 차이를 보일 가능성을 반영하기 위해 청취 패널 크기를 늘릴 필요가 있을 수 있습니다.
4. 시험 방법
미세한 손상을 일으키는 시스템에 대한 주관적 평가를 수행하기 위해 적절한 방법을 선택하는 것이 필요합니다. “숨겨진 참조와 함께하는 더블 블라인드 트리플 자극(double-blind triple-stimulus with hidden reference)” 방법이 특히 민감하고 안정적이며 미세한 손상을 정확히 감지할 수 있음이 밝혀졌습니다. 따라서 이러한 유형의 시험에 이 방법을 사용해야 합니다. 이 방법의 선호되고 가장 민감한 형태에서는 한 번에 한 명의 피험자가 참여하며, 세 가지 자극(“A”, “B”, “C”) 중 하나를 선택하는 것은 피험자의 자유 재량에 맡겨집니다. 알려진 참조 자극은 항상 “A”로 제공됩니다. 숨겨진 참조와 평가 대상 자극은 동시에 제공되나, 시도(trial)에 따라 “B”와 “C”에 “무작위”로 할당됩니다. 피험자는 연속적인 5단계 손상 척도에 따라 “B”와 “A”를 비교한 손상 정도와 “C”와 “A”를 비교한 손상 정도를 평가하도록 요청받습니다. 자극 “B” 또는 “C” 중 하나는 자극 “A”와 구별할 수 없어야 하며, 다른 하나는 손상을 드러낼 수 있습니다. 참조 자극과 다른 자극 간의 모든 인지된 차이는 손상으로 해석되어야 합니다. 선호되는 방법에서는 피험자가 한 시험(tial)에 대한 등급 평가를 완료하면 즉시 다음 시험으로 진행할 수 있어야 합니다. 평가 대상 음원은 피험자가 평가할 때까지 반복 재생될 수 있어, 시험 절차는 피험자 스스로 진행 속도를 조절할 수 있습니다. 등급 척도는 ITU-R 권고 BS.1284 및 표 1에 제시된 ITU-R 5단계 손상 척도에서 유래한 “기준점(anchors)”을 포함하는 연속 척도로 취급되어야 합니다.
표 1
손상 등급 | 점수 |
---|---|
감지 불가능 (Imperceptible) | 5.0 |
감지 가능하지만 불쾌하지 않음 (Perceptible, but not annoying) | 4.0 |
약간 불쾌함 (Slightly annoying) | 3.0 |
불쾌함 (Annoying) | 2.0 |
매우 불쾌함 (Very annoying) | 1.0 |
노트 1 – 사전에 정의된 중간 기준점(앵커 포인트)의 사용이 편향을 초래할 수 있음이 입증되었습니다 [Poulton, 1992]. 앵커 포인트에 대한 설명 없이 숫자 척도만 사용하는 것도 가능합니다. 이러한 경우 척도의 의도된 방향을 명시해야 합니다. 이는 다양한 언어로 수행된 테스트 결과를 비교할 때 번역 문제를 극복하는 데 도움이 될 수 있습니다.
만약 중간 앵커 포인트를 사용하지 않는 경우, 개별 피험자의 결과는 평균과 표준편차를 기준으로 정규화하는 것이 필수적입니다. 다음 식을 사용하면 원래 척도를 유지하면서도 이러한 정규화를 수행할 수 있습니다.
여기서,
- Zi: 정규화된 결과 (normalized result)
- xi: 피험자 i의 점수 (score of subject i)
- xsi: 세션 s에서 피험자 i의 평균 점수 (mean score for subject i in session s)
- xs: 세션 s의 모든 피험자의 평균 점수 (mean score of all subjects in session s)
- ss: 세션 s의 모든 피험자의 표준편차 (standard deviation for all subjects in session s)
- ssi: 세션 s에서 피험자 i의 표준편차 (standard deviation for subject i in session s)
중간 앵커 포인트 없는 척도 사용은 결과의 절대적 해석을 방해합니다. 척도는 소수점 한 자리까지 해상도로 사용하는 것이 권장됩니다. 시험 방법은 두 부분으로 구성됩니다: 친숙해지는 단계(학습 단계)와 등급 매기기 단계입니다.
4.1 친숙화 또는 교육 단계
공식적인 평가 전에, 피험자들은 시험 시설, 시험 환경, 평가 과정, 평가 척도 및 사용 방법에 대해 철저히 익숙해져야 합니다. 피험자들은 또한 평가 대상 왜곡음(아티팩트)에 대해 충분히 익숙해져야 합니다. 가장 민감한 테스트의 경우, 공식 평가 세션에서 평가할 모든 자료에 미리 노출되어야 합니다. 친숙화 또는 교육 단계에서는 가능하면 피험자들이 3명 정도의 그룹으로 함께 있어 자유롭게 상호작용하며 감지한 왜곡음에 대해 토론할 수 있도록 하는 것이 권장됩니다. 첨부 문서 3 “청취자에게 주는 지침”에는 모델로서 이러한 지침 예시가 포함되어 있습니다. 이 지침에는 ‘숨겨진 참조와 함께하는 이중 맹검 3자극’ 기법에 대한 설명이 포함되어 있습니다. 적절한 친숙화는 초기 능력이 낮은 피험자를 테스트 목적에 적합한 전문가로 변화시킬 수 있습니다. 친숙화 과정이 끝날 때에는 피험자들이 이후 공식 평가 단계에서 사용할 척도에 대해 안정적인 감각을 갖게 되어야 합니다.
4.2 평가 단계
첫 번째 공식 평가 세션이 시작될 때, 각 피험자에게 구두로 시험 지침이 전달되어야 하며, 가능하면 서면 자료가 함께 제공되어야 합니다. 공식 평가가 시작되기 전에 몇 가지 예시 비교가 제시될 수 있습니다. 장기 및 중기 기억은 신뢰할 수 없으므로 시험 절차는 단기 기억에만 의존해야 합니다. 이는 첨부 문서 3에 설명된 3자극 시스템과 함께 근접 즉시 전환(참고 1) 방식을 사용하는 경우에 가장 효율적입니다. 이런 전환은 자극 간 시간을 정확히 맞추는 것을 요구합니다. 참고 1 – 완전 즉시 전환은 연속 자극의 파형이 동일하지 않으면 아티팩트를 발생시킬 수 있습니다. 예를 들어, 전체 약 40ms 동안 페이드 다운, 교체, 페이드 업이 포함된 근접 즉시 전환이 바람직합니다. 가장 민감한 평가의 경우, 한 번에 한 명의 피험자만 처리해야 합니다. 오직 이렇게 해야 피험자가 3자극 방법에서 자극 간 전환을 완전한 자유로 할 수 있습니다. 이 자유는 피험자가 각 시험 자극 간의 세밀한 비교를 충분히 탐색하는 데 필수적입니다. 가능하면 피험자는 시각적 안내 없이 자극 간 전환을 할 수 있어야 하며, 피험자가 원한다면 눈을 감고 최소한의 주의 산만한 환경에서 더 집중할 수 있도록 해야 합니다. 전환 시스템에서 “딸깍” 같은 가청 아티팩트가 없어야 하며, 이런 아티팩트는 평가 과정에 심각한 방해가 될 수 있습니다. 평가 세션은 20~30분을 넘지 않아야 하며, 본 권고에 따라 피험자 스스로 속도를 조절할 수 있는 시험 특성으로 인해 피험자 간 변동성이 발생할 수 있습니다. 경험에 따르면 원하는 세션 길이를 달성하기 위해서는 세션당 10~15 트라이얼을 넘지 않는 것이 적당합니다. 피험자 피로도는 판단의 타당성에 심각한 영향을 줄 수 있는 주요 요인입니다. 이를 피하기 위해서 연속된 세션 사이에 세션 길이와 같거나 그 이상의 휴식 시간을 배정해야 합니다.
5. 속성
아래는 모노포닉, 2채널 스테레오, 멀티채널 스테레오(최대 3/2 채널) 및 고급 음향 시스템 평가에 특화된 속성들입니다. 각 경우마다 “기본 오디오 품질(basic audio quality)” 속성을 평가하는 것이 권장됩니다. 실험자는 기타 속성들을 정의하고 평가할 수도 있습니다. 한 시험에서 피험자가 여러 속성을 평가하도록 하면, 과도한 응답 부담(response burden) 문제가 발생할 수 있습니다. 피험자가 주어진 자극에 대해 여러 질문에 답하느라 과부하가 걸리거나 혼란스러워 하면 모든 질문의 평가가 신뢰할 수 없게 될 수 있습니다.
5.1 모노포닉 시스템
5.2 2채널 스테레오 시스템
기본 오디오 품질 – 모노포닉과 마찬가지로 참조와 대상 간 모든 차이 판단에 사용되는 단일 전반 속성입니다. 추가적으로 고려될 수 있는 속성:
스테레오 이미지 품질 (Stereophonic image quality) – 참조와 대상 간에 사운드 이미지 위치, 음향 사건의 깊이감 및 현실성 등에서 차이에 관련된 속성입니다. 일부 연구에서는 스테레오 이미지 품질이 저하될 수 있음을 보였지만, 기본 오디오 품질과 별도의 등급 평가가 필요한지는 아직 충분한 연구가 이루어지지 않았습니다.
5.3 멀티채널 스테레오 시스템
기본 오디오 품질 – 앞서와 같이 참조 및 대상 간 차이를 판단하는 전반 속성입니다.
5.4 고급 음향 시스템
기본 오디오 품질 – 이 단일 전반적 속성은 참조 신호와 평가 대상 간에 감지된 모든 차이를 판단하는 데 사용됩니다. 고급 음향 시스템 평가를 위한 속성 고려는 다채널 시스템에 대해 설명된 속성을 포함해야 합니다.
추가적으로 다음과 같은 속성들이 관심 대상이 될 수 있습니다:
음색 품질 – 이 속성은 특히 중요하다고 알려져 있습니다. 음색 품질은 두 그룹의 특성으로 설명될 수 있습니다: 첫째, 음색 특성은 소리 색깔과 관련되며 예를 들어 밝기, 음색, 색채, 명료성, 단단함, 이퀄라이제이션 또는 풍부함 등이 있습니다. 둘째, 음색 특성은 소리의 균질성과 관련되며 예를 들어 안정성, 선명도, 현실감, 충실도 및 다이내믹스 등이 있습니다. 이러한 특성들은 소리의 음색을 설명할 수 있지만, 소리의 다른 특성을 묘사할 수도 있습니다.
위치 인식 품질 – 이 속성은 모든 방향성 사운드 소스의 위치 인식과 관련됩니다. 여기에는 스테레오 이미지 품질과 정의 손실이 포함됩니다. 이 속성은 수평 위치 인식 품질, 수직 위치 인식 품질 및 원거리 위치 인식 품질로 구분할 수 있습니다. 그림이 함께 있는 테스트의 경우, 이러한 속성은 디스플레이 상 위치 인식 품질과 청취자 주변 위치 인식 품질로도 분리할 수 있습니다.
환경 품질 – 이 속성은 서라운드 품질 속성을 확장한 것입니다. 공간적 인상, 감싸는 느낌, 분위기, 분산성 또는 공간 방향 서라운드 효과와 관련됩니다. 이 속성은 수평 환경 품질, 수직 환경 품질 및 원거리 환경 품질로 구분할 수 있습니다.
6. 프로그램 자료
시험 중인 시스템 간의 차이를 드러내기 위해서는 중요한 자료만 사용해야 합니다. 중요한 자료란 시험 중인 시스템을 강하게 시험하는 자료입니다. 모든 시스템을 모든 조건에서 평가할 수 있는 보편적으로 “적합한” 프로그램 자료는 존재하지 않습니다. 따라서 각 실험에서 시험할 각 시스템에 대해 명확히 중요한 프로그램 자료를 찾아야 합니다. 좋은 자료를 찾는 일은 일반적으로 시간이 많이 소요됩니다. 그러나 각 시스템에 대해 진정으로 중요한 자료를 찾지 않으면, 실험은 시스템 간 차이를 드러내지 못하고 결론이 불명확해질 것입니다.
시스템 간 차이를 발견하지 못한 결과가 시험 재료 선택이 부적절하거나, 또는 실험의 다른 약점 때문에 실험이 민감하지 않아서가 아니라는 것이 경험적이고 통계적으로 입증되어야만 “차이 없음(null)” 결과가 유효하다고 인정될 수 있습니다. 만약 여러 시스템 혹은 모든 시스템이 완전히 투명한 것으로 나타난 극단적인 경우, 시험 대상 전문가의 숙련도를 명확히 검증하기 위해 낮거나 중간 수준 앵커를 사용하는 특별 시험을 프로그래밍해야 할 수도 있습니다(부록 1 참조). 이 앵커들은 전문가 청취자는 감지할 수 있지만 비전문가는 감지할 수 없는 것으로 알려져 있어야 합니다.
이 앵커들은 청취자의 전문성뿐 아니라 실험 상황의 다른 모든 측면들의 민감도도 점검하기 위한 시험 항목으로 도입됩니다. 이러한 앵커가 투명해 보이는 항목들 사이에 예측할 수 없이 삽입되거나 별도의 시험에서 제시되어, 표준 시험 방법(부록 3 §3 참조)으로 실시하여 부록 1에 나오는 통계적 고려사항을 적용했을 때, 모든 피험자가 정확히 식별한다면, 이는 청취자의 전문성이 적합하며 실험 상황의 다른 측면에 민감도 문제가 없음을 입증하는 증거로 사용될 수 있습니다. 이 경우, 청취자가 코딩된 버전과 코딩되지 않은 버전을 구분하지 못하는 항목이나 시스템에 대해 명백한 투명성을 나타내는 결과가 “진정한 투명성”임을 의미합니다.
반면, 이 앵커가 일부 피험자에게서 올바르게 식별되지 못한다면, 이는 해당 피험자의 전문성이 부족하거나 실험 상황에 민감도 문제, 또는 두 가지 모두가 있음을 시사합니다. 그런 경우, 시스템의 명백한 투명성은 제대로 해석될 수 없으며, 이 추가 시험에 실패한 피험자를 교체하고 실험 민감도를 높일 수 있는 기타 변경을 하여 실험을 다시 수행해야 합니다.
중요한 자료 탐색에서 방송 가능 자료로 간주될 수 있는 모든 자극은 허용되어야 합니다. 특정 시스템을 고장내기 위해 의도적으로 설계된 합성 신호는 포함하지 않아야 합니다. 프로그램 시퀀스의 예술적 또는 지적 내용은 피험자가 손상 감지에 집중하는 것을 방해할 만큼 너무 매혹적이거나 불쾌하거나 지루하지 않아야 합니다.
실제 방송에서 각 유형 프로그램 자료가 나타날 빈도도 고려해야 합니다. 그러나 방송 자료의 성격은 미래의 음악 스타일과 선호도의 변화에 따라 달라질 수 있음을 인지해야 합니다. 앞으로는 객관적 지각 모델이 중요한 자료 선택을 돕는 데 활용될 수 있습니다. 프로그램 자료를 선택할 때는 평가할 속성이 정확히 정의되어야 하며, 자료 선택 책임은 손상 예상에 대한 기본 지식을 가진 숙련 피험자 집단에 위임되어야 합니다. 이들은 매우 폭넓은 자료 범위를 출발점으로 삼아야 하며, 필요하면 전용 녹음을 통해 범위를 확장할 수 있습니다.
주관적 비교 시험용 테이프 준비를 위해, 각 발췌 구간의 음량은 녹음 전에 숙련 피험자 집단에 의해 주관적으로 조정되어야 하며, 이렇게 하면 모든 프로그램 항목에 대해 고정된 게인 설정으로 시험 매체를 사용할 수 있습니다.
따라서 모든 시험 시퀀스에 대해 숙련 피험자 집단은 모여 개별 시험 발췌 구간의 상대 음량에 대해 합의해야 하며, 전문가들은 전체 시퀀스에 대한 절대 재생 음압 수준이 정렬 수준과 상대적으로 적절한지도 합의해야 합니다.
각 녹음의 시작에는 재생 채널이 요구하는 입력 정렬 수준에 출력 정렬 레벨을 맞출 수 있도록 정렬 신호 수준에서 1 kHz, 300 ms, –18 dBFS의 톤 버스트를 포함해야 합니다(§ 8.4.1 참조).
디지털로 녹음된 시험 자료의 정렬 수준은 디지털 시스템 최대 코딩 레벨에 대해 –18 dB이어야 합니다[EBU, 1992].
음향 프로그램 신호는 순간적인 피크가 ITU-R BS.645 권고서에 정의된 허용 최대 신호 피크 진폭(정렬 수준 대비 9 dB 높은 사인파)만 가끔 초과하도록 제어되어야 합니다.
이 조건에서 피크 프로그램 미터는 허용 최대 신호 수준을 초과하지 않는 신호 레벨을 표시할 것입니다. 톤 버스트는 참조 자극과 테스트 자극의 시간 정렬에도 유용할 수 있습니다.
시험에 포함할 수 있는 발췌 구간 수는 각 대상별로 같아야 하며, 합리적인 추정치는 대상 수의 1.5배이며, 최소값은 5개 발췌 구간입니다. 발췌 구간 길이는 일반적으로 10~25초입니다.
작업의 복잡성 때문에 대상 물체는 사용할 수 있어야 합니다. 적절한 시간 계획이 정의되어야만 성공적인 선택이 가능합니다.
모노포닉 및 스테레오 시스템 평가의 경우, 쉽게 접근 가능한 출처에서 발췌를 선정하는 것이 바람직하며, 준비된 시험 테이프를 필요할 때 원본과 쉽게 대조할 수 있는 것이 좋습니다. SQAM 컴팩트 디스크가 이런 출처의 예입니다. 그러나 더욱 중요한 것은 진정으로 중요한 발췌가 더 접근하기 어려운 출처에서라도 사용되어야 한다는 점입니다.
2채널 스테레오 재생 조건에서 멀티채널 시스템의 성능 평가는 참조 다운믹스를 사용해 시험해야 합니다. 고정 다운믹스의 사용은 상황에 따라 제한적으로 간주될 수 있지만, 장기적으로 방송사들이 사용하는 데 가장 합리적인 선택입니다.
- L0 = 1.00 L + 0.71 C + 0.71 Ls
- R0 = 1.00 R + 0.71 C + 0.71 Rs
고급 음향 시스템 시험 조건에서는, 고급 시스템에서 2채널 또는 멀티채널 시스템으로의 다운믹스 수식이나, 재렌더링이 수행되는 경우 재렌더링 과정에 대한 설명을 시험 보고서에 기술해야 합니다. 레퍼런스 2채널 다운믹스 성능의 중요 평가를 위한 적절한 시험 발췌의 사전 선택은 2채널 다운믹스된 프로그램 자료 재생을 기반으로 해야 합니다.
7. 재생장치
7.1 일반
레퍼런스 모니터 스피커 또는 헤드폰은 모든 음향 프로그램 신호나 기타 테스트 신호가 최적의 방식으로 재생될 수 있도록 선택해야 합니다. 즉, 어떤 종류의 재생에서도 중립적인 음향을 제공해야 하며, 모노포닉 평가와 2채널 이상의 스테레오 음향 시스템 평가 모두에 사용할 수 있어야 합니다. 헤드폰 재생에서는 특정 품질 저하가 더 명확하게 인식되며, 스피커 재생에서는 다른 품질 저하가 더 명확히 인식됩니다. 따라서 적절한 재생 장치 종류는 주관적 사전 테스트를 통해 결정해야 합니다. 특히 스테레오 사운드 이미지의 특성에 영향을 미치는 품질 저하가 있을 경우에는 스피커 재생을 사용해야 합니다. 2채널 스테레오 시스템 평가에는 스테레오 스피커와 헤드폰을 모두 사용할 수도 있습니다. 모노포닉 시스템 평가는 중앙에 위치한 하나의 스피커나 헤드폰으로 수행할 수 있습니다. 시험이나 시험 그룹 단위로 스피커 또는 헤드폰 중 하나를 선택하면, 효과의 청취 가능성을 사용 중인 변환기(재생 장치)와 연관시킬 수 있으나, 실질적인 피험자 수는 줄어듭니다. 반대로, 피험자가 스피커와 헤드폰 사이를 자유롭게 전환할 수 있다면, 효과의 청취 가능성을 특정 재생 장치와 연관시키기 어렵습니다. 멀티채널 음향 시스템 및 영상이 포함되거나 포함되지 않은 고급 음향 시스템 평가에는, 동시에 재생되는 모든 채널에 미치는 영향을 평가하려면 헤드폰 대신 스피커를 반드시 사용해야 합니다. 모든 경우에 각 스피커는 해당 주파수 대역에서 음향적으로 매칭되어 고유 음색 차이가 최소화되어야 합니다.
7.2 레퍼런스 모니터 스피커
7.2.1 일반
“참조 모니터 스피커”란 고품질 스튜디오 청취 장비를 의미하며, 특별히 치수화된 인클로저에 내장된 통합형 스피커 시스템으로서, 특수 이퀄라이제이션, 고품질 파워 앰프 및 적절한 크로스오버 네트워크와 결합되어 있습니다. 전기음향적 특성은 자유장 조건에서 측정된 다음 최소 요구사항을 충족해야 합니다. 절대 음압 레벨 값은 별도로 명시되지 않는 한, 음향 중심으로부터 1m 측정 거리를 기준으로 합니다.
7.2.2 전기음향 요구사항
7.2.2.1 진폭 주파수 응답
스피커 사전 선정 시, 메인 축(방향각 0°)에서 핑크 노이즈를 사용해 40Hz~16kHz 범위 내에서 1/3 옥타브 밴드로 측정한 주파수 응답 곡선은 바람직하게는 ±4dB의 허용 오차 범위 내에 있어야 합니다. ±10° 방향각에서 측정된 주파수 응답 곡선은 메인 축 응답과 3dB 이상 차이나면 안 되며, 수평면 내에서 ±30° 방향각에선 4dB를 넘으면 안 됩니다. 서로 다른 스피커들의 주파수 응답은 조화되어야 하며, 250Hz~2kHz 범위 내에서는 1.0dB를 넘지 않는 것이 바람직합니다. 참고 1 – §8.3.4에 언급된 운용 룸 응답 곡선은 청취실 내 음장 주파수 특성을 설명합니다.
7.2.2.2 지향성 지수
7.2.2.3 비선형 왜곡
평균 음압 레벨(SPL) 90 dB를 출력하는 일정한 전압 입력 신호가 스피커에 공급될 때, 해당 SPL 기준으로 40 Hz에서 16 kHz의 기본 주파수 범위 내에서 어떤 고조파 왜곡 성분도 다음 값을 초과해서는 안 됩니다:
7.2.2.4 과도응답 충실도
사용한 오실로스코프에서 측정한 음압 감쇠 시간은 원래 음압의 1/e (약 0.37) 수준까지 감쇠하는 시간을 의미하며, (메인 축에서만 측정함) 다음 조건을 만족해야 합니다:
- ts < 5/f
여기서, f는 주파수를 의미합니다.
7.2.2.5 시간 지연
7.2.2.6 다이내믹 레인지
스피커가 10분 이상 열적 또는 기계적 손상 없이, 과부하 회로가 작동하지 않은 상태로 최대 동작 음압 레벨을 프로그램 시뮬레이션 노이즈 신호(국제 전기기술 위원회(IEC) 출판물 268-1c 기준)를 사용해 측정한 경우, Leff 최대값은 108 dB 이상이어야 합니다. (평탄 응답 및 r.m.s.(느린)로 설정된 소리 레벨 미터 이용) 단일 참조 모니터 스피커와 앰프에서 발생하는 등가 음향 노이즈 레벨은 음향 중심으로부터 1m 거리에서 측정하며 10 dBA 미만이어야 합니다.
7.3 참조 모니터 헤드폰
7.3.1 일반
7.3.2 전기음향 요구사항
7.3.2.1 주파수 응답
7.3.2.2 시간 지연
스테레오 시스템에서 채널 간 시간 지연 차이는 20 μs를 초과하지 않아야 합니다. 영상이 함께 제공되는 시스템의 경우, 참조 모니터 헤드폰과 시험 대상 시스템을 결합한 전체 시간 지연은 ITU-R BS.775 권고안에 명시된 한도를 넘지 않아야 합니다.
8 청취 조건
8.1 일반
'Listening conditions'라는 용어는 스피커를 통해 재생되는 소리가 청취실 내 참조 청취 지점에 있는 청취자에게 영향을 미치는 참조 음장에 대한 복합적인 음향 요구 사항을 설명합니다. 이에는 다음이 포함됩니다:
현대 기술 수준으로는 음향 매개 변수만으로 참조 음장을 완벽하고 고유하게 설명할 수 없으므로, 기술된 청취 조건의 타당성을 보장하기 위해 참조 청취실에 대한 일부 기하학적 및 실내 음향 요구사항이 제공됩니다.
8.2 레퍼런스 리스닝 룸
8.2.1 일반
스피커 재생의 주관적 시험을 위해 다음 요구 사항을 준수해야 합니다. 참조 청취실의 최소 요구 사항이 아래에 설명되어 있습니다. 헤드폰 재생만 하는 경우, 청취실은 최소한 배경 소음 수준 요구 사항을 충족해야 합니다.
8.2.2 기하학적 특성
다음 값들은 참조 청취실에 적합한 실면적 치수를 설명합니다. 시험실이 이 치수를 충족하지 못할 경우, 다음 절에서 언급된 음장 조건과 스피커 배치 요구 사항을 최소한 충족해야 합니다.
8.2.2.1 방 크기(실면적)
8.2.2.2 방 형태
8.2.2.3 방 비율
다음 치수 비율은 방의 저주파 고유음 분포를 균등하게 하기 위해 준수해야 합니다:
- 1.1w / h ≤ l / h ≤ 4.5w / h - w
여기서:
- l : 길이
- w : 너비
- h : 높이
또한, l / h < 3 및 w / h < 3 조건도 적용되어야 합니다.
8.2.3 룸 어커스틱 특성
8.2.3.1 잔향 시간
잔향 시간 Tm은 다음 수식으로 주파수 200Hz~4kHz 범위에서 측정한 평균값이어야 합니다:
여기서
는 방의 부피
는 기준 부피 100m³를 의미합니다.
주파수 63Hz부터 8kHz까지 Tm에 허용되는 오차 범위는 별도의 도면(도 1)에 명시되어 있습니다.
8.3 레퍼런스 음장 조건
8.3.1 일반
청취 영역의 음장 특성은 청각 사건의 주관적 인지나 품질 평가, 그리고 다른 청취 장소나 방에서의 재현 가능성에 가장 중요합니다. 이러한 특성은 스피커와 청취실의 상호 작용에서 발생하며, 사용 중인 청취 배열에 기준을 둡니다(§ 8.5 참조). 현재 다음과 같은 특성을 기술할 수 있습니다.
8.3.2 직접음
8.3.2.1 모니터 스피커의 주파수 응답
8.3.3 반사음
8.3.3.1 초기 반사음
8.3.3.2 후기 에너지
8.3.3.3 잔향 시간
§ 8.2.3.1 참조
8.3.3.4 임펄스 응답
시험에 사용되는 청취 위치 모두에서, 시험에 사용될 상태(가구 포함)로 셋업된 방에서 각 스피커의 임펄스 응답을 시간 영역에서 측정하고 시험 보고서에 제시해야 합니다. 이를 통해 스피커와 실내 음향이 초기 반사음, 후기 에너지, 잔향 요구사항을 얼마나 충족하는지 검증할 수 있습니다.
8.3.4 정상 상태 음장
8.3.4.1 운용 룸 응답 곡선
운용 룸 응답 곡선은 50Hz~16kHz 범위의 주파수에서 핑크 노이즈를 사용해 참조 청취 지점에서 각 모니터 스피커가 생성하는 음압 수준의 1/3옥타브 주파수 응답 곡선으로 정의합니다. 측정된 운용 룸 응답 곡선은 도면 2에 명시된 허용 오차 범위 내에 있어야 합니다. 참조 청취 지점에서 각각의 스피커가 만들어내는 운용 룸 응답 곡선 간 차이는 전체 주파수 범위에서 2dB를 넘지 않는 것이 바람직하며, 특히 전면의 ±60도 방위각 내에 존재하는 스피커, 특히 중간 수평층 간의 매칭이 중요합니다. 측정된 운용 룸 응답 곡선은 시험 보고서에 포함되어야 합니다. 이러한 사양은 이퀄라이제이션 도입으로 달성할 수 있으며, 이퀄라이제이션이 포함될 경우 사용된 이퀄라이제이션에 대한 인정 및 상세 내역을 시험 보고서에 기록해야 합니다.
8.3.4.2 배경 소음
명목상 앉은 청취자의 귀 높이에서 측정한 연속 배경 소음(냉난방 장치, 내부 장비, 외부 원인에 의한 소음)은 가능한 한 NR 10을 초과하지 않아야 하며(도면 3 및 4 참조), 어떠한 경우에도 NR 15를 넘지 않아야 합니다. 배경 소음은 충격음, 주기적 또는 음색적인 소음이어서는 안 됩니다.
8.4 청취 레벨
8.4.1 스피커 재생
8.4.1.1 운용 음압 레벨(레퍼런스 청취 레벨)
참조 청취 레벨은 참조 청취 지점에서 주어진 측정 신호로 생성되는 선호 청취 레벨로 정의됩니다. 이는 같은 음원 구간을 다양한 청취실에서 동일한 음압 수준으로 재생할 수 있도록 하는 재생 채널의 음향 이득을 특징짓습니다. 청취 배열 내 각 스피커의 레벨 정렬은 핑크 노이즈를 이용해 수행되어야 합니다.
측정 신호가 관례적으로 ITU-R BS.645 권고에 따른 “정렬 신호 레벨”(0 dBμ0s; 디지털 테이프 녹음의 클리핑 레벨 대비 -18 dB)에 RMS 전압이 같으며, 이 신호를 각 재생 채널(즉, 파워 앰프와 연결된 스피커) 입력에 순차적으로 공급할 때, 앰프 게인은 다음 참조 음압 레벨(IEC/A가중치, 느린 응답)로 조정되어야 합니다:
- Lref = 78 ± 0.25 dBA
(청취자마다 선호하는 절대 청취 레벨이 다를 수 있으며, 이는 실험 중 유연한 조절 필요성을 만들 수 있으나, 이런 조절이 평가 중인 일부 왜곡음 청취에 영향을 미칠 가능성은 현재 알려져 있지 않습니다. 따라서 만약 실험 대상자가 시스템의 게인을 조절한다면, 이 사실은 시험 결과에 기재되어야 합니다.)
8.4.2 헤드폰 재생
8.5 청취 배열
8.5.1 일반
청취 배열은 청취실 내 스피커 배치와 청취 장소(청취 영역)를 설명합니다. 보통 청취 시험은 참조 위치 및 기타 권장 청취 위치에서 수행됩니다. 그러나 중심 좌표 밖의 청취 위치에서 발생하는 영향도 평가해야 하며, 이때 “최악의 경우” 청취 위치들이 포함됩니다.
8.5.1.1 모니터 스피커 높이 및 방향
모든 스피커의 높이는 방위각 평면에서 각 스피커의 음향 중심까지 측정하며, 앉아 있는 청취자의 귀 높이와 일치해야 합니다. 스피커의 방향은 참조 축이 청취자의 귀 높이의 참조 위치를 통과하도록 조정되어야 합니다. 고급 음향 시스템의 경우, 높이가 다른 위치에 설치된 모든 스피커의 위치를 방 크기와 청취 위치를 기준으로 수평 및 수직 차원에서 문서화하고 설명하는 것이 필요합니다.
8.5.1.2 벽과의 거리
독립형 스피커의 경우, 스피커 음향 중심이 주변 반사면으로부터 최소 1m 이상 떨어져야 합니다. 이 기준을 실내 크기 제한으로 충족하지 못하는 경우에도 이 권고안의 방법을 사용할 수 있으나, 시험 보고서에는 벽과의 거리 기준 미충족 사실을 명시해야 합니다. 이때 초기 반사음은 § 8.3.3.1에 제시된 요구사항을 만족하도록 다른 방법으로 제어해야 하며, 그 방법도 시험 보고서에 기재되어야 합니다.
8.5.2 모노포닉 재생
8.5.3 2채널 스테레오 재생
8.5.3.1 기준 너비 B
BS.1116-06에 따르면, 선호되는 기준 너비는 B = 2~3 m입니다. 적절히 설계된 방에서는 최대 4 m까지 허용될 수 있습니다.
8.5.3.2 청취 거리 D (스피커와 청취자 사이 거리)
8.5.3.3 청취 위치
이른바 참조 청취 지점은 60° 청취 각도로 정의됩니다. 권장 청취 영역은 참조 청취 지점 주변 반경 0.7 m를 넘지 않아야 합니다. 추가로 “최악의 경우” 청취 위치도 도 6에 표시되어 있습니다.
8.5.4 다채널 스테레오 재생
8.5.4.1 기준 너비
선호하는 기준 너비는 B = 2-3m 입니다. 적절하게 설계된 방에서는 값이 최대 5 m까지 허용될 수 있습니다.
8.5.4.2 청취 거리 및 기준 각도
8.5.4.3 청취 위치
8.5.5 고급 음향 시스템 재생
실험 조건을 명확히 하기 위해 시험에 사용된 모든 스피커 위치(거리 및 각도)와 청취 위치에 대한 상대적 배치를 시험 보고서에 상세히 기술해야 합니다. 이 기술은 권고 ITU-R BS.775에 명시된 스피커 배열과 청취 위치에 상응하는 형식과 내용을 따라야 합니다. 고급 음향 시스템에서는 높이가 다른 위치에 설치된 모든 스피커 위치를 수직 차원에서도 명확히 식별하고 설명해야 합니다. ITU-R BS.2051 권고안도 이러한 문맥에서 유용한 정보를 포함하고 있습니다.
9. 통계 분석
테스트 결과에 대한 통계 분석의 기본 목표는 각 시험 시스템의 평균 성능을 정확하게 식별하고, 그 평균 성능들 간 차이의 신뢰성을 평가하는 것입니다. 후자는 결과의 변동성 또는 분산을 추정하는 것을 필요로 합니다. 본 문서의 다른 절에 설명된 절차에 따라 테스트가 수행되었다면, 척도가 구간 척도처럼 되어 각 평가 단계가 거의 동일한 크기를 가지게 됩니다. 하지만 이 척도의 성질이 특정 통계 방법을 금지하거나 강제하지는 않습니다. 모수 통계의 기본 가정이 합리적으로 충족된다면, 가장 민감하고 강력한 방법이므로 권장됩니다. 분산 분석(ANOVA)의 기본 가정에서 크게 벗어나는 경우에만 대체 분석 방법(예: 비모수 방법) 사용을 고려해야 합니다. 구체적으로는 ANOVA 모델을 1차 분석으로 적용하는 것이 권장됩니다. 이후 ANOVA가 드러낸 유의미한 전체 효과가 어디에 있는지 상세히 알아보기 위해 t-검정, Neuman-Keuls, Scheffe 같은 방법들도 사용할 수 있으며, 이때 ANOVA로부터 제공된 분산 추정치를 이용합니다. 특정 가설은 여러 통계 방법으로 검증될 수 있으며, 대체 통계 방법으로도 동일한 가설이 통과된다면 그 결정 근거는 더욱 강화됩니다. 따라서 Wilcoxon 같은 보조 데이터 분석 적용도 제안됩니다. 또한 심리측정적 측면을 어느 단계에서든 고려하는 것이 중요한데, 이는 비물리적 척도로부터 유의미한 결론을 도출하는 데 영향을 미칩니다. 만약 척도의 선형성이 증명되지 않는다면, 서로 다른 등급의 비교는 순위 차원에서만 이루어져야 함을 유념해야 합니다.
10 통계 분석 결과의 제시
10.1 일반
통계 결과 제시는 초보자부터 전문가까지 모든 독자가 관련 정보를 평가할 수 있도록 해야 합니다. 처음에는 전체 실험 결과를 그래픽 형태로 보여주는 것이 좋으며, 더 자세한 정량 정보는 첨부 자료에 제공될 수 있습니다.
10.2 절대 등급
객체 및 숨겨진 참조에 대한 절대 평균 등급 제시는 데이터의 좋은 초기 개요를 제공할 수 있지만, 이는 상세한 통계 분석의 적절한 근거가 아닙니다. 이는 제안된 시험 방법에서 피험자가 쌍대 비교에서 하나의 소스가 참조와 동일함을 명확히 알고 있기 때문에 관찰이 독립적이지 않습니다. 따라서 이러한 절대 등급에 대한 통계 분석은 의미 있는 정보를 도출하지 못하므로 수행하지 않아야 합니다.
10.3 등급 차이
10.4 유의 수준과 신뢰 구간
시험 보고서는 모든 주관적 데이터가 본질적으로 통계적임을 독자에게 알려야 합니다. 유의 수준과 통계 방법 및 결과에 대한 세부 정보를 명시하여 독자가 이해할 수 있도록 해야 합니다. 예를 들면 그래프의 신뢰 구간이나 오차 막대 등이 포함될 수 있습니다. “올바른” 유의 수준은 없으나 전통적으로 0.05가 선택됩니다. 가설에 따라 단측 또는 양측 검정을 사용할 수 있습니다.
11 시험 보고서 내용
시험 보고서는 연구의 근거, 사용한 방법, 도출된 결론을 명확히 전달해야 합니다. 충분한 세부 내용이 포함되어야 하는데, 이는 숙련된 사람이 원칙적으로 연구를 재현해 결과를 경험적으로 검증할 수 있도록 하기 위함입니다. 독자는 연구의 주요 세부 사항, 즉 연구 배경, 실험 설계 및 실행, 분석 및 결론을 이해하고 평가할 수 있어야 합니다. 특히 다음 사항에 주의를 기울여야 합니다:
대상자 및 음원 선정 및 명세
청취 환경 및 장비의 물리적 세부사항 (방 크기, 음향 특성, 변환기 종류 및 배치, 전기 장비 명세 등)
시험된 채널 구성이 ITU-R BS.775 또는 ITU-R BS.2051 권고에 명시된 것인지 여부 및 상세 설명
ITU-R BS.775에 명시되지 않은 음향 시스템의 경우, 시험된 모든 스피커 위치를 ITU-R BS.775 권고 수준의 상세함으로 문서화하여 외부 재현성을 확보
참조 청취 위치를 시험 대상 스피커 위치와 함께 문서화(§ 8.5.4 및 8.5.5 참조)
§ 8.5.1.2에 명시된 거리 요구 사항 충족 여부 기록. 미충족 시 명시 필요
거리 요구 사항 미충족 시 초기 반사음 제어 방법과 § 8.3.3.1 요구사항 충족 방식을 시험 보고서에 기술
모든 스피커의 운용 음향 응답 측정 결과. 이퀄라이제이션이 포함될 경우, 이에 대한 인정 및 상세 방식을 기록
본 문서의 음향 및 물리적 방 요구 사항 미준수 사항 보고 (운용 음향 측정, 성능 지표, 거리 요구 사항 등)
시험에 사용될 상태(가구 포함)로 셋업된 방에서 평가자의 청취 위치에서 측정한 각 스피커의 임펄스 응답(시간 영역 표시)
실험 설계, 교육, 지시, 실험 순서, 시험 절차, 데이터 생성 방식
기술 통계 및 추론 통계의 데이터 처리, 모든 결론의 상세 근거
이와 같은 상세한 보고가 시험의 신뢰성 및 재현성을 보장합니다.
[공지]회원 가입 방법
[공지]글 작성 및 수정 방법