목차
ITU-R BS.562
Subjective assessment of sound quality, 음질에 대한 주관적 평가
ITU Radiocommunication Assembly
아래 사항을 고려하여
- b) 이러한 평가는, 열화가 가해진 프로그램 시퀀스를 “탁월한 품질” 또는 “감지할 수 없는 열화”에 해당하는 원래의 시퀀스와 비교하는 것을 뜻한다.
1. 다음과 같이 권고한다.
아래에 제시된 평가 척도는 방송 음질(소리)의 주관적 품질 평가 또는 열화 정도 평가에 사용되어야 한다.(텔레비전 화상의 경우 Recommendation ITU-R BT.500을 참조할 것). 시험의 성격과 목적에 따라 두 가지 척도 중 어느 것이 더 적절한지가 결정된다.
1.1 5등급 품질 및 열화 척도 (Five-grade quality and impairment scale)
등급 (Grade) | 품질 (Quality) | 열화 (Impairment) |
---|---|---|
5 | 탁월함 (Excellent) | 감지 불가 (Imperceptible) |
4 | 좋음 (Good) | 감지되나 성가시지 않음 (Perceptible, but not annoying) |
3 | 보통 (Fair) | 약간 성가심 (Slightly annoying) |
2 | 나쁨 (Poor) | 성가심 (Annoying) |
1 | 매우 나쁨 (Bad) | 매우 성가심 (Very annoying) |
1.2 7등급 비교 척도 (Seven-grade comparison scale)
특정 유형의 주관적 시험에서는 비교 척도(comparison scale)를 사용하는 것이 더 적절할 수 있다. 이 경우 다음의 7단계 척도를 사용한다.
등급 (Grade) | 설명 (Description) |
---|---|
+3 | 훨씬 더 좋음 (Much better) |
+2 | 더 좋음 (Better) |
+1 | 약간 더 좋음 (Slightly better) |
0 | 동일함 (The same) |
-1 | 약간 더 나쁨 (Slightly worse) |
-2 | 더 나쁨 (Worse) |
-3 | 훨씬 더 나쁨 (Much worse) |
2. 결과 제시 방법 (Presentation of results)
전문가 청취 패널을 이용하여 얻어진 결과는 비전문가 패널로부터 제공된 결과와는 별도로 제시되어야 한다. 청취 조건과 음향 수준의 세부 사항이 제공되어야 하며, 시험 결과를 분석하는 데 사용된 모든 통계적 방법도 기술되어야 한다.
비고 1 – 평가 절차, 청취 조건, 평가자 선정 등과 관련된 일반적인 고려 사항은 부록 1에 제시되어 있다.
노트 1 - 평가 절차, 청취 조건, 평가자 선정 등에 관한 일반적인 고려 사항은 Annex 1에 제시되어 있다.
내용 1
1. 일반 사항
시험에 사용되는 프로그램 시퀀스에는 무음 구간이 포함되어야 하며, 이것은 원하는 신호가 없을 때 시스템 잡음으로 인한 열화에 대한 주관적 평가가 배제되지 않도록 하기 위함이다.
반대로, 시험에서는 어떤 경우에는 불쾌감을 주지 않을 수도 있고, 심지어는 주관적으로 품질이 향상된 듯한 인상을 줄 수도 있는 결함에 대한 평가는 제외되어야 한다. 따라서 프로그램 시퀀스는 시험 대상 시스템에서 발생할 수 있는 것과 유사한 청각적으로 인지 가능한 결함이 없어야 한다. 그러나 이것이 실행 불가능한 경우, 그로 인해 발생하는 결과의 타당성에 대한 제한은 명확히 지적되어야 한다.
권고안 제1.1항에서 언급된 5점 척도를 사용하는 시험의 경우, 청취자가 듣고 있는 프로그램의 출처(손상된 것인지, 손상되지 않은 것인지)를 표시하기 위해 조명 시스템을 사용해야 한다. 청취자의 주의력과 일관성을 확인하기 위해, 손상된 조건이 손상되지 않은 조건으로 대체되는 시험을 일부 무작위로 포함해야 하며, 이 경우 청취자에게 이 사실을 알려서는 안 된다.
7점 비교 척도를 사용하는 시험의 경우, 청취자의 판단에 영향을 줄 수 있는 어떠한 표시도 제공해서는 안 된다. 그러나 비교 시험에서는 때때로 기준 조건(손상되지 않은 원본일 수 있음)을 제공하는 것이 유용할 수 있으며, 이 기준 조건은 조명으로 표시될 수 있다.
수집되어야 하는 데이터의 양은 결과에서 요구되는 통계적 신뢰 수준, 측정의 표준편차, 그리고 검출해야 할 효과의 상대적인 크기와 같은 상호 연관된 요인에 따라 달라진다.
아래 제안들은 충분히 고려된 실험 설계(experimental design)를 수립하는 데 도움이 되는 지침으로 제시된 것이다.
2. 청취 패널의 선정
일반적인 청취자 집단에는 일부 전문가 청취자2)들이 있을 수 있지만, 그 비율은 매우 적을 가능성이 높다. 따라서 실험실 시험의 목적은 비전문가들의 의견에 집중하는 것이 타당하다. 이는 전문가를 사용할 경우, 비전문가 청취자를 대상으로 얻어지는 결과보다 훨씬 더 비판적인 결과가 나올 수 있기 때문이다.
시험 청취 조건의 선택은 평균보다 더 엄격해야 하지만, 지나치게 엄격해서는 안 된다. 비전문가 청취자를 대상으로 하는 시험은 시간이 길어지는 경향이 있으므로, 전문가를 통한 빠른 시험이 바람직할 수 있다. 이 경우에는 더 적은 수의 청취자를 사용할 수 있다.
그러나 특정 상황에서는 전문가 청취자를 대상으로 한 시험이 비전문가를 대상으로 한 시험을 만족스럽게 대체하지 못할 수도 있음을 유의해야 한다. 의심이 드는 경우, 전문가와 비전문가 간의 의견 관계를 조사하는 것이 필요하다.
비전문가 청취자의 최소 수는 일반적으로 20명이어야 하고, 전문가 청취자의 최소 수는 일반적으로 10명이어야 한다. 모든 경우에, 청취자의 수와 범주, 그리고 시험의 지속 시간은 명확히 제시되어야 한다.
3. 시험 절차 및 지속 시간
장기 또는 중기 청각 기억의 극도의 신뢰성 부족 때문에, 항상 즉각 비교 방법(instantaneous comparison method)을 사용해야 한다.
5등급 품질 또는 열화 척도를 사용하는 시험의 경우, 각 과정은 동일한 프로그램 시퀀스를 연속적으로 네 번 반복하는 것을 포함하는데, 순서는 다음과 같다:
- 원래 시퀀스
- 동일 시퀀스, 손상된 것
- 원래 시퀀스 (반복)
- 동일 시퀀스, 손상된 것 (반복)
각 프로그램 시퀀스는 15~20초를 초과해서는 안 되며, 일부 시험의 경우 몇 초와 같이 아주 짧을 수도 있다. 음악 항목의 경우, 구절이 끊어진 것처럼 들려서는 안 된다.
제시 1과 2 사이, 그리고 3과 4 사이의 간격은 약 0.5~1초여야 하며, 2와 3 사이의 간격은 조금 더 길어야 하는데, 예를 들어 1.5초 정도가 적절하다. 정확한 시간은 프로그램의 종류에 따라 달라져야 한다.
전환 장치(switching device)는 청각적으로 인지 가능한 간섭을 유발해서는 안 된다. 프로그램 시퀀스 및 손상은 무작위 순서로 제시되어야 하나, 동일한 시퀀스가 같은 손상 수준이든 다른 손상 수준이든 연속되는 두 번의 경우에 제시되어서는 안 된다.
어떤 청취자와의 한 세션은 끊김 없이 약 15~20분을 초과해서는 안 된다. 세션이 연속적이어야 하는 경우, 대략 같은 길이의 휴식 시간이 그 사이에 주어져야 한다.
7등급 비교 척도를 사용하는 시험에서 두 가지의 손상 조건이 관련될 경우, 유사한 형태의 제시 절차를 사용할 수 있으며, 그 순서는 다음과 같다:
- 조건 1
- 조건 2
- 조건 1 (반복)
- 조건 2 (반복)
조건 1과 조건 2는 무작위로 교체되어야 한다. 또한, 각 네 번의 제시 시작 시에 기준 조건(reference condition)을 제시할 수 있으며, 이 경우 이 항목이 기준 조건임을 알리는 명확한 표시(예: 조명 신호)가 제공되어야 한다.
4. 프로그램 시퀀스의 선택
고정된 구체적인 목적, 특히 시험 중인 음향 프로그램 전송 또는 재생 시스템의 범주에 따라, 다음과 같은 프로그램 시퀀스를 사용해야 한다: – 전형적인 프로그램 자료의 대표적인 선별, 또는 – 시험 중인 시스템에 의해 발생하는 열화에 대해 매우 민감하게 반응하도록 의도적으로 선택된 일부 시퀀스의 선별.
예를 들어, 보호비(protection ratios)를 평가할 때 적절히 민감한 시험 시퀀스는, 원하는 프로그램의 음성이 원하지 않는 프로그램의 “팝(pop)” 음악에 의해 손상되는 경우일 것이다.
시스템이 고품질 음향을 전달하기 위한 것이라면, 두 번째 유형의 프로그램 시퀀스를 사용해야 한다. 서로 다른 장소와 시점에서 얻어진 시험 데이터의 비교 가능성을 보장하기 위해, 가급적 동일한 프로그램 시퀀스를 사용하는 것이 바람직하다.
EBU(European Broadcasting Union)에서 채택·발행한 SQAM (Subjective Quality Assessment Material) 콤팩트 디스크는 이러한 목적에 적합한 고품질 디지털 프로그램 자료의 출처를 제공하며, 이로부터 알맞은 항목을 선택할 수 있다.
어떠한 경우에도, 프로그램 시퀀스의 예술적 또는 지적 내용은 청취자가 본래의 목적에서 주의를 산만하게 할 정도로 지나치게 매력적이거나, 혹은 불쾌하거나 지루해서는 안 된다.
5. 재생 장치의 선택
평가해야 할 열화의 범주에 따라, 헤드폰 또는 스피커를 사용할 수 있다. 일부 품질 결함은 스피커 재생에 비해 헤드폰 재생에서 훨씬 더 뚜렷하게 인지된다는 것이 입증되었다.
예를 들어, 헤드폰을 사용하여 잡음 없는 청취를 위해 요구되는 신호 대 잡음비(signal-to-noise ratio, SNR)는 동일한 음량에서 스피커를 사용할 때 얻어지는 수치보다 최대 10 dB나 높다. 이와 유사한 차이는 디지털 전송에서의 비트 오류로 인한 클릭 잡음, 양자화 왜곡, 비선형 왜곡, 위상 왜곡 등으로 발생하는 품질 손실의 경우에도 나타난다.
그러나 다른 종류의 품질 결함들은 스피커 재생에서 더 명확히 인지된다. 특히, 스피커 사이의 스테레오 음향 이미지를 특징짓는 요소들에 영향을 주는 요인은, 반드시 스피커 재생을 통해 평가되어야 한다. 예를 들어, A 채널과 B 채널 간의 차이로 인한 품질 손실이 그러한 경우이다.
가능한 한 서로 평가를 비교 가능하게 만들기 위해서는, 헤드폰을 사용하는 것이 바람직할 수 있다. 헤드폰 재생은 청취실 및 조정실의 기하학적·음향적 특성과 무관하기 때문에, 원칙적으로 매우 정확하게 정의될 수 있으며, 체계적인 오차 없이 쉽게 재현될 수 있다. 이것은 스피커 재생에는 해당되지 않는다.
또한 헤드폰 재생의 경우, 동일한 청취 조건 하에서 대규모의 청취자들과 동시에 평가 시험을 수행할 수 있다.
6. 음량 수준
6.1 스피커 재생
고 피크 레벨의 원하는 신호를 사용할 경우, 음량 수준은 IEC(출판물 123)에 의해 표준화된 무가중치(no weighting) 및 “slow” 시간 상수를 가진 음량계(sound level meter)로 측정해야 한다. 그 밖의 신호와 실내 잡음을 측정할 때는, IEC(출판물 123)에 의해 표준화된 A 가중치(weighting A) 및 “slow” 시간 상수를 가진 음량계로 측정해야 한다.
시험의 특수 조건 하에서, 특정 청취실의 위치에서의 프로그램 시퀀스의 음량 수준은, 각 시퀀스 동안 음량계가 표시한 최대값과 같다고 정의된다.
고품질의 고레벨 신호를 평가할 경우, 80~90 dB의 청취 음량 수준을 사용해야 한다.
시험이 수행된 조건을 정확히 정의하는 데 고려되는 음량 수준은, 청취자들이 차지한 여러 위치에서 측정된 음량들의 평균이어야 한다. 임의의 위치에서 이 평균값과의 차이는 가능한 한 작아야 하며, ±4 dB의 값은 합리적일 수 있다. 모든 측정은 청취자들이 있는 상태에서 이루어져야 한다.
6.2 헤드폰 재생
헤드폰 재생의 경우, 귀도 내의 음량 수준을 직접 측정하는 것을 피하기 위하여, 음량 수준은 참조 음장(reference sound field)과 동일한 크기의 음량이 되도록 조절되어야 한다.
동일한 음량을 결정하기 위하여, 청취자는 §6.1에 따라 참조 음장 내에 위치해야 한다. 헤드폰의 음량과 참조 음장의 음량을 비교할 때, 신호는 청취자에게 교대로 제시되어야 하며 (동시에 제시되지 않음), 헤드폰에는 참조 음장과 동일한 성격을 가진 입력 신호가 공급되고, 청취자의 판단에 따라 동일한 음량이 되도록 조정되어야 한다.
모든 음량 비교 판단의 평균값이 사용되어야 하며, 이를 통해 시험에서 올바른 헤드폰 음량 수준이 사용되도록 보장해야 한다.
7. 청취 조건
일반적으로, 특히 고품질 음향 전송에 대한 허용 오차를 설정할 때에는, 실내 잡음에 의한 마스킹 효과를 최소화하려는 노력이 이루어져야 한다. 실내 잡음의 평균 수준은 항상 표시되어야 하며, 명백히 알아차릴 수 있는 마스킹 효과가 있을 것 같을 경우에는, 평균 스펙트럼 또한 표시되어야 한다.
또한, 청취자가 주변 환경의 특정 요소들(온도, 조명, 움직이는 물체나 사람 등)로 인해 가능한 한 불쾌함을 느끼거나 주의가 산만해지지 않도록 주의해야 한다.
7.1 스피커 재생
시험이 스피커로 수행되는 경우, 청취실3)의 치수 및 잔향 시간, 청취자의 배치, 청취자와 스피커(또는 스피커들)와의 거리 등 관련 모든 필수 정보가 제공되어야 한다. 스피커 특성에 대한 기술적 요구사항은 러시아 연방에서 사용되고 있다.
7.2 헤드폰 재생
시험이 헤드폰으로 수행되는 경우, 사용된 헤드폰의 종류 및 형식 지정을 포함한 모든 필수 정보가 제공되어야 한다. 헤드폰 특성에 대한 기술적 요구사항은 정의되어야 한다.
현재 EBU에서 작성된 문서는, 고품질 헤드폰에 적용 가능한 국제 표준을 수립하기 위한 실행 프로그램의 수립을 제안하고 있다.
8. 장비, 프로그램, 스튜디오 등의 특수 특성 평가
8.1 보호비
보호비 평가에는 약간 다른 시험 절차가 필요하다. 이 경우, 비교에 사용되는 손상되지 않은 프로그램 시퀀스는 수신기가 설계된 방송 시스템에 적합한 음향 품질을 재생할 수 있어야 한다.
8.2 녹음 프로그램, 스튜디오
녹음의 평가에는 통일된 방법이 존재하지 않는다. OIRT는 국제 프로그램 교환을 위한 녹음 평가를 위한 특별한 작업 방법(OIRT 권고안 63/1, 91)과 스튜디오 및 콘서트홀의 음향 특성 평가 방법(OIRT 권고안 68)을 제안하였다. 러시아 연방에서 적용되는 고품질 주관 평가 요건(청취 조건, 방법 선택, 청취자 수 및 선정)에 관한 정보가 제공되고 있다.
8.3 음질 주관 평가의 적용
러시아 연방에서는 방송에서 주관적 시험에 대한 요구 조건을 식별하려는 연구가 진행되었다. 주관 평가의 적용 분야는 세 영역으로 구분되었으며,
이 3개 영역은 다시 하위 그룹으로 분류되어 표로 제시되었다. 평가 요구 사항은 ISO, IEC, OIRT 문서에 반영된 국제 관행에 기반하며, 예를 들어 IEC 출판물 543에서는 잡음 수준, 조명, 지시사항, 스피커 및 피험자의 위치 등에 대해, OIRT 권고안 68/1에서는 시험 프로토콜에 대해 다루고 있다.
9. 다차원 음향 시스템의 주관적 평가
비선형성, 간섭 또는 잡음으로 인해 발생하는 신호 왜곡에 대한 주관적 평가는 본 권고안 본문에서 제시된 방법으로 적절하게 측정될 수 있다고 주장된다. 그러나 사운드 “서라운드 사운드”나 고화질 텔레비전과 같은 특정 분야에서는 설계 문제가 더욱 복잡하다.
다채널 음향 시스템을 설계하거나 선택하기 위해서는 주관적 평가가 필요하며, 이 경우에는 단순히 음향 채널의 왜곡을 넘는 새로운 고려사항이 있다. 여기에는 위치화가 어느 정도 가능한지, 주어진 지점에서 다차원 음향장의 재생 효율이 어느 정도인지가 포함된다.
이 경우에는 현재 본 권고안에서 다루는 것을 넘는 새로운 평가 방법이 필요하다.
예를 들어, NHK의 Oghusi가 다차원 척도를 사용하여 수행한 연구에서는 다음과 같은 속성이 조사되었다:
평가자들은 이 속성들에 대해 여러 대안 시스템을 평가하도록 요청받았다. 유사성 테이블이 작성되었으며, 여기에서 두 개의 직교 지각 축이 지각된 현실감(채널 수와 가장 강한 연관)과 음향 및 영상의 일치성(중앙 소스 제공과 가장 강한 연관)과 관련이 있는 것으로 보인다.
NHK 사례에서 시스템 선택은 전반적인 품질에 기반하였으며, 일본은 이러한 경우에 이러한 접근법을 권장하고 있다.
[공지]회원 가입 방법
[공지]글 작성 및 수정 방법