Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
T T
A S
t a n
d a
r d
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1 제정일 년 월 일: 2014 12 17
오디오 콘텐츠 필터링
성능 평가 지침
Performance Evaluation Guideline of
Audio Contents Filtering
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1 제정일 년 월 일: 2014 12 17
오디오 콘텐츠 필터링
성능 평가 지침
Performance Evaluation Guideline of
Audio Contents Filtering
본 문서에 대한 저작권은 에 있으며 와 사전 협의 없이 이 문서의 전체 또는TTA , TTA 일부를
상업적 목적으로 복제 또는 배포해서는 안 됩니다.
Copyright Telecommunications Technology Association 2014. All Rights Reserved.ⓒ
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1i
서 문
표준의 목적1.
본 표준에서는 오디오 콘텐츠의 불법 유통을 차단하기 위하여 특징점 기반 오디오 필
터링 기술의 성능을 객관적으로 평가할 수 있는 평가 항목과 평가 방법 평가 결과의 정,
량화 및 평가에 필요한 데이터 셋에 대한 가이드라인 표준을 정의하여 오디오 필터링 기
술의 품질을 인증하는 데 그 목적이 있다.
주요 내용 요약2.
주요 내용으로는 필터링 기술의 성능 평가를 위한 평가 항목에서 변형된 콘텐츠에 대
한 필터링의 강인성과 신뢰성 특징점 추출과 인식에 걸리는 시간 인식에 필요한 최소, ,
단위 임의 부분에 대한 필터링 시간 정보에 대한 정확도와 시간 정밀도 특징 정보 크, , ,
기와 특징 크기를 정의한다 또한 정의된 평가 항목에 대해서는 구체적인 평가 방법DB .
을 정의하고 평가 결과의 정량화를 위한 방법 평가에 필요한 데이터 셋을 만들기 위한,
가이드라인을 제공한다.
표준 적용 산업 분야 및 산업에 미치는 영향3.
년 월 개정된 저작권법 조에 따르면 웹하드 와 같은 컴퓨터 등을 이용2006 12 104 , P2P
하여 상호 간에 저작물을 전송하도록 하는 특수한 유형의 온라인 서비스 제공자 는 권리" "
자의 요청이 있는 경우 저작물의 불법적인 전송을 차단하는 기술적 조치를 하여야 한다
고 규정하고 있다 또한 년 월 개정 및 월 시행된 전기통신사업법에 근거하여. , 2011 5 11
웹하드 등록제가 시행되면서 동법 시행령의 웹하드 등록요건에서 성능평가를 통과한 기
술을 온라인서비스에 상시 적용하도록 규정하고 있다.
본 표준은 콘텐츠 필터링 기술에 대한 객관적인 성능 평가를 제공함으로써 사업자가
시장에 존재하는 다양한 콘텐츠 필터링 기술 중 자신의 응용서비스에 적합한 필터링 기
술을 선택하는데 도움이 될 것이다 또한 궁극적으로는 콘텐츠 서비스 사업자에 대한 신.
뢰성을 확보하여 저작권 산업을 자연스럽게 활성화시켜 나가는 데 도움이 될 것이다.
참조 표준 권고4. ( )
국외 표준 권고4.1. ( )
해당 사항 없음- .
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1ii
국내 표준4.2.
정보통신단체표준- TTAK.KO-12.0162, ‘ (TTAS)’, 2010.12.
참조 표준 권고 과의 비교5. ( )
참조 표준 권고 과의 관련성5.1. ( )
본 표준은 정보통신단체표준 의 개정안임(TTAS) 'TTAK.KO-12.0162' .
참조한 표준 권고 과 본 표준의 비교표5.2. ( )
TTAK.KO-12.0162 TTAK.KO-12.0162/R1 비고
개요1. 개요1. 동일
표준의 구성 및 범위2. 표준의 구성 및 범위2. 동일
용어 정의3. 참조 표준3. 추가
4 오디오 필터링 기술의 개요. 용어 정의 및 약어4.수정
일부 용어 등 수정( )
오디오 필터링 기술 성능 평5.
가 항목오디오 필터링 기술의 개요5.
수정
용어 수정( )
오디오 필터링 기술 성능 평6.
가 방법
오디오 필터링 기술 성능 평6.
가 항목
수정
일부 항목 수정 및 설명(
추가)
오디오 필터링 기술 성능평가7.
를 위한 평가 데이터
오디오 필터링 기술 성능 평7.
가 방법
수정
일부 항목 수정( )
평가 결과 수치화 방법8.오디오 필터링 기술 성능평가8.
를 위한 평가 데이터
수정
추가( )
- 평가 결과 수치화 방법9.수정
장르 추가( )
지식 재산권 관련 사항6.
본 표준의 지식 재산권 확약서 제출 현황은 웹사이트에서 확인할 수 있다‘ ’ TTA .
본 표준을 이용하는 자는 이용함에 있어 지식 재산권이 포함되어 있을 수 있으므※
로 확인 후 이용한다, .
본 표준과 관련하여 접수된 확약서 이외에도 지식 재산권이 존재할 수 있다.※
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1iii
시험 인증 관련 사항7.
시험 인증 대상 여부7.1.
해당 사항 없음- .
시험 표준 제정 현황7.2.
해당 사항 없음- .
표준의 이력 정보8.
표준의 이력8.1.
판수 제정 개정일․ 제정 개정 내역․
제 판1 2010.12.23. 제정TTAK.KO-12.0162
제 판2 2014.12.17. 개정TTAK.KO-12.0162/R1
주요 개정 사항8.2.
TTAK.KO-12.0162 TTAK.KO-12.0162/R1 비고
개요1. 개요1. 동일
표준의 구성 및 범위2. 표준의 구성 및 범위2. 동일
용어 정의3. 참조 표준3. 추가
4 오디오 필터링 기술의 개요. 용어 정의 및 약어4.수정
일부 용어 등 수정( )
오디오 필터링 기술 성능평가5.
항목오디오 필터링 기술의 개요5.
수정
용어 수정( )
오디오 필터링 기술 성능 평6.
가 방법
오디오 필터링 기술 성능 평6.
가 항목
수정
일부 항목 수정(
및 설명 추가)
오디오 필터링 기술 성능평가7.
를 위한 평가 데이터
오디오 필터링 기술 성능 평7.
가 방법
수정
일부 항목 수정( )
평가 결과 수치화 방법8.오디오 필터링 기술 성능평가8.
를 위한 평가 데이터
수정
추가( )
- 평가 결과 수치화 방법9.수정
장르 추가( )
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1iv
Preface
1. Purpose of Standard
The purpose of this standard is to provide a method to evaluate an audio filtering
technique. There have been many signature-based audio filtering solutions
released on the market; however, the evaluation of those techniques is not simple.
This standard can be used as a guide for certifying audio filtering techniques.
This standard provides the specifications of quality characteristics, their
measurements, and a guideline for testing data.
2. Summary of Contents
This standard specifies the following quality characteristics to evaluate an audio
filtering technique:
- Robustness
- Consistency
- System Utilization
- Feature Size
- Fast Extraction
- Search Speed
- Partial Matching
- Compactness
This standard also provides a measurement method for each characteristic, and it
provides guidance regarding the test data.
3. Applicable Fields of Industry and its Effect
According to Article 104 of the Copyright Act revised in Dec, 2006, special types
of online service providers (OSP) should provide technological measures for
copyright protection at copyright owners' requests.
This standard will help to evaluate the performance of content filtering technology
and help OSP choose the right technology for their service applications. The
standard is also expected to boost the digital content market by establishing trust
between the service providers and the content copyright owners.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1v
4. Reference Standards(Recommendations)
4.1. International Standards(Recommendations)
- None
4.2. Domestic Standards
- TTA, TTAK.KO-12.0162, “Performance Evaluation of Audio Contents Filtering”,
2010.12.
5. Relationship to Reference Standards(Recommendations)
5.1. Relationship of Reference Standards(Recommendations)
This standard is the revision of “TTAK.KO-12.0162”.
5.2. Differences between Reference Standard(Recommendation) and this Standard
TTAK.KO-12.0162 TTAK.KO-12.0162/R1 Remarks
1. Introduction 1. Introduction Equal
2. Constitution and Scope 2. Constitution and Scope Equal
3. Terms and Definitions 3. Reference Standards Added
4. Overview of Audio Filtering
Technique4. Terms and Definitions Modified
5 Quality Characteristics for
Audio Filtering Evaluation
5. Overview of Audio Filtering
TechniqueModified
6. Methods and
Measurements for Audio
Filtering Evaluation
6. Quality Characteristics for
Audio Filtering EvaluationModified
7. Guideline on Audio Filtering
Evaluation Test Data
7. Methods and
Measurements for Audio
Filtering Evaluation
Modified
8. Assessment of Audio
Filtering Evaluation
8. Guideline on Audio Filtering
Evaluation Test DataModified
-9. Assessment of Audio
Filtering EvaluationModified
6. Statement of Intellectual Property Rights
IPRs related to the present document may have been declared to TTA. The
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1vi
information pertaining to these IPRs, if any, is available on the TTA Website.
No guarantee can be given as to the existence of other IPRs not referenced on
the TTA website.
And, please make sure to check before applying the standard.
7. Statement of Testing and Certification
7.1. Object of Testing and Certification
Using this standard, the performance evaluation can be applied to the content
filtering technology.
7.2. Standards of Testing and Certification
- None
8. History of Standard
8.1. Change History
Edition Issued date Outline
The 1st edition 2010.12.23.Established
TTAK.KO-12.0162
The 2nd edition 2014.12.17.Revised
TTAK.KO-12.0162/R1
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1vii
8.2. Revisions
TTAK.KO-12.0162 TTAK.KO-12.0162/R1 Remarks
1. Introduction 1. Introduction Equal
2. Constitution and Scope 2. Constitution and Scope Equal
3. Terms and Definitions 3. Reference Standards Added
4. Overview of Audio Filtering
Technique4. Terms and Definitions Modified
5 Quality Characteristics for
Audio Filtering Evaluation
5. Overview of Audio Filtering
TechniqueModified
6. Methods and
Measurements for Audio
Filtering Evaluation
6. Quality Characteristics for
Audio Filtering EvaluationModified
7. Guideline on Audio
Filtering Evaluation Test Data
7. Methods and
Measurements for Audio
Filtering Evaluation
Modified
8. Assessment of Audio
Filtering Evaluation
8. Guideline on Audio
Filtering Evaluation Test DataModified
-9. Assessment of Audio
Filtering EvaluationModified
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1viii
목 차
개 요1. ···········································································································································1
표준의 구성 및 범위2. ···············································································································1
참조 표준 권고3. ( ) ························································································································1
용어 정의 및 약어4. ···················································································································2
오디오 필터링 기술의 개요5. ···································································································4
오디오 필터링 기술 성능 평가 항목6. ···················································································5
오디오 필터링 기술 성능 평가 방법7. ···················································································6
강인성7.1. ································································································································6
일관성7.2. ································································································································8
시스템 사용률7.3. ··················································································································9
특징정보량7.4. ························································································································9
고속 추출7.5. ··························································································································9
추출 및 검색 비교 속도7.6. · ································································································9
부분 매칭7.7. ··························································································································9
인식 정보량7.8. ······················································································································9
오디오 필터링 기술 성능 평가를 위한 평가 데이터8. ·······················································9
평가 결과 수치화 방법9. ·········································································································10
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R1ix
Contents
1. Introduction ·······························································································································1
2. Constitution and Scope ········································································································1
3. Reference Standards ·············································································································1
4. Terms and Definitions ···········································································································2
5. Overview of Audio Filtering Technique ············································································4
6. Quality Characteristics for Audio Filtering Evaluation ·················································5
7. Methods and Measurements for Audio Filtering Evaluation ·····································6
7.1. Robustness ······················································································································6
7.2. Consistency ·····················································································································8
7.3. System Utilization ··········································································································9
7.4. Feature Size ····················································································································9
7.5. Fast Extraction ···············································································································9
7.6. Search Speed ·················································································································9
7.7. Partial Matching ·············································································································9
7.8. Compactness ··················································································································9
8. Guideline on Audio Filtering Evaluation Test Data ······················································9
9. Assesment of Audio Filtering Evaluation ······································································10
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R11
오디오 콘텐츠 필터링 성능 평가 지침
(Performance Evaluation Guideline of Audio Contents Filtering)
개요1.
서비스의 등장과 활성화로 기존의 저작권을 보호하는 가장 강력한 수단인DRM-Free
이 해제됨으로써 이를 대체할 수 있는 기술에 대한 요구가 그 어느 때보다 높다 저DRM .
작권법 제 조 제 항에서는 권리자가 요청할 때 특수한 유형의 온라인 서비스 제공자104 1
는 저작권 보호를 위한 기술적 조치를 의무적으로 취하도록 되어있다 기술적 조치에는.
다양한 기술들이 포함될 수 있으나 현실적으로 가장 많은 OSP(Online Service Provider)
가 채택하고 있는 기술이 콘텐츠 필터링 기술이다 그러나 다양한 필터링 기술이 등장하.
면서 이들의 객관적인 품질 평가를 위해서는 통일된 평가 항목과 평가 방법 및 테스트
셋에 대한 가이드라인 등이 제공되어야 한다 이에 본 표준은 특정 기술에 종속되지 않.
고 오디오 콘텐츠 필터링 서비스의 성능을 평가하기 위한 표준 제정을 목표로 한다.
표준의 구성 및 범위2.
본 표준은 저작권 보호 기술의 하나인 오디오 콘텐츠 필터링 기술에 대한 객관적인 성능
평가를 위해서 표준적인 평가 항목과 평가 방법 평가 결과의 정량화 평가를 위한 데이터, ,
셋 선정을 위한 가이드라인을 명시하고 있으며 크게 네 개의 장으로 구성되어있다, .
첫 번째로 오디오 필터링 기술의 성능 평가를 위해서 필요한 평가 항목을 구체적으로
기술하고 있다.
두 번째로 성능 평가 항목에 대한 평가 방법에 대해서 구체적으로 기술하고 있다.
세 번째로 평가를 위한 데이터 셋 선정을 신뢰성 있게 할 수 있는 가이드라인을 제시
하고 있다.
마지막으로 성능 평가 결과를 정량화된 지표로 표시할 수 있도록 정량화를 위한 방법
을 기술하고 있다.
참조 표준 권고3. ( )
국외 표준 권고3.1. ( )
해당 사항 없음- .
국내 표준3.2.
정보통신단체표준- TTAK.KO-12.0162, ‘ (TTAS)’, 2010.12.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R12
용어 정의 및 약어4.
필터링 기술4.1.
콘텐츠의 불법 유통으로부터 보호하기 위하여 다양한 방법에 의해 식별된 콘텐츠를
사전에 구축된 데이터베이스와 비교하여 전송을 차단하는 기술을 의미한다.
특수한 유형의 온라인 서비스 제공자4.2.
저작권법 제 조의 규정에 의하여 다른 사람들 상호 간에 컴퓨터 등을 이용하여 저104
작물 등을 전송하도록 하는 것을 주된 목적으로 하는 온라인 서비스 제공자를 의미
하며 문화체육관광부 고시 제 호에 구체적으로 그 범위가 명시되어 있다2014-07 .
콘텐츠 필터링4.3.
콘텐츠 이용 과정에서 저작권 침해 여부 등을 판단하기 위해 데이터를 제어하는 기
술 콘텐츠 필터링은 불법 복제된 콘텐츠가 유통되지 못하도록 하는 역할 등을 수행.
하는 기술로 크게 키워드 필터링 해시 필터링 특징기반 필터링 등(keyword) , (hash) ,
이 있다.
평가 항목4.4.
정량적 평가를 위하여 측정해야 하는 항목과 그 평가 방법을 의미한다.
변형4.5.
콘텐츠 본래의 특성 크기 형태나 압축품질 등 이 바뀌는 상태를 의미한다( , ) .
특징정보4.6.
콘텐츠 고유의 특징으로 서로 다른 콘텐츠를 식별할 수 있는 정보로 콘텐츠 라DNA
고도 한다.
강인성4.7.
원본 콘텐츠에서 추출한 특징 정보는 다양한 콘텐츠 변형 후에도 원본과 유사한 특
징 정보를 추출할 수 있어야 하는데 이를 변형에 대한 강인성이라 한다.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R13
일관성4.8.
일관성은 콘텐츠로부터 고유한 특징 정보를 추출하여 해당 콘텐츠를 정확하게 식별
하는 것을 의미하며 원본 콘텐츠에 대해 정확히 인식한 비율인 인식률과 잘못 인식,
한 에러 비율인 오인식률 그리고 특징점 에 존재하는 콘텐츠를 인식하지 못하는, DB
불인식률로 구분하여 평가할 수 있다.
고속 추출4.9.
원본 콘텐츠로부터 특징점을 추출하는 시간과 특징점 로부터 일치하는 특징정보DB
를 검색하는데 소요되는 시간을 고속 추출이라고 한다.
최소 단위4.10.
신뢰성 있는 특징 정보를 추출하기 위해 필요한 원본 콘텐츠의 최소 시간 단위 크기
를 최소 단위라 한다.
부분 매칭4.11.
콘텐츠의 시간 축상 임의 부분에서 추출한 특징 정보를 이용하여 해당 콘텐츠를 인
식하는 것을 부분 매칭이라 한다.
시간 정확도4.12.
특징 정보를 이용하여 특징점 에서 매칭되는 인식 결과가 시간 축상에서 원본 대DB
비 얼마나 정확한지를 나타내는 것을 시간 정확도라 한다.
시간 정밀도4.13.
시간 정밀도는 특징점 에서 매칭되는 인식 결과 시간를 얼마나 정밀하게 표현 가DB
능한지에 대한 척도이다 즉 시간 정밀도는 등으로 표현된다. ms, sec, min .
특징 정보 크기4.14.
특징 정보의 크기는 콘텐츠의 단위 시간당 특징점의 크기 용량 를 의미한다( ) .
특징 크기4.15. DB
특징 정보의 크기와 용량을 의미한다.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R14
오디오 필터링 기술의 개요5.
콘텐츠 필터링 기술은 디지털 콘텐츠를 해시 함수 나 콘텐츠 내용에 기(hash function)
반한 고유의 특징 정보를 추출하여 분석한 후 메타정보와 함께 를 구축하고 아래의DB ,
그림 처럼 임의의 콘텐츠에 대해 특징점 를 검색하여 콘텐츠를 인식하고 그 결( 5-1) DB
과에 따라 전송을 차단하거나 허락하는 기술을 말한다.
해시 함수를 이용한 콘텐츠 필터링은 구현이 간단하고 인식 속도가 빠르다는 장점이
있으나 콘텐츠의 작은 변형에 따라 해시 값이 달라져 인식이 불가능하게 된다 따라서.
변형에도 강인한 내용 기반 특징점을 이용한 필터링 방법이 주로 사용된다.
그림 오디오 필터링 기술 개요( 5-1)
오디오 콘텐츠 필터링을 위해서는 콘텐츠를 식별하기 위한 특징정보 가 필요하(feature)
고 이 특징은 다음과 같은 속성을 만족해야 한다, .
강인성 특징정보는 지각적으로 비슷한 콘텐츠에 대해서는 유사성을 나타내어야 한o :
다 즉 원본 콘텐츠의 지각적 특성을 유지하는 압축 리샘플링 등의 변화에 대해 유. ,
사한 특징정보가 있어야 한다.
상호 독립 서로 다른 콘텐츠에 대해서는 반드시 서로 다른 특징정보가 있어야 한o :
다.
검색 효율성 데이터베이스내의 특징정보는 효율적인 검색을 위한 구조를 고려하여o :
만들어져야 한다.
오디오 콘텐츠 필터링을 위해서는 콘텐츠를 식별하기 위한 특특징정보를 기반으로 콘
텐츠 필터링 시스템을 구성하기 위해서는 먼저 특징정보 를 생성하는 과정이 필요하DB
며 이 과정 후에 콘텐츠의 식별이 가능하다, .
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R15
그림( 5-2) 특징 생성 및 검색 개요DB
오디오 필터링 기술 성능 평가 항목6.
오디오 콘텐츠 필터링 기술의 객관적인 성능을 평가하기 위해 다음의 각 항목에 대해
성능을 평가한다.
강인성o (Robustness)
디지털 오디오 콘텐츠가 다양하게 변형된 후에도 원본과 유사한 특징 정보를 추출할
수 있어야 하는데 이러한 강인성을 평가하기 위한 오디오 콘텐츠의 왜곡 변형 의 종류는( )
다음과 같다.
에코 삽입- Echo( )
재생 가능 음역대 감소- Dynamic Range Reduction( )
균일화- Equalization( )
속도 변환- Speed Change( )
시간 척도 변환- Time Scale Change( )
샘플링 빈도 변환- Sample Rate Conversion( )
통과 대역 필터링- Band-Pass Filtering( )
노이즈 추가- Noise Addition( )
시간 흐름에 따른 속도- Wow and Flutter( )
코덱 변환- Codec Change( )
디지털 아날로그 형태 변환- D/A-A/D Conversion( / )
코덱변환 속도변환- Multi-transformation( + )
기타 등 압축 및 실행파일- (ZIP )
일관성o
반복적으로 수행된 특징정보 추출 및 인식에 대한 일관성 정도를 의미한다 특징정보.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R16
추출의 일관성 및 인식의 일관성의 두 개 항목으로 평가한다.
시스템 사용률o
특징정보 추출 및 인식 결과 회신 등에 사용한 시스템 자원의 사용률을 의미한다 원본.
콘텐츠 특징정보 추출에 사용한 시스템 자원 사용률 메모리 과 인식결과 회신에 사(CPU, )
용한 시스템 자원 사용률 메모리 을 측정한다(CPU, ) .
특징정보량o
원본콘텐츠에서 추출하는 특징정보의 크기를 의미한다.
고속 추출o
원본 오디오 콘텐츠로부터 특징정보를 추출하는데 소요되는 시간을 의미한다.
추출 및 검색 비교 속도o ·
변형 콘텐츠가 원본콘텐츠를 인식하는데 소요되는 변형 콘텐츠의 특징정보 추출 속도
및 원본콘텐츠의 특징정보 검색 비교 시간을 의미한다DB / .
부분 매칭o
혼합된 콘텐츠를 인식하는 정도를 의미한다.
인식 정보량o
인식하기 위해 필요한 콘텐츠의 최소 크기를 의미한다.
오디오 필터링 기술 성능 평가 방법7.
강인성7.1.
오디오의 변형을 다루고 있는 방법은 다수 존재하고 있으나 오디오 콘텐츠의 특징을,
표현하는 오디오 신호의 에너지 피치 주기 대역폭 주요 주파수 성분 등의 특성에 변형, , ,
을 가하는 공격 항목을 중심으로 성능 평가 항목을 기술한다.
에코 삽입- Echo( )
음파가 물체에 부딪쳐 들리는 반사음을 말한다 원 음악 콘텐츠에 에코를 가하는 공격.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R17
방법은 다음과 같다.
Delay: 100ms, feedback coefficient: 0.5
Delay: 200ms, feedback coefficient: 0.25
재생 가능 음역대 감소- Dynamic Range Reduction( )
은 음향 신호를 전송하거나 녹음할 때 신호의 최강음Dynamic Range Reduction (Peak
과 잡음 로 표현되며 디지털 녹음에서는 정도의level) (Noise floor)' 90dB Dynamic Range
를 얻을 수 있다 원 음악 콘텐츠에 변형을 가하는 방법은 다음과 같다. Dynamic Range .
1) threshold : 50dB 8db max compression
2) rate: 10ms attacks, 3s recovery
이퀄리제이션- (Equalization)
소리의 스펙트럼이 갖는 각각의 부분을 조절하기 위해 특정 주파수를 줄이거나 증폭하
는 것을 의미한다 즉 저주파나 고주파를 조절함으로써 개별적인 음원의 톤과 레벨 등이.
조정되어 하나의 단일 트랙으로 믹스된다 원 음악 콘텐츠에 이퀄리제이션을 가하는 방.
법은 다음과 같다.
밴드 그래픽 이퀄라이저는 아래 표와 같이 조절한다10- .
Freq.[Hz] 31 2 125 250 500 1k 2k - 8k 16
Gain[db] -3 +3 -3 +3 -3 +3 +3 +3 -3 +3
속도 변환- (Speed Change)
원 음악 콘텐츠에 플레이 속도를 증가 혹은 감소시키는 공격 방법으로 다음과 같은 범
위로 조절한다.
+5%, +3%, -3%, -5%
시간 척도 변환- (Time Scale Change)
오디오의 재생 시간을 증 감하는 변형으로 다음과 같은 방법으로 수행된다/ .
Pitch shifting: +/- 3%
샘플링 빈도 변환- (Sample Rate Conversion)
디지털 오디오의 음질 기준을 정의하는 것으로 보통 는 의 디CD 44.1Khz, 16bit, DVD
지털 구현은 최대 까지 지원이 가능하다 원 음악 콘텐츠에 변형을 가하는192Khz, 24bit .
방법은 다음과 같다.
16bit 44.1kHz to 16bit 16.0kHz
통과 대역 필터링- (Band-Pass Filtering)
일정한 전자 장치를 사용하여 일정한 범위 대역 에 속한 주파수를 통과시키고 나머지는( )
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R18
모두 차단시키는 것을 의미한다 원 음악 콘텐츠에 을 가하는 공. Bandp-Pass Filtering
격 방법은 다음과 같다.
100 Hz to 6000 Hz, 12dB/oct
노이즈 추가- (Noise Addition)
원 음악 콘텐츠에 일정한 잡음을 가하는 공격으로 방법은 다음과 같다.
White noise (Amplitude = -37.1dB)
White noise (Amplitude = -19.0dB)
변환- D/A-A/D (Conversion)
디지털 음악의 스피커 출력을 디지털로 다시 녹음하는 형태의 변형을 의미하며 이때,
여러 가지 복합적인 변형들이 함께 가해지는 공격 방법이다.
시간 흐름에 따른 속도- Wow and Flutter( )
효과는 와 기능으로 구분되며WOW SRS (3D SOUND) TRUBASS (Deep Bass), Focus ,
는 중고역대의 특정 주파수 의 사라지지 않는 반사음을 말한다 이러Flutter (200Hz~9Khz) .
한 공격을 가하는 방법은 다음과 같다.
Rate : 1.5Hz, Depth : 50%, Wetout : -6db
코덱 변환- Codec Change( )
오디오 코덱의 종류는 다양하게 존재하나 일반적으로 많이 사용되는 다음과 같은 코덱
과 동일한 방법으로 원 음악 콘텐츠를 압축한다.
AAC/MP4 (128/96kbps), OGG(128/96kbps), WMA (128/96kbps)
일관성7.2.
오디오 콘텐츠 필터링 기술의 정확도를 나타내는 요구 사항으로서 다른 콘텐츠와의 구
별 정도와 인식 결과에 대한 정확성 그리고 알고리즘에 대한 성능 등을 평가하기 위한
항목으로 구성된다.
인식률1)
검색 결과 특징 로부터 질의 오디오의 정보를 정확하게 결과로 나타내는 비율· , DB
인식률 인식 불가율 오인식률· (%) = 100 - -
오인식률 오탐율2) ( , False positive)
검색 결과 질의 오디오와 다른 정보를 결과로 나타내는 비율· ,
오인식율 다른 오디오로 인식한 질의 수 전체 질의 수· (%) = ( / ) x 100
불인식률 미탐율3) ( , False negative)
검색 결과 특징 에 질의 오디오의 정보가 있으나 인식 불가 결과를 나타내는 비율· , DB
불인식률 인식하지 못한 질의 수 전체 질의 수· (%) = ( / ) x 100
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R19
시스템 사용률7.3.
원본 콘텐츠에 대한 특징정보 추출 강인성 평가 수행 시 변형콘텐츠 특징정보 추출 및,
인식 결과 회신에 사용 되는 와 메모리에 대해 일정 시간 단위로 평균값을 저장하여CPU
결과를 분석한다.
특징정보량7.4.
추출한 특징정보의 크기로 일정 크기의 오디오 콘텐츠 셋 에 대하여 특징점을 추출(set)
하여 그 총 크기를 로 표현한다KB .
고속 추출7.5.
원본 오디오 콘텐츠로부터 특징정보를 추출하는데 소요되는 시간을 의미한다.
추출 및 검색 비교 속도7.6. ·
변형 콘텐츠가 원본콘텐츠를 인식하는데 소요되는 변형 콘텐츠의 특징정보 추출 속도
및 원본콘텐츠의 특징정보 검색 비교 시간을 의미한다DB / .
부분 매칭7.7.
특징점을 등록한 원본 콘텐츠의 임의 부분에 대한 인식 성능을 평가하기 위하여 원본,
오디오 콘텐츠의 시간 축상 초에서 초 사이에서 시작점을 정하고 그 시작점으로부터1 10
임의의 길이를 갖는 질의셋에서 추출한 특징을 이용하여 해당 콘텐츠를 인식할 수 있는
지를 평가한다.
인식 정보량7.8.
인식하기 위해 필요한 콘텐츠의 최소 크기를 의미한다.
오디오 필터링 기술 성능 평가를 위한 평가 데이터8.
오디오 콘텐츠 필터링 성능 평가를 위한 실험 데이터는 다음과 같은 규격의 오디오 파
일로 구성한다.
오디오 특징 는 곡 이상에서 추출한 특징 정보로 구성한다- DB 1,000 .
원본 오디오는 이상으로 구성한다- MP3 192kbps, 44.1kHz .
특징 를 구성하는 곡 이상의 오디오는 장르별로 다음 구성 중 최소 개- DB 1,000 10 이
상의 서로 다른 장르로 구성한다.
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R110
· A Cappella
· Classical
· Dance&Club music
· Electronic
· Hip-hop
· Jazz
· MR
· Newage
· Pop
· R&B/Soul
· Remake
· Remix
· Rock
교육·
국악·
동요·
평가 결과 수치화 방법9.
오디오 필터링 성능 평가 시험 결과를 다음과 같이 평가 시트에 기입하여 수치화된 결
과를 얻을 수 있다 평가 결과에 따른 평가 등급은 본 표준을 활용하는 기관이 각 평가.
항목별 가중치를 달리 적용하여 결정할 수 있다.
표 오디오 필터링 기술의 성능 평가표< 8-1>
요구
사항평가항목 파라메터
항목
속성
측정
단위가중치
결과
점수인식율
오인
식율불인식율
강
인
성
Echo
delay: 100ms
Feedback
coefficient:
0.5
필수
%
delay 200ms
Feedback
coefficient:
0.25
옵션
Dynamic
Range
Reduction
Threshold 50dB:
16dB max
compression
Rate: 10ms
attacks 3s,
recovery
필수
Equalization Freq(Gain) 필수 %
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R111
요구
사항평가항목 파라메터
항목
속성
측정
단위가중치
결과
점수인식율
오인
식율불인식율
31Hz(-3dB)
2Hz(+3dB)
125Hz(-3dB)
250Hz(+3dB)
500Hz(-3dB)
1kHz(+3dB)
2kHz(-3dB)
Hz(+3dB)
8kHz(-3dB)
16kHz(+3dB)
Speed Change+3%/-3% 필수
+5%/-5% 필수
Time Scale
Change
Pitch shifting 3% 필수
Pitch shifting -3% 필수
Sample Rate
conversion
44.1 kHz to
16.0kHz(16bit)필수
Band-Pass
Filtering
100Hz
to
6kHz
12dB/oct
High 필수
Low 필수
All 필수
Noise Addition
White noise
(Amplitude =
-37.1db)
필수
White noise
(Amplitude =
-19.0db)
필수
Wow and Flutter
Rate = 1.5Hz,
Depth : 50%,
Wetout : -6db
필수
Codec Change
AAC(MP4)-128kbps 필수
AAC(MP4)-96kbps 필수
OGG-128kbps 필수
OGG-96kbps 필수
WMA-128kbps 필수
WMA-96kbps 필수
D/A-A/D
Conversion
디지털 아날로그/
형태 변환 녹음( )필수
Multi
-transformatio
n
AAC, 128kbps, 3% 필수
AAC, 128kbps, -3% 필수
OGG, 128kbps, 3% 필수
OGG, 128kbps,-3% 필수
WMA, 128kbps, 3% 필수
WMA, 128kbps,-3% 필수
기타
등 압축 및(zip
실행 파일)
압축 원본콘텐츠zip ( ) 필수
이중압축zip 필수
압축egg 필수
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R112
요구
사항평가항목 파라메터
항목
속성
측정
단위가중치
결과
점수인식율
오인
식율불인식율
압축exe 필수
압축exe, zip 필수
일관성
추출의 일관성 추출의 일관성(%) 필수
인식의 일관성
인식의 일관성(%)
오인식의 일관성(%)
오인식의 일관성(%)
필수
시스템
사용률
사용률CPU
특징정보 추출시
사용률CPU (%)
인식결과 회신시
사용률CPU (%)
필수
메모리 사용률
특징정보 추출시
메모리 사용률(%)
인식결과 회신시
메모리 사용률(%)
필수
특징
정보량
원본콘텐츠
특징정보 크기Byte 필수
고속
추출
원본콘텐츠
특징정보를
추출하는데
소요되는 시간
평균 특징정보
추출시간필수
추출
및
비교
검색
속도
강인성 평가
수행에 따른
변형콘텐츠
추출 및
검색 비교 시간/
단위시간 필수
부분
매칭
원본 분(3 )
개로 구성된3
콘텐츠
개 총 개100 ( 300 )
부분인식(%)
전체인식(%)옵션
인식
정보량
2/3/5/10/15/20
초/30/50/70/90
각 개100
% 필수
총평균
comment
정보통신단체표준 국문표준( )
TTAK.KO-12.0162/R113
표준 작성 공헌자
표준 번호 : TTAK.KO-12.0162/R1
이 표준의 제정 개정 및 발간을 위해 아래와 같이 여러분들이 공헌하였습니다.․
구분 성명 위원회 및 직위연락처
등(E-mail )소속사
표준 과제 제안( ) 장의진디지털콘텐츠
프로젝트 그룹 위원[email protected] 한국저작권위원회
표준 초안 작성자 김영모디지털콘텐츠
프로젝트 그룹 위원[email protected] 한국저작권위원회
표준 초안 에디터 김영모디지털콘텐츠
프로젝트 그룹 위원[email protected] 한국저작권위원회
표준 초안 검토
주상현디지털콘텐츠 PG
의장[email protected] ETRI
외 프로젝트그룹 위원
표준안 심의
박승민소프트웨어 콘텐츠/
기술위원회 의장[email protected] ETRI
외 기술위원회 위원
사무국 담당
김영화 - [email protected] TTA
이혜진 - [email protected] TTA
정보통신단체표준 국문표준( )
오디오 콘텐츠 필터링 성능 평가 지침
(Performance Evaluation Guideline of Audio Contents Filtering)
발행인 한국정보통신기술협회 회장:
발행처 한국정보통신기술협회:
경기도 성남시 분당구 분당로463-824, 47
Tel : 031-724-0114, Fax : 031-724-0109
발행일 : 2014.12.