Upload
soufyan-dexter
View
227
Download
0
Embed Size (px)
Citation preview
7/28/2019 Features Based on Zero-Crossing
1/4
F E A T U R E E X T R A C T I O N B A S E D O N Z E R O - C R O S S I N G S W I T H P E A K
A M P L I T U D E S F O R R O B U S T S P E E C H R E C O G N I T I O N I N N O I S Y E N V I R O N M E N T S
D o h - S u k K i m J a e - H o o n J e o n g J a e - W e o n K i m S o o - Y o u n g L e e
D e p a r t m e n t o f E l e c t r i c a l E n g i n e e r i n g
K o r e a A d v a n c e d I n s t i t u t e o f S c i e n c e a n d T e c h n o l o g y
3 7 3 - 1 K u s o n g - d o n g , Y u s o n g - g u , T a e j o n 3 0 5 - 7 0 1 , K o r e a
E - m a i l : d s k @ e e k a i s t . k a i s t . a c . k r
A B S T R A C T
T h e E n s e m b l e I n t e r v a l H i s t o g r a m ( E I H ) i s a n a u d i t o r y
m o d e l w h i c h c a n b e u s e d a s a r o b u s t \ f r o n t - e n d " f o r
s p e e c h r e c o g n i t i o n s y s t e m s . T h e u t i l i z a t i o n o f m u l t i p l e
l e v e l - c r o s s i n g d e t e c t o r s i n t h e E I H p r o v i d e s f r e q u e n c y a n d
i n t e n s i t y i n f o r m a t i o n , w h i c h m a y b e u s e f u l f o r s p e e c h p r o -
c e s s i n g . P r o p e r d e t e r m i n a t i o n o f t h e n u m b e r o f l e v e l s a n d
t h e l e v e l v a l u e s i s v e r y i m p o r t a n t f o r r e l i a b l e p e r f o r m a n c e
o f t h e s y s t e m . I n t h i s p a p e r , a n a n a l y t i c r e l a t i o n s h i p i s d e -
v e l o p e d f o r v a r i a n c e a n d S N R o f t h e l e v e l - c r o s s i n g i n t e r v a l s
a s a f u n c t i o n o f t h e c r o s s i n g l e v e l v a l u e , a n d a n e w f e a t u r e
e x t r a c t i o n m e t h o d b a s e d o n z e r o - c r o s s i n g s w i t h p e a k a m -
p l i t u d e s i s p r o p o s e d f o r r o b u s t s p e e c h r e c o g n i t i o n i n n o i s y
e n v i r o n m e n t s . T h e p r o p o s e d m e t h o d n o t o n l y c a n p r e s e r v e
i n t e n s i t y i n f o r m a t i o n , b u t a l s o i s r o b u s t t o n o i s e i n e s t i m a t -
i n g f r e q u e n c y i n f o r m a t i o n w i t h o u t t h e e o r t s t o d e t e r m i n e
t h e l e v e l v a l u e s a n d t h e n u m b e r o f l e v e l s . E x p e r i m e n t a l
r e s u l t s s h o w t h e r o b u s t n e s s o f t h e p r o p o s e d m e t h o d .
1 . I N T R O D U C T I O N
S e v e r a l a u d i t o r y m o d e l s h a v e b e e n i n v e s t i g a t e d f o r r o b u s t
s p e e c h r e c o g n i t i o n s i n n o i s y e n v i r o n m e n t s 1 , 2 , 3 ] . A m o n g
t h e m E I H ( E n s e m b l e I n t e r v a l H i s t o g r a m ) , p r o p o s e d b y
G h i t z a 1 ] , i s c o m p u t a t i o n a l l y e c i e n t a n d r o b u s t e n o u g h
t o b e u s e d a s a \ f r o n t - e n d " f o r s p e e c h r e c o g n i t i o n s y s t e m s .
T h e E I H i s c o m p o s e d o f a b a n k o f b a n d p a s s c o c h l e a r l -
t e r s a n d a n a r r a y o f l e v e l - c r o s s i n g d e t e c t o r s a t t h e o u t p u t
o f e a c h c o c h l e a r l t e r . T h e l t e r b a n k m o d e l s f r e q u e n c y
s e l e c t i v i t y a t v a r i o u s p o i n t s a l o n g a b a s i l a r m e m b r a n e i n a
c o c h l e a , a n d t h e a r r a y o f l e v e l - c r o s s i n g d e t e c t o r s m o d e l s t h e
e n s e m b l e o f n e r v e b e r s i n n e r v a t i n g a s i n g l e i n n e r h a i r c e l l .
E a c h l e v e l r e p r e s e n t s a b e r o f s p e c i c t h r e s h o l d c o n n e c t e d
t o a n i n n e r h a i r c e l l , a n d t h e l e v e l v a l u e s a r e u n i f o r m l y d i s -
t r i b u t e d o n a l o g s c a l e o v e r t h e p o s i t i v e a m p l i t u d e r a n g e o f
t h e s i g n a l . T h i s c o r r e s p o n d s t o t h e h a l f - w a v e r e c t i c a t i o n
o b s e r v e d i n c i l i a a t t a c h e d t o i n n e r h a i r c e l l s . N e u r a l r i n g s
a r e s i m u l a t e d a s t h e l e v e l - c r o s s i n g e v e n t s o f t h e s i g n a l a t
t h e o u t p u t o f e a c h b a n d p a s s l t e r . I n v e r s e o f t i m e i n t e r v a l s
b e t w e e n a d j a c e n t n e u r a l r i n g s a t g i v e n l e v e l s i s c o d e d a s
a f r e q u e n c y h i s t o g r a m , a n d t h e h i s t o g r a m s f o r e v e r y l e v e l
a n d l t e r c h a n n e l a r e c o m b i n e d t o g e t h e r t o r e p r e s e n t o u t -
p u t s o f t h e E I H . F r o m t h e v i e w p o i n t o f s i g n a l p r o c e s s i n g ,
t h e u t i l i z a t i o n o f m u l t i p l e l e v e l - c r o s s i n g d e t e c t o r s c a n p r o -
v i d e i n t e n s i t y i n f o r m a t i o n , w h i c h m a y b e u s e f u l f o r s p e e c h
p r o c e s s i n g . H o w e v e r p r o p e r d e t e r m i n a t i o n o f t h e n u m b e r
o f l e v e l s a n d t h e l e v e l v a l u e s i s v e r y i m p o r t a n t t o t h e p e r -
f o r m a n c e . U n f o r t u n a t e l y t h e r e i s n o t h e o r y a v a i l a b l e t o
d e t e r m i n e t h o s e v a l u e s .
I n t h i s p a p e r , a n a n a l y t i c f o r m u l a i s d e v e l o p e d f o r v a r i -
a n c e a n d S N R o f t h e l e v e l c r o s s i n g i n t e r v a l s d u e t o a d d i -
t i v e w h i t e G a u s s i a n n o i s e a s a f u n c t i o n o f t h e l e v e l - c r o s s i n g
v a l u e , a n d a n e w f e a t u r e e x t r a c t i o n m e t h o d , z e r o - c r o s s i n g s
w i t h p e a k a m p l i t u d e s ( Z C P A ) , i s d e v e l o p e d f o r r o b u s t f e a -
t u r e e x t r a c t i o n s i n n o i s y e n v i r o n m e n t s .
2 . S T A T I S T I C A L A N A L Y S I S O F T H E L E V E L
V A L U E S
L e t ' s c o n s i d e r a n i n p u t s i g n a l o f t h e f o r m
x ( t ) =
M 1
X
= 0
A c o s ( ! t + ) + g v ( t ) ( 1 )
w h e r e v ( t ) i s w h i t e G a u s s i a n n o i s e w i t h z e r o m e a n a n d u n i t
v a r i a n c e , a n d S N R ( S i g n a l - t o - N o i s e R a t i o ) i s d e t e r m i n e d b y
t h e p a r a m e t e r g . L e t ' s a s s u m e t h a t t h e l t e r c h a r a c t e r i s t i c s
o f t h e l t e r b a n k i s i d e a l b a n d p a s s , a n d t h e b a n d w i d t h o f a
l t e r i s B . S u p p o s e t h a t e a c h s i n u s o i d a l c o m p o n e n t i n t h e
i n p u t s i g n a l i s s e p a r a t e d b y t h e l t e r b a n k , a n d t h e o u t p u t
o f t h e k - t h l t e r c o n s i s t s o f a s i n g l e s i n u s o i d a n d b a n d p a s s
n o i s e a s
x
k
( t ) = A c o s ( ! t + ) + g v
k
( t ) ( 2 )
A s s h o w n i n F i g . 1 , l e t ' s d e n o t e t h e u p w a r d l e v e l - c r o s s i n g
l o c a t i o n s b y t
n
, i . e . x
k
( t
n
) = l n = 1 2 ; : : : , t h e s u c c e s s i v e
l e v e l - c r o s s i n g i n t e r v a l s b y
n
= t
n + 1
? t
n
, a n d t h e p e r t u r -
b a t i o n i n t h e l e v e l - c r o s s i n g p o s i t i o n s b y r
n
. T h e m e a n o f
t h e u p w a r d l e v e l - c r o s s i n g i n t e r v a l c a n b e a p p r o x i m a t e d b y
2 = ! f o r A g , u s i n g t h e d o m i n a n t f r e q u e n c y p r i n c i p l e
4 ] . F r o m F i g . 1 , o n e o b t a i n s
A c o s ( ! t
n
+ ) = l ? V
n
( 3 )
A c o s ( ! ( t
n
? r
n
) + ) = l ( 4 )
w h e r e V
n
i s t h e i n s t a n t a n e o u s v a l u e o f t h e b a n d p a s s n o i s e a t
t
n
. N o w o n e s u b s t i t u t e s = ! t
n
+ a n d = c o s
1
( l = A )
a n d o b t a i n s
! r
n
= ? ( 5 )
S i n c e o n l y t h e u p w a r d l e v e l c r o s s i n g s a t p o s i t i v e l e v e l v a l u e s
a r e c o n s i d e r e d a n d ! r
n
i s a s s u m e d t o b e s m a l l , s o 3 = 2
T o a p p e a r i n P r o c . I C A S S P - 9 6 , M a y 7 - 1 0 , A t l a n t a , G A 1
c
I E E E 1 9 9 6
7/28/2019 Features Based on Zero-Crossing
2/4
l
t
sin(x)cosAi ( it )i +
vkg ( )t
- rntn tn
Vn
F i g u r e 1 . S i g n a l s a n d n o i s e c o m p o n e n t s a t t h e o u t -
p u t o f a b a n d p a s s l t e r
2 . B y t a k i n g c o s i n e f u n c t i o n o n E q . ( 5 ) , o n e o b t a i n s
c o s ( ! r
n
) =
l ? V
n
A
l
A
+
1 ?
l ? V
n
A
2
1 ?
l
A
2
1 = 2
( 6 )
W h e n ! r
n
i s s m a l l , E q . ( 6 ) c a n b e a p p r o x i m a t e d f u r t h e r a s
r
2
n
2
!
2
h
1 ? R
R ?
V
n
A
i
?
2
!
2
1 ?
R ?
V
n
A
2
?
1 ? R
2
1 = 2
( 7 )
w h e r e R = l = A , s i n = ? 1 ? ( ( l ? V
n
) = A )
2 1 = 2
, a n d
s n = ? 1 ? ( l = A )
2 1 = 2
a r e u t i l i z e d .
N o w , l e t ' s c o n s i d e r t w o s u c c e s s i v e l e v e l c r o s s i n g p e r t u r -
b a t i o n s r
n
a n d r
n + 1
, a n d t h e p e r t u r b a t i o n o f t h e c o r r e -
s p o n d i n g l e v e l - c r o s s i n g i n t e r v a l r
n
? r
n + 1
. V a r i a n c e o f t h e
i n t e r v a l p e r t u r b a t i o n s i s g i v e n a s
2
= E
r
n
? r
n + 1
2
= E
r
2
n
+ E
r
2
n + 1
( 8 )
w h e r e t h e r a n d o m v a r i a b l e s r
n
a n d r
n + 1
a r e a s s u m e d t o
h a v e z e r o m e a n a n d n e g l i g i b l e c o r r e l a t i o n . F r o m E q . ( 7 ) ,
o n e o b t a i n s
E
r
2
n
2
!
2
?
1 ? R
2
?
2
!
2
E
(
?
1 ? R
2
1 ?
R ?
V
n
A
2
1 = 2
)
( 9 )
w i t h E f V
n
g = 0 . T h e s e c o n d t e r m i n t h e r i g h t s i d e o f
E q . ( 9 ) i s a p p r o x i m a t e d a s
E
(
?
1 ? R
2
1 ?
R ?
V
n
A
2
1 = 2
)
1 ? R
2
?
1
A
2
1 +
R
2
1 ? R
2
1
2
B
g
2
( 1 0 )
w h e r e E
V
2
n
= B g
2
= a n d t h e 2 n d o r d e r T a y l o r s e r i e s
e x p a n s i o n
E f h ( x ) g =
Z
1
1
h ( x ) f
X
( x ) d x
h (
X
) + h (
X
)
2
X
2
( 1 1 )
i s u t i l i z e d f o r V
n
= A 1 , w h e r e
X
a n d
2
X
a r e t h e m e a n
a n d v a r i a n c e o f t h e r a n d o m v a r i a b l e s r e s p e c t i v e l y . F r o m
E q s . ( 8 ) , ( 9 ) a n d ( 1 0 ) , t h e v a r i a n c e o f t h e t i m e i n t e r v a l s b e -
t w e e n t w o a d j a c e n t l e v e l - c r o s s i n g s a r e r e p r e s e n t e d a s
2
=
( 2 B = ) g
2
( ! A )
2
1
1 ? ( l = A )
2
=
2
0
1
1 ? ( l = A )
2
( 1 2 )
w h e r e
2
0
i s t h e v a r i a n c e i n t h e c a s e o f z e r o - c r o s s i n g s , a n d
S N R =
2 = !
=
A
g
h
2
B
?
1 ? ( l = A )
2
i
1 = 2
( 1 3 )
i s t h e S N R o f t h e t i m e i n t e r v a l s . T h e v a r i a n c e o f t h e t i m e
i n t e r v a l b e t w e e n t w o a d j a c e n t l e v e l - c r o s s i n g s i s m i n i m u m
w h e n l i s z e r o . A s t h e l e v e l v a l u e l i n c r e a s e s f o r g i v e n A
a n d g , t h e v a r i a n c e i n c r e a s e s a n d S N R o f t h e t i m e i n t e r v a l s
d e c r e a s e s . T h e r e f o r e r e s u l t s w i t h h i g h e r l e v e l v a l u e s a r e
m o r e s e n s i t i v e t o a d d i t i v e n o i s e .
3 . Z E R O - C R O S S I N G S W I T H P E A K
A M P L I T U D E S
E v e n t h o u g h t h e h i g h e r v a l u e o f l e v e l i s s e n s i t i v e t o n o i s e ,
a p i l o t e x p e r i m e n t s h o w s t h a t t h e p e r f o r m a n c e o f t h e E I H
w i t h m u l t i p l e l e v e l - c r o s s i n g d e t e c t o r s i s s o m e w h a t s u p e r i o r
t o t h a t o f t h e E I H w i t h s i n g l e l e v e l - c r o s s i n g d e t e c t o r p r o -
v i d e d t h e l e v e l v a l u e s w e r e d e t e r m i n e d p r o p e r l y . T h i s m a y
c o m e f r o m t h e i n t e n s i t y i n f o r m a t i o n i n t h e m u l t i p l e l e v e l -
c r o s s i n g d e t e c t o r s . H o w e v e r t h e f r e q u e n c y i n f o r m a t i o n i n
h i g h e r l e v e l s m a y b e i n c o r r e c t i n n o i s y c o n d i t i o n a s s h o w n
i n s e c t i o n 2 . T h u s , a r o b u s t m e t h o d w h i c h c a n e s t i m a t e
f r e q u e n c y i n f o r m a t i o n a s w e l l a s i n t e n s i t y i n f o r m a t i o n e v e n
i n n o i s y c o n d i t i o n s i s r e q u i r e d . W e p r o p o s e a m e t h o d t o
i n c o r p o r a t e i n t e n s i t y i n f o r m a t i o n i n t h e z e r o - c r o s s i n g d a t a .
T h e d e v e l o p e d z e r o - c r o s s i n g s w i t h p e a k a m p l i t u d e s
( Z C P A ) m e t h o d u t i l i z e s z e r o - c r o s s i n g o n l y , b u t p e a k a m -
p l i t u d e b e t w e e n t h e t w o z e r o - c r o s s i n g t i m e s i s u s e d a s a
w e i g h t i n g f a c t o r f o r t h e f r e q u e n c y c o m p o n e n t . T h e o u t p u t
o f t h e Z C P A a t t i m e t i s g i v e n a s
y ( t i ) =
X
c h a n n e l
K 1
X
k = 1
j
k
f ( A
k
) 1 i N ( 1 4 )
w h e r e K i s t h e n u m b e r o f u p w a r d z e r o - c r o s s i n g s a t e a c h
l t e r c h a n n e l , N i s t h e n u m b e r o f f r e q u e n c y b i n s , j
k
i s t h e
i n d e x o f f r e q u e n c y b i n c o m p u t e d u s i n g t h e k - t h a n d ( k + 1 ) -
t h z e r o c r o s s i n g s , A
k
i s t h e p e a k a m p l i t u d e b e t w e e n t h e k - t h
2
7/28/2019 Features Based on Zero-Crossing
3/4
a n d ( k + 1 ) - t h z e r o - c r o s s i n g s , a n d
j
i s a K r o n e c k e r d e l t a .
T h e r i n g r a t e o f a u d i t o r y n e r v e b e r s s a t u r a t e s a b o v e a
c e r t a i n s t i m u l u s i n t e n s i t y 5 ] . f ( ) i s a m o n o t o n i c f u n c t i o n
w h i c h i m p l e m e n t s t h i s s a t u r a t i n g n o n l i n e a r i t y . I n c o n n e c -
t i o n w i t h h u m a n a u d i t o r y s y s t e m , l o g f u n c t i o n i s u s e d i n o u r
e x p e r i m e n t s . T h e f r e q u e n c y c o m p o n e n t i s f o u n d b y z e r o -
c r o s s i n g i n t e r v a l s o n l y , a n d t h e f r e q u e n c y b i n o f h i s t o g r a m i s
i n c r e a s e d b y a n a m o u n t o f f ( A
k
) . T h e u s e o f z e r o - c r o s s i n g s
i n n d i n g f r e q u e n c y c o m p o n e n t s m a k e s i t m o r e r o b u s t t o
n o i s e , a n d t h e s p e c t r a l i n t e n s i t y i n f o r m a t i o n i s a l s o i n c o r -
p o r a t e d . I t i s a l s o f r e e f r o m c o m p l i c a t i o n s t o d e t e r m i n e t h e
l e v e l v a l u e s a n d t h e n u m b e r o f l e v e l s i n t h e E I H .
F r o m t h e s i g n a l p r o c e s s i n g v i e w p o i n t s t h e Z C P A u t i l i z e s
z e r o - c r o s s i n g s o f t h e s i g n a l , a n d a z e r o - c r o s s i n g b a s e d s i g -
n a l r e p r e s e n t a t i o n i s v a l i d f o r b a n d - l i m i t e d s i g n a l s . I n t h e
c a s e o f p e r i o d i c b a n d - l i m i t e d s i g n a l , t h e y c a n b e r e c o v e r e d
w i t h i n a s c a l e f a c t o r f r o m t h e i r r e a l z e r o s , a n d r a t i o s b e -
t w e e n a n y o f t w o D F T c o e c i e n t s c a n b e c o m p u t e d . I n t h e
c a s e o f a p e r i o d i c s i g n a l s , t h e y c a n o n l y b e r e c o v e r e d a p -
p r o x i m a t e l y 6 ] . S r e e n i v a s a n d N i e d e r j o h n 7 ] p r o p o s e d a n
a l g o r i t h m t o a n a l y z e s p e c t r u m b a s e d o n t h e n o i s e t h r e s h -
o l d f o r t h e d e t e c t a b i l i t y o f a s i n u s o i d w h i c h w a s d e r i v e d
f r o m t h e s t a t i s t i c a l p r o p e r t i e s o f t h e z e r o - c r o s s i n g i n t e r v a l s
a t t h e o u t p u t o f a l t e r b a n k , a n d s h o w e d t h a t t h e i r a l -
g o r i t h m w a s r o b u s t t o n o i s e . C o m p a r i n g t h e Z C P A w i t h
S r e e n i v a s ' m e t h o d , S r e e n i v a s ' m e t h o d u t i l i z e s t h e r s t a n d
s e c o n d o r d e r s t a t i s t i c s o f z e r o - c r o s s i n g i n t e r v a l s w h i l e t h e
Z C P A i s t h e p r o b a b i l i t y d e n s i t y f u n c t i o n o f t h e i n v e r s e o f
z e r o - c r o s s i n g i n t e r v a l s a n d i n c o r p o r a t e s i n t e n s i t y i n f o r m a -
t i o n i n a n o n l i n e a r m a n n e r .
4 . E X P E R I M E N T S
4 . 1 . E x p e r i m e n t a l C o n d i t i o n s
S p e a k e r - i n d e p e n d e n t w o r d r e c o g n i t i o n e x p e r i m e n t s w e r e
c o n d u c t e d t o e v a l u a t e t h e r o b u s t n e s s o f p e r f o r m a n c e s u s -
i n g w o r d u t t e r a n c e s m a d e b y 2 0 s p e a k e r s . T h e v o c a b u l a r y
c o n s i s t s o f 7 5 p h o n e t i c a l l y - b a l a n c e d K o r e a n w o r d s w h i c h
a r e m u t u a l l y v e r y c o n f u s a b l e . E a c h s p e a k e r u t t e r e d t h e
w o r d s o n c e i n a q u i e t o c e e n v i r o n m e n t v i a a S e n n h e i s e r
H M D 2 2 4 X h e a d s e t . T h e u t t e r a n c e s w e r e s a m p l e d b y 1 6
k H z s a m p l i n g r a t e w i t h 1 6 b i t r e s o l u t i o n . T h e d a t a w e r e
d i v i d e d i n t o 4 s e t s , 5 s p e a k e r s e a c h . T h r e e s e t s a r e u s e d a s
r e f e r e n c e s , a n d t h e o t h e r s e t i s u s e d a s t e s t p a t t e r n s . B y
c h a n g i n g t h e c o m b i n a t i o n o f t h e s e t s , o n e o b t a i n s 4 d i e r -
e n t r e s u l t s f o r e a c h e x p e r i m e n t , a n d r e c o g n i t i o n a c c u r a c y
i s a v e r a g e d o v e r t h e 4 e x p e r i m e n t s t o n o r m a l i z e t h e s e n -
s i t i v i t y o f t h e r e s u l t s t o t h e d a t a s e t s . T o e v a l u a t e n o i s e
r o b u s t n e s s o f t h e f e a t u r e s , w h i t e G a u s s i a n n o i s e i s a d d e d t o
i s o l a t e d w o r d u t t e r a n c e s t o b e u s e d a s t e s t p a t t e r n s a t v a r -
i o u s S N R ' s . T h e g a i n o f t h e n o i s e i s a d j u s t e d t o m a k e t h e
d e s i r e d S N R , w h e r e S N R i s t h e e n e r g y r a t i o o f t h e w h o l e
u t t e r a n c e t o n o i s e . T h e l t e r b a n k u s e d i n t h e E I H a n d t h e
Z C P A i s t h e c o c h l e a r l t e r 8 ] w i t h 2 0 b a n d s w h e r e c e n t e r
f r e q u e n c i e s a r e d i s t r i b u t e d f r o m 2 0 0 t o 5 0 0 0 H z a c c o r d i n g
t o t h e f r e q u e n c y - p o s i t i o n r e l a t i o n s h i p 9 ]
F = A ( 1 0
a x
? 1 ) ( 1 5 )
w h e r e F i s f r e q u e n c y i n H z , x i s t h e n o r m a l i z e d d i s t a n c e
a l o n g t h e b a s i l a r m e m b r a n e w i t h v a l u e f r o m 0 t o 1 . T h e
a p p r o p r i a t e c o n s t a n t s f o r t h e h u m a n c o c h l e a a r e A = 1 6 5 4
a n d a = 2 1 . T h e l e n g t h o f a n a l y s i s w i n d o w s i s t e n t i m e s
o f t h e i n v e r s e o f t h e c e n t e r f r e q u e n c y t o g e t n e f r e q u e n c y
r e s o l u t i o n i n l o w e r f r e q u e n c y s i d e a n d n e t i m e r e s o l u t i o n i n
h i g h e r f r e q u e n c y s i d e . F r e q u e n c y b i n s d i v i d e t h e f r e q u e n c y
r a n g e 0 , 5 0 0 0 ] H z i n t o 1 8 r e g i o n s a c c o r d i n g t o t h e b a r k
s c a l e . N e a r e s t n e i g h b o r c l a s s i e r w i t h t r a c e - s e g m e n t a t i o n
1 0 ] i s u s e d f o r t h e t e s t e v a l u a t i o n .
4 . 2 . R e s u l t s o f t h e E I H
F i g . 2 c o m p a r e s r e c o g n i t i o n r a t e s o f t h e E I H w i t h s e v e r a l
d i e r e n t n u m b e r o f l e v e l s a n d d i e r e n t l e v e l v a l u e s . L e v e l
v a l u e s o f t h e E I H a r e u n i f o r m l y d i s t r i b u t e d o n a l o g 2 s c a l e
o v e r t h e p o s i t i v e a m p l i t u d e r a n g e o f t h e s i g n a l , a n d t h e
r s t d i g i t f o l l o w i n g t h e \ L " d e n o t e s t h e n u m b e r o f l e v e l s
u s e d i n t h e E I H . T h e s e c o n d d i g i t r e p r e s e n t s t h e r a n g e o f
t h e c r o s s i n g l e v e l v a l u e s . H i g h e r v a l u e s o f t h e s e c o n d d i g i t
m e a n t h a t t h e c r o s s i n g l e v e l v a l u e s a r e d i s t r i b u t e d i n l o w e r
r a n g e . F o r e x a m p l e , t h e h i g h e s t l e v e l v a l u e o f L 3 . 1 i s f o u r
t i m e s h i g h e r t h a n t h a t o f L 3 . 3 . A n d t h e s a m e v a l u e o f t h e
s e c o n d d i g i t f o r t h e E I H ' s w i t h d i e r e n t n u m b e r o f l e v e l s
m e a n s t h a t t h e h i g h e s t l e v e l v a l u e s a r e s a m e . F o r e x a m p l e
t h e h i g h e s t l e v e l v a l u e o f L 5 . 7 i s s a m e a s t h a t o f L 3 . 7 a n d
L 7 . 7 , a n d L 5 . 7 h a s a d d i t i o n a l 2 l o w e r l e v e l s c o m p a r e d w i t h
L 3 . 7 .
R e c o g n i t i o n r a t e s o f t h e E I H t e n d t o i n c r e a s e a s t h e l e v e l
v a l u e s a r e l o w e r e d . H o w e v e r i f t h e l e v e l v a l u e s a r e t o o l o w ,
t h e i n f o r m a t i o n o b t a i n e d f r o m s o m e l o w e r l e v e l s w i l l b e d u -
p l i c a t e d , a n d r e c o g n i t i o n r a t e s d e c r e a s e t o s o m e e x t e n t .
0
20
40
60
80
100
L3.1 L3.3 L3.5 L3.7 L5.1 L5.3 L5.5 L5.7 L7.1 L7.3 L7.5 L7.7
Recog
nitionRate(%)
Feature
CleanSNR = 30dBSNR = 20dBSNR = 10dB
SNR = 0dB
F i g u r e 2 . R e c o g n i t i o n r a t e s o f t h e E I H ' s w i t h m u l t i -
p l e l e v e l s a t v a r i o u s S N R ' s . T h e r s t d i g i t f o l l o w i n g
\ L " d e n o t e s t h e n u m b e r o f l e v e l s u s e d i n t h e E I H ,
a n d h i g h e r v a l u e s o f t h e s e c o n d d i g i t m e a n t h a t t h e
c r o s s i n g l e v e l v a l u e s a r e d i s t r i b u t e d i n l o w e r r a n g e .
4 . 3 . R e s u l t s o f t h e Z C P A a n d C o m p a r i s o n w i t h
O t h e r F e a t u r e s
F i g . 3 c o m p a r e s r e c o g n i t i o n r a t e s o f t h e Z C P A w i t h t h e
E I H ' s a n d L P C - d e r i v e d c e p s t r u m a t v a r i o u s S N R ' s . C o m -
p a r i s o n o f r e c o g n i t i o n r a t e s o f t h e Z C P A a n d o t h e r f e a t u r e s
a t v a r i o u s S N R ' s i s s h o w n i n F i g . 3 . L P C - d e r i v e d c e p s t r u m
i s o n e o f t h e m o s t w i d e l y u s e d f e a t u r e s i n s p e e c h r e c o g n i -
t i o n t a s k s . T h e n u m b e r o f c e p s t r a l c o e c i e n t s w a s v a r i e d
t o b e 1 2 a n d 1 8 , a n d w e c h o s e 1 8 c e p s t r a l c o e c i e n t s w h i c h
p r o d u c e d h i g h e r r e c o g n i t i o n r a t e . R e c o g n i t i o n r a t e o f t h e
L P C - d e r i v e d c e p s t r u m d e c r e a s e s s e v e r e l y a s n o i s e l e v e l i s
3
7/28/2019 Features Based on Zero-Crossing
4/4
i n c r e a s e d . I f w e c o m p a r e t h e Z C P A w i t h t h e E I H ( L 7 . 1 ) o f
w h i c h t h e h i g h e s t l e v e l v a l u e i s s e t t o b e a t 6 . 4 % o f t h e
p o s s i b l e m a x i m u m v a l u e o f t h e s i g n a l a t t h e o u t p u t o f e a c h
c h a n n e l , r e c o g n i t i o n r a t e s o f t h e Z C P A a r e h i g h e r b y 1 0 . 3 % ,
8 . 9 % , 7 . 2 % , a n d 1 1 . 1 % t h a n t h a t o f t h e E I H a t c l e a n , 3 0 d B
S N R , 2 0 d B S N R , a n d 1 0 d B S N R , r e s p e c t i v e l y . C o m p a r -
i n g t h e Z C P A w i t h t h e E I H ( L 7 . 5 ) o f w h i c h t h e l e v e l v a l u e s
a r e s e t t o p r o p e r v a l u e s ( t h e h i g h e s t l e v e l v a l u e i s s e t t o b e
a t 0 . 4 % o f t h e p o s s i b l e m a x i m u m v a l u e o f t h e s i g n a l ) , t h e
d i e r e n c e s i n r e c o g n i t i o n r a t e s b e t w e e n t h e E I H a n d t h e
Z C P A a r e l e s s t h a n 2 % a b o v e 2 0 d B S N R . R e c o g n i t i o n r a t e
o f t h e Z C P A i s 6 . 2 % h i g h e r t h a n t h a t o f t h e E I H ( L 7 . 5 ) a t
1 0 d B S N R . T h i s d e m o n s t r a t e s l o w s e n s i t i v i t y o f t h e Z C P A
t o a d d i t i v e r a n d o m n o i s e .
0
20
40
60
80
100
Clean 30 20 10 0
Recognitio
nRate(%)
SNR(dB)
CEPEIH(L7.1)EIH(L7.5)
ZCPA
F i g u r e 3 . C o m p a r i s o n o f r e c o g n i t i o n r a t e s o f t h e
Z C P A w i t h o t h e r f e a t u r e s a t v a r i o u s S N R ' s
5 . C O N C L U S I O N
T h e E I H i s a n a u d i t o r y m o d e l w h i c h c a n b e u s e d a s a r o -
b u s t \ f r o n t - e n d " f o r s p e e c h r e c o g n i t i o n s y s t e m s . T h e u t i -
l i z a t i o n o f m u l t i p l e l e v e l - c r o s s i n g d e t e c t o r s i n t h e E I H p r o -
v i d e s f r e q u e n c y a n d i n t e n s i t y i n f o r m a t i o n o f i n p u t s i g n a l
w h i c h m a y b e u s e f u l f e a t u r e s , a n d p r o p e r d e t e r m i n a t i o n o f
t h e n u m b e r o f l e v e l s a n d t h e l e v e l v a l u e s i s v e r y i m p o r -
t a n t . H o w e v e r t h e r e i s n o t h e o r y a v a i l a b l e t o d e t e r m i n e
t h o s e v a l u e s . I n t h i s p a p e r i t i s s h o w n t h e o r e t i c a l l y t h a t
t h e v a r i a n c e o f t h e l e v e l - c r o s s i n g i n t e r v a l s i n c r e a s e s a s t h e
l e v e l v a l u e i s i n c r e a s e d i n p r e s e n c e o f a d d i t i v e w h i t e G a u s -
s i a n n o i s e . A l s o a n e w f e a t u r e e x t r a c t i o n m e t h o d b a s e d o n
z e r o - c r o s s i n g s w i t h p e a k a m p l i t u d e s ( Z C P A ) i s i n t r o d u c e d
i n w h i c h t h e i n t e n s i t y i n f o r m a t i o n o f t h e s t i m u l u s i s i n c o r -
p o r a t e d b y t h e p e a k d e t e c t i o n a n d s a t u r a t i n g n o n l i n e a r i t y ,
a n d t h e u t i l i z a t i o n o f z e r o - c r o s s i n g s i n e s t i m a t i n g f r e q u e n c y
m a k e s i t m o r e r o b u s t t o n o i s e w i t h o u t c o m p l i c a t i o n s o f d e -
t e r m i n i n g l e v e l - c r o s s i n g v a l u e s . S p e a k e r - i n d e p e n d e n t w o r d
r e c o g n i t i o n e x p e r i m e n t d e m o n s t r a t e s t h e r o b u s t n e s s o f t h e
p r o p o s e d f e a t u r e e x t r a c t i o n m e t h o d o v e r t h e c o n v e n t i o n a l
o n e .
6 . A C K N O W L E D G M E N T
S p e e c h d a t a b a s e u s e d i n t h i s w o r k i s d i s t r i b u t e d b y C o m -
m u n i c a t i o n s R e s e a r c h L a b o r a t o r y , D e p a r t m e n t o f E l e c t r i c a l
E n g i n e e r i n g , K A I S T . A l s o , t h e a u t h o r s w o u l d l i k e t o t h a n k
P r o f e s s o r X u e l o n g Z h u o f T s i n g h u a U n i v e r s i t y f o r h i s u s e f u l
c o m m e n t s .
R E F E R E N C E S
1 ] O . G h i t z a , \ A u d i t o r y m o d e l s a n d h u m a n p e r f o r m a n c e s
i n t a s k s r e l a t e d t o s p e e c h c o d i n g a n d s p e e c h r e c o g -
n i t i o n , " I E E E T r a n s . S p e e c h a n d A u d i o P r o c e s s i n g
v o l . 2 , n o . 1 , p a r t I I , p p . 1 1 5 { 1 3 2 , 1 9 9 4 .
2 ] S . S e n e , \ P i t c h a n d s p e c t r a l e s t i m a t i o n o f s p e e c h
b a s e d o n a u d i t o r y s y n c h r o n y m o d e l , " i n P r o c . I E E E
I n t . C o n f . o n A c o u s t . , S p e e c h , a n d S i g n a l P r o c e s s i n g
p p . 3 6 . 2 . 1 { 3 6 . 2 . 4 , 1 9 8 4 .
3 ] K . W a n g a n d S . A . S h a m m a , \ S e l f - n o r m a l i z a t i o n a n d
n o i s e - r o b u s t n e s s i n e a r l y a u d i t o r y r e p r e s e n t a t i o n s , "
I E E E T r a n s . S p e e c h a n d A u d i o P r o c e s s i n g , v o l . 2 , n o . 3 ,
p p . 4 2 1 { 4 3 5 , 1 9 9 4 .
4 ] B . K e d e m , \ S p e c t r a l a n a l y s i s a n d d i s c r i m i n a t i o n b y
z e r o - c r o s s i n g s , " P r o c . I E E E , v o l . 7 4 , p p . 1 4 7 7 { 1 4 9 3 ,
N o v e m b e r 1 9 8 6 .
5 ] M . B . S a c h s a n d P . J . A b b a s , \ R a t e v e r s u s l e v e l f u n c -
t i o n s f o r a u d i t o r y n e r v e b e r s i n c a t s : T o n e b u r s t s t i m -
u l i , " J . A c o u s t . S o c . A m e r i c a , v o l . 5 6 , n o . 6 , p p . 1 8 3 5 {
1 8 4 7 , 1 9 7 4 .
6 ] S . M . K a y a n d R . S u d h a k e r , \ A z e r o c r o s s i n g - b a s e d
s p e c t r u m a n a l y z e r , " I E E E T r a n s . A c o u s t . , S p e e c h , S i g -
n a l P r o c e s s i n g , v o l . A S S P - 3 4 , p p . 9 6 { 1 0 4 , F e b . 1 9 8 6 .
7 ] T . V . S r e e n i v a s a n d R . J . N i e d e r j o h n , \ Z e r o - c r o s s i n g
b a s e d s p e c t r a l a n a l y s i s a n d S V D s p e c t r a l a n a l y s i s f o r
f o r m a n t f r e q u e n c y e s t i m a t i o n i n n o i s e , " I E E E T r a n s .
S i g n a l P r o c e s s i n g , v o l . 4 0 , n o . 2 , p p . 2 8 2 { 2 9 3 , 1 9 9 2 .
8 ] J . M . K a t e s , \ A t i m e - d o m a i n d i g i t a l c o c h l e a r m o d e l , "
I E E E T r a n s . S i g n a l P r o c e s s i n g , v o l . 3 9 , n o . 1 2 ,
p p . 2 5 7 3 { 2 5 9 2 , 1 9 9 1 .
9 ] D . G r e e n w o o d , \ A c o c h l e a r f r e q u e n c y - p o s i t i o n f u n c -
t i o n f o r s e v e r a l s p e c i e s { 2 9 y e a r s l a t e r , " J . A c o u s t . S o c .
A m e r i c a , v o l . 8 7 , n o . 6 , p p . 2 5 9 2 { 2 6 5 0 , 1 9 9 0 .
1 0 ] H . F . S i l v e r m a n a n d N . R . D i x o n , \ S t a t e c o n s t r a i n e d
d y n a m i c p r o g r a m m i n g ( S C D P ) f o r d i s c r e t e u t t e r a n c e
r e c o g n i t i o n , " i n P r o c . I E E E I n t . C o n f . o n A c o u s t . ,
S p e e c h , a n d S i g n a l P r o c e s s i n g , p p . 1 6 9 { 1 7 2 , 1 9 8 0 .
4