14-Structure of a full-length cDNA clone for the preproal(I) chain.pdf

Embed Size (px)

Citation preview

  • 8/10/2019 14-Structure of a full-length cDNA clone for the preproal(I) chain.pdf

    1/4

    B i o c h e m . J . 1 9 8 8 ) 2 5 3 ,

    9 1 9 - 9 2 2

    P r i n t e d i n

    G r e a t B r i t a i n )

    S t r u c t u r e

    o f

    a

    f u l l - l e n g t h cDNA c l o n e f o r

    t h e

    p r e p r o a l I )

    c h a i n

    o f human

    t y p e

    I

    p r o c o l l a g e n

    G e r a r d

    TROMP,*

    H e l e n a

    KUIVANIEMI,*

    A l e x STACEY,t H i d e o

    SHIKATA,*

    C l i n t o n T .

    BALDWIN,*

    R u d o l f

    JAENISCHt a n d

    D a r w i n

    J . PROCKOP*

    *

    D e p a r t m e n t o f B i o c h e m i s t r y

    a n d

    M o l e c u l a r

    B i o l o g y ,

    J e f f e r s o n

    I n s t i t u t e o f M o l e c u l a r M e d i c i n e , Thomas

    J e f f e r s o n U n i v e r s i t y ,

    J e f f e r s o n

    M e d i c a l

    C o l l e g e ,

    P h i l a d e l p h i a ,

    PA

    1 9 1 0 7 , U . S . A . ,

    a n d

    t

    W h i t e h e a d

    I n s t i t u t e f o r

    B i o m e d i c a l R e s e a r c h

    a n d

    D e p a r t m e n t

    o f

    B i o l o g y ,

    M a s s a c h u s e t t s

    I n s t i t u t e

    o f

    T e c h n o l o g y , C a m b r i d g e ,

    MA

    0 2 1 4 2 ,

    U . S . A .

    A f u l l - l e n g t h cDNA c l o n e f o r t h e

    human

    p r e p r o c a l I ) c h a i n o f t y p e

    I p r o c o l l a g e n

    w a s

    c h a r a c t e r i z e d .

    N u c l e o t i d e s e q u e n c i n g

    o f t h e f i r s t 1 5 0 0 n u c l e o t i d e r e s i d u e s o f t h e

    5 - e n d o f t h e cDNA c l o n e

    p r o v i d e d

    7 2 9

    n u c l e o t i d e r e s i d u e s a n d t h e c o d o n s f o r 2 4 3

    a m i n o a c i d

    r e s i d u e s

    n o t

    p r e v i o u s l y

    d e f i n e d f r o m

    a n y

    s p e c i e s .

    T h e

    d a t a m a d e i t

    p o s s i b l e ,

    f o r t h e

    f i r s t t i m e ,

    t o

    c o m p a r e c o m p l e t e l y

    c o d o n u s a g e f o r t h e human o c l I ) a n d z 2 I

    c h a i n s .

    INTRODUCTION

    T y p e

    I

    c o l l a g e n

    i s

    t h e

    m a j o r c o m p o n e n t

    o f

    b o n e ,

    t e n d o n ,

    s k i n a n d d e n t i n e f o r r e v i e w s

    s e e

    P r o c k o p

    K i v i r i k k o ,

    1 9 8 4 ;

    B u r g e s o n M o r r i s , 1 9 8 6 ) . I t

    i s

    a

    h e t e r o t r i m e r w i t h t h e c h a i n

    c o m p o s i t i o n [ a l I ) ] 2 a 2 I ) ,

    a n d

    i t i s

    f i r s t

    s y n t h e s i z e d a s

    a p r o c o l l a g e n c o m p r i s e d o f

    t w o

    p r o a c l I ) a n d

    o n e p r o a 2 I )

    c h a i n s .

    A l t h o u g h

    d a t a o n

    t h e

    c o m p l e x

    s t r u c t u r e o f

    t y p e

    I

    c o l l a g e n

    a r e now a v a i l a b l e ,

    a

    c o m p l e t e

    n u c l e o t i d e s e q u e n c e

    f o r

    t h e

    p r e p r o a l

    1 I

    cDNA

    h a s n o t

    h i t h e r t o b e e n

    d e t e r m i n e d .

    H e r e w e

    r e p o r t

    t h e

    p a r t i a l s e q u e n c e

    o f

    a

    f u l l - l e n g t h

    human

    cDNA c l o n e c o d i n g f o r

    a

    p r e p r o a c l I )

    c h a i n

    i s o l a t e d

    p r e v i o u s l y S t a c e y

    e t

    a l . ,

    1 9 8 7 ) .

    T h e

    i n f o r m a t i o n

    p r o v i d e d

    b y

    t h e

    s e q u e n c i n g

    o f

    t h i s c l o n e w i l l b e

    o f

    g r e a t

    h e l p

    i n

    s t u d y i n g

    m u t a t i o n s

    i n

    t y p e I

    p r o c o l l a g e n

    g e n e s

    i n

    d i s e a s e s s u c h a s

    o s t e o g e n e s i s i m p e r f e c t a , E h l e r s - D a n l o s

    s y n d r o m e

    a n d M a r f a n

    s y n d r o m e s e e P r o c k o p

    K i v i r i k k o , 1 9 8 4 ; B y e r s

    B o n a d i o ,

    1 9 8 5 ; P r o c k o p

    K u i v a n i e m i ,

    1 9 8 6 ) .

    MATERIALS

    AND

    METHODS

    N u c l e o t i d e s e q u e n c i n g

    o f

    cDNA c l o n e f o r p r e p r o c l I )

    c o l l a g e n

    T h e i s o l a t i o n

    a n d p a r t i a l

    c h a r a c t e r i z a t i o n

    o f t h e

    f u l l -

    l e n g t h human p r e p r o a l I ) cDNA

    c l o n e

    p H U C I )

    h a s

    1 0 0 b p

    a )

    E

    Av RR

    P Av

    Av XPAv

    Av

    Av

    - Y

    I r

    Av X

    E

    P XP

    X

    P

    B a

    P

    E

    E

    b )

    pHC

    H f

    4 0 4

    I

    H f 6 7 7

    ~ p H U C I

    5 0 0

    b p

    H

    -l

    F i g .

    1 .

    S e q u e n c i n g

    s t r a t e g y

    u s e d

    a n d

    p a r t i a l

    r e s t r i c t i o n

    map

    o f

    t h e

    cDNA

    c l o n e f o r

    p r e p r o a l I

    c h a i n

    p H U C I )

    a )

    S e q u e n c e

    s t r a t e g y

    u s e d f o r t h e a b o u t 1 . 5 k b E c o R I / X h o I

    f r a g m e n t

    o f

    p H U C I .

    A r r o w s

    s t a r t i n g

    w i t h

    X

    i n d i c a t e c l o n e s

    t h a t

    w e r e

    g e n e r a t e d b y

    t h e

    S e q u e n e s t

    t r a n s p o s o n - d e l e t i o n

    s y s t e m .

    O t h e r

    a r r o w s i n d i c a t e c l o n e s

    s t a r t i n g

    a t

    c o r r e s p o n d i n g

    r e s t r i c t i o n

    s i t e s .

    b )

    P a r t i a l r e s t r i c t i o n

    m ap

    f o r e n t i r e

    p H U C I . C ] ,

    U n t r a n s l a t e d

    r e g i o n .

    T h e

    r e g i o n s

    c o d i n g

    f o r

    t h e

    p r o t e i n

    d o m a i n s a r e

    i n d i c a t e d b y s h a d i n g a n d h a t c h i n g : X, p r o p e p t i d e s ; U , t e l o p e p t i d e s ; C , t r i p l e - h e l i c a l

    d o m a i n ;

    E ,

    s i g n a l

    p e p t i d e .

    A l s o

    s h o w n

    a r e

    t h e

    r e l a t i v e

    s i z e s o f t w o c l o n e s

    p r e v i o u s l y r e p o r t e d

    C h u

    e t

    a l . ,

    1 9 8 2 ;

    B e r n a r d

    e t

    a l . , 1 9 8 3 b )

    f o r t h e

    human

    p r o a l I )

    c h a i n

    H f 4 0 4

    a n d

    H f 6 7 7 ) . S y m b o l s : A v ,

    A v a I

    s i t e ;

    B a ,

    BamHI

    s i t e ; E ,

    E c o R I

    s i t e ; P ,

    P v u I I

    s i t e ;

    R ,

    R s a I

    s i t e ; X ,

    X h o I

    s i t e .

    t

    - T o

    w h o m

    c o r r e s p o n d e n c e

    s h o u l d b e a d d r e s s e d .

    T h e s e

    s e q u e n c e

    d a t a

    h a v e b ee n

    s u b m i t t e d

    t o

    t h e

    E M B L / G e n B a n k

    L i b r a r i e s .

    V o l .

    2 5 3

    x

    9 1 9

  • 8/10/2019 14-Structure of a full-length cDNA clone for the preproal(I) chain.pdf

    2/4

    9 2 0

    G .

    T r o m p

    a n d

    o t h e r s

    + 6 1

    + 1 0 3

    1 1 3

    c h i c k e n

    C

    T G S A T A A

    T C

    C T

    A

    C C

    C

    - -

    - G A

    C AA A G

    C A

    T A

    h u m a n

    G O

    C A C

    G CG G AG

    T G T

    G A G

    6 C C

    A C G

    C A T G A G

    C G O

    A C G

    C T A A CC C CC

    T C C

    C C A

    G C C

    A C A

    A A G

    A G T C T A C AT

    G T C T A G

    G O T

    h u m a n H e t

    S er G ly

    A r g

    S t o p

    M e t S e r

    A r g V a l

    c h i c k e n

    -

    T h r

    A r g

    P r o

    - -

    A s n

    l i e

    + 1 2 0

    v

    2 0 3

    c h i c k e n

    T

    T

    T C T T A

    G

    T G

    A

    A G

    T

    TA

    A

    C CG

    G G

    G A

    A G

    h u m a n

    C T A G A C A T G T TC

    A G C m

    T G

    G A C

    C T C C O G C T C C T G C T C C T C T T A

    O C G

    6C C

    A C C

    G C C

    C T C

    C T G A C G

    C A C

    G O C

    C A A

    G A G

    G M A A

    GC

    C A A

    G T C

    h u m a n S t o p

    M e t P he S e r

    P h e

    V a l

    A s p

    L e u

    A r g L e u

    L eu L eu

    L o u L eu

    A l a

    A l a

    T h r

    A l a

    L e u L e u

    T h r

    Hi s

    G l y

    G l n

    G 1 u

    G l u

    G l y

    G i n

    V a l

    c h i c k e n

    -

    S e r

    l

    l-

    -

    a

    rg

    Gl u

    Gly

    -Glu'

    *

    b o v i n e G l u

    - - - -

    G l u

    2 8

    I 2

    2 9 3

    c h i c k e n

    - - -

    -- -

    _ _

    AG A C

    6 G G

    G C

    6 G G

    C

    A

    C T

    A A G

    T

    A

    G

    h u m a n

    G AG G GC C AA G AC G A A

    G A C

    T C

    C C A

    C C A

    A T C

    A C C T G C

    G T A

    C A G

    A A C

    G G C

    C T C

    A G G

    T A C

    C A T

    G A C

    C GA G AC

    G T G

    T GO A AA

    C C C

    G A G

    C CC T GC

    h u m a n

    G l u

    G ly G l n

    A s p

    G i u A s p

    I l e

    P r o P r o I l e T h r

    C y s

    V a l

    G i n

    A s n

    G l y

    Le u A r g

    T y r

    H i s

    A s p

    A r g

    A s p

    V a l

    T r p L y s P r o

    G l u

    P r o

    C y s

    c h i c k e n

    * *

    - - G l n T h r

    G l y

    S e r -

    - -

    A s p

    - - T h r

    -

    A s n

    -

    L y s

    b o v i n e

    -

    - -

    a l

    -

    - - -

    As p-

    -

    -

    - - - -

    -

    -

    -

    5 8

    3 8 3

    c h i c k e n

    A G C

    A C C C

    C

    G

    C G C T C C G A A A

    T T C

    h u m a n C G O

    A T C

    T G C G T C

    T G C

    G AC A AC G G C

    A A G

    G T G

    T T G

    t G C G A T G A C G T G A T C

    T G T

    G A C

    G A G A C C A A G A A C

    T G C

    C C C

    G G C G C C

    G A A

    G T C

    C C C

    G A G

    h u m a n

    A r g I I *

    C y s

    V a l C y s A s p A s n G l y

    L y s

    V a l

    L e u

    C y s

    A s p A s p

    V a l I I e

    C y s

    A sp G l u

    T h r

    L y s

    A s n C y s P ro

    G l y

    A l a G 6 u

    V o l

    P r o

    G 6 u

    c h i c k e n

    G i n

    -

    - - - -

    S e r

    -

    A s n

    I l e

    -

    -

    -

    G 6u

    - - -

    G l u

    A s p

    -

    S er A sp

    -

    - A s n

    -

    - I 1 i

    -

    P h e

    b o v i n e

    G i n -

    - - -

    - - -

    A s n

    -

    - - - - - -

    -

    -

    G l n L e u

    -

    A s p

    -

    - A s n

    -

    L y s

    -

    -

    T h r

    8 8

    | E

    E 4 4 7 3

    c h i c k e n

    A

    C

    A

    T

    T

    GA C K I C

    C A

    G T

    T

    C S G 6

    T

    G

    T A A T T

    A

    C

    h u m n

    G G C

    G A G

    T G C

    T G T

    C CC G TC

    T G C

    C C C

    G A C G G C

    T C A

    G A G t CA C CC

    A C C G A C C A A

    G A

    A C C

    A C C

    G G C

    GT C

    GAG

    GGA

    C C C

    A A G G G A

    G A C A C T

    G G C

    h u m a n

    G l y G l u

    C y s

    C y s P ro

    V o l

    C y s

    P r o

    A s p G l y

    S e r

    G l u

    S e r

    P r o

    T h r A s p G i n

    G 6 u

    T h r T h r G l y

    V a l

    G l u G ly

    P ro L y s

    G l y

    A s p

    T h r

    G l y

    c h i c k e n -

    -

    - -

    -

    I l e -

    - -

    V o l

    A sp A l a

    - -

    V o l T y r

    P r o -

    S e r A la

    -

    - - -

    - - - -

    -

    b o v i n e

    A s p

    -

    - - - -

    -

    -

    G l u

    -

    G i n -

    - - - -

    -

    - -

    - -

    -

    -

    -

    - - - -

    1 1 8

    I E S

    5 6 3

    c h i c k e n

    A

    A

    SAC

    T

    CC

    C

    A C

    C G A C

    T A

    h u m a n C C C C G A G GC C CA AGG6A

    C C C

    G C A G G C C C C

    C c T

    G G C

    C C A

    G A T

    G G C

    A T C C C T

    G G A

    C A G C C T

    G G A

    c C CC G G A C C C

    C C C

    G G A

    C C C

    C C C

    G G A

    h u m a n P r o

    A r g S l y

    P r o A r g G l y

    P r o A l a G l y

    P r o P r o G l y

    A rg A sp

    S l y I l e

    P r o

    G l y G i n

    P r o

    G l y

    L e u P r o

    G ly P ro

    P ro S l y

    P r o

    P r o

    S l y

    c h i c k e n -

    -

    -

    A s p

    -

    -

    L o u

    P r o

    -

    -

    -

    - - - - -

    -

    - - - - -

    -

    - -

    - - -

    - -

    b o v i n e

    -

    - - - -

    - - - - -

    - - -

    - - - - -

    - - - - - - -

    - - - - -

    1 4 8

    A | E 6

    4 6 5 3

    h u m a n

    C C T

    C C C

    G G A C C C

    C c T

    G G C

    C T C

    T

    A

    G

    AGAAC

    mC T C C C C A 6

    C T G T C T

    T A T G G C T A T

    S AT

    G A G

    A A A

    T C A A CC G S A G S A A T T

    T C C

    G T G C C T

    humn P r o P r o G l y P r o

    P r o

    S l y L e u G l y G l y

    A s n P h e

    A l a

    P r o

    G i n

    L e o S o r T y r G l y

    T y r

    A s p

    G l u Ly s S e r T h y S l y G l y l I e

    S e r V a l P r o

    c h i c k e n

    - - -

    6 l u

    t -

    - - - -

    - -

    -

    A l e

    -

    *

    V a l

    A i a

    -

    -

    b o v i n e

    -

    -

    -

    - -

    - - - -

    - - - -

    6 l u

    -

    -

    -

    - - -

    -

    - - -

    -

    *

    1 7 8

    h u m a n G G C

    C C C

    A T 6 I S

    C C C

    TCT G G t

    C C T C G T

    G 6 T

    C T C

    CC T

    G GC C C C

    C C T

    G G t

    TCA C C T

    G 6 t

    C C C

    CM G G C

    TT C

    C A A

    GGT C C C

    C C T

    G

    G A

    C C T

    h u m n

    S l y

    P r o

    M e t G l y P ro S e r G i y P ro A rg

    S l y

    L e u

    P r o S l y

    P r o P r o S l y

    A l a P ro

    S l y

    P r o

    G i n

    S l y P h e

    G l n

    G i y

    P r o

    P r o

    G l y

    G l u P r o

    c h i c k e n

    - - -

    -

    -

    Al a

    -

    - -

    - -

    -

    - - -

    -

    -

    - - - - - -

    -

    -

    _

    b o v i n e

    -

    - - -

    -

    - - - -

    - -

    - - - - - -

    -

    2 0 8

    8 3 3

    humn G 6 C

    S A G C C T

    G G A G C T

    T C A G G T

    C C C

    A T G

    6 6 T

    C C C C S A

    G 6 T

    C C C C C A

    G G T C C C

    C C T

    G S A A AS A AT

    G S A

    S A T

    S A T B B S G S G C T

    G S A A A C C T

    h u m a n

    S l y

    G 1 u

    P r o

    G l y

    A l a

    S e r

    S l y

    P r o H e t

    G l y

    P r o

    A r g

    S l y

    P ro P ro

    G l y

    P r o P r o

    S l y L y s

    A s n

    S l y

    A s p A s p S l y G 6 u A l a S l y

    L y s

    P r o

    c h i c k e n

    -

    - - -

    - - - - -

    - - -

    - -

    Al-

    b o v i n e

    2 3 8

    9 2 3

    h u m a n

    G G t

    C G T

    C C T

    G 6 t

    GAG

    C G T

    G G G C C T C C T G G S

    C C T

    C A 6

    G G t

    G C T

    CT A

    A T T G

    C C C

    G S A A C A G C T

    G G C

    C T C

    C C T

    G S A A T G

    U G

    G G A

    C A C A S A

    h u m n

    G l y

    A r g

    P r o

    S l y

    G l u A r g

    G l y

    P r o P r o

    G l y

    P r o

    G i n

    G l y

    A l a

    A r g

    G l y

    L e u

    P r o

    G l y

    T h r

    A l e

    S l y

    L o u

    P r o

    G l y

    M e t L y s

    S l y

    Hi s

    A r g

    c h i c k e n

    - - -

    S i n .

    b o v i n e

    2 6 8

    1 0 1 3

    h u m n

    G t T T C

    AGT

    G t

    T T G G A T

    G G t

    G C C A A M

    GGAAT G C T

    G G T

    C C T G C T Gt

    C C T

    AAM

    G G T

    SAG

    C C T

    GG C A G C C C T Gt

    A A

    A A T

    GG AG C T C C T

    h u m a n

    G l y

    P h e

    S e r

    G l y

    Le u A s p

    G l y

    A l a

    L y s

    S l y A s p

    A l e

    S l y P r o

    A l e

    G l y

    P r o L y s

    G l y

    G l u P r o G l y S e r P r o

    G l y

    G l u

    A s n

    G l y

    A l a P ro

    c h i c k e n

    -

    - - -

    - - - - - - G i n

    P r o

    -

    b o v i n e

    2 9 8

    1 1 0 3

    humn G G T

    C A G

    A T G

    G GC C CC

    C G T

    G G C

    C T G C C T G G tG A T

    A G A

    G G T

    C G C

    C C T

    G G A

    G C C C C T

    G G C

    C C T G CT G G T G Ct C GT

    G G A

    A M T

    G A T

    G G T

    G C T

    A C T

    humn

    G l y

    G l n M e t

    G l y

    P r o

    A r g

    G l y

    L e u

    P r o

    G l y

    G l u A r g G l y

    A r g

    P r o

    G l y

    A l a

    P r o

    G l y

    P ro A la G l y A l a A r g G l y

    A sn A sp

    S l y

    A l a

    T h r

    c h i c k e n

    -

    -

    -

    b o v i n e

    3 2 8

    1 1 9 3

    h u m a n

    G G t

    TC T G C C

    G G G

    C C C

    C C T

    G G t

    C C C

    A C C

    G G C C C C

    G C T G G T

    CCTCCTG G C TT C CCT

    G G t

    T C T

    T T

    GGT G C T

    A A G

    G G T GM GC T

    G G T C C C C AA

    humn

    G l y

    A la A la

    G l y

    P r o P r o

    G l y

    P r o

    T h r

    G l y P r o

    A l a

    G l y

    P r o P r o

    S l y Ph e

    P r o

    G l y

    A l a

    V o l

    G l y

    A l a L y s G l y

    G l u

    A l a

    S l y

    P r o G i n

    b o v i n e

    -

    - - - -

    - -

    -

    - - - -

    - - - -

    -

    -

    - -

    -

    - -

    -

    - -

    S l y

    - -

    -

    3 5 8

    1 2 8 3

    h u m a n

    G G G

    C C C

    C G A G G C T C T

    6M

    G G T C C C

    C A G

    G G T

    G T G

    C G T G G T

    SAG

    C C T

    G C

    C C C

    C C T G G C C C T

    G C T

    G G t G C T G C T

    G GC C CT

    G C T G G A

    A AC C C T

    h u m a n

    S l y

    P r o

    A r g

    S l y

    S e r

    G 6 u

    S l y

    P r o

    G i n

    S l y

    V o l

    A r g

    G l y

    S l u

    P r o

    S l y

    P r o

    P r o

    S l y

    P r o

    A l e

    G l y

    A l a A la

    G l y

    P r o

    A l a

    G l y A s n

    P r o

    b o v i n e

    3 8 8

    1 3 7 3

    h u m n

    GGT

    G C T

    S A T G G A C A G C C T

    G G T

    G C T

    A A A

    6 6 T

    G C C A A T

    G G T

    6 C T

    C C T

    6 6 T

    A T t

    G C T G G T G C T C C T

    G G C

    T T C

    C C T

    G G T GCCCGA G G C

    C C C

    T C T

    h m a n

    G l y

    A l a

    A s p G l y

    S i n

    P r o

    G l y

    A l a

    Ly s

    S l y

    A l a

    A s n

    S l y

    A l a P r o

    S l y

    I I e

    A l a

    S l y

    A l a P r o

    S l y

    P he P r o

    G l y

    A l a

    A r g

    G l y

    P r o

    S e r

    b o v i n e

    - -

    -

    -

    G l u

    4 1 8

    1 4 6 3

    h u m a n

    G G A

    C C C

    C A G

    S G C

    C C C

    G S C

    S O C

    C C T

    C C T

    G G T C C C

    A A M

    G 6 T

    A A C

    A 6 C

    S G T SM

    C C T

    G S T

    G C T

    C C T G G C

    AC A A A

    S G A

    S A C

    A C T

    G G T

    G C T

    A A G

    h u m a n

    S l y

    P r o

    S i n

    S l y

    P r o

    S l y S l y

    P r o P r o

    S l y

    P r o

    L y s G l y

    A s n S e r

    S l y

    G l u

    P r o

    S l y

    A la P ro

    S l y

    S e r

    L y s S l y

    A s p

    T h r

    G i y

    A l a

    L y s

    b o v i n e

    - S e r

    -

    - -

    - -

    -

    - - -

    - - - -

    -

    -

    A s n

    -

    4 4 8

    1 5 3 6

    h u m a n

    G G A

    G A G C C T

    G G C C C T

    G T T

    G G T

    G T T C M

    G G

    C C C C C T

    G G C C C T G CT G G

    G A G

    AGAA

    GA

    M A

    C G A G G A G CT C GA

    G

    h u m a n

    S l y

    G 1 u

    P r o

    G l y

    P r o V o l

    S l y

    V o l G i n

    S l y

    P r o P r o

    G l y

    P r o

    A l

    G l y

    G l u G l u S l y

    L y s

    A rg G iy A l a

    A r g

    b o v i n e

    - - - -

    -

    T h r

    -

    I l e

    - 4 7

    4 7 2

    1 9 8 8

  • 8/10/2019 14-Structure of a full-length cDNA clone for the preproal(I) chain.pdf

    3/4

    cDNA f o r

    p r e p r o a l

    c h a i n o f h u m a n

    t y p e

    I

    p r o c o l l a g e n

    b e e n d e s c r i b e d

    p r e v i o u s l y S t a c e y

    e t

    a l . ,

    1 9 8 7 ) . F o r

    s e q u e n c i n g ,

    t h e c l o n e w a s

    i n s e r t e d i n t o t h e S e q u e n e s t

    t r a n s p o s o n - d e l e t i o n

    v e c t o r s

    c a l l e d p A A - P Z 6 1 8 a n d

    p A A - P Z 6 1 9

    G o l d

    B i o T e c h n o l o g y , S t . L o u i s ,

    MO,

    U . S . A . ; P e n g

    Wu ,

    1 9 8 6 ) . D e l e t i o n s w e r e g e n e r a t e d

    a c c o r d i n g

    t o m a n u f a c t u r e r s

    r e c o m m e n d a t i o n s .

    S i n g l e -

    s t r a n d e d t e m p l a t e s

    f o r

    s e q u e n c i n g

    w e r e

    o b t a i n e d

    b y

    s i n g l e - s t r a n d r e s c u e b y

    u s e o f t h e h e l p e r

    b a c t e r i o p h a g e

    MI 3 K 0 7

    a n d

    s e q u e n c e d b y u s i n g

    a

    p r i m e r

    s p e c i f i c

    f o r

    t h e

    v e c t o r s

    p A A - p Z 6 1 8

    a n d

    p A A - p Z 6 1 9 .

    S u b s e q u e n t l y ,

    f r a g m e n t s

    o f

    pHUCI

    w e r e

    s u b c l o n e d i n t o b a c t e r i o p h a g e s

    Ml3mpl8 a n d M 1 3 m p l 9 ,

    a n d s e q u e n c e d b y

    u s i n g

    u n i v e r s a l

    p r i m e r s S a n g e r

    e t

    a l . ,

    1 9 7 7 ; M e s s i n g , 1 9 8 3 ) .

    RESULTS

    AND

    DISCUSSION

    R e s t r i c t i o n

    map a n d

    n u c l e o t i d e s e q u e n c e

    o f t h e

    cDNA

    T h e c l o n e

    pHUCI h u m a n c o l l a g e n ) i s

    a

    cDNA

    c l o n e

    c o r r e s p o n d i n g

    t o t h e c o m p l e t e

    4 . 8

    k b h u m a n

    p r o a l I )

    mRNA S t a c e y e t a l . , 1 9 8 7 )

    F i g .

    1 .

    To

    e s t a b l i s h

    t h a t

    t h e

    c l o n e w a s f u l l

    l e n g t h

    a n d

    c o d e d

    f o r

    a f u n c t i o n a l

    a l I )

    c o l l a g e n

    mRNA,

    i t

    w a s c l o n e d i n t o a r e t r o v i r a l v e c t o r

    c a p a b l e o f

    e x p r e s s i n g

    i n s e r t e d

    s e q u e n c e s

    i n

    h o s t m o u s e

    c e l l s .

    I n f e c t i o n

    o f

    Movi3

    m o u s e

    c e l l s

    H a r b e r s

    e t a l . ,

    1 9 8 4 ;

    S c h n i e k e

    e t a l . ,

    1 9 8 7 )

    w i t h t h e v e c t o r r e s u l t e d

    i n

    t h e

    p r o d u c t i o n

    o f

    s t a b l e t y p e

    I

    c o l l a g e n c o n s i s t i n g

    o f

    t w o

    human

    a l I

    c h a i n s a n d

    o n e m o u s e

    a 2

    c h a i n

    S t a c e y

    e t a l . ,

    1 9 8 7 ) .

    T h e

    p r e v i o u s l y

    a n a l y s e d

    cDNAs c o v e r e d

    t h e

    c o d o n s

    f o r

    a m i n o

    a c i d r e s i d u e s

    2 4 7 - 1 0 1 4

    o f t h e a - c h a i n

    d o m a i n ,

    t h e 2 6 a m i n o

    a c i d r e s i d u e s o f

    t h e C - t e r m i n a l

    t e l o p e p t i d e ,

    t h e 2 4 6

    a m i n o a c i d r e s i d u e s

    o f t h e

    C - p r o p e p t i d e

    a n d

    F i g .

    2 .

    N u c l e o t i d e a n d

    a m i n o a c i d sequence o f t h e

    cDNA c l o n e

    f o r t h e

    p r e p r o o c l I )

    c h a i n

    p H U C I )

    T h e n u c l e o t i d e s ar e n u m b e r e d

    f r o m t h e s t a r t

    s i t e

    f o r

    t r a n s c r i p t i o n

    C h u

    e t

    a l . ,

    1 9 8 5 )

    a n d

    t h e

    a m i n o

    a c i d s

    f r o m

    t h e f i r s t a m i n o

    a c i d

    o f

    t h e

    p r e p r o a l I )

    c h a i n .

    T h e 1 5 0 0

    b p

    n u c l e o t i d e

    sequences

    f r o m t h e 5 - e n d o f

    t h e human cDNA

    c l o n e ar e i n d i c a t e d

    i n t h e

    s e c o n d

    l i n e . T h e

    o v e r l a p

    w i t h

    p r e v i o u s l y p u b l i s h e d

    sequences

    f r o m

    H f 4 0 4

    B e r n a r d e t

    a l . ,

    1 9 8 3 b )

    s t a r t s

    a t n u c l e o t i d e

    p o s i t i o n

    1 3 9 2

    a m i n o

    a c i d

    r e s i d u e 4 2 5 ) . T h e a m i n o

    a c i d

    sequence

    e n c o d e d f o r

    b y

    t h e

    c l o n e

    i s i n d i c a t e d

    b e l o w t h e n u c l e o t i d e

    sequence.

    L i n e 1 :

    n u c l e o t i d e

    sequences

    f o r t h e c h i c k e n

    p r e p r o a l I )

    c h a i n

    w h e r e

    t h e y

    ar e

    known

    b a s e s 2 7 - 5 7 1 ;

    F i n e r

    e t

    a l . ,

    1 9 8 7 )

    a n d d i f f e r

    f r o m t h e human

    s e q u e n c e .

    L i n e s

    2

    a n d 3 :

    n u c l e o t i d e a n d a m i n o a c i d

    sequences

    o f

    pHUCI d e f i n e d

    i n

    t h e

    p r e s e n t

    w o r k .

    L i n e

    4 :

    a m i n o

    a c i d

    sequences

    o f t h e

    c h i c k e n

    p r e p r o a l I )

    c h a i n w h e r e

    t h e y

    ar e

    k n o w n ,

    t h e s e

    b e i n g

    r e s i d u e s 1 - 15 1 d er i v e d

    f r o m

    g e n o m i c

    c l o n e

    F i n e r

    e t

    a l . ,

    1 9 8 7 )

    a n d

    r e s i d u e s

    1 5 8 - 3 0 1

    d e f i n e d

    b y Edman

    d e g r a d a t i o n

    o f

    p e p t i d e

    f r a g m e n t s s e e

    G a l l o w a y , 1 9 8 2 ) .

    L i n e

    5 :

    a m i n o

    a c i d sequence

    o f

    t h e

    b o v i n e

    p r o a l I )

    c h a i n

    t h a t was d e f i n e d

    t y

    Edm4n

    d e g r a d a t i o n

    o f

    p e p t i d e

    f r a g m e n t s

    s e e G a l l o w a y , 1 9 8 2 ) . S y m b o l s :

    - ,

    i d e n t i c a l

    a m i n o

    a c i d ;

    - ,

    m i s s i n g

    n u c l e o t i d e s

    i n t h e

    human

    or

    c h i c k e n

    cDNA; * ,

    m i s s i n g

    amino

    a c i d ;

    e m p t y s p a c e

    i n

    a m i n o

    a c i d

    sequence,

    n o t

    k n o w n ;

    6 1 a n d

    1 0 3 , p o s s i b l e

    s t a r t

    s i t e s f o r t r a n s l a t i o n

    t h a t

    b o t h

    e n d

    i n

    a

    s t o p

    codon

    a f t e r

    1 2

    n u c l e o t i d e

    r e s i d u e s ;

    1 2 0 ,

    s t a r t

    s i t e f o r

    t r a n s -

    l a t i o n ;

    v e r t i c a l

    l i n e s ,

    b e g i n n i n g s

    o f

    e x o n s

    i n d i c a t e d ,

    w h e r e

    known

    C h u

    e t

    a l . , 1 9 8 4 ) ;

    V

    c l e a v a g e

    s i t e

    f o r

    s i g n a l

    p e p t i d a s e ;

    + ,

    c l e a v a g e

    s i t e f o r

    p r o c o l l a g e n

    N - p r o t e i n a s e ;

    l ,

    b e g i n n i n g

    o f

    a - c h a i n

    d o m a i n .

    V o l .

    2 5 3

    T a b l e 1 . C o d o n u s a g e

    i n

    t h e

    t r i p l e - h e l i c a l d o m a i n o f t h e p r o a l I )

    a n d

    p r o a 2 W )

    h u m a n

    t y p e

    I p r o c o U a g e n

    D a t a f o r t h e

    t r i p l e - h e l i c a l d o m a i n

    o f

    t h e p r o a

    l I ) c h a i n a r e

    f r o m K u i v a n i e m i

    e t

    a l .

    1 9 8 8 ) a n d B e r n a r d

    e t

    a l .

    1 9 8 3 a ) .

    T h i r d

    Amino a c i d a l I )

    a 2 I ) b a s e

    G l y

    0 . 5 0

    0 . 5 1

    U

    0 . 2 8

    0 . 2 2 C

    0 . 1 8

    0 . 2 2

    A

    0 . 0 3 0 . 0 5 G

    C o d o n s e x a m i n e d

    3 4 2

    3 4 2

    P r o t o t a l ) 0 . 6 0 0 . 6 2

    U

    0 . 3 8

    0 . 2 1

    C

    0 . 0 2

    0 . 1 6

    A

    0 0 . 0 1

    G

    C o d o n s e x a m i n e d 2 3 5

    1 9 9

    P r o Y a a

    p o s i t i o n )

    0 . 8 4 0 . 7 3

    U

    0 . 1 3 0 . 0 9

    C

    0 . 0 3 0 . 1 6

    A

    0 0 . 0 2 G

    C o d o n s

    e x a m i n e d

    1 1 7

    9 1

    A l a 0 . 7 5 0 . 7 6

    U

    0 . 2 0

    0 . 1 5 C

    0 . 0 5 0 . 0 8

    A

    0

    0

    G

    C o d o n s e x a m i n e d

    1 1 8 1 0 7

    2 2 4 b p

    o f

    t h e

    3 - n o n - t r a n s l a t e d

    r e g i o n

    o f

    t h e

    mRNA. I n

    t o t a l ,

    t h e y

    i n c l u d e d 3 3 4 4

    b p

    o f

    t h e

    mRNA

    a n d c o d o n s

    f o r

    1 0 4 0 a m i n o

    a c i d r e s i d u e s

    C h u

    e t

    a l . ,

    1 9 8 2 ; B e r n a r d

    e t

    a l . , 1 9 8 3 b ) .

    I n

    t h e p r e s e n t w o r k w e d e t e r m i n e d

    7 2 9

    n u c l e o t i d e r e s i d u e s

    a n d . t h e

    c o d o n s

    f o r 2 4 3 a m i n o

    a c i d s

    r e s i d u e s

    n o t

    p r e v i o u s l y d e f i n e d

    r e s i d u e s

    1 8 2 - 4 2 4

    i n F i g .

    2 ) f r o m

    a n y s p e c i e s .

    I n a d d i t i o n ,

    w e r e - e x a m i n e d t h e

    s e q u e n c e

    o f

    6 2 6

    b p

    d e f i n e d b y s e q u e n c i n g

    g e n o m i c

    c l o n e s

    c o n t a i n i n g

    e x o n s

    t o 6 C h u e t

    a l . ,

    1 9 8 4 ,

    1 9 8 5 ) .

    A s i n d i c a t e d i n F i g . 1 , t h e e n t i r e 1 5 0 0

    b p

    w a s

    s e q u e n c e d

    i n

    b o t h

    d i r e c t i o n s .

    C o m p a r i s o n

    o f

    c o d o n

    u s a g e b e t w e e n t h e h u m a n a l I )

    a n d

    o c 2 1

    cDNAs

    T h e d a t a

    d e v e l o p e d h e r e m a d e

    i t p o s s i b l e , f o r

    t h e

    f i r s t

    t i m e ,

    t o c o m p a r e c o m p l e t e l y c o d o n u s a g e f o r

    t h e

    human

    a l I )

    c h a i n

    w i t h

    t h a t

    f o r t h e

    h u m a n a 2 I ) c h a i n . T h e

    r e s u l t s T a b l e 1 d e m o n s t r a t e d

    a m a r k e d p r e f e r e n c e

    f o r

    U a s

    a t h i r d

    b a s e

    i n

    c o d o n s

    f o r

    g l y c i n e , p r o l i n e

    a n d

    a l a n i n e ,

    i n

    t h a t

    U

    w a s

    u s e d

    f o r 0 . 5 0 - 0 . 8 4

    o f

    t h e s e

    c o d o n s

    i n b o t h

    c h a i n s .

    E v e n m o r e

    s t r i k i n g

    w a s t h e r a r e u s e

    o f G

    f o r t h e t h i r d

    b a s e

    o f

    t h e

    s a m e

    c o d o n s .

    G

    w a s

    f o u n d

    i n

    o n l y

    n i n e o f 3 4 2

    g l y c i n e

    c o d o n s

    i n t h e

    a l

    I I )

    c h a i n . I t

    w a s

    n o t u s e d f o r

    a n y

    o f

    t h e t o t a l 3 5 3

    p r o l i n e

    a n d

    a l a n i n e

    c o d o n s . T h e

    r e s u l t s t h e r e f o r e i n d i c a t e a

    s t r o n g

    s e l e c t i v e

    p r e s s u r e

    a g a i n s t

    t h e

    u s e o f

    G

    i n

    t h e s e

    c o d i n g s e q u e n c e s .

    T h e r e w a s

    a l s o

    a

    p r e f e r e n c e

    f o r

    U

    i n

    t h e

    t h i r d

    p o s i t i o n

    o f

    c o d o n s

    f o r

    p r o l i n e

    t h a t w e r e i n

    t h e Yaa

    p o s i t i o n

    o f

    t h e

    r e p e a t i n g

    - G l y - X a a - Y a a -

    _ s e q u e n c e

    o f

    t h e

    c o l l a g e n

    a -

    c h a i n s .

    T h e

    p r e f e r e n c e

    h a d

    b e e n

    n o t e d

    i n t h e

    s e q u e n c e

    o f

    t h e

    a 2 I )

    c h a i n

    K u i v a n i e m i

    e t

    a l . , 1 9 8 8 ) ,

    b u t w a s e v e n

    m o r e

    p r o n o u n c e d

    i n t h e

    s e q u e n c e

    o f

    t h e

    a l I )

    c h a i n .

    9 2 1

  • 8/10/2019 14-Structure of a full-length cDNA clone for the preproal(I) chain.pdf

    4/4

    9 2 2

    G .

    T r o m p

    a n d

    o t h e r s

    T h e

    w o r k

    p r e s e n t e d

    h e r e w a s

    s u p p o r t e d

    i n

    p a r t

    b y

    N . I . H .

    R e s e a r c h G r a n t

    A R - 3 8 1 8 8 a n d b y a g r a n t f r o m

    t h e M a r c h o f

    D i m e s - B i r t h D e f e c t s

    F o u n d a t i o n .

    REFERENCES

    B e r n a r d ,

    M .

    P . ,

    M y e r s , J . C . , C h u ,

    M . - L . ,

    R a m i r e z ,

    F . ,

    E i k e n b e r r y ,

    E . F .

    P r o c k o p ,

    D .

    J .

    1 9 8 3 a )

    B i o c h e m i s t r y

    2 2 ,

    1 1 3 9 - 1 1 4 5

    B e r n a r d ,

    M. P . ,

    C h u ,

    M . - L . , M y e r s ,

    J .

    C . ,

    R a m i r e z ,

    F . ,

    E i k e n b e r r y , E . F .

    P r o c k o p ,

    D . J .

    1 9 8 3 b ) B i o c h e m i s t r y

    2 2 ,

    5 2 1 3 - 5 2 2 3

    B u r g e s o n , R . E .

    M o r r i s , N . P . 1 9 8 6 )

    i n C o n n e c t i v e

    T i s s u e

    D i s e a s e :

    M o l e c u l a r P a t h o l o g y o f

    t h e E x t r a c e l l u l a r

    M a t r i x

    U i t t o ,

    J .

    P e r e j d a ,

    A . J . , e d s . ) , p p .

    3 - 2 8 ,

    M a r c e l D e k k e r ,

    Ne w Y o r k

    B y e r s ,

    P . H . B o n a d i o ,

    J .

    F .

    1 9 8 5 )

    i n G e n e t i c

    a n d

    M e t a b o l i c

    D i s e a s e s

    i n

    P e d i a t r i c s L l o y d ,

    J .

    S c r i v e r ,

    C .

    R . , e d s . ) , p p .

    5 6 - 9 0 ,

    B u t t e r w o r t h s , L o n d o n

    C h u ,

    M . - L . ,

    M y e r s ,

    J .

    C . ,

    B e r n a r d ,

    M.

    P . , D i n g ,

    J . - F .

    R a m i r e z , F .

    1 9 8 2 )

    N u c l e i c A c i d s

    R e s .

    1 0 , 5 9 2 5 - 5 9 3 4

    C h u , M . - L . ,

    d e W e t ,

    W . ,

    B e r n a r d , M . , D i n g ,

    J . - F . ,

    M o r a b i t o ,

    M . , M y e r s ,

    J . ,

    W i l l i a m s , C .

    R a m i r e z , F .

    1 9 8 4 )

    N a t u r e

    L o n d o n ) 3 1 0 ,

    3 3 7 - 3 4 0

    C h u , M . - L . , d e

    W e t , W . ,

    B e r n a r d ,

    M .

    R a m i r e z ,

    F .

    1 9 8 5 )

    J . B i o l .

    C h e m . 2 6 0 ,

    2 3 1 5 - 2 3 2 0

    F i n e r , M .

    H . , A h o ,

    S . ,

    G e r s t e n f e l d , L . C . ,

    B o e d t k e r , H .

    D o t y ,

    P .

    1 9 8 7 ) J . B i o l .

    C h e m . 2 6 2 ,

    1 3 3 2 3 - 1 3 3 3 2

    G a l l o w a y ,

    D .

    1 9 8 2 )

    i n

    C o l l a g e n

    i n

    H e a l t h

    a n d D i s e a s e

    W e i s s ,

    J .

    B .

    J a y s o n ,

    M. I . V . , e d s . ) ,

    p p .

    5 2 8 - 5 5 7 , C h u r c h i l l -

    L i v i n g s t o n e ,

    E d i n b u r g h

    H a r b e r s ,

    K . , K u e h n , M . ,

    D e l i u s , H .

    J a e n i s c h , R .

    1 9 8 4 ) P r o c .

    N a t l .

    A c a d .

    S c i .

    U . S . A . 8 1 ,

    1 5 0 4 - 1 5 0 8

    K u i v a n i e m i ,

    H . ,

    T r o m p ,

    G . ,

    C h u ,

    M . - L .

    P r o c k o p , D . J .

    1 9 8 8 )

    B i o c h e m .

    J .

    2 5 2 , 6 3 3 - 6 4 0

    M e s s i n g , J . 1 9 8 3 )

    M e t h o d s

    E n z y m o l .

    1 0 1 , 2 0 - 7 8

    P e n g , Z G

    W u , R .

    1 9 8 6 ) G e n e 4 5 ,

    2 4 7 - 2 5 2

    P r o c k o p ,

    D .

    J .

    K i v i r i k k o , K .

    I .

    1 9 8 4 )

    N . E n g l . J . M e d .

    3 1 1 ,

    3 7 6 - 3 8 6

    P r o c k o p ,

    D .

    J .

    K u i v a n i e m i , H .

    1 9 8 6 ) R h e u m a t o l o g y 1 0 ,

    2 4 6 - 2 7 1

    S a n g e r ,

    F . ,

    N i c k l e n ,

    S .

    C o u l s o n ,

    A .

    R .

    1 9 7 7 )

    P r o c .

    N a t l .

    A c a d .

    S c i . U . S . A .

    7 4 ,

    5 4 6 3 - 5 4 6 7

    S c h n i e k e ,

    A . ,

    D z i a d e k ,

    M . ,

    B a t e m a n , J . , M a s c a r a , T . ,

    H a r b e r s ,

    K . , G e l i n a s , R .

    J a e n i s c h ,

    R .

    1 9 8 7 ) P r o c .

    N a t l .

    A c a d .

    S c i .

    U . S . A .

    8 4 ,

    7 6 4 - 7 6 8

    S t a c e y ,

    A . ,

    M u l l i g a n ,

    R .

    J a e n i s c h ,

    R .

    1 9 8 7 )

    J .

    V i r o l .

    6 1 ,

    2 5 4 9 - 2 5 5 4

    R e c e i v e d 5

    A p r i l 1 9 8 8 / 2 3

    May 1 9 8 8 ; a c c e p t e d

    1

    J u n e

    1 9 8 8

    1 9 8 8