22
Serial Analysis of Gene Expression - SAGE

Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Embed Size (px)

Citation preview

Page 1: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Serial Analysis of Gene Expression - SAGE

Page 2: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA
Page 3: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

AAAAAA

TTTTTT

AAAAAA

TTTTTT

Serial Analysis of Gene Expression - SAGE

AAAAAA

TTTTTTAAAAAA

TTTTTT

GTAC

GTAC

AAAAAA

TTTTTTAAAAAA

TTTTTT

GTAC

GTAC

CATG

CATG

AAAAAA

TTTTTTAAAAAA

TTTTTT

GTAC

GTAC

CATG

CATG

AGGYTGTACXXXXXXXXXXXXXXXTCCRACATGXXXXXXXXXXXXXXXXX

TE AE Tag

TCCRACATGXXXXXXXXXXXXXXXXXAGGYTGTACXXXXXXXXXXXXXXX

TE AE Tag

Clivagem com a enzima de ancoragem (AE) – Nla IIILigação às esferas de estreptoavidina

Dividir e ligar os“linkers” (A+B)

Clivar com a enzima para a produção das Tags (TE) Mme I - Gerar extremidades coesivas

Page 4: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

AGGYTGTACXXXXXXXXXXXXXXXTCCRACATGXXXXXXXXXXXXXXXXX

TE AE Tag

TCCRACATGXXXXXXXXXXXXXXXXXAGGYTGTACXXXXXXXXXXXXXXX

TE AE Tag

AGGYTGTACXXXXXXXXXXXXXXXTCCRACATGXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXCATGTYGGA

XXXXXXXXXXXXXXXXXGTACARCCT

Ditag

Ligar e amplificar com os iniciadores A e B

----CATGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCATGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCATG--------GTACXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGTACXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGTAC----

AE Tag1 Tag2 AE Tag1 Tag2 AE

Ditag Ditag

Clivar com a enzima de ancoragemIsolar os “ditags”Concatenar e clonar

Page 5: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

TÉCNICA1) 2)

3)

Page 6: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

4)

5)

Page 7: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

6)

7) 8)

9)

Page 8: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

10)

Page 9: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Contagem das Tags

Anotação das Tags

Análisedos dados

Experimento de SAGE

Page 10: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

A Bioinformática têm papel essencial para o SAGE em três funções básicas:

•Extração e gerenciamento dos dados•Anotação das tags•Análise estatística (distribuição e comparações)

Page 11: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Extração das Tags

Dados estão no formato de cromatogramas

Software de Base Calling (Ex.: Phred) para gerar a sequência do concatâmero no formato texto com seu valor de qualidade

Extração e contagem das tags

Page 12: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Contagem das Tags

Localizar CATG

Extração dos Ditags (20 – 34 pb)

Descartar ditags duplicadas

Obter as 10-17 bases extremas, sendo o complemento reverso a sequencia da direita

Descartar adaptadores (linkers) de sequências

Contagem das tags

Page 13: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Exemplo

>SAGE-WT1-A0001-A01.abd 1047 0 1047 ABI

GGCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGCCCTCTAATGCATGTTGACGTGCACTTCCGTAGCCTCATGTTTTATGGAATCACCTATTATGCCATGACTTTTTCAAAACTAGGCTGTGCCATGTTTACACAGTATGCACACATCTTCCATGGATGTGGACAGAAAATCCTCCAACATGATGGCAA

A tag em azul deverá ser a o complemento reverso da sequência.

Page 14: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Contagem das Tags

Softwares que fazem a extração e contagem das tag:

SAGE 300 – Zhang et al. (1997)SAGE 2000 – Invitrogen, Inc. (I-SAGE)eSAGE – Margulies & Innis (2000)USAGE (On-line) – van Kampen el at. (2000)SAGEnhaft (On-line) – Beissbarth et al. (2004)

Page 15: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Anotação de SAGE Tags

Tag, etiqueta, marcador, assinatura...

É uma sequência de 10-17 nt.

Uma Tag possui informação suficiente para a identificação de um transcrito único.

Mais de 1 gene pode estar relacionado a mesma tag.

1 gene pode estar relacionado a 1 ou mais tags diferentes.

Page 16: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Erros de amostragem;

Erros de sequenciamento;

Possibilidade de tags não unívocas;

Transcritos que não geram tags utilizando uma dada enzima;

Sequências repetitivas;

Principais Problemas

Page 17: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Aumento do número de tags coletadas.

Uso de tags mais longas.

Uso de diferentes enzimas de restrição.

Como Resolver?

Page 18: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Biblioteca de SAGE

Short SAGE:

Tag Freq.

GCAGACCATA 1451AACAGTTCCA 931GCCAACTCGG 2CGTGCGGATT 1

Page 19: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Gerar a lista das CSTs (Confident SAGE Tag):

Remover tags com frequência igual a 1;Remover linkers de sequências

Biblioteca de SAGE

Page 20: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Extração das Tags virtuais:

Tag Virtual: é uma “tag” extraída computacionalmente.

Encontrada nos 10 nt posterior ao sítio da enzima NlaIII na região 3' UTR em mRNA.

Cauda de poli-A: quantidade de “A” nas ultimas bases.

Sinal de poli-A: AATAAA e ATAAAA nas últimas 50 bases.

Anotação de SAGE Tags

Page 21: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Relacionar Tag ao Gene

Pode-se encontrar mais de uma tag relacionada a um mesmo gene.

Qual a melhor Tag para o Gene?

RankingTag com alta expressão (Maior pontuação).Tag virtual interna (Menor pontuação).

SAGE Tags x Tag Virtual

Page 22: Serial Analysis of Gene Expression - SAGE. AAAAAA TTTTTT AAAAAA TTTTTT Serial Analysis of Gene Expression - SAGE AAAAAA TTTTTT AAAAAA TTTTTT GTAC AAAAAA

Onde encontrar os transcritos?

Banco de dados públicos: UniGene, RefSeq.Caso não tenha, pode-se usar organismo filogeneticamente próximos para obter uma anotação prévia.

Extração das Tags Virtuais