120
© Various sources. All rights reserved. This content is excluded from our Creative Commons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

© Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

���������

© Various sources. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

Page 2: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Computational Biology: Genomes, Networks, Evolution

MIT 6.047 / 6.878

HSPH IMI.231 HST.507

�� �����������������

�������������������� �

���������������������������

��������������������

Page 3: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

I. Administrivia

���������������������������������������������������������������������

�� ����������!������� �"��#���

$

Page 4: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Introductions

% !��������& ��������'������(�����)��*+��� ,����������-�����.+�-��������������/�

& �.��������������� ,�����0������ ��+������ ���������+�10�������+�1,����� ��+�".������ ��+�����

8

Page 5: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Course Information

% *�������& � ��, �&���$9�

% ������������& :��7����.����$, �& �����������������(�)�<�)"��������������#���/�

% ����������������& :��������+�����,�3������������ ;�98?�*������ �����@;�98?����������A�

>

– All handouts, lectures, notes, etc will be posted here.

Page 6: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Goals for the term

% ���������������� ,����������3�����.�& 7���� ������,��3�� ������ ,����������3�����.�& ������� �< ������������������B����6������������.����& ����������������6������0��,�����,������������6�����& C�������������how �����������

% �3����.�����������������& "��3�� �����B����������������� �������������������& "����� ���������� �������������5����D,��������<���������������

& 7�����,��#����D,�����������,��,�����������.���������,�������������������������,�������6�������������6������6�� ���(�������+�����/�

;

Page 7: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Course content

?

Page 8: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Computation & Biology | Foundations & Frontiers

% 2�����.�E��(D5�D��/����� ,������������-�����.�& $��������%�����&���%��������������'(���

��� ,�������3���������,��3�� ���& �������������������������������

��������������B���+�,����,����% 2�����.�E��(.5�D��/��7���������������7���������& ���������������& ����5��6�����,��3�� �+��������� ������������& ��������� ��6����6�����& ���������)���& ��5��,����������� ,��D+��������,��3�� �+��,���B���������& � 3��������B������������& �,�������,��#���+������������������

F

Page 9: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Course organized around bio/comp modules % 1�� �����������,��������������0��������6��������& �)�*��������&��'�������)�#��'�+������'������%�,%�-����& �)�����������"����������)��.#/��0%����������'%�����������& 1)���'�������)�2��'�������%�"��%����� �%�.��������� �������& 3)�4��������)���������%�-����� �����(%� ����������(%��5"!��& )�2&�������)� (��'��(%��&���������(���'�%�6�,%��������(�& 7)����������)��������+,������%�1,�'������%� ����%�8(�� �

% 7������ ��������7�������6������6�����������& 2.�� ��,����� ���+�������� �����+������+�����+�1�+���33��)� ,����+�����������+�������6������+�7���������������+�)G��+�� 7�+������D�57������� ���+�,.���������+������<��,����������+��0���������.� �����+��=�)+��������� �,,����

% 7������ ��������)�������6������6���������& 10���������.�����������+��������,������.���+���� H��+�H���������6��������������.���+�1,����� ��+� ������ ����������������������.+��� ���������������+��������������3����.+�$2� I

Page 10: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

�9

Page 11: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Textbook / class notes / resources

��

Page 12: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

(Optional) Books for the Course

,�����%�2��(%����' %����� ����� 9����%��&:����

�0����3����.���-C����,+�� ������ �(JK895;9/�

���������3�������������0����������������-C�1�������������3�������

,���%�-���%�8�����© Cambridge University Press. All rights reserved.�This ����������� ������������������ �������������� © Wiley-Interscience. All rights reserved. Thiscontent is excluded from our Creative Commons license. ������������������������������������������ content is excluded from our Creative CommonsFor more information, see http://ocw.mit.edu/help/faq- �!������� �"�!��#$$%��&����'����(��������� license. For more information, see http://ocw.mitfair-use/. .edu/help/faq-fair-use/.

Courtesy of The MIT Press. Used with permission. ��

Page 13: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

New this year!! Book for the Course

�0����3����.���:������"27�

*�������������;����'()��������%�.�������%�2&��������

������������;�98?<;�F?F�

����� L�3������ ,���������.�����

���������������<������ �(��=� 3.���������������.��M�L�������.+����������.��M�

�$

Page 14: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Lectures and Scribing

% 1���������������0����������������3����������������������������������& "������������,�������3��6���������������������3�����,�������������

% -��������������6�� �,��0�����.������& �0����3��������������3�����

% �� ,��������6���6����3���������3�6����,��0���������& C�������� �����������6�� �,��0�����.����(�����������/�

% 7��������6���6����3������������;���.���6�����������& N������������,������������ ,��0� ����6�� �,��0�����.��������� ,���������

% )� ��������������� ���������� ����,������3���% )� ������������3�����5����������.�������#�������3����& 1����6������+���6������+���.���+� ����+������������M�

�8

Page 15: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Scribing details – DropBox 6047_book LaTex

�>

Page 16: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Sign up here if you haven’t already

�;

Page 17: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Online material from last year ���)++���������������+���� ��'� ���>����������

�?

Page 18: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Lecture feedback:

�� N��������������������0��������,����5>��� ��� ��������������.�,����������5>�$� !�����.��6�,������������& !�����.��6���������5>�& �����6.��6��D,�����������5>�& C��6��������6���������������5>�& =����B������������B�����.�����������5>�

8� "�����& 2�66����.��6���� ����������������.�5�#���������5���������& � ������6� ���������0�����������������5�#���������5����� ��& "����6���������������������5�#���������5�����6����

>� �� ,���������(6��������,�/�& Q�9R+��9589R+�895;9R+�;95F9R+�SF9R�

� �F

Page 19: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Homeworks and quiz

�I

Page 20: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Details on Problem sets % 1��,��3�� �� ,������������������(������/�& "�������,��3�� ��������D,��������������B���+����������+������������������+����.���������.���+������,����.�����������+��������3����3��0�����6�,��3�� < �����

& ����������,��3�� ��,��<,�,��+��D,������������ ��<������������<� ����������������,������������<��,����(�.,����.��������������0�����,��3�� �6���;�F?F/�

% 2���������.�����F, �& *����,���.���������6��D�3��+���0������������6��������& �6� ����������6�������+������,������������ ����+��D����������.,����.������������+��D�,���,���������

% )�3 �������� �������������& H������������������3�������6�.�� 0�����0����� +�.������������.������������������<����0��<���0���

�9

Page 21: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Details on the in-class quiz

% �� �������� ����� +������� ��������6������D� �& �� ����B���+�6������.+�6��+������������+����+�6���.�

% 2� ��������� �����.��6���� �����������8� �������& C������������.�,������� ,�����������������& C������������3����������0������������,�����& �3����.�����,,�.������������������0��,�������,��3�� ��

% �.,����6�B���������& '���������B�����������<7�#����6.+� ����,�������& 2��,�����������������B�����������������������& "�������,��3�� ���������������� ,���������� �& 2������,��3�� (�/�����< ���6����������� +������3�������������������������+������������������ ��

Page 22: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Final Project

��

Page 23: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Final Project: Original Research in Comp Bio % �� �#�����,����6�������������,��,������.���6����������������������� ,����������3�����.���& 7�� ������3���������,��3�� �� ,����������.�& �������������0����������������������������& )��0������������������������ �+� ��������������& �����,������������������3���������.�

% ������3����.����,�������.���������������������& ���6��������������,��,�����(6�������,�<������/�& =������������� ���6�� ,�� �����.������������& �0����,����,��,�����+�6����6����+���������� ,�0 ���& ���0����6���3���������0������.����,��,�����& =��������,�.�����������������������6��,�,���6�� ���& "�����������������������������������6����������

% ��� �,��#����D,������� �����������,�������$

Page 24: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

It’s a team project % "������ ��������66������� ����.����,����M�% 7�� ���� ������.������ ,�� �����.��D,�������

�8

Page 25: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Fin

al P

roje

ct a

t a

Gla

nce

�?��

�����

����

'��

�?��

���@�

�����

��

������ ��������7���3����� ��

�>

Page 26: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Details on the final project % ��������������������66������,��������<�6���3���& )��5�,��6����,��#��� ������.�������������������������& ��� ��� ������������������ ,�� �����.��������& ���,��������������.��� ��,��#���+�����������,�,����& "��,����������3���� ���������+�����0���3���+��D,���������& �����������������,����+�����������,���+� �����+�6�������

% "������� ������������������& )�������������������,�������������0�����.���� �������& ����,�������������������������+��������+�6���3���& "���5��0�����������������.��3����,����,��,�����+�����0��6���3��<�����������+����,�����������B���+���#����������

% ���5�������D,������+������������������������� �& �����<6�������,��,��,�����+�,������0���+�.����.���,����+�3�������� �<�66���+�����3�������+�,�,����������+���0�������

�;

Page 27: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Finding a research mentor / research advisor

% �������� ����6����.�������<-����<���0������& ������������������������ ���������& ��,�������,�,�����0�������������������& 1D,���������(�/�� ���� ,�����0������ ��+�(�/���� H��+�($/� ���3���� �������+�(8/��������� �,,���+���������+��0�����������������.�(6���������6���� ������/�

% �������� ������������������������,��������& :��������������+�� H��+����������.� ���6�+���������+��,����� ��+�,.������ ���(������������ �����/�

& ��������,��������������������������� ,-�������,�% N��������,����������������D,���������& ����3�������+����������& ���������0������������������+�6���������& ��0���+�3���������������6�����

�?

Page 28: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Putting it all together

�F

Page 29: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Course Grading

% �����������

% 8�,��3�� ��������& 1��,��3�� ������?5�9R+��0����$58��������+���������$58�,��3�� ����& ������� ��,��3�� ������,����� ���������� �����(")���������/�& ���������0��������������������������,��3�� ������������������

% 7�����,��#���& �������������������������� ,����������3�����.�(?������M/�& ��������,���5��0������H��5��.���,��,��������� ��6���3���

% !����& ��5�����B����(����H�0��>/��H��6������D� ��

% �����3��������,���.�& �����3���������������+�3���.��� ������

% =��������,�������.�������,��3�� �3�6�����������������% =������������������.��������% ��������������������������3����������H��������������

������������1�A� ��������?����3�A� ����������A� 8������A�

�I

Page 30: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Why Computational Biology ?

$9

Page 31: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Why Computational Biology: Last year s answers

% *�����6������(T�������6�����/�% ���������������% "�������6�������% �� ��all �3���������% �3����.����0���������% )� ��������+��� ,���������������,��% ������U�0���6.�(���������.,�������6����������/�% "��,���� ����� ��<�����.�����D,������3���0�������% H��������<�� 3����������6�0����3����% 166����.�(�������D,��� �������,�������0��/�% ��6�� �������6�����������(�3����.����� 3������������/�% ������������+�����5����������������,��% �.���6�� �.,��������������������������������������% *�6�������6��������������C���������������������������������

$�

Page 32: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

$�

Page 33: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

������

� 1������ ,��������

��������.� ���6��

� ��������� ������D,��������

$$

Page 34: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

$8

Page 35: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

1D���������������6�� �������

$>

Page 36: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

The components of genomes and gene regulation

����)�#��(�����/��&���������������'�� �'�����������'������'�������)�% ������� �����,������+������������<���� ��+����� 3�.������������% �����������"������5�������D���+��������+����5������ H�+� H��6�������% �������������������"�� �����+��������+�����������+��� ������������% ���������������� ��������.� ���6�+���5����������������3����.� �,��% �����������������������,�����6�����+��� ����� ���6����+�������� ���% ����.�� ������������ �,��3������������.,��+���������0���, ����% �������������������������������������+���"5��B+��������������0��.�% ������ �������7< ���6< ����� 3��������+�,������0�� ������% �� ���0������������ �����0�����.+�,�,������������ ��+��������� �,��% 10���������".���������+�,.������ ��+���������+�� ���������.�% �=�)<!�*������� ��0������������������ ��< ��������,����.,���% 2��������"��������(�,�/���� ��+�,�� ������ ��+��.������3�����.� $;

Page 37: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

$?

37

Page 38: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Coupling each topic with foundational CS tools

Lect Fundamental problbio em Foundational toolcomp.

�� ������������

�� )�B���������� ���� 2.�� ��,����� ����

$� 2���3��������� �������

8+>� ���������3����������������� ����<��������<*�������<1��

;+?� �������,�� ������.���� �����������<�1��

F+I� ��������.���������� ���,�������� �+��,����������.����

�9� ��������.� ���6�� ��6�� �����<��33��)� ,����<1��

��� 1,����� ��� ������6�������<����������

�$5�;� "�,���������������� )���������� ��������������6�������

�F5�I� ����������������,����������� ".���������<-�.��������6������

$F

Page 39: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Overview of the 5 modules

$I

Page 40: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Challenges in Computational Biology

2H��

8� ���� ������ 3�.�

�� �����7�������>� ��������.� ���6�����0��.�

2���3���������,�$�

������D,������������.����F�

H���������,��

)�B���������� ������

10���������.�����.�?�TCATGCTAT TCGTGATAA TGAGGATAT TTATCATAT TTATGATTT

������������0��.�I� ��33���� ,������9�"�������������������.�������

�� ,�����0������ ���

��� ����3���� ���������

;�

1 ���������������,��,��������$�

89

Page 41: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Module 1: Aligning and Modeling Genomes

% 7�����������0���6���������& 7���������������������� ,���������� ������<�3�����������,���& 7����������*��������0���, ����+��,���B��������+��������������& 2�����.�6��������3����,��3�� ��<�6���� ����������B����

% )�B���������� ������& *���<���3�������� �������6������������5��0����0���������.��0�����& 2���3��������������6��������������� �.��0��� ���������.�

% ������������0��������& ������������0��������(����/�������������������)�& 2������+��0��������+�,������+����������+��������

8�

Page 42: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Dynamic Programming Algorithms: Align, HMMs

% )�B���������� ����

G�(�/�

% ������������0��������% 2"�������� ,��������������B���& "��0���0������ ,����������+������ ,����������3�����.�& 7���.��D,������D,���������������,�������,��.��� �M�& �����.�������� ���������������+�3��5�������+���0���������& ),�������B���� ������:,�� �����3���������& 7�������������� ���+�����+�,.�����.+��������+�,�,����L

8��

Page 43: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Module II: Gene expression analysis and transcripts

% �� ,����������6�������������& C���,��0�����*���������1D,����������D� ��������& )�,��0�����������������������0�<����� �����0�� ������& ���� �,,���+������6������������+��,�������,��

% -���������6����������& ")�����������������0�����+����������+��,����������& *;<*?������ �����������������,�������& *F��������D,������������.�����������������<����������& *I�� ��������.� ���6�����0��.��1�+���33���� ,����+���6��

8$

Page 44: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

��&���������������������

H��������������,������,��� ���������<��� ����

*��������'�*��������'��)� ����������.,��� ��)� �����.53��0��������,���6�������

��&�����������'������ �&������

*�����������

��

����

� *�����������

��

����

�� ������+�H�����������99�� �������+�H�������999�

"�������������������)��(��������������������������������������*��������������������������������������+�������������� ��������(011�'��������1���(1��23����3���1�4����0��������� �4��������������5�66���������������(����������������������*(�������(������������������������������2�����7�����5��������)��������8$ ����9�;#$$#<0�%93%=� 88

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Alizadeh, Ash A., Michael B. Eisen, R. Eric Davis, Chi Ma, Izidore S.Lossos, AndreasRosenwald, Jennifer C. Boldrick et al. "Distinct types of diffuse large B-cell lymphomaidentified by gene expression profiling." Nature 403, no. 6769 (2000): 503-511.

Page 45: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

�6���3���������������6���� �����6��� ���.,����������6.���������� ��������6.������������66������,����.��

����� ��������� ���������'��� ��������������� ������������������������� ��@�����'�'�����������

������� ��������� ���� ��������:���'������

*����� ��������*����� ��������

�� ������+�H�����������99��

"�������������������)��(����������������������������������

�������+�H�������999�

����*��������������������������������������+�������������� ��������(011�'��������1���(1��23����3���1�Source: Armstrong, Scott A. et al. "MLL translocations specifya distinct gene expression profile that distinguishes a uniqueleukemia." Nature Genetics 30, no. 1 (2002): 41-47.

8>

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Alizadeh, Ash A., Michael B. Eisen, R. Eric Davis, Chi Ma, Izidore S.Lossos, AndreasRosenwald, Jennifer C. Boldrick et al. "Distinct types of diffuse large B-cell lymphomaidentified by gene expression profiling." Nature 403, no. 6769 (2000): 503-511.

Page 46: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Module III: Epigenomics and gene regulation

% �� ,����������7�����������& ������������0��������(����/�������������������)�& 2������+��0��������+�,������+����������+��������& C���,��0�����*���������1D,����������D� ��������& )�,��0�����������������������0�<����� �����0�� ������

% -���������6����������& ")�����������������0�����+����������+��,����������& *;<*?������ �����������������,�������& *F��������D,������������.�����������������<����������& *I�� ��������.� ���6�����0��.��1�+���33���� ,����+���6�� 8;

Page 47: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Motifs summarize TF sequence specificity

% )� ��������6�� �������

% ���������� ��.�,���������

% ���������6���6�� �������

% 2���������� ���6��0��� ���6����������

% ���� ,�������& ����,�������& 7�D����,������

8?

Page 48: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Starting positions �� Motif matrix

sequence positions

A C G T

1 2 3 4 5 6 7 8

0.1

0.1

0.6

0.2

% ��0�������������B�����������.����� ,����,��6���� ����D�

0.1

0.5

0.2

0.2 0.3

0.2

0.2

0.3 0.2

0.1

0.5

0.2 0.1

0.1

0.6

0.2

0.3

0.2

0.1

0.4

0.1

0.1

0.7

0.1

0.3

0.2

0.2

0.3

shared motif

given profile matrix �% easy to find starting position probabilities

��(�����)��$������&������������ ������������'���� %�'�&�������������(�

B�������'������������ � ������&��������)��� ���������'����������C�8F

Page 49: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

MultivariaTr

tanscription

e HMM for Chromatin States Start Site

Enhancer DNA

Observed chromatin marks. Called based on a poisson distribution

Most likely Hidden State

Transcribed Region

1 6 5 3 4 6 6 6 6 5

1:

3:

4:

5:

6:

5

High Probability Chromatin Marks in State

2:

0.8

0.9

0.9

0.8 0.7

0.9

200bp intervals All probabilities are

learned from the data

2

'8 �$� '$; �$� '$; �$� '$; �$� '$; �$�'8 ��� '8 �$� '8 ���

'�?��

0.8

'8 ���

'$; �$�

'�?��

'8 ���'8 �$�

'8 �$�

'8 ��� '8 ���

2����������������.������;����� ������

8I

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Ernst, Jason and Manolis Kellis. "Discovery and characterization of chromatin states forsystematic annotation of the human genome." Nature Biotechnology 28, no. 8 (2010): 817-825.

Page 50: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Modules IV and V: Evolution/phylogeny/populations

% ".����������<�".������ ���& ".�����������10���������.� �����+������3�������+�".�����6������& ".������ ��������<�,����������+�������������+���������+�,�,��

% "�,������������ �����& *��������,�,�������������.�6�� �������������(2�0��� ��/�& )��������������������������� �,,�������,�,���������(�����2��./�& ������������������������������� ���,�,���������("������)�3���/�& ��� ������������3����.�������� �5�����������������(N���0�1���/�

% ������ �������M�*����,����H�0�����+���5�����B�������H�0������& H����3�8M������������6������6������,��#���+��������0���+�7���������

>9

Page 51: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Characterizing sub-threshold variants in heart arrhythmia

Trait: QRS/QT interval

© source unknown. All rights reserved. This contentis excluded from our Creative Commons license. Formore information, see http://ocw.mit.edu/help/faq-fair-use/.

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Arking, Dan E. et al. "Genetic association study of QT interval highlights role for calciumsignaling pathways in myocardial repolarization." Nature Genetics 46, no. 8 (2014): 826-836.

Focus on sub-threshold variants (e.g. rs1743292 P=10-4.2)

(1) Large cohorts, (2) many known hits (3) well-characterized tissue drivers >�

Page 52: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

��F��-���

�1H1�7*:=�

H���������� �� ����

Evidence of Neanderthal�

�� ����

�Human gene flow

"�,���������,����J�$>9��.��

����������� ����H����������

��F�-���

H:���1H1�7*:=�

�� ��5� �����0�����������

�G1 ��1�

�0������� ����� ����J�>99��.��

�� �����

�� ��5� �����0����������

������

H�����5�6�������� ����JF�>��.��

J��99��.��

Courtesy of Luna04 on wikipedia.License: CC BY.

Courtesy of Luna04 on wikipedia.License: CC BY.

>�

Page 53: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

% )�3���������������,�����0�����,��,���������������������������D����% *���������,��6���0���������.��������������������������,������5������������% ������������6������3��������0������� ,�.�3���������3���0�����3����������,��������

QC����� �����6�� ���������������������

QN����� �����6�� ����5��������������

������,��6.���66�������������6��������3���������+����������������������66������,��3�3���������6���.���0�������� �����

Structure of genetic code �� evolutionary signatures

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

>$

Page 54: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Distance matrix � Phylogenetic tree

Hum Mou Rat Dog Cat

Human 9� 8� >� ?� ;�Mouse �.� � 9� $� F� >�

Rat �.��� ��� 9� I� ?�Dog ���D��� �.���D��� ��.���D��� 9� ��Cat ���D�� �.���D�� ��.���D�� ��� 9�

�� ���

2���

����

������

���

��

�D�

��� �

.���

����������� ���������,��.�3��������3���0��������������������53��������������

��,����������2�#�����������

������ ,��������������� ����D�

��#�

�����#�(2�#5��#/��

>8

Page 55: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

‘Peeling’ algorithm for P(D|B,T) term

�� ���� ��sites j evolve independently���������������� ���6��������� �����������������

�� ���� ��branch independence+���������������,��������1D,����������#�����,��3�3����.������,�����6�"(D�VD,�����+��/���:��.�"(D��5�/��� ����+������,����+�3��������������6��B��

$� =�������������� ,����P(xi|xparent(i),ti)�6���6�D���,����2�6�����3.�������B����� �����(O�+�'�"+��'N+���/��1����.���������6�����.���0��������� �����6����������������

8� �����������������0����������������������marginalize �)� ��0�������,����3���0�������6�������������<������������*���D�U�+L+D��5����,���������B���6��5����������������� >>

Page 56: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Two types of gene-tree species-tree reconciliation

�� -� �� �� -� ��

���������� Coalescence Duplication & Loss

% Coalescent models of alleles in populations Deal with 1-to-1 orthologs Estimate divergence times, pop sizes, etc Models move backward in time Cannot cope with duplication and loss

8������������

;�#� *�

;�#� *�

% DL models of genes in species Deal with paralogous families Estimate birth death rates Models move forward in time Cannot cope with incomplete

lineage sorting

��,!*����

>;

Page 57: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

>?

Page 58: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Biology primer

!������������������� ��������3�����.�������6�� �����������6����������������

>F

Page 59: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

>I

Page 60: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DNA: The double helix � ���������� ���� ��� �������������

��

Image by MIT OpenCourseWare.

Page 61: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DNA: the molecule of heredity % )��65� ,�� �������.������ ��������3������6�������.�

& '�����������������+������������ ,�����6�����������& �������������,���������������������,��6��,�����������0��,����������� �������.������������,����3����,.���� ����� �6������������� �������� �=������W�����+��I>$�

Phosphate moleculeDeoxyribose

sugar molecule

Nitrogenous bases

Weak bonds between bases

Sugar-phosphate backbone

{

A

A

C

C

G

G

T

T

{ CGTA

AT

CG

TA

GC

DNA REPLICATING ITSELF

TA

TAAT

TA

TAT A

C G G

G

TA

GC

CA

TOLD

OLD

NEWNEW

GCAT

TA

GCTA

TAGC

GC

G

TAGC

AT

Image by MIT OpenCourseWare.61

Page 62: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DNA: chemical details

123

4

5

1

2 345

123

4

5

1

2 345

123

4

5

1

2 345

123

4

5

1

2 345

T % -�������������������������

A % "

•��,����

W3��3����

eak hydrogen bonds hold the �������� two strands together

• This allows low-energy opening C and re-closing of two strands

G • Anti-parallel strands • Extension 5 �3 tri-

T phosphate coming from

A newly added nucleotide

The only parings are: C • A with T

G • C with G

;�

Page 63: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DNA: the four bases

"������ "������".�� ������ ".�� ������

=���� =����)������ )������

� ���� � ����'���� '����

;$

Page 64: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Alignment: all species/genes share common ancestry

)������������)���6� �-�����© Various sources. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

���� ;8

Page 65: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

© Neal Olander. All rights reserved. This content is excluded from our Creative Commonslicense. For more information, see http://ocw.mit.edu/help/faq-fair-use/. ;>

Page 66: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Tree of life

© Neal Olander. All rights reserved. This content is excluded from our Creative Commonslicense. For more information, see http://ocw.mit.edu/help/faq-fair-use/. ;;

Page 67: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Extinctions part of life

Phylogenetic tree showing archosaurs, dinosaurs, birds, etc. through geologic time removed due to copyright restrictions.

;?

Page 68: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Phylogenetics ��������������)����6���� ,�����������.��6���������6� ��?���� �3��������������������6������ ������ ��

J�?���� �������)�),����+�������+�������.,��+�2�������+��������+�*��������+�7����+������+������������)�.�����

"�����

Mammal family tree removed due to copyright restrictions.

�������)����,�������+� �������+�������D,�������+��7�3������+� ���6�+������L��

-�����������������&�����)�7������+�� ,�����+���� �����6������������0����+� ��0����6������ +����B��������6��D������,����+�,��������+������������

"���()�".������������������.��D������,������������'����������(,�������<���������<�� ����������/�

;F

Page 69: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

2��'��������

;I

Page 70: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Chromosomes inside the cell

Prokaryote

DNA organized in a single chromosome.

No nucleus. No mitosis.DNA organized in multiple chromosomes

inside a nucleus.Mitotic division

DNAEukaryote

Nucleus

Figures by MIT OpenCourseWare.

Page 71: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DNA packaging % =.�,��������& 2H�����0��.������& ��������0��.�� ����

% �� ,��������& ��� ��� ������>9+999��� �������������� Image removed due to copyright restrictions.

Please see: Figure 8-10 from Alberts, Bruce, and Martin Raff.

�D�������2H��Essential Cell Biology. New York, NY: Garland Publishing Inc.,1997. ISBN: 0815320450.

% C��������2H��& -�6������,�����6�2H����������6�����.����+������ ,������������ �����,��������.�

% H���� ��������& �����6������3����.�& )���������� ����������6�& �����6�$2�������������

?�

Page 72: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

2�0������,�������� ���6��������

Courtesy of the National Institutes of Health; in the public domain.

� �������������,�<<������ �,������0<�,����� ��< ?� ˆˆ,.<<ˇ. .... .,.ˇ. .˛.0<˝,.˛˝ˇ. ...<

Page 73: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Diversity of epigenetic modifications ���6�������� %��99U���66������������� ���6��������

%���������,����������$<�8<���<��-�%��������������*.����8('8/<'$;L�%��� ���� ���6���������������������� ����<"�<C3��%�H� 3�������5��5��( �$/�%�)���������$'8 �$+���-'>��

%���������������%�2H�� ���6��������%����.�5������,��<����.�5����������

2H�����,,������������������,�������� %�H������ ��,�����������

© source unknown. All rights reserved. This contentis excluded from our Creative Commons license. For %�2H�������3����.�more information, see http://ocw.mit.edu/help/faq-fair-use/� %����������������������6�����������������

%��7<������<�����<�7�<��� �� ,����?$

Page 74: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Diverse tissues and cells:

Epigenomics Roadmap across 100+ tissues/cell types

Diverse epigenomic assays:

1. Adult tissues and cells (brain, muscle, heart, digestive, skin, adipose, lung, blood…) 2. Fetal tissues (brain, skeletal muscle, heart, digestive, lung, cord blood…) 3. ES cells, iPS, differentiated cells (meso/endo/ectoderm, neural, mesench, trophobl)

1. Histone modifications % H3K4me3, H3K4me1 % H3K36me3

Art: Rae Senarighi, Richard Sandstrom % H3K27me3, H3K9me3 % H3K27/9ac, +20 more

2. Open chromatin: % DNase

Courtesy of Macmillan Publishers Limited. Used with permission. 3. DNA methylation: Source: Roadmap Epigenomics Consortium et al. "Integrative analysis of 111reference human epigenomes." Nature 518, no. 7539 (2015): 317-330.

% WGBS, RRBS, MRE/MeDIP 4. Gene expression % RNA-seq, Exon Arrays

?8

Page 75: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Deep sampling of 9 reference epigenomes (e.g. IMR90)

Courtesy of Ting Wang. Used with permission. UWash Epigenome Browser, Ting Wang Chromatin state+RNA+DNAse+28 histone marks+WGBS+Hi-C ?>

Page 76: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

2�0������� �����������������������,����� ��������

% �99���6������� ���6�������+� ��.������������ �������% ).��� ���� �,,������������"5+�-����6���5+�2H���5)�B�

%H3K4me3 %H3K9ac %DNase

%H3K36me3 %H3K79me2 %H4K20me1�

%H3K4me1 %H3K27ac %DNase�

%H3K9me3 %H3K27me3 %DNAmethyl�% H3K4me3 % H3K4me1 % H3K27ac % H3K36me3 % H4K20me1 % H3K79me3 % H3K27me3 % H3K9me3 % H3K9ac % H3K18ac

Enhancers Promoters Transcribed Repressed

© source unknown. All rights reserved.This content�is excluded from our CreativeCommons license. For�more information,Courtesy of Broad Communications. Used with permission.see http://ocw.mit.edu/help/faq-fair-use/.

?;

Page 77: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Chromatin state annotations across 127 epigenomes

Reveal epigenomic variability: enh/prom/tx/repr/het Anshul Kundaj

Courtesy of Anshul Kundaje. Used with permission.

e ??

Page 78: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

?F

Page 79: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Genes control the making of cell parts

% �������������6���� ������������6�����������& 1��2H�� ����������9+999U�������& �����������6������������ ����(���� ,��� ��6����� �����./�

& 10��.��� ���� ,��� ���� ���+���������,�����������������% ��,��������� H�+������,�����+���������3���,�������� ����,�������

% H��������� ,����.��,.�& ��� ���� �6��������,����������������6�� ������6�� ����2H����6�� ��������,������.�������,������5 ������ �����.������� H�� �������

& ��� ����,���������������+���� �����,�������� ����& 1�� H�����.����������� ������� ��3�6����������������

?I

Page 80: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

mRNA: The messenger

% ��6�� ������������ ���� �& ��������������0������3����������& ��3����0������D.��3����������A T T A C G G T A C C G T

U A A U G C C A U G G C A

& �� ,���3���3���5,����������.3����.3��������

Image by MIT OpenCourseWare.

F9

DNA

Transcription

Translation

Replication

RNA

Protein

Page 81: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

From DNA to RNA: Transcription

Image removed due to copyright restrictions.Please see: Figure 7-9 from Alberts, Bruce, and Martin Raff.Essential Cell Biology. New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

F�

Page 82: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

From pre-mRNA to mRNA: Splicing

% ���1����.����+������0��.�,�����6�����������������& 7����������D�����������,����3.����5�������������������& 2������,��5 H�� ���������+��������������,���������& ���� ���+�,�� ��.��������,�����3���9;�3,������

Image removed due to copyright restrictions.Please see: Figure 7-16 from Alberts, Bruce, and Martin Raff. Essential Cell Biology.New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

& ���������0���,���������.�������66�������D�����3�����6�������� ������+�����������66������,�������,�������

F�

Page 83: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

RNA can be functional

% )������)�������������� ,��D����������& )��65� ,�� �����.���������6�� ���������� ��& ����5�� �������������������������6����������.��6� H��

% 7�����.,����6� H��& H��� ����������6����������6�� ������& � H�������5��5� ���������,��6���.�& � H��������6������3��� ��& �� H�����,���������������

% ���3����������L�& =� ��������� ���������������������������� H��������& :����,������� �+�3�6����2H������,������+� H����������

F$

Page 84: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

RNA structure: 2ndary and 3rdary

Courtesy of SStructView F8

Page 85: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Splicing machinery made of RNA

Image removed due to copyright restrictions.Please see: Figure 7-16 from Alberts, Bruce, and Martin Raff. Essential Cell Biology.New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

F>

Page 86: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

F;

Page 87: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Proteins carry out the cell s chemistry

% ������ ,��D�,��. ���& H�����������0��8�3��������3�����& "���������0���9�����������0���������.�& 1��� ������������,��6��,��,�������

%•

DNA

Replication

Transcription

Translation

RNA

Protein

)�B�������)����������7�������& ���� ����������B���������� ������������5�� ���������6�����6�,�������

& ���,������ ��6�������������.���,�����������6���������6����$2����������

% "��������,��.���0�����������& �����.���+�3������+�������������+����������+������,���+� ���3���� �

F?

Image by MIT OpenCourseWare.

Page 88: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Protein structure

Alpha-beta horseshoeBeta-barrel this placental ribonuclease inhibitor is a

Helix-turn-helix Some antiparallel b-sheet cytosolic protein that binds extremely domains are better described as strongly to any ribonuclease that may leak

Common motif for b-barrels rather than b- into the cytosol. 17-stranded parallel b DNA-binding proteins sandwiches, for example sheet curved into an open horseshoe shape, that often play a streptavadin and porin. Note with 16 a-helices packed against the outer regulatory role as that some structures are surface. It doesn't form a barrel although it mRNA level looks as though it should. The strands are transcription factors intermediate between the only very slightly slanted, being nearly

extreme barrel and sandwich parallel to the central `axis'.arrangements.

Base pair

DNA

Sugar phosphate backbone

3

1

2

A

FF

Image by MIT OpenCourseWare. Image by MIT OpenCourseWare.

Image by MIT OpenCourseWare.

Page 89: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Protein building blocks % � ����������

FI

Page 90: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

From RNA to protein: Translation

•tRNA

Image by MIT OpenCourseWare.

I9

NH +3

NH +3

C C A

5' 3'

U A C

G G C

NH +3

A U G

Tyr

Gly

Met

Pro

A U G C C G G G U U A C U A A

• Ribosome

Page 91: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

The Genetic Code

��C����0���������.������ ,����������,��,������������ ,����������.�����0���,������5������������ I�

Page 92: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Summary: The Central Dogma

2H�� ����� H�� �����"�������

Image by MIT OpenCourseWare.I�

Inheritance

Messages

Reactions

DNA

Transcription

Translation

Replication

RNA

Protein

Page 93: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

Cellular dynamics and regulation How cells move through this Central Dogma

�����

�������'��������

I$

Page 94: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Animal/Human gene regulation: One genome � Many cell types

ACCAGTTACGACGGTCAGGGTACTGATACCCCAAACCGTTGACCGCATTTACAGACGGGGTTTGGGTTTTGCCCCACACAGGTACGTTAGCTACTGGTTTAGCAATTTACCGTTACAACGTTTACAGGGTTACGGTTGGGATTTGAAAAAAAGTTTGAGTTGGTTTTTTCACGGTAGAACGTACCGT

TACCAGTA

Images of a heart, red blood cell, and a brainremoved due to copyright restrictions.

Image in the public domain.

� ����)���������,���� I8

Page 95: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Eukaryotic Gene Regulation

Cartoon depicting eukaryotic gene regulation removed due to copyright restrictions.

I>

Page 96: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Diverse roles for regulatory non-coding RNAs

% Small RNA pathways (18-21 nt) & ��� H�����

% �,�����������3.����������������$ C� ��3.�� ,�� �������.�% 2��3��5��������� H��������������������������������% �����.�6��������������������,�� ��������������������������

& ,��� H���% �������������,����������,���3������ ����������� �����

& ��� H���& ��C5 H���

% Long non-coding RNAs (1000s nt, many exons) & )�66�����6���,������<�7�3�������& )�66�����6���$2�����������6� H��

I;

Page 97: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Regulation of Gene Expression

% C,����� ��6�����������promoter ��������

% ��������,�� �������B���������motifs�

% Transcription factors (�7�/�3������� ���6��

% �7���������RNA polymerase % ������������,�����

��������

"��������������������;�����'�8�����1D� ,�����

��.#�

"�������������������� ��(�������

I?

Page 98: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Predicted motif drivers of enhancer modules

% Activator and repressor motifs consistent with tissues

Pouya Kheradpour Courtesy of Macmillan Publishers Limited. Used with permission. IF98

Page 99: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Network components reveal functional modules

% 7���56����������,�������0���, ������,����������% ���,���������6� �����������W���������� ������

© Cold Spring Harbor Laboratory Press. All rights reserved. This content is excluded from ourCreative Commons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.Source: Zeitlinger, Julia et al. "Whole-genome ChIP–chip analysis of Dorsal, Twist, and Snailsuggests integration of diverse patterning prcesses in the Drosophila embryo." Genes &Development 21, no. 4 (2007): 385-390.

K������'���et al%�������<�,�&������������L� II

Page 100: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

3���M��������������B@�������%��@�����C�

Kheradpour et al Genome Research 2013

Systematic motif dissection in 2000 enhancers: 5 activators and 2 repressors in 2 cell lines

Figure 1: selection of activator and repressor motifs removed due to copyright restrictions.Source: Kheradpour, Pouya et al. "Systematic dissection of regulatory motifs in 2000predicted human enhancers using a massively parallel reporter assay." Genome Research23, no. 5 (2013): 800-811.

�99

Page 101: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Emerging properties of regulatory networks

Figures removed due to copyright restrictions.

% ������������0�����6����������.��������& ) ������ 3����6�3������5,��������������

% ),��6��<���������6���3���3.� ��� H�����������0���& ������������6��7��� � H����������������� � 5����������

�9�

Page 102: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

From Systems Biology to Synthetic Biology

9���*�������

).�������

��������.�H��������

© source unknown. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

% �� ,�����������������,��,�������

�� % ���� 3���3�����

�.� ���������������

������

"��� ������<�,����,����

% � ,�� ����������

).

����3����

��������������������������� ��

% )���.�3��0����W�Courtesy of Macmillan Publishers Limited. Used with permission.Source: Benner, Steven A. and A. Michael Sismour. "Syntheticbiology.“ Nature Reviews Genetics 6, no. 7 (2005): 533-543.

��#��������������9�(��������'� �9�

Page 103: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Over-express a single microRNA leads to new wing

% 2���0��.��6������<����5������ � H���% ��������.�������������3�������������0���, ������,����� ��

% -.��0��5�D,�������������������( � H���/����3����������������

% =����,����� ��������0����������

�������������

������

�������)�����.�3��������

�������<3��������

������ #���������

6"�

.��

�)�*

%,%2

����

���

�'��

����

����

© source unknown. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

8�����et al%������<,�&������������L�

�9$

Page 104: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Brief intro to Human Genetics

�98

Page 105: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

,.#�

�.#�

�������

�����

The role of genetic alterations

�����

�9>

Page 106: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Brief intro to human genetics % -�����'�������$��-��������+����,���+��$��� ��� ��+��9�������+�J$��� ���)H"�+�J>99���,���.,��3�����

Figure in the public domain. Created by Darryl Leja and Teri Manolio, NHGRI;Tony Burdett, Dani Welter, and Helen Parkinson, EBI.

�9;

www.genome.gov/GWAStudieswww.ebi.ac.uk/fgpt/gwas/

Page 107: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

The power and challenge of disease-association studies

% Large associated blocks with many variants: Fine-mapping challenge % No information on cell type/mechanism, most variants non-coding � Epigenomic annotations help find relevant cell types / nucleotides

Slide credit: Luke Ward, Mark Daly

"���������7�'����������������������������������������*����������������������

�9?

���������������+����� ��������� ��������(011�'��������1���(1��23����3���1�

Page 108: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

rs11209026 A G

������ ��� I?;���������� ;F� I$��* �/�0�N��3�%���NL�1�@���/L�

�*�$ �.����������,�����������3�����6��66������5�����

The power of GWAS: reveal new disease genes

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Cho, Judy H. "The genetics and immunopathogenesis ofinflammatory bowel disease." Nature Reviews Immunology 8, no.6 (2008): 458-466.

© ADAM, Inc. All rights reserved. This content is excluded fromour Creative Commons license. For more information, seehttp://ocw.mit.edu/help/faq-fair-use/.

�9F

Page 109: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Genomewide association in schizophrenia with 40,000 cases

����������99������������������6�������� �������������������,�����MMM��

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Ripke, Stephan et al. "Biological insights from 108 schizophrenia-associated genetic loci." Nature 511, no. 7510 (2014): 421. �9I

Page 110: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

DD

% Disease-associated SNPs enriched for enhancers in relevant cell types % E.g. lupus SNP in GM enhancer disrupts Ets1 predicted activator

Interpreting non-coding variants

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1� ��9

Page 111: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Mechanistic predictions for top disease-associated SNPs

Disrupt activator Ets-1 motif �� Loss of GM-specific activation � Loss of enhancer function � Loss of HLA-DRB1 expression

2�(� ���(���� ����(��������7����������������!�������(� �����������������(�� ����������

Creation of repressor Gfi1 motif � Gain K562-specific repression � Loss of enhancer function � Loss of CCDC162 exp

Figures removed due to copyright restrictions.

ression ���

Page 112: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Chromatin state annotations across 127 epigenomes

Figures removed due to copyright restrictions.

Reveal epigenomic variability: enh/prom/tx/repr/het Anshul Kundaje ���

Page 113: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Characterizing sub-threshold variants in heart arrhythmia

Trait: QRS/QT interval

© source unknown. All rights reserved.�This contentis excluded from our Creative Commons license. Formore information, see http://ocw.mit.edu/help/faq-fair-use/.

Focus on sub-threshold variants (e.g. rs1743292 P=10-4.2)

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Arking, Dan E. et al. "Genetic association study of QT interval highlights role for calciumsignaling pathways in myocardial repolarization." Nature Genetics 46, no. 8 (2014): 826-836.

(1) Large cohorts, (2) many known hits (3) well-characterized tissue drivers ��$

Page 114: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Courtesy of Macmillan Publishers Limited. Used with permission. Source: Roadmap Epigenomics Consortium et al. "Integrative analysis of 111 reference human epigenomes." Nature 518, no. 7539 (2015): 317-330. ��8

Page 115: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Linking traits to their relevant cell/tissue types

ES Liver

Brain

Digestive

Heart

T cells B cells

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1� ��>

Page 116: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Methylation differences a causal component of AD

AD predictive power reduced after removing meQTL effect

Methylation probes altered in AD are enriched in AD-associated SNPs

G � M � D

G � M � D

G � D M

"���������7�'���������������������������������������*���������� ���������������������������+�������������� ��������(011�'��������1���(1��23����3���1�

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

Set-wise causality testing ��;

Page 117: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Uncovering the molecular basis of top obesity gene

Obese

C-to-T motif rescue (anti-obesity phenotypes)

T-to-C motif disruption (pro-obesity phenotypes)

Lean

IRX3, IRX5 knock-down (anti-obesity phenotypes)

IRX3, IRX5 overexpression (pro-obesity phenotypes)

ARID5B KD (obesity)

ARID5B OE (anti-obesity)

"���������7�'�� ������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

117

Page 118: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Model: beige �� white adipocyte development

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

Shift therapeutic focus from brain to adipocytes ��F

Page 119: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

Challenges in Computational Biology

2H��

8� ���� ������ 3�.�

�� �����7�������>� ��������.� ���6�����0��.�

2���3���������,�$�

������D,������������.����F�

H���������,��

)�B���������� ������

10���������.�����.�?�TCATGCTAT TCGTGATAA TGAGGATAT TTATCATAT TTATGATTT

������������0��.�I� ��33���� ,������9�"�������������������.�������

��� ����3���� ���������

�� ,�����0������ ���;�

1 ���������������,��,��������$�

��I

Page 120: © Various sources. All rights reserved. This content is ......Computational Biology: Genomes, Networks, Evolution MIT 6.047 / 6.878 HSPH IMI.231 HST.507 ˚˛ ˙˙ ˜ ˘

����:,��������=�����,�<<��� ������

;�98?�<�;�F?F�<��)��>9?��� ,����������-�����.7�����9�>

7�����6�� �������3��������������� ������������������� ���6�C��+�0��������,�<<��� ������<��� ��