© Various sources. All rights reserved. This content is ......Computational Biology: Genomes,...

Preview:

Citation preview

���������

© Various sources. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

Computational Biology: Genomes, Networks, Evolution

MIT 6.047 / 6.878

HSPH IMI.231 HST.507

�� �����������������

�������������������� �

���������������������������

��������������������

I. Administrivia

���������������������������������������������������������������������

�� ����������!������� �"��#���

$

Introductions

% !��������& ��������'������(�����)��*+��� ,����������-�����.+�-��������������/�

& �.��������������� ,�����0������ ��+������ ���������+�10�������+�1,����� ��+�".������ ��+�����

8

Course Information

% *�������& � ��, �&���$9�

% ������������& :��7����.����$, �& �����������������(�)�<�)"��������������#���/�

% ����������������& :��������+�����,�3������������ ;�98?�*������ �����@;�98?����������A�

>

– All handouts, lectures, notes, etc will be posted here.

Goals for the term

% ���������������� ,����������3�����.�& 7���� ������,��3�� ������ ,����������3�����.�& ������� �< ������������������B����6������������.����& ����������������6������0��,�����,������������6�����& C�������������how �����������

% �3����.�����������������& "��3�� �����B����������������� �������������������& "����� ���������� �������������5����D,��������<���������������

& 7�����,��#����D,�����������,��,�����������.���������,�������������������������,�������6�������������6������6�� ���(�������+�����/�

;

Course content

?

Computation & Biology | Foundations & Frontiers

% 2�����.�E��(D5�D��/����� ,������������-�����.�& $��������%�����&���%��������������'(���

��� ,�������3���������,��3�� ���& �������������������������������

��������������B���+�,����,����% 2�����.�E��(.5�D��/��7���������������7���������& ���������������& ����5��6�����,��3�� �+��������� ������������& ��������� ��6����6�����& ���������)���& ��5��,����������� ,��D+��������,��3�� �+��,���B���������& � 3��������B������������& �,�������,��#���+������������������

F

Course organized around bio/comp modules % 1�� �����������,��������������0��������6��������& �)�*��������&��'�������)�#��'�+������'������%�,%�-����& �)�����������"����������)��.#/��0%����������'%�����������& 1)���'�������)�2��'�������%�"��%����� �%�.��������� �������& 3)�4��������)���������%�-����� �����(%� ����������(%��5"!��& )�2&�������)� (��'��(%��&���������(���'�%�6�,%��������(�& 7)����������)��������+,������%�1,�'������%� ����%�8(�� �

% 7������ ��������7�������6������6�����������& 2.�� ��,����� ���+�������� �����+������+�����+�1�+���33��)� ,����+�����������+�������6������+�7���������������+�)G��+�� 7�+������D�57������� ���+�,.���������+������<��,����������+��0���������.� �����+��=�)+��������� �,,����

% 7������ ��������)�������6������6���������& 10���������.�����������+��������,������.���+���� H��+�H���������6��������������.���+�1,����� ��+� ������ ����������������������.+��� ���������������+��������������3����.+�$2� I

�9

Textbook / class notes / resources

��

(Optional) Books for the Course

,�����%�2��(%����' %����� ����� 9����%��&:����

�0����3����.���-C����,+�� ������ �(JK895;9/�

���������3�������������0����������������-C�1�������������3�������

,���%�-���%�8�����© Cambridge University Press. All rights reserved.�This ����������� ������������������ �������������� © Wiley-Interscience. All rights reserved. Thiscontent is excluded from our Creative Commons license. ������������������������������������������ content is excluded from our Creative CommonsFor more information, see http://ocw.mit.edu/help/faq- �!������� �"�!��#$$%��&����'����(��������� license. For more information, see http://ocw.mitfair-use/. .edu/help/faq-fair-use/.

Courtesy of The MIT Press. Used with permission. ��

New this year!! Book for the Course

�0����3����.���:������"27�

*�������������;����'()��������%�.�������%�2&��������

������������;�98?<;�F?F�

����� L�3������ ,���������.�����

���������������<������ �(��=� 3.���������������.��M�L�������.+����������.��M�

�$

Lectures and Scribing

% 1���������������0����������������3����������������������������������& "������������,�������3��6���������������������3�����,�������������

% -��������������6�� �,��0�����.������& �0����3��������������3�����

% �� ,��������6���6����3���������3�6����,��0���������& C�������� �����������6�� �,��0�����.����(�����������/�

% 7��������6���6����3������������;���.���6�����������& N������������,������������ ,��0� ����6�� �,��0�����.��������� ,���������

% )� ��������������� ���������� ����,������3���% )� ������������3�����5����������.�������#�������3����& 1����6������+���6������+���.���+� ����+������������M�

�8

Scribing details – DropBox 6047_book LaTex

�>

Sign up here if you haven’t already

�;

Online material from last year ���)++���������������+���� ��'� ���>����������

�?

Lecture feedback:

�� N��������������������0��������,����5>��� ��� ��������������.�,����������5>�$� !�����.��6�,������������& !�����.��6���������5>�& �����6.��6��D,�����������5>�& C��6��������6���������������5>�& =����B������������B�����.�����������5>�

8� "�����& 2�66����.��6���� ����������������.�5�#���������5���������& � ������6� ���������0�����������������5�#���������5����� ��& "����6���������������������5�#���������5�����6����

>� �� ,���������(6��������,�/�& Q�9R+��9589R+�895;9R+�;95F9R+�SF9R�

� �F

Homeworks and quiz

�I

Details on Problem sets % 1��,��3�� �� ,������������������(������/�& "�������,��3�� ��������D,��������������B���+����������+������������������+����.���������.���+������,����.�����������+��������3����3��0�����6�,��3�� < �����

& ����������,��3�� ��,��<,�,��+��D,������������ ��<������������<� ����������������,������������<��,����(�.,����.��������������0�����,��3�� �6���;�F?F/�

% 2���������.�����F, �& *����,���.���������6��D�3��+���0������������6��������& �6� ����������6�������+������,������������ ����+��D����������.,����.������������+��D�,���,���������

% )�3 �������� �������������& H������������������3�������6�.�� 0�����0����� +�.������������.������������������<����0��<���0���

�9

Details on the in-class quiz

% �� �������� ����� +������� ��������6������D� �& �� ����B���+�6������.+�6��+������������+����+�6���.�

% 2� ��������� �����.��6���� �����������8� �������& C������������.�,������� ,�����������������& C������������3����������0������������,�����& �3����.�����,,�.������������������0��,�������,��3�� ��

% �.,����6�B���������& '���������B�����������<7�#����6.+� ����,�������& 2��,�����������������B�����������������������& "�������,��3�� ���������������� ,���������� �& 2������,��3�� (�/�����< ���6����������� +������3�������������������������+������������������ ��

Final Project

��

Final Project: Original Research in Comp Bio % �� �#�����,����6�������������,��,������.���6����������������������� ,����������3�����.���& 7�� ������3���������,��3�� �� ,����������.�& �������������0����������������������������& )��0������������������������ �+� ��������������& �����,������������������3���������.�

% ������3����.����,�������.���������������������& ���6��������������,��,�����(6�������,�<������/�& =������������� ���6�� ,�� �����.������������& �0����,����,��,�����+�6����6����+���������� ,�0 ���& ���0����6���3���������0������.����,��,�����& =��������,�.�����������������������6��,�,���6�� ���& "�����������������������������������6����������

% ��� �,��#����D,������� �����������,�������$

It’s a team project % "������ ��������66������� ����.����,����M�% 7�� ���� ������.������ ,�� �����.��D,�������

�8

Fin

al P

roje

ct a

t a

Gla

nce

�?��

�����

����

'��

�?��

���@�

�����

��

������ ��������7���3����� ��

�>

Details on the final project % ��������������������66������,��������<�6���3���& )��5�,��6����,��#��� ������.�������������������������& ��� ��� ������������������ ,�� �����.��������& ���,��������������.��� ��,��#���+�����������,�,����& "��,����������3���� ���������+�����0���3���+��D,���������& �����������������,����+�����������,���+� �����+�6�������

% "������� ������������������& )�������������������,�������������0�����.���� �������& ����,�������������������������+��������+�6���3���& "���5��0�����������������.��3����,����,��,�����+�����0��6���3��<�����������+����,�����������B���+���#����������

% ���5�������D,������+������������������������� �& �����<6�������,��,��,�����+�,������0���+�.����.���,����+�3�������� �<�66���+�����3�������+�,�,����������+���0�������

�;

Finding a research mentor / research advisor

% �������� ����6����.�������<-����<���0������& ������������������������ ���������& ��,�������,�,�����0�������������������& 1D,���������(�/�� ���� ,�����0������ ��+�(�/���� H��+�($/� ���3���� �������+�(8/��������� �,,���+���������+��0�����������������.�(6���������6���� ������/�

% �������� ������������������������,��������& :��������������+�� H��+����������.� ���6�+���������+��,����� ��+�,.������ ���(������������ �����/�

& ��������,��������������������������� ,-�������,�% N��������,����������������D,���������& ����3�������+����������& ���������0������������������+�6���������& ��0���+�3���������������6�����

�?

Putting it all together

�F

Course Grading

% �����������

% 8�,��3�� ��������& 1��,��3�� ������?5�9R+��0����$58��������+���������$58�,��3�� ����& ������� ��,��3�� ������,����� ���������� �����(")���������/�& ���������0��������������������������,��3�� ������������������

% 7�����,��#���& �������������������������� ,����������3�����.�(?������M/�& ��������,���5��0������H��5��.���,��,��������� ��6���3���

% !����& ��5�����B����(����H�0��>/��H��6������D� ��

% �����3��������,���.�& �����3���������������+�3���.��� ������

% =��������,�������.�������,��3�� �3�6�����������������% =������������������.��������% ��������������������������3����������H��������������

������������1�A� ��������?����3�A� ����������A� 8������A�

�I

Why Computational Biology ?

$9

Why Computational Biology: Last year s answers

% *�����6������(T�������6�����/�% ���������������% "�������6�������% �� ��all �3���������% �3����.����0���������% )� ��������+��� ,���������������,��% ������U�0���6.�(���������.,�������6����������/�% "��,���� ����� ��<�����.�����D,������3���0�������% H��������<�� 3����������6�0����3����% 166����.�(�������D,��� �������,�������0��/�% ��6�� �������6�����������(�3����.����� 3������������/�% ������������+�����5����������������,��% �.���6�� �.,��������������������������������������% *�6�������6��������������C���������������������������������

$�

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

$�

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

������

� 1������ ,��������

��������.� ���6��

� ��������� ������D,��������

$$

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

$8

ATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCAAAGAAGTTTAATAATCATATTACATGGCATTACCACCATATATATCCATATCTAATCTTACTTATATGTTGTGGAAATGTAAAGAGCCCCATTATCTTAGCCTAAAAAAACCTTCTCTTTGGAACTTTCTAATACGCTTAACTGCTCATTGCTATATTGAAGTACGGATTAGAAGCCGCCGAGCGGGCGACAGCCCTCCGACGGAAGACTCTCCTCTGCGTCCTCGTCTTCACCGGTCGCGTTCCTGAAACGCAGATGTGCCTCGCGCCGCACTGCTCCGAACAATAAAGATTCTACAATACTCTTTTATGGTTATGAAGAGGAAAAATTGGCAGTAACCTGGCCCCACAAACCTTCAAATTAACGAATCAAATTAACAACCATAGGATGAATGCGATTAGTTTTTTAGCCTTATTTCTGGGGTAATTAATCAGCGAAGCGATGATTTTTGATCTATTAACAGATATATAAATGGAAGCTGCATAACCACTTTAACTAATACTTTCAACATTTTCAGTTTGTATTACTTCTTATTCAAATGTCATAAAAGTATCAACAAAAAATTTAATATACCTCTATACTTTAACGTCAAGGAGAAAAAACTATAATGACTAAATCTCATTCAGAAGAAGTGATTGTACCTGAGTTCAACTAGCGCAAAGGAATTACCAAGACCATTGGCCGAAAAGTGCCCGAGCATAATTAAGAAATTTATAAGCGCTTATGATGCTAAACCGGTTTGTTGCTAGATCGCCTGGTAGAGTCAATCTAATTGGTGAACATATTGATTATTGTGACTTCTCGGTTTTACCTTTAGCTATTGATTGATATGCTTTGCGCCGTCAAAGTTTTGAACGAGAAAAATCCATCCATTACCTTAATAAATGCTGATCCCAAATTTGCTCAAAGGAATCGATTTGCCGTTGGACGGTTCTTATGTCACAATTGATCCTTCTGTGTCGGACTGGTCTAATTACTTTAAATGTGGTCTCCATGTTGCACTCTTTTCTAAAGAAACTTGCACCGGAAAGGTTTGCCAGTGCTCCTCTGGCCGGGCTGCAAGTCTTCTGTGAGGGTGATGTACCATGGCAGTGGATTGTCTTCTTCGGCCGCATTCATTTGTGCCGTTGCTTTAGCTGTTGTTAAAGCGAATATGGGCCCTGGTTATCATATCCAAGCAAAATTTAATGCGTATTACGGTCGTTGCAGAACATTATGTTGGTGTTAACAATGGCGGTATGGATCAGGCTGCCTCTGTTTGGTGAGGAAGATCATGCTCTATACGTTGAGTTCAAACCGCAGTTGAAGGCTACTCCGTTTAAATTTCCGCAATTAAAAAACCATGAATAGCTTTGTTATTGCGAACACCCTTGTTGTATCTAACAAGTTTGAAACCGCCCCAACCAACTATAATTTAAGAGTGGTAGAAGTCACCAGCTGCAAATGTTTTAGCTGCCACGTACGGTGTTGTTTTACTTTCTGGAAAAGAAGGATCGAGCACGAATAAAGGTAATCTAAGAGTTCATGAACGTTTATTATGCCAGATATCACAACATTTCCACACCCTGGAACGGCGATATTGAATCCGGCATCGAACGGTTAACAAAGGCTAGTACTAGTTGAAGAGTCTCTCGCCAATAAGAAACAGGGCTTTAGTGTTGACGATGTCGCACAATCCTTGAATTGTTCTCGCGAAATTCACAAGAGACTACTTAACAACATCTCCAGTGAGATTTCAAGTCTTAAAGCTATATCAGAGGGCTAAGCATGTGTATTCTGAATTTAAGAGTCTTGAAGGCTGTGAAATTAATGACTACAGCGAGCTTTACTGCCGACGAAGACTTTTTCAAGCAATTTGGTGCCTTGATGCGAGTCTCAAGCTTCTTGCGATAAACTTTACGAATGTTCTTGTCCAGAGATTGACAAAATTTGTTCCATTGCTTTGTCAAATGGATCATGGTTCCCGTTTGACCGGAGCTGGCTGGGGTGGTTGTACTGTTCACTTGGTTCCAGGGGGCCCAAATGGCAACATAGAAAAGGTAAGAAGCCCTTGCCAATGAGTTCTACAAGGTCAAGTACCCTAAGATCACTGATGCTGAGCTAGAAAATGCTATCATCGTCTCTAAACCAATTGGGCAGCTGTCTATATGAATTATAAGTATACTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAACTAGCATCACAAAATACGCAATAATAACGAGTAGTAACACTTTTATAGTTCATACATGCTTCAACTACTTAATAAATGATTGTATGATAGTTTTCAATGTAAGAGATTTCGATTATCCACAAACTTTAAAACACAGGGACAAAATTCTTGATATGCTTTCAACCGCTGCGTTTTGGACCTATTCTTGACATGATATGACTACCATTTTGTTATTGTACGTGGGGCAGTTGACGTCTTATCATATGTCAAAGTCATTTGCGAAGCTTGGCAAGTTGCCAACTGACGAGATGCAGTAAAAAGAGATTGCCGTCTTGAAACTTTTTGTCCTTTTTTTTTTCCGGGGACTCTACGAACCCTTTGTCCTACTGATTAATTTTGTACTGAATTTGGACAATTCAGATTTTAGTAGACAAGCGCGAGGAGGAAAAGAAATGACAAAAATTCCGATGGACAAGAAGATAGGAAAAAAAAAAAGCTTTCACCGATTTCCTAGACCGGAAAAAAGTCGTATGACATCAGAATGAAATTTTCAAGTTAGACAAGGACAAAATCAGGACAAATTGTAAAGATATAATAAACTATTTGATTCAGCGCCAATTTGCCCTTTTCCATTCCATTAAATCTCTGTTCTCTCTTACTTATATGATGATTAGGTATCATCTGTATAAAACTCCTTTCTTAATTTCACTCTAAAGCATCCCATAGAGAAGATCTTTCGGTTCGAAGACATTCCTACGCATAATAAGAATAGGAGGGAATAATGCCAGACAATCTATCATTACATTAGCGGCTCTTCAAAAAGATTGAACTCTCGCCAACTTATGGAATCTTCCAATGAGACCTTTGCGCCAAATAATGTGGATTTGGAAAAAGTATAAGTCATCTCAGAGTAATATAACTACCGAAGTTTATGAGGCATCGAGCTTTGAAGAAAAAGTAAGCTCAGAAAAACCTCAATAGCTCATTCTGGAAGAAAATCTATTATGAATATGTGGTCGTTGACAAATCAATCTTGGGTGTTTCTATTCTGGATTCATTTATGTACACAGGACTTGAAGCCCGTCGAAAAAGAAAGGCGGGTTTGGTCCTGGTACAATTATTGTTACTTCTGGCTTGCTGAATGTTTCAATATCCACTTGGCAAATTGCAGCTACAGGTCTACAACTGGGTCTAAATTGGTGGCAGTGTTGGATAACAATTTGGATTGGGTACGGTTTCGTGTGCTTTTGTTGTTTTGGCCTCTAGAGTTGGATCTGCTTATCATTTGTCATTCCCTATATCATCTAGAGCATCATTCGGTATTTTCT

1D���������������6�� �������

$>

The components of genomes and gene regulation

����)�#��(�����/��&���������������'�� �'�����������'������'�������)�% ������� �����,������+������������<���� ��+����� 3�.������������% �����������"������5�������D���+��������+����5������ H�+� H��6�������% �������������������"�� �����+��������+�����������+��� ������������% ���������������� ��������.� ���6�+���5����������������3����.� �,��% �����������������������,�����6�����+��� ����� ���6����+�������� ���% ����.�� ������������ �,��3������������.,��+���������0���, ����% �������������������������������������+���"5��B+��������������0��.�% ������ �������7< ���6< ����� 3��������+�,������0�� ������% �� ���0������������ �����0�����.+�,�,������������ ��+��������� �,��% 10���������".���������+�,.������ ��+���������+�� ���������.�% �=�)<!�*������� ��0������������������ ��< ��������,����.,���% 2��������"��������(�,�/���� ��+�,�� ������ ��+��.������3�����.� $;

$?

37

Coupling each topic with foundational CS tools

Lect Fundamental problbio em Foundational toolcomp.

�� ������������

�� )�B���������� ���� 2.�� ��,����� ����

$� 2���3��������� �������

8+>� ���������3����������������� ����<��������<*�������<1��

;+?� �������,�� ������.���� �����������<�1��

F+I� ��������.���������� ���,�������� �+��,����������.����

�9� ��������.� ���6�� ��6�� �����<��33��)� ,����<1��

��� 1,����� ��� ������6�������<����������

�$5�;� "�,���������������� )���������� ��������������6�������

�F5�I� ����������������,����������� ".���������<-�.��������6������

$F

Overview of the 5 modules

$I

Challenges in Computational Biology

2H��

8� ���� ������ 3�.�

�� �����7�������>� ��������.� ���6�����0��.�

2���3���������,�$�

������D,������������.����F�

H���������,��

)�B���������� ������

10���������.�����.�?�TCATGCTAT TCGTGATAA TGAGGATAT TTATCATAT TTATGATTT

������������0��.�I� ��33���� ,������9�"�������������������.�������

�� ,�����0������ ���

��� ����3���� ���������

;�

1 ���������������,��,��������$�

89

Module 1: Aligning and Modeling Genomes

% 7�����������0���6���������& 7���������������������� ,���������� ������<�3�����������,���& 7����������*��������0���, ����+��,���B��������+��������������& 2�����.�6��������3����,��3�� ��<�6���� ����������B����

% )�B���������� ������& *���<���3�������� �������6������������5��0����0���������.��0�����& 2���3��������������6��������������� �.��0��� ���������.�

% ������������0��������& ������������0��������(����/�������������������)�& 2������+��0��������+�,������+����������+��������

8�

Dynamic Programming Algorithms: Align, HMMs

% )�B���������� ����

G�(�/�

% ������������0��������% 2"�������� ,��������������B���& "��0���0������ ,����������+������ ,����������3�����.�& 7���.��D,������D,���������������,�������,��.��� �M�& �����.�������� ���������������+�3��5�������+���0���������& ),�������B���� ������:,�� �����3���������& 7�������������� ���+�����+�,.�����.+��������+�,�,����L

8��

Module II: Gene expression analysis and transcripts

% �� ,����������6�������������& C���,��0�����*���������1D,����������D� ��������& )�,��0�����������������������0�<����� �����0�� ������& ���� �,,���+������6������������+��,�������,��

% -���������6����������& ")�����������������0�����+����������+��,����������& *;<*?������ �����������������,�������& *F��������D,������������.�����������������<����������& *I�� ��������.� ���6�����0��.��1�+���33���� ,����+���6��

8$

��&���������������������

H��������������,������,��� ���������<��� ����

*��������'�*��������'��)� ����������.,��� ��)� �����.53��0��������,���6�������

��&�����������'������ �&������

*�����������

��

����

� *�����������

��

����

�� ������+�H�����������99�� �������+�H�������999�

"�������������������)��(��������������������������������������*��������������������������������������+�������������� ��������(011�'��������1���(1��23����3���1�4����0��������� �4��������������5�66���������������(����������������������*(�������(������������������������������2�����7�����5��������)��������8$ ����9�;#$$#<0�%93%=� 88

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Alizadeh, Ash A., Michael B. Eisen, R. Eric Davis, Chi Ma, Izidore S.Lossos, AndreasRosenwald, Jennifer C. Boldrick et al. "Distinct types of diffuse large B-cell lymphomaidentified by gene expression profiling." Nature 403, no. 6769 (2000): 503-511.

�6���3���������������6���� �����6��� ���.,����������6.���������� ��������6.������������66������,����.��

����� ��������� ���������'��� ��������������� ������������������������� ��@�����'�'�����������

������� ��������� ���� ��������:���'������

*����� ��������*����� ��������

�� ������+�H�����������99��

"�������������������)��(����������������������������������

�������+�H�������999�

����*��������������������������������������+�������������� ��������(011�'��������1���(1��23����3���1�Source: Armstrong, Scott A. et al. "MLL translocations specifya distinct gene expression profile that distinguishes a uniqueleukemia." Nature Genetics 30, no. 1 (2002): 41-47.

8>

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Alizadeh, Ash A., Michael B. Eisen, R. Eric Davis, Chi Ma, Izidore S.Lossos, AndreasRosenwald, Jennifer C. Boldrick et al. "Distinct types of diffuse large B-cell lymphomaidentified by gene expression profiling." Nature 403, no. 6769 (2000): 503-511.

Module III: Epigenomics and gene regulation

% �� ,����������7�����������& ������������0��������(����/�������������������)�& 2������+��0��������+�,������+����������+��������& C���,��0�����*���������1D,����������D� ��������& )�,��0�����������������������0�<����� �����0�� ������

% -���������6����������& ")�����������������0�����+����������+��,����������& *;<*?������ �����������������,�������& *F��������D,������������.�����������������<����������& *I�� ��������.� ���6�����0��.��1�+���33���� ,����+���6�� 8;

Motifs summarize TF sequence specificity

% )� ��������6�� �������

% ���������� ��.�,���������

% ���������6���6�� �������

% 2���������� ���6��0��� ���6����������

% ���� ,�������& ����,�������& 7�D����,������

8?

Starting positions �� Motif matrix

sequence positions

A C G T

1 2 3 4 5 6 7 8

0.1

0.1

0.6

0.2

% ��0�������������B�����������.����� ,����,��6���� ����D�

0.1

0.5

0.2

0.2 0.3

0.2

0.2

0.3 0.2

0.1

0.5

0.2 0.1

0.1

0.6

0.2

0.3

0.2

0.1

0.4

0.1

0.1

0.7

0.1

0.3

0.2

0.2

0.3

shared motif

given profile matrix �% easy to find starting position probabilities

��(�����)��$������&������������ ������������'���� %�'�&�������������(�

B�������'������������ � ������&��������)��� ���������'����������C�8F

MultivariaTr

tanscription

e HMM for Chromatin States Start Site

Enhancer DNA

Observed chromatin marks. Called based on a poisson distribution

Most likely Hidden State

Transcribed Region

1 6 5 3 4 6 6 6 6 5

1:

3:

4:

5:

6:

5

High Probability Chromatin Marks in State

2:

0.8

0.9

0.9

0.8 0.7

0.9

200bp intervals All probabilities are

learned from the data

2

'8 �$� '$; �$� '$; �$� '$; �$� '$; �$�'8 ��� '8 �$� '8 ���

'�?��

0.8

'8 ���

'$; �$�

'�?��

'8 ���'8 �$�

'8 �$�

'8 ��� '8 ���

2����������������.������;����� ������

8I

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Ernst, Jason and Manolis Kellis. "Discovery and characterization of chromatin states forsystematic annotation of the human genome." Nature Biotechnology 28, no. 8 (2010): 817-825.

Modules IV and V: Evolution/phylogeny/populations

% ".����������<�".������ ���& ".�����������10���������.� �����+������3�������+�".�����6������& ".������ ��������<�,����������+�������������+���������+�,�,��

% "�,������������ �����& *��������,�,�������������.�6�� �������������(2�0��� ��/�& )��������������������������� �,,�������,�,���������(�����2��./�& ������������������������������� ���,�,���������("������)�3���/�& ��� ������������3����.�������� �5�����������������(N���0�1���/�

% ������ �������M�*����,����H�0�����+���5�����B�������H�0������& H����3�8M������������6������6������,��#���+��������0���+�7���������

>9

Characterizing sub-threshold variants in heart arrhythmia

Trait: QRS/QT interval

© source unknown. All rights reserved. This contentis excluded from our Creative Commons license. Formore information, see http://ocw.mit.edu/help/faq-fair-use/.

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Arking, Dan E. et al. "Genetic association study of QT interval highlights role for calciumsignaling pathways in myocardial repolarization." Nature Genetics 46, no. 8 (2014): 826-836.

Focus on sub-threshold variants (e.g. rs1743292 P=10-4.2)

(1) Large cohorts, (2) many known hits (3) well-characterized tissue drivers >�

��F��-���

�1H1�7*:=�

H���������� �� ����

Evidence of Neanderthal�

�� ����

�Human gene flow

"�,���������,����J�$>9��.��

����������� ����H����������

��F�-���

H:���1H1�7*:=�

�� ��5� �����0�����������

�G1 ��1�

�0������� ����� ����J�>99��.��

�� �����

�� ��5� �����0����������

������

H�����5�6�������� ����JF�>��.��

J��99��.��

Courtesy of Luna04 on wikipedia.License: CC BY.

Courtesy of Luna04 on wikipedia.License: CC BY.

>�

% )�3���������������,�����0�����,��,���������������������������D����% *���������,��6���0���������.��������������������������,������5������������% ������������6������3��������0������� ,�.�3���������3���0�����3����������,��������

QC����� �����6�� ���������������������

QN����� �����6�� ����5��������������

������,��6.���66�������������6��������3���������+����������������������66������,��3�3���������6���.���0�������� �����

Structure of genetic code �� evolutionary signatures

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

>$

Distance matrix � Phylogenetic tree

Hum Mou Rat Dog Cat

Human 9� 8� >� ?� ;�Mouse �.� � 9� $� F� >�

Rat �.��� ��� 9� I� ?�Dog ���D��� �.���D��� ��.���D��� 9� ��Cat ���D�� �.���D�� ��.���D�� ��� 9�

�� ���

2���

����

������

���

��

�D�

��� �

.���

����������� ���������,��.�3��������3���0��������������������53��������������

��,����������2�#�����������

������ ,��������������� ����D�

��#�

�����#�(2�#5��#/��

>8

‘Peeling’ algorithm for P(D|B,T) term

�� ���� ��sites j evolve independently���������������� ���6��������� �����������������

�� ���� ��branch independence+���������������,��������1D,����������#�����,��3�3����.������,�����6�"(D�VD,�����+��/���:��.�"(D��5�/��� ����+������,����+�3��������������6��B��

$� =�������������� ,����P(xi|xparent(i),ti)�6���6�D���,����2�6�����3.�������B����� �����(O�+�'�"+��'N+���/��1����.���������6�����.���0��������� �����6����������������

8� �����������������0����������������������marginalize �)� ��0�������,����3���0�������6�������������<������������*���D�U�+L+D��5����,���������B���6��5����������������� >>

Two types of gene-tree species-tree reconciliation

�� -� �� �� -� ��

���������� Coalescence Duplication & Loss

% Coalescent models of alleles in populations Deal with 1-to-1 orthologs Estimate divergence times, pop sizes, etc Models move backward in time Cannot cope with duplication and loss

8������������

;�#� *�

;�#� *�

% DL models of genes in species Deal with paralogous families Estimate birth death rates Models move forward in time Cannot cope with incomplete

lineage sorting

��,!*����

>;

>?

Biology primer

!������������������� ��������3�����.�������6�� �����������6����������������

>F

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

>I

DNA: The double helix � ���������� ���� ��� �������������

��

Image by MIT OpenCourseWare.

DNA: the molecule of heredity % )��65� ,�� �������.������ ��������3������6�������.�

& '�����������������+������������ ,�����6�����������& �������������,���������������������,��6��,�����������0��,����������� �������.������������,����3����,.���� ����� �6������������� �������� �=������W�����+��I>$�

Phosphate moleculeDeoxyribose

sugar molecule

Nitrogenous bases

Weak bonds between bases

Sugar-phosphate backbone

{

A

A

C

C

G

G

T

T

{ CGTA

AT

CG

TA

GC

DNA REPLICATING ITSELF

TA

TAAT

TA

TAT A

C G G

G

TA

GC

CA

TOLD

OLD

NEWNEW

GCAT

TA

GCTA

TAGC

GC

G

TAGC

AT

Image by MIT OpenCourseWare.61

DNA: chemical details

123

4

5

1

2 345

123

4

5

1

2 345

123

4

5

1

2 345

123

4

5

1

2 345

T % -�������������������������

A % "

•��,����

W3��3����

eak hydrogen bonds hold the �������� two strands together

• This allows low-energy opening C and re-closing of two strands

G • Anti-parallel strands • Extension 5 �3 tri-

T phosphate coming from

A newly added nucleotide

The only parings are: C • A with T

G • C with G

;�

DNA: the four bases

"������ "������".�� ������ ".�� ������

=���� =����)������ )������

� ���� � ����'���� '����

;$

Alignment: all species/genes share common ancestry

)������������)���6� �-�����© Various sources. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

���� ;8

© Neal Olander. All rights reserved. This content is excluded from our Creative Commonslicense. For more information, see http://ocw.mit.edu/help/faq-fair-use/. ;>

Tree of life

© Neal Olander. All rights reserved. This content is excluded from our Creative Commonslicense. For more information, see http://ocw.mit.edu/help/faq-fair-use/. ;;

Extinctions part of life

Phylogenetic tree showing archosaurs, dinosaurs, birds, etc. through geologic time removed due to copyright restrictions.

;?

Phylogenetics ��������������)����6���� ,�����������.��6���������6� ��?���� �3��������������������6������ ������ ��

J�?���� �������)�),����+�������+�������.,��+�2�������+��������+�*��������+�7����+������+������������)�.�����

"�����

Mammal family tree removed due to copyright restrictions.

�������)����,�������+� �������+�������D,�������+��7�3������+� ���6�+������L��

-�����������������&�����)�7������+�� ,�����+���� �����6������������0����+� ��0����6������ +����B��������6��D������,����+�,��������+������������

"���()�".������������������.��D������,������������'����������(,�������<���������<�� ����������/�

;F

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

2��'��������

;I

Chromosomes inside the cell

Prokaryote

DNA organized in a single chromosome.

No nucleus. No mitosis.DNA organized in multiple chromosomes

inside a nucleus.Mitotic division

DNAEukaryote

Nucleus

Figures by MIT OpenCourseWare.

DNA packaging % =.�,��������& 2H�����0��.������& ��������0��.�� ����

% �� ,��������& ��� ��� ������>9+999��� �������������� Image removed due to copyright restrictions.

Please see: Figure 8-10 from Alberts, Bruce, and Martin Raff.

�D�������2H��Essential Cell Biology. New York, NY: Garland Publishing Inc.,1997. ISBN: 0815320450.

% C��������2H��& -�6������,�����6�2H����������6�����.����+������ ,������������ �����,��������.�

% H���� ��������& �����6������3����.�& )���������� ����������6�& �����6�$2�������������

?�

2�0������,�������� ���6��������

Courtesy of the National Institutes of Health; in the public domain.

� �������������,�<<������ �,������0<�,����� ��< ?� ˆˆ,.<<ˇ. .... .,.ˇ. .˛.0<˝,.˛˝ˇ. ...<

Diversity of epigenetic modifications ���6�������� %��99U���66������������� ���6��������

%���������,����������$<�8<���<��-�%��������������*.����8('8/<'$;L�%��� ���� ���6���������������������� ����<"�<C3��%�H� 3�������5��5��( �$/�%�)���������$'8 �$+���-'>��

%���������������%�2H�� ���6��������%����.�5������,��<����.�5����������

2H�����,,������������������,�������� %�H������ ��,�����������

© source unknown. All rights reserved. This contentis excluded from our Creative Commons license. For %�2H�������3����.�more information, see http://ocw.mit.edu/help/faq-fair-use/� %����������������������6�����������������

%��7<������<�����<�7�<��� �� ,����?$

Diverse tissues and cells:

Epigenomics Roadmap across 100+ tissues/cell types

Diverse epigenomic assays:

1. Adult tissues and cells (brain, muscle, heart, digestive, skin, adipose, lung, blood…) 2. Fetal tissues (brain, skeletal muscle, heart, digestive, lung, cord blood…) 3. ES cells, iPS, differentiated cells (meso/endo/ectoderm, neural, mesench, trophobl)

1. Histone modifications % H3K4me3, H3K4me1 % H3K36me3

Art: Rae Senarighi, Richard Sandstrom % H3K27me3, H3K9me3 % H3K27/9ac, +20 more

2. Open chromatin: % DNase

Courtesy of Macmillan Publishers Limited. Used with permission. 3. DNA methylation: Source: Roadmap Epigenomics Consortium et al. "Integrative analysis of 111reference human epigenomes." Nature 518, no. 7539 (2015): 317-330.

% WGBS, RRBS, MRE/MeDIP 4. Gene expression % RNA-seq, Exon Arrays

?8

Deep sampling of 9 reference epigenomes (e.g. IMR90)

Courtesy of Ting Wang. Used with permission. UWash Epigenome Browser, Ting Wang Chromatin state+RNA+DNAse+28 histone marks+WGBS+Hi-C ?>

2�0������� �����������������������,����� ��������

% �99���6������� ���6�������+� ��.������������ �������% ).��� ���� �,,������������"5+�-����6���5+�2H���5)�B�

%H3K4me3 %H3K9ac %DNase

%H3K36me3 %H3K79me2 %H4K20me1�

%H3K4me1 %H3K27ac %DNase�

%H3K9me3 %H3K27me3 %DNAmethyl�% H3K4me3 % H3K4me1 % H3K27ac % H3K36me3 % H4K20me1 % H3K79me3 % H3K27me3 % H3K9me3 % H3K9ac % H3K18ac

Enhancers Promoters Transcribed Repressed

© source unknown. All rights reserved.This content�is excluded from our CreativeCommons license. For�more information,Courtesy of Broad Communications. Used with permission.see http://ocw.mit.edu/help/faq-fair-use/.

?;

Chromatin state annotations across 127 epigenomes

Reveal epigenomic variability: enh/prom/tx/repr/het Anshul Kundaj

Courtesy of Anshul Kundaje. Used with permission.

e ??

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

?F

Genes control the making of cell parts

% �������������6���� ������������6�����������& 1��2H�� ����������9+999U�������& �����������6������������ ����(���� ,��� ��6����� �����./�

& 10��.��� ���� ,��� ���� ���+���������,�����������������% ��,��������� H�+������,�����+���������3���,�������� ����,�������

% H��������� ,����.��,.�& ��� ���� �6��������,����������������6�� ������6�� ����2H����6�� ��������,������.�������,������5 ������ �����.������� H�� �������

& ��� ����,���������������+���� �����,�������� ����& 1�� H�����.����������� ������� ��3�6����������������

?I

mRNA: The messenger

% ��6�� ������������ ���� �& ��������������0������3����������& ��3����0������D.��3����������A T T A C G G T A C C G T

U A A U G C C A U G G C A

& �� ,���3���3���5,����������.3����.3��������

Image by MIT OpenCourseWare.

F9

DNA

Transcription

Translation

Replication

RNA

Protein

From DNA to RNA: Transcription

Image removed due to copyright restrictions.Please see: Figure 7-9 from Alberts, Bruce, and Martin Raff.Essential Cell Biology. New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

F�

From pre-mRNA to mRNA: Splicing

% ���1����.����+������0��.�,�����6�����������������& 7����������D�����������,����3.����5�������������������& 2������,��5 H�� ���������+��������������,���������& ���� ���+�,�� ��.��������,�����3���9;�3,������

Image removed due to copyright restrictions.Please see: Figure 7-16 from Alberts, Bruce, and Martin Raff. Essential Cell Biology.New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

& ���������0���,���������.�������66�������D�����3�����6�������� ������+�����������66������,�������,�������

F�

RNA can be functional

% )������)�������������� ,��D����������& )��65� ,�� �����.���������6�� ���������� ��& ����5�� �������������������������6����������.��6� H��

% 7�����.,����6� H��& H��� ����������6����������6�� ������& � H�������5��5� ���������,��6���.�& � H��������6������3��� ��& �� H�����,���������������

% ���3����������L�& =� ��������� ���������������������������� H��������& :����,������� �+�3�6����2H������,������+� H����������

F$

RNA structure: 2ndary and 3rdary

Courtesy of SStructView F8

Splicing machinery made of RNA

Image removed due to copyright restrictions.Please see: Figure 7-16 from Alberts, Bruce, and Martin Raff. Essential Cell Biology.New York, NY: Garland Publishing Inc., 1997. ISBN: 0815320450.

F>

,.#�

�.#�

�������

�����

�����

Central dogma of Molecular Biology

F;

Proteins carry out the cell s chemistry

% ������ ,��D�,��. ���& H�����������0��8�3��������3�����& "���������0���9�����������0���������.�& 1��� ������������,��6��,��,�������

%•

DNA

Replication

Transcription

Translation

RNA

Protein

)�B�������)����������7�������& ���� ����������B���������� ������������5�� ���������6�����6�,�������

& ���,������ ��6�������������.���,�����������6���������6����$2����������

% "��������,��.���0�����������& �����.���+�3������+�������������+����������+������,���+� ���3���� �

F?

Image by MIT OpenCourseWare.

Protein structure

Alpha-beta horseshoeBeta-barrel this placental ribonuclease inhibitor is a

Helix-turn-helix Some antiparallel b-sheet cytosolic protein that binds extremely domains are better described as strongly to any ribonuclease that may leak

Common motif for b-barrels rather than b- into the cytosol. 17-stranded parallel b DNA-binding proteins sandwiches, for example sheet curved into an open horseshoe shape, that often play a streptavadin and porin. Note with 16 a-helices packed against the outer regulatory role as that some structures are surface. It doesn't form a barrel although it mRNA level looks as though it should. The strands are transcription factors intermediate between the only very slightly slanted, being nearly

extreme barrel and sandwich parallel to the central `axis'.arrangements.

Base pair

DNA

Sugar phosphate backbone

3

1

2

A

FF

Image by MIT OpenCourseWare. Image by MIT OpenCourseWare.

Image by MIT OpenCourseWare.

Protein building blocks % � ����������

FI

From RNA to protein: Translation

•tRNA

Image by MIT OpenCourseWare.

I9

NH +3

NH +3

C C A

5' 3'

U A C

G G C

NH +3

A U G

Tyr

Gly

Met

Pro

A U G C C G G G U U A C U A A

• Ribosome

The Genetic Code

��C����0���������.������ ,����������,��,������������ ,����������.�����0���,������5������������ I�

Summary: The Central Dogma

2H�� ����� H�� �����"�������

Image by MIT OpenCourseWare.I�

Inheritance

Messages

Reactions

DNA

Transcription

Translation

Replication

RNA

Protein

,.#�

�.#�

�������

�����

Cellular dynamics and regulation How cells move through this Central Dogma

�����

�������'��������

I$

Animal/Human gene regulation: One genome � Many cell types

ACCAGTTACGACGGTCAGGGTACTGATACCCCAAACCGTTGACCGCATTTACAGACGGGGTTTGGGTTTTGCCCCACACAGGTACGTTAGCTACTGGTTTAGCAATTTACCGTTACAACGTTTACAGGGTTACGGTTGGGATTTGAAAAAAAGTTTGAGTTGGTTTTTTCACGGTAGAACGTACCGT

TACCAGTA

Images of a heart, red blood cell, and a brainremoved due to copyright restrictions.

Image in the public domain.

� ����)���������,���� I8

Eukaryotic Gene Regulation

Cartoon depicting eukaryotic gene regulation removed due to copyright restrictions.

I>

Diverse roles for regulatory non-coding RNAs

% Small RNA pathways (18-21 nt) & ��� H�����

% �,�����������3.����������������$ C� ��3.�� ,�� �������.�% 2��3��5��������� H��������������������������������% �����.�6��������������������,�� ��������������������������

& ,��� H���% �������������,����������,���3������ ����������� �����

& ��� H���& ��C5 H���

% Long non-coding RNAs (1000s nt, many exons) & )�66�����6���,������<�7�3�������& )�66�����6���$2�����������6� H��

I;

Regulation of Gene Expression

% C,����� ��6�����������promoter ��������

% ��������,�� �������B���������motifs�

% Transcription factors (�7�/�3������� ���6��

% �7���������RNA polymerase % ������������,�����

��������

"��������������������;�����'�8�����1D� ,�����

��.#�

"�������������������� ��(�������

I?

Predicted motif drivers of enhancer modules

% Activator and repressor motifs consistent with tissues

Pouya Kheradpour Courtesy of Macmillan Publishers Limited. Used with permission. IF98

Network components reveal functional modules

% 7���56����������,�������0���, ������,����������% ���,���������6� �����������W���������� ������

© Cold Spring Harbor Laboratory Press. All rights reserved. This content is excluded from ourCreative Commons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.Source: Zeitlinger, Julia et al. "Whole-genome ChIP–chip analysis of Dorsal, Twist, and Snailsuggests integration of diverse patterning prcesses in the Drosophila embryo." Genes &Development 21, no. 4 (2007): 385-390.

K������'���et al%�������<�,�&������������L� II

3���M��������������B@�������%��@�����C�

Kheradpour et al Genome Research 2013

Systematic motif dissection in 2000 enhancers: 5 activators and 2 repressors in 2 cell lines

Figure 1: selection of activator and repressor motifs removed due to copyright restrictions.Source: Kheradpour, Pouya et al. "Systematic dissection of regulatory motifs in 2000predicted human enhancers using a massively parallel reporter assay." Genome Research23, no. 5 (2013): 800-811.

�99

Emerging properties of regulatory networks

Figures removed due to copyright restrictions.

% ������������0�����6����������.��������& ) ������ 3����6�3������5,��������������

% ),��6��<���������6���3���3.� ��� H�����������0���& ������������6��7��� � H����������������� � 5����������

�9�

From Systems Biology to Synthetic Biology

9���*�������

).�������

��������.�H��������

© source unknown. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

% �� ,�����������������,��,�������

�� % ���� 3���3�����

�.� ���������������

������

"��� ������<�,����,����

% � ,�� ����������

).

����3����

��������������������������� ��

% )���.�3��0����W�Courtesy of Macmillan Publishers Limited. Used with permission.Source: Benner, Steven A. and A. Michael Sismour. "Syntheticbiology.“ Nature Reviews Genetics 6, no. 7 (2005): 533-543.

��#��������������9�(��������'� �9�

Over-express a single microRNA leads to new wing

% 2���0��.��6������<����5������ � H���% ��������.�������������3�������������0���, ������,����� ��

% -.��0��5�D,�������������������( � H���/����3����������������

% =����,����� ��������0����������

�������������

������

�������)�����.�3��������

�������<3��������

������ #���������

6"�

.��

�)�*

%,%2

����

���

�'��

����

����

© source unknown. All rights reserved. This content is excluded from our CreativeCommons license. For more information, see http://ocw.mit.edu/help/faq-fair-use/.

8�����et al%������<,�&������������L�

�9$

Brief intro to Human Genetics

�98

,.#�

�.#�

�������

�����

The role of genetic alterations

�����

�9>

Brief intro to human genetics % -�����'�������$��-��������+����,���+��$��� ��� ��+��9�������+�J$��� ���)H"�+�J>99���,���.,��3�����

Figure in the public domain. Created by Darryl Leja and Teri Manolio, NHGRI;Tony Burdett, Dani Welter, and Helen Parkinson, EBI.

�9;

www.genome.gov/GWAStudieswww.ebi.ac.uk/fgpt/gwas/

The power and challenge of disease-association studies

% Large associated blocks with many variants: Fine-mapping challenge % No information on cell type/mechanism, most variants non-coding � Epigenomic annotations help find relevant cell types / nucleotides

Slide credit: Luke Ward, Mark Daly

"���������7�'����������������������������������������*����������������������

�9?

���������������+����� ��������� ��������(011�'��������1���(1��23����3���1�

rs11209026 A G

������ ��� I?;���������� ;F� I$��* �/�0�N��3�%���NL�1�@���/L�

�*�$ �.����������,�����������3�����6��66������5�����

The power of GWAS: reveal new disease genes

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Cho, Judy H. "The genetics and immunopathogenesis ofinflammatory bowel disease." Nature Reviews Immunology 8, no.6 (2008): 458-466.

© ADAM, Inc. All rights reserved. This content is excluded fromour Creative Commons license. For more information, seehttp://ocw.mit.edu/help/faq-fair-use/.

�9F

Genomewide association in schizophrenia with 40,000 cases

����������99������������������6�������� �������������������,�����MMM��

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Ripke, Stephan et al. "Biological insights from 108 schizophrenia-associated genetic loci." Nature 511, no. 7510 (2014): 421. �9I

DD

% Disease-associated SNPs enriched for enhancers in relevant cell types % E.g. lupus SNP in GM enhancer disrupts Ets1 predicted activator

Interpreting non-coding variants

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1� ��9

Mechanistic predictions for top disease-associated SNPs

Disrupt activator Ets-1 motif �� Loss of GM-specific activation � Loss of enhancer function � Loss of HLA-DRB1 expression

2�(� ���(���� ����(��������7����������������!�������(� �����������������(�� ����������

Creation of repressor Gfi1 motif � Gain K562-specific repression � Loss of enhancer function � Loss of CCDC162 exp

Figures removed due to copyright restrictions.

ression ���

Chromatin state annotations across 127 epigenomes

Figures removed due to copyright restrictions.

Reveal epigenomic variability: enh/prom/tx/repr/het Anshul Kundaje ���

Characterizing sub-threshold variants in heart arrhythmia

Trait: QRS/QT interval

© source unknown. All rights reserved.�This contentis excluded from our Creative Commons license. Formore information, see http://ocw.mit.edu/help/faq-fair-use/.

Focus on sub-threshold variants (e.g. rs1743292 P=10-4.2)

Courtesy of Macmillan Publishers Limited. Used with permission.Source: Arking, Dan E. et al. "Genetic association study of QT interval highlights role for calciumsignaling pathways in myocardial repolarization." Nature Genetics 46, no. 8 (2014): 826-836.

(1) Large cohorts, (2) many known hits (3) well-characterized tissue drivers ��$

Courtesy of Macmillan Publishers Limited. Used with permission. Source: Roadmap Epigenomics Consortium et al. "Integrative analysis of 111 reference human epigenomes." Nature 518, no. 7539 (2015): 317-330. ��8

Linking traits to their relevant cell/tissue types

ES Liver

Brain

Digestive

Heart

T cells B cells

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1� ��>

Methylation differences a causal component of AD

AD predictive power reduced after removing meQTL effect

Methylation probes altered in AD are enriched in AD-associated SNPs

G � M � D

G � M � D

G � D M

"���������7�'���������������������������������������*���������� ���������������������������+�������������� ��������(011�'��������1���(1��23����3���1�

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

Set-wise causality testing ��;

Uncovering the molecular basis of top obesity gene

Obese

C-to-T motif rescue (anti-obesity phenotypes)

T-to-C motif disruption (pro-obesity phenotypes)

Lean

IRX3, IRX5 knock-down (anti-obesity phenotypes)

IRX3, IRX5 overexpression (pro-obesity phenotypes)

ARID5B KD (obesity)

ARID5B OE (anti-obesity)

"���������7�'�� ������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

117

Model: beige �� white adipocyte development

"���������7�'����������������������������������������*�������������������������������������+��������������� ��������(011�'��������1���(1��23����3���1�

Shift therapeutic focus from brain to adipocytes ��F

Challenges in Computational Biology

2H��

8� ���� ������ 3�.�

�� �����7�������>� ��������.� ���6�����0��.�

2���3���������,�$�

������D,������������.����F�

H���������,��

)�B���������� ������

10���������.�����.�?�TCATGCTAT TCGTGATAA TGAGGATAT TTATCATAT TTATGATTT

������������0��.�I� ��33���� ,������9�"�������������������.�������

��� ����3���� ���������

�� ,�����0������ ���;�

1 ���������������,��,��������$�

��I

����:,��������=�����,�<<��� ������

;�98?�<�;�F?F�<��)��>9?��� ,����������-�����.7�����9�>

7�����6�� �������3��������������� ������������������� ���6�C��+�0��������,�<<��� ������<��� ��

Recommended