Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
11
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
2302664Computational Methods in Chemistry
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
หัวขอหลกัของการสอนในประมวลรายวิชา:Data manipulationsวัตถุประสงค:เรียนรูเทคนิคเคมีคอมพิวเตอรและการเขียนโปรแกรมเบื้องตนสําหรับการจัดการกับขอมูลที่ไดจากคํานวณทางเคมีคอมพิวเตอรวิธีสอน:สอนพื้นฐาน กําหนดโจทย แกปญหาโดยเนนปฏบิัติการการวัดผล:คะแนนเก็บที่ไดจากงานที่กําหนดให
22
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
การสอนมี 5 ปฏิบัติการ ซึ่งเกี่ยวของกับกิจกรรมดังตอไปนี้1. การเขียนโปรแกรมวิเคราะหทางโครงสรางโมเลกุลจากระบบ
พิกัดของอะตอม2. การเขียนโปรแกรมวิเคราะหขอมูลจาก Gaussian output 3. การเขียนโปรแกรมวิเคราะหขอมูลจาก Autodock output4. การเขียนโปรแกรมวิเคราะหขอมูลจาก Amber output5. การสืบคนฐานขอมูลและการเขียนโปรแกรมวิเคราะห
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Topics (1st week )I. overview เกี่ยวกับเทคนิคและทักษะเบื้องตนทางเคมี
คอมพิวเตอรสําหรับการศึกษาชีวโมเลกุลII. การสืบคนและการใชฐานขอมูลชีวสารสนเทศIII. โครงสรางพื้นฐานและองคประกอบทางเคมีของสารชีว
โมเลกุลIV. ระดับโครงสรางของโปรตีน V. โปรแกรมและขอมูลทางโครงสรางในรูปแบบตางVI. ปฏิบัติการ 1
33
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS from Roadmap for computational chemistry 1999
Overview
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Current Applications of Computational Chemistry• Atmospheric Chemistry• Drug Design• Catalyst/Biocatalyst Design• Materials Design• Physical Properties for Process Simulation• Polymer Structures/Properties• Adhesives/Coatings Design• Lubricant Properties/Chemistry• Surfactant Chemistry
44
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Computational chemistry describes chemical systemsat various size scales.Quantum Scale - Solves the Schroedinger equation for electronic motion in atoms and molecules either by molecular orbital or density functional theories. Predicts molecular structure, energetics, bonding, reaction rates, and spectroscopic data.Atomistic or Molecular Scale – computes interactions between atoms or groups using classical Newtonian mechanics and empirically determined force fields. Calculates structure and thermodynamic and transport properties, and time dependence of the structure.
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Mesoscale - in between atomistic calculations and the continuum assumption of traditional materials engineering. Typically applies to systems of millions of atoms which still reflect molecular scalephenomena.Bridging Scales - theory and models to provide aninterface between scales.
55
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
- Quantum chemical calculations: Hartree Fock, Density functional theory etc.
- Simulations: molecular dynamics, Monte Carlo simulation
- Modelings: sequence alignment, homology modeling, QSAR (quantitative structure-activity relationship), molecular docking, structure-based drug design
- Algorithms: energy minimization, simulated annealing, genetic algorithm, neural network, clustering algorithm, distance geometry,
- Others: free energy calculations,
I. เทคนิคสําคัญในดานการจําลองและการออกแบบโมเลกุลดวยคอมพิวเตอรสําหรับการศึกษาชีวโมเลกุล
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
66
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS GAMESS (UK)FireflyCulgiCPMDCP2KCOSMOSCootCHARMMChimeraCP2KCerius2ADFAMBER
WHAT IF[web 12]
VMDReaxFFTURBOMOLEMCCCSSybylSTR3DI32SPARTANSiriusQ-ChemPyMOLOscail XNOCH
Popular software for molecular modelling
NAMDMOPACMolsoft ICMMolecular Docking ServerMOE MDynaMixMaterials StudioMacroModelInsightIIGROMOSGROMACSGAUSSIANGAMESS (US)
77
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
- literature source - databases of gene, genome & protein sequence information- software, tools and web service - etc. substance databases, sub-databases, consultants, collaboration
NCBI : Information center for bioinformatic research
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
protein sequence alignmentdownload information (prot. seq.)
molecular modeling & design
Protein Data Bank
Work flow: from sequence to structure
88
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Example : The 2009 influenza A virusA/California/04/2009(H1N1) : NA & M2 sequences
structure modeling
binding calculations
aa changes in new 2009 N1 do not affecttamiflu’ssusceptibility
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
What are the basic requirements to be qualified as a computational chemist?
ความรูและทักษะเบื้องตนทางเคมีคอมพิวเตอร
99
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Basic & Skills required for computational chemists
- Linux and Windows software- Mathematic & physic knowledge - unix commands- text editors : vi, emacs, sedt etc. - programming languages : Fortran, c, unix etc.- molecular modeling software - databases- model & graph representation: science + art
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
- ทักษะทางภาษายูนิกซ (Unix commands) : user, admin.- ทักษะการเขียนและแกไขโปรแกรมภาษาตางๆ เชน C , Fortran, perl, www- ความสามารถในการใชซอฟทแวรสําเร็จรูปการคํานวณ
- Graphic-based manipulation : Rasmol, VMD- Text-based manipulation: Amber, Charmm, Autodock- Database system management
- ทักษะพิเศษอื่นๆ
ทักษะสําคัญในงานวิจัยเคมีคอมพิวเตอร
1010
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
II. การสืบคนและการใชฐานขอมูลชีวสารสนเทศ
Chemical databases, Software tools, Educations etc.
Other resources
Eukaryotic, Fungi, Insects, Mammals, Microbial, Plants
Genome Databases
Protein sequence database, Protein structureMolecular Databases
Journal (abstract), Books etc. (Entrez Pubmed)Literature Databases
Genetic (DNA) sequence databaseGenBankDescriptionDatabase
a (inter)national and public resource for molecular biology information
1) Databases in NCBI
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
http://www.ncbi.nlm.nih.gov
1111
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
NCBI GenBank
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Influenza A virus (A/bird/Thailand/3.1/2004(H5N1)) neuraminidase(NA) gene
translation= "MNPNQKITTIGSICMVTGMVSLMLQIGNLISIWVSHSIHTGNQHKAEPISNTNFLTEKAVASVKLAGNSSLCPINGWAVYSKDNSIRIGSKGDVFVIREPFISCSHLECRTFFLTQGALLNDKHSNGTVKDRSPHRTLMSCPVGEAPSPYNSRFESVAWSASACHDGTSWLTIGISGPDNGAVAVLKYNGIITDTIKSWRNNILRTQESECACVNGSCFTVMTDGPSNGQASHKIFKMEKGKVVKSVELDAPNYHYEECSCYPDAGEITCVCRDNWHGSNRPWVSFNQNLEYQIGYICSGVFGDNPRPNDGTGSCGPVSSNGAYGVKGFSFKYGNGVWIGRTKSTNSRSGFEMIWDPNGWTETDSSFSVKQDIVAITDWSGYSGSFVQHPELTGLDCIRPCFWVELIRGRPKESTIWTSGSSISFCGVNSDTVGWSWPDGAELPFTIDK"
1212
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
10 20 30 40
250 270260
Sequence alignment determines the similarity of proteins
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Properties Computed from Structure:
Molecular Weight: 151.163 g/mol
Molecular Formula: C8H9NO2
XLogP: 0.917
Hydrogen Bond Donor Count: 2
Hydrogen Bond Acceptor Count: 2
Rotatable Bond Count: 1
Tautomer Count: 4
Chemical Database
AcetaminophenAnalgesic antipyretic derivative of acetanilide. It has weak anti-inflammatory properties and is used as a common analgesic, but may cause liver, blood cell, and kidney damage.
1313
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
“the central repository and distribution of 3D-biological macromolecular structures”
2. Protein Data Bank (PDB)
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Growth Rate of 3D Structures
1414
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
www.rcsb.org
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Protein Data Bank (PDB)
keyword
pdb id code: 1bl8, 1dg5, 3lzmSearch Field
1515
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Results: Search Hits
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Obtaining 3D protein structure from PDB
1616
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
PDB File Format Content : atomic coordinates, Atom name, Residue Name, Residue Number, (x, y, z) Coordinates
3D structural data is presented in the form of Cartesian coordinates of atoms
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Protein StructureProtein StructureProtein Structure
Fundamental basis (a helpful source of information) for understanding their role in biological process Global impact : pharmaceutical & medical, industry, science & technology etc.
1717
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ประเภทของโปรตีน อาศัยลักษณะทางโครงสรางตติยภูมิ (Tertiary structure) ก. Fibrous proteinsโครงสรางของสายโปรตีนมีลักษณะเปนเสนยาว โปรตีนกลุมนี้สวนใหญทําหนาที่เปนองคประกอบหรือกรอบทางโครงสราง (structural framework) ใหกับเซลล ดังนั้นโครงสรางจึงมีการปรับเปลี่ยนนอย ข. Globular proteins โครงสรางของสายโปรตีนมีลักษณะมวนพับเขาหากันมากกวาชนิดแรก โปรตีนกลุมนีส้วนใหญไดแก เอนไซมและโปรตีนที่เกี่ยวของกับกระบวนการทํางานของยีน
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
องคประกอบทางเคมี ไดแก เมทัลโลโปรตีน (metalloprotein) ซึ่งเปนกลุมโปรตีนที่มีโลหะเปนองคประกอบรวม, ไกลโคโปรตีน (glycoprotein) เปนกลุมโปรตีนที่มีคารโบไฮเดรตเปนองคประกอบรวม, หรือ ฮีมโปรตีน (heam-protein) เปนกลุมโปรตีนที่มีหมูฮีมรวมอยูดวย เปนตน
หนาท่ีทางชีวภาพ ไดแก เอ็นไซม (enzyme) เปนกลุมโปรตีนทําหนาที่เปนคะตะลิสตของปฏิกิริยาเคมี โปรตีนที่ทําหนาที่ถายเทอเิลคตรอน (electron transfer protein) โปรตีนขนสง (transport protein) โปรตีนที่ทําหนาที่กักเก็บหรือสะสม (storage protein) ฮอรโมน แอนติบอดี้ เปนตน
สมบัติในการละลาย อาศัยสภาพแวดลอมที่โปรตีนอยู เชนโปรตีนที่อยูบริเวณหรือในชั้นเมมเบรนซึง่เปนสารในกลุมไขมัน เรียกวา เมมเบรนโปรตีน (membrane protein) และโปรตีนที่ไมไดอยูในบริเวณดังกลาว เรียกวาโปรตีนที่ละลายในน้ํา (soluble protein)
ลักษณะรูปราง อาศัยรูปทรงหรือโครงสรางของโปรตีน เชน โปรตีนโกลบูลาร (globular protein) หรือโปรตีนกอนกลม โปรตีนที่มีลักษณะยาวคลายเสนใย (fibrous protein)
1818
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ProteinsProteinsProteins
Protein : a biopolymer containing amino acids as building block
N CA
H
C
O
R sidechainbackbone
H
N CA
H
C
O
R sidechainbackbone
H
N CA
H
C
O
R
H
N CA
H
C
O
R'
H
N CA
H
C
O
R
H
N CA
H
C
O
R'
H
Peptide bond
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Amino acidAmino acid
N
H
CA
H
C'
O
R
R is the side chainBackbone (heavy) atoms:N, CA, C', O
Basic Protein Structure
• Backbone (Mainchain) • Sidechain (R): 20 types • Geometry and Hybridization• Properties
Tetrahedral sp3
Square planar sp2
1919
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
20 amino acid residues20 amino acid residues20 amino acid residues
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
StereoisomersStereoisomers
StereochemistryStereochemistryStereochemistry
HNH2
R
COOHNH2H
R
COOH
L-form(Naturally occurring)
D-form
Two stereisomers : L- (R configuration) and D- (S configuration) forms. In nature, proteins are formed by L-amino acid.
CA is a chiral center
2020
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
HH3N
COO
R
-+
Zwitter ionsZwitter ions
•The ends of amino acid, the amino (NH2) and the carboxylic (COOH) groups, are ionizable.
•Amino acid with the ionized form of both ends is called zwitter ions.
protonation : -NH2 + H + --> -NH3+
deprotonation : -COOH --> -COO- + H +
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
การจัดหมวดหมูของกรดอะมิโน
ก) Hydrophobic residues
คือ กรดอะมิโนที่ไมชอบน้ําหรือมีความเปนขั้วต่ํา กรดอะมิโนในกลุมนี้มีชนิดที่ sidechain เปนแบบ aliphatic residue ไดแก Ala, Val, Leu, Ile, Pro และ Met และชนิดที่ sidechain เปนแบบ aromatic residue ไดแก Trp และ Phe
ข) Polar residues คือ กรดอะมิโนที่มีขั้ว เชน Ser, Thr, Cys, Tyr, Asn, Gln, His ขอสงัเกตุ กรดอะมิโนเหลานี้มักจะมีหมู –OH , -CONH, -SH, imidazole รวมอยูที่ sidechain
ค) Charge residues คือ กรดอะมิโนที่มีประจ ุ สมบัติของกรดอะมิโนในกลุมนี้คือสามารถรับหรือใหโปรตอนได สําหรับกรดอะมิโนที่ sidechain มีหมู –COOH เชน Asp และ Glu มีสมบัติคลายกรด (บางครั้งเรียกวา acidic residues)
2121
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
General Classifications of Amino Acids
On the basis of general physical properties, the amino acids are categorized as follows
1. Hydrophobic residues2. Polar residues3. Charged residues
* Gly is an exception.
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Structure & Classification of 20 Amino AcidsStructure & Classification of 20 Amino AcidsStructure & Classification of 20 Amino Acids
2222
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
H
Gly
CH3
Ala
O
CH2
*SCH2
* CH3 CH3
CH CHO CH3
*C
CH2
O O*
C
CH2
O NH2 CH
CH2
CH3CH3 CH2
CH
CH3
CH3
CH2
CH2
CH2
CH2
NH3+
Ser Cys Val The Asp
Asn Leu Ile Lys
CH2
CH2
CH2
NHC
+NH2NH2
C
CH2
O O*
CH2
C
CH2
O NH2
CH2
CH2
CH2
SCH3
N CH
CH2CH2 NN
CH2
H
CH2 CH2
O *
N
CH2
H
His Phe Tyr TrpProMet
GlnGluArg
Labile protons (solvent exchangeable, HLabile protons (solvent exchangeable, H--bond)bond)
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Greek letters
ε
N
O
N
ηα
β
γ
δζ
δ
ε
ε
ζ
CBCG
CDCE
CZCHCA
N
O
O
N
α
β
γ
δ
δ
Basic Protein Structure
Naming Convention of Amino AcidNaming Convention of Amino Acid
2323
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Levels of protein structureLevels of protein structureLevels of protein structure
Primary Str. Secondary Str.
Tertiary Str. Quaternary Str.
MMAGHT…CMT
C-terminalN-terminal
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
PDB File Format Content : atomic coordinates, Atom name, Residue Name, Residue Number, (x, y, z) Coordinates
3D structural data is presented in the form of Cartesian coordinates of atoms
2424
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Understanding PDB structural data
ID code, Header, Title ReferencesExpt. Data, Resolution Sequence residues, Helix, SheetAtomic coordinates in PDB ***Naming convention of atoms ***HETATM
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
ATOM 1 N PRO A 1 39.948 8.524 7.859 ATOM 2 CA PRO A 1 40.303 8.742 9.262 ATOM 3 C PRO A 1 39.969 7.576 10.198 ATOM 4 O PRO A 1 39.210 6.721 9.764 ATOM 5 CB PRO A 1 39.566 10.000 9.686 ATOM 6 CG PRO A 1 38.424 10.110 8.676 ATOM 7 CD PRO A 1 39.168 9.672 7.422 ATOM 8 N GLN A 2 40.448 7.444 11.438
Atomic coordinates in PDB
z crd
ycrd
x crd
res no
chain id
res name
at name
at id
Initial
col9 54
col8 46
col7 38
col6 26
col5 22
col4 18
col313-14
col211
col11
2525
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ε
N
O
N
ηα
β
γ
δζ
δ
ε
ε
ζ
N CC
COHH
CC
O NH2
HH
HH
α
β
γ
δε1 ε2
N CC
COHH
CC
O NH2
HH
HH
α
β
γ
δε1 ε2
Naming convention of atoms
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
Greek-Eng Examplesα=Alpha=A CA, HAβ=Beta=B CB, HBγ=Gamma=G CG, HG, OG, SGδ=Delta=D CD, HD, OD, ND, SDε=Epsilon=E CE, HE, OE, NE, SEξ=Zeta=Z CZ, HZ, OZ, NZη=Eta=H CH, HH, OH, NH
Atom notation
2626
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
N CC
COHH
CC
O NH2
HH
HH
α
β
γ
δε1 ε2
N CC
COHH
CC
O NH2
HH
HH
α
β
γ
δε1 ε2
ATOM 8 N GLN A 2 40.448 7.444 11.438 ATOM 9 CA GLN A 2 39.939 6.415 12.343 ATOM 10 C GLN A 2 38.829 6.989 13.237 ATOM 11 O GLN A 2 38.947 8.080 13.803 ATOM 12 CB GLN A 2 41.045 5.894 13.208 ATOM 13 CG GLN A 2 40.630 4.836 14.200 ATOM 14 CD GLN A 2 41.824 4.393 15.014 ATOM 15 OE1 GLN A 2 42.177 5.018 15.998 ATOM 16 NE2 GLN A 2 42.569 3.353 14.712
Example
Glutamine
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
ATOM 39 N TRP A 6 32.115 6.209 20.712ATOM 40 CA TRP A 6 31.509 6.765 21.920ATOM 41 C TRP A 6 30.374 7.747 21.627ATOM 42 O TRP A 6 29.416 7.951 22.380ATOM 43 CB TRP A 6 32.599 7.452 22.709ATOM 44 CG TRP A 6 33.732 6.509 23.070ATOM 45 CD1 TRP A 6 34.880 6.448 22.338ATOM 46 CD2 TRP A 6 33.723 5.616 24.084ATOM 47 NE1 TRP A 6 35.619 5.497 22.875ATOM 48 CE2 TRP A 6 34.957 4.978 23.914ATOM 49 CE3 TRP A 6 32.851 5.268 25.104ATOM 50 CZ2 TRP A 6 35.352 3.959 24.768ATOM 51 CZ3 TRP A 6 33.250 4.250 25.964ATOM 52 CH2 TRP A 6 34.479 3.601 25.803
ε
N
O
N
ηα
β
γ
δζ
δ
ε
ε
ζ
Example
Tryptophan
2727
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ATOM 191 N ASP A 25 26.997 3.522 8.604ATOM 192 CA ASP A 25 26.320 2.350 9.110ATOM 193 C ASP A 25 26.682 0.960 8.579ATOM 194 O ASP A 25 26.035 0.418 7.696ATOM 195 CB ASP A 25 24.834 2.615 8.929ATOM 196 CG ASP A 25 23.891 1.734 9.727ATOM 197 OD1 ASP A 25 24.287 0.792 10.396ATOM 198 OD2 ASP A 25 22.708 1.992 9.697
N CC
COHH
CH H
O O-Aspartic acid
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
'pdb' : PDB, 'mmod' : Macromodel, 'xyz' : Tinker, 'cc1' : ChemDraw3D 'mol' : MDL MOL-file, 'sdf' : MDL SD-file 'xplor' : X-PLOR/CNS map, 'ccp4' : CCP4 map, 'callback' : PyMOL Callback object (PyOpenGL) 'cgo' : compressed graphics object (list of floats) 'trj' : AMBER trajectory (use load_traj command for more control) 'top' : AMBER topology file 'rst' : AMBER restart file 'cex' : Metaphorics CEX format 'pse' : PyMOL Session file 'pqr' : PQR (a modified PDB file with charges and radii) 'mol2' : MOL2
ขอมลูทางโครงสรางในรูปแบบหรือ format ตางๆ
2828
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ปฏิบัติการ 1
1. สืบคนขอมูลจากฐานขอมูลตอไปนี้1.1 คนหาลําดับกรดอะมิโนของโปรตีนจากฐานขอมูล NCBI1.2 คนหาขอมูลโครงสรางสามมิติของโปรตีนจากฐานขอมูล RCSB
2. เขียนโปรแกรมวิเคราะหขอมูลที่ไดจากขอ 1
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
แบบฝกหัด
1. ศึกษาการใชโปรแกรม Rasmol2. จากขอมูลโครงสรางสามมิติ เขียนโปรแกรมวิเคราะหทาง
โครงสราง เชน ความยาวพันธะ มุมพันธะ มุมไดฮีดรัล เปนตน
2929
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
Work Assignment I
1. เขียนโปรแกรมแปลงขอมูลทางโครงสรางจากรูปแบบอ่ืนๆ ใหอยูในรูป PDB format
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS
3030
ChulalongkornChulalongkorn UniversityUniversityC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lChulalongkornChulalongkorn UniversityUniversity
PS
ChulalongkornChulalongkorn UniversityUniversity
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
Com
puta
tiona
l Che
mis
try
Uni
t Cel
lC
ompu
tatio
nal C
hem
istr
y U
nit C
ell
ChulalongkornChulalongkorn UniversityUniversity
PS