11
Instituto de Química * Facultad de Ciencias Avenida Universidad 330 * Valparaíso * Chile Fono (56-32) 2274994 [email protected] * http://institutoquimica.ucv.cl OBJETIVOS Preparación del sistema con visualizador VMD (Visual Molecular Dynamics) Solvatación del sistema Aprender acerca de archivo input y output de NAMD para correr simulación molecular Aprender los pasos básicos de la simulación Molecular mediante el uso de la herramienta NAMD Introducción DINÁMICA MOLECULAR Este laboratorio consiste en el aprendizaje de pasos básicos de Dinámica Molecular, las cuales son: PRÁCTICA 11: DINÁMICA MOLECULAR Preparación del sistema Minimización Equilibración

Manual VMD

Embed Size (px)

Citation preview

Page 1: Manual VMD

Instituto de Química * Facultad de Ciencias

Avenida Universidad 330 * Valparaíso * Chile

Fono (56-32) 2274994

[email protected] * http://institutoquimica.ucv.cl

OBJETIVOS

• Preparación del sistema con visualizador VMD (Visual Molecular Dynamics)

• Solvatación del sistema

• Aprender acerca de archivo input y output de NAMD para correr simulación molecular

• Aprender los pasos básicos de la simulación Molecular mediante el uso de la herramienta NAMD

Introducción

DINÁMICA MOLECULAR

Este laboratorio consiste en el aprendizaje de pasos básicos de Dinámica Molecular, las cuales son:

PRÁCTICA 11: DINÁMICA MOLECULAR

Preparación del sistema

Minimización

Equilibración

Page 2: Manual VMD

Antes de correr nuestra simulación molecular, NAMD requiere 5 archivos importantes:

• Un archivo PDB (Protein Data Bank), contiene las coordenadas atómicas y / o las velocidades para

el sistema. Los archivos PDB puede ser generados manualmente, u obtenido por vía Internet

http://www.pdb.org

• Un archivo PSF (Protein Structure File), contiene la información estructural de la proteína

• Un archivo de topología (*.top o Force File Topology File), contiene la información sobre tipo de

átomos, cargas y cómo los átomos están conectado en una molécula. Nota que el archivo PDB contiene sólo las coordenadas, pero no la información de conectividad

• Un archivo de parámetro (*.par o Force Field Parameter File). Un campo de fuerza es una

expresión matemática que indica el potencial del sistema. CHARMM, AMBER, y GROMACS son tres

tipos de campo de fuerza y NAMD es apto para usar todos ellos. El archivo de parámetro define

longitud de enlace, longitudes del equilibrio, etc

• Un archivo de configuración, en la cual el usuario especifica todas las opciones que NAMD debiera

usar para correr la simulación. El archivo de configuración le dice a NAMD cómo la simulación es

corrida

Construya el árbol de archivo

En este caso, vamos a enfocarnos en el estudio de

la ubiquitina (PDB: 1UBQ), una pequeña proteína

de 76 aminoácidos encontrada células eucariótica,

cuya función es marcar otra proteína, tal como

receptores de membrana. Para su destrucción

procesos conocido como proteasoma

home

usuario

escritorio

1-1-build

1-2-esphere

1-3-box

Page 3: Manual VMD

SECCIÓN 1: PREPARACIÓN DEL SISTEMA GENERACIÓN DEL ARCHIVO PSF (PROTEIN STRUCTURE FILE) PASO 1: Vamos al directorio /1-1-build y encontrarás los archivos requeridos para construir nuestro archivo

PSF:

• archivo PDB de la ubiquitina, PDB: 1UBQ, es típicamente obtenido a través del Protein Data Bank

• archivos de parámetros (par_all27_prot_lipid.inp )

• topología (top_all27_prot_lipid.inp).

En la consola tipear VMD y cargar la proteína ubiquitina (1UBQ.pdb)

File ���� New Molecule...

Nota: La estructura rayos-X obtenida de Protein Data Bank no contiene los átomos de hidrógenos de la

ubiquitina. Esto es porque la cristalografía de rayos-X usualmente no resuelve átomos de hidrógenos, El

archivo PDB que generarás con psfgen, junto con el PSF contendrán coordenadas para átomos de hidrógenos

de la estructura. De esta forma, en la minimización de la energía de la proteína garantizará que sus posiciones

sean razonables.

PASO 2: Elegir Extensions ���� Tk Console . Asegúrate de que estás en el directorio /1-1-build En la consola Tk, tipea los siguientes comandos

set ubq [atomselect top protein] $ubq writepdb ubqp.pdb

Nota: En el paso anterior sólo haz creado el archivo ubqp.pdb, contiene las coordenadas de la ubiquitina sin los

hidrógenos

PASO 3: Ahora crearemos el archivo PSF de la ubiquitina.

El paquete psfgen de VMD es muy útil para construir el archivo psf. En la línea de comando tipea gedit build_protein.tcl. Tipea la siguiente línea de comando:

package require psfgen topology top all27 prot lipid.inp

pdbalias residue HIS HSE pdbalias atom ILE CD1 CD segment U {pdb ubqp.pdb} coordpdb ubqp.pdb U

guesscoord writepdb ubq.pdb writepsf ubq.psf

Después de tipear, guarda el archivo File� Save. Asegúrate que estás en el directorio /1-1-build. Luego, sales

del editor de texto cliqueando File�Exit

El archivo que has creado contiene los comandos necesarios para crear el archivo PSF de la ubiquitina con los

átomos de hidrógenos y sin agua

• Línea 1: Estás corriendo psfgen con VMD. Esta línea requiere que el paquete psfgen esté

disponible para ser llamado por VMD

• Línea 2: Carga el archivo de topología top_all27_prot_lipid.inp

• Línea 3: Cambia el nombre de residuo histidina por el nombre apropiado encontrado en el archivo

de topología. HSE es uno de los 3 nombres basado en el estado protonación de la cadena lateral.

Page 4: Manual VMD

• Línea 4: El átomo nombrado “CD1” (carbono δ) en el residuo isoleucina es llamado “CD”, su

nombre adecuado en el archivo de topología.

• Línea 5: Un segmento llamado U es creado, contiene todos los átomos de ubqp.pdb El comando

segment añade todos los átomos de hidrógenos

• Línea 6: Coordenadas son leídos desde ubqp.pdb, residuos y nombre se átomos son acertados. Las

etiquetas del antiguo segmento será anuladas

• Línea 7: Coordenadas de átomos faltantes (hidrógenos) son añadidos basados en la definición de

residuos del archivo de topología

• Línea 8: Nuevo archivo pdb con las coordenadas completas de todos los átomos, incluyendo los

hidrógenos.

• Línea 9: Archivo psf con la información completa de la estructura de la proteína

En la consola tcl/tk escribe la siguiente línea de comando.

play buil_protein.tcl

PASO 4 Una vez construido el psf, revisaremos que los archivos pdb y psf de la ubiquitina vamos a cargar el

sistema.

Copie el arhivo ubq.pdb y ubq.psf al directorio /1-2-sphere y 1-3-box.

SECCIÓN 2: SOLVATACIÓN DE LA PROTEÍNA Ahora, la proteína necesita ser solvatada. Puedes hacerle de dos formas, localizando la proteína en:

• Una esfera de agua, en preparación de minimización y equilibrado sin condiciones periódicas de

borde.

• Una caja de agua, en preparación de minimización y equilibrado con condiciones periódicas de

borde.

1.b.1 Ubiquitina en una esfera de agua

PASO 1. Situarse en el directorio /1-2-sphere. encontrarás un script tcl wat_sphere.tcl para crear la esfera de

agua. En la consola tipear VMD y cargar la proteína ubiquitina (ubq.pdb y ubq.psf)

vmd ubq.psf ubq.pdb PASO2. Luego llamarás al script, ésto ubicará la ubiquitina en una esfera de agua lo más pequeña posible. Elegir

Extensions ���� Tk Console . En la consola Tk, tipea los siguientes comandos

play wat_sphere.tcl

PASO 3. Los outputs generado por el script wat_sphere.tcl estará el centro y el radio de la esfera de agua.

Registrar estos números, los necesitarás más tarde. El script tendrás creado los archivos ubq_ws.pdb y

ubq_ws.psf, respectivamente, ubiquitina en una esfera de agua. Estos estarán en el directorio /1-2-sphere.

Revisa esto tipeando ls

Luego cargar las coordenadas que están en el archivo pdb, Cliquear File����New Molecule … , en la ventana

principal de VMD. En el Molecule File Browser, usa el botón Browse… para encontrar el archivo ubq_ws.pdb .

Cargar presionando el botón Load…

Una vez revisada vamos sal ir , abrimos la tk consola y tipeamos exit.

Page 5: Manual VMD

1.b.2 Ubiquitina en una caja de agua

Construir Automáticamente Vamos a cargar los archivos generados.

PASO 1. Cargar las coordenadas que están en el archivo pdb. Cliquear File����New Molecule … , en la ventana

principal de VMD. En el Molecule File Browser, usa el botón Browse… para encontrar el archivo ubq.pdb .

Cargar presionando el botón Load…

O bien puede tipear por consola:

vmd ubq.pdb

PASO 2. En la ventana Tk Consola, tipear:

set ubq [atomselect top all]

measure minmax $ubq

Esto analiza todos los átomos del sistema y entrega los valores mínimos y máximos de coordenadas x, y, z del

sistema proteína-agua. Estos valores también definen origen del sistema de coordenada. El centro de la caja

de agua puede ser determinado determinando el punto medio de cada uno de los tres lados. Por ejemplo, si los

valores mínimos y máximo del eje X la caja sería 10.44 y 51.12, respectivamente. Entonces el punto medio:

51.12 + 10.44 = 30.78

2

PASO 3. Cliquear Extensiones���� Modeling ���� Add Solvation Box, se mostrará lo siguiente:

Una vez definido los parámetros cliquear sobre el botón Solvate, obtienes los archivos con los parámetros de la

proteína en una caja de agua

Nombre de arhivo psf

Nombre de arhivo pdb

Nombre de arhivo de salida

Dimensiones de la caja, lo puedes

obtener tipeando en la consola Tk lo

siguiente:

set prot [atomselect top all] measure minmax $prot

Page 6: Manual VMD

Construir Manualmente

PASO 1. Situarse en el directorio /1-3--box. encontrarás un script tcl wat_box.tcl para crear el cubo de agua.

En la consola tipear VMD y cargar la proteína ubiquitina (ubq.pdb y ubq.psf)

vmd ubq.psf ubq.pdb PASO2. Luego llamarás al script, ésto ubicará la ubiquitina en ula caja de agua lo más pequeña posible. Elegir

Extensions ���� Tk Console . En la consola Tk, tipea los siguientes comandos

play wat_box.tcl

PASO 3. En el script usted verá el siguiente código

package require solvate solvate ubq.psf ubq.pdb -t 15 -o ubq_wb

El comando package require solvate carga el paquete solvate, asi VMD podrá llamarlo. El paquete solvate colocará la proteína en una caja de agua. La opción –t crea las dimensiones de la caja de agua de tal manera

que hay una capa de agua de 15 Å en cada dirección desde el átomo más lejano del centro. La opción –o crea

archivos output ubq_ws.pdb y ubq_ws.psf para ubiquitina en caja de agua.

Otra forma de crear una caja de agua es usando la herramienta de vmd.

SECCIÓN 3: SIMULACIÓN MOLECULAR 3.1 Ubiquitina en una esfera de Agua En esta sección, examinarás la minimización y equilibrado de la ubiquitina en una esfera de agua localizada en

el vacío

PASO 1. Dirigirse al directorio /1-2-sphere, aquí encontrarás el archivo de configuración llamado

ubq_ws_eq.conf , para la minimización y el equilibrado de la ubiquitina en una esfera de agua.

Los archivos de salidas para la minimización y el equilibrado de la ubiquitina en una esfera de agua estará

ubicado en este directorio, el archivo de configuración, es sólo un archivo de entrada, que contiene todas las

instrucciones necesarias para correr la simulación. Además, encontrarás en el directorio /1-2-sphere archivo

pdb (ubq_ws.pdb), psf (ubq_ws.psf) y archivo de parámetros (par_all27_prot_lipid.inp). Podras comprobar

usando el comando ls

Paso Alternativo 1.1 Fijar backbone de la proteína usando el script fix_backbone.ucl. Esto se realiza previo a la Minimización

del sistema

1.2 Fijar Restraint a los Carbono alfa de los aminoácidos usando el script restraint_ca.tcl Esto se realiza previo a

la Equilibrado del sistema

PASO 2. Abrir el archivo de configuración, ubq_ws_eq.conf , con un editor de texto gedit

El archivo de configuración puede ser muy simple al principio, pero lo examinaremos línea por línea para

determinar su función en tu simulación

• La sección “JOB DESCRIPTION”

Page 7: Manual VMD

Contiene sólo comentario y su propósito es informar al simulador qué tipo de simulación se reaizará. Tú

comentario debiera decir:

# Minimization and Equilibration of Ubiquitin in a Water Sphere • La sección “ADJUSTABLE PARAMETERS”

Contiene 5 comandos:

1. structure: llama al archivo psf para describir el sistema (ubq_ws.psf)

2. coordinates: llama al archivo pdb que contiene las coordenadas iniciales (ubq_ws.pdb)

3. set temperatura: se crea una variable llamada “temperature” el cual almacena un valor de

temperatura inicial del sistema. Si localiza el texto “$temperature” en el archivo de configuración,

NAMD leerá como etiqueta el número 310 (corresponde a la temperatura inicial del sistema)

4. set outputname: crea un variable llamada “outputname” el cual almacena el nombre genérico de los

archivos de salida. Si localizas el texto “$outputname” en el archivo de configuración NAMD leerá

como etiqueta “ubq_ws_eq”

5. firsttimestep: asigna un valor numérico para el primer paso de la simulación. Esto es útil cuando

reinicia la simulación.

• La sección “SIMULATION PARAMETERS”

Input

– paraTypeCharmm: Indica si o no el archivo de parámetro es el formato usado por el campo de fuerza CHARMM, off indica que esto no lo es

– parameters: llama a los parámetros campo de fuerza desde el archivo par_all27_prot_lipid.inp

– temperature: Asigna la temperatura inicial del sistema en Kelvin, con ello se asigna la

velocidad aleatoria a átomos seleccionado de la distribución de Maxwell tal que se obtiene

promedio de energía cinética dado la temperatura

Force-Field Parameters

– exclude: Especifica cuáles interacciones atómica debe ser excluido. La etiqueta scaled1-4 indica que las interacciones entre los átomos 1 y2 , 1y3 son despreciados y las interacciones

entre los átomos 1 y 4 son debilitados

– 1-4scaling: especifica el grado de libertad en la cual interacción entre los átomos 1 y 4 es

tomado en cuenta. Esta variable puede tomar valor hexadecimal 0 (falso) o 1 (verdadero)

– cutoff: indica la distancia en ángstrom el cual las interacciones electrostática y Van der Waals

son cortados

– switching: indica si la función switching es usada sin problema tomando las interacciones

electrostática y Van der Waals desde 0 a una distancia cutoff

– switchdist: indica la distancia en ángstrom el cual la forma funcional de interacciones

electrostática y Van der Waals son modificadas para permitir que sus valores se acerquen a

cero a una distancia cutoff

– pairlistdist: diseñado para hacer que el cálculo se más rápido Integrator Parameters

– timestep: indica el valor time step usado en la simulación

– rigidBonds: especifica cuáles enlaces formados por hidrógenos con considerados como

rígidos (no vibración). El valor all indica que todos los enlaces formados por hidrógenos y

algún otro átomos.

– nonbondedFreq: especifica el número de time steps en que las interacciones no enlzantes

son calculadas.

Page 8: Manual VMD

– fullElectFrequency: especifica el número de time steps en que las interacciones

electrostática son calculadas.

– stepspercycle: Atomos que son reasignados en lista de pares una vez por ciclo. Constant Temperature Control

– langevin: indica sí o no la simulación usa la dinámica Langevine, usa valores off u on. – langevinDamping: asigna valores de acoplamiento de Langevin. Cuantifica la aflicción

aplicada al sistema, removiendo energía desde el sistema, etc. – langevinTemp: Dinámica de Langevine puede ser aplicada a todos los átomos o a sólo

átomos no-hidrógeno del sistema. Este comando especifica la temperatura a la cual se

mantiene estos átomos, incluyendo fricción y la fuerza que actuará en ellos

– langevinHydrogen: indica sí o no la dinámica Langevine será aplicado a átomos de

hidrógenos en la simulación, usa valores off u on.

Output

– outputName: Muchos tipos de datos de salida son escrito por NAMD en la simulación. Este

comando especifica el prefijo para archivos de salida. NAMD retorna dos archivos salida por

cada simulación: archivo pdb que contiene las coordenadas finales de todos los átomos del

sistema y un archivo pdb que contiene las velocidades finales de todos los átomos del

sistema. Las extensiones de estos archivos son: *.coor y *.vel – restartfreq: Durante la simulación. NAMD puede crear archivo restart, uno el cual es un

archivo pdb que almacena las coordenadas atómica y otro que almacena las velocidades

atómica. Este comando especifica por cada cuánto time steps se escriba la salida en el archivo

restart

– dcdfreq: El archivo dcd contiene sólo coordenadas atómica y éstos son escritos a un archivo

muchas veces en el curso de la simulación

– outputEnergies: especifica por cada cuánto time steps la energía del sistema es ecrito al

archivo .log

– outputPressure: especifica por cada cuánto time steps la presión del sistema es ecrito al

archivo .log

• La sección “EXTRA PARAMETERS” contiene los comandos la cual se aplican a simulaciones más

específicas. Incluye comando la cual caracteriza condiciones esféricas de borde en una esfera de agua.

Spherical boundary conditions. Los siguientes tres comandos debe ser especificado para

que condiciones esférica de borde trabaje apropiadamente

– sphericalBC: indica si o no la simulación usa condiciones esféricas de borde, usa valores off u

on.

– sphericalBCcenter: asigna las coordenadas x, y, z del centro de la esfera para el cual

condiciones esféricas de borde es aplicada

– sphericalBCr1: asigna distancia en ángstrom en el cual el primer potencial de borde actúa.

– sphericalBCk1: el primer potencial aplicado condiciones esféricas de borde que mantiene las

esferas juntas (o separadas) es armónico. Este comando asigna valores de constante de

fuerza a este potencial

– sphericalBCexp1: asigna el valor al exponente usada en la fórmula de potencial

• La sección “EXECUTION SCRIPT”, contiene tres comandos, los primeros dos es aplicado a la

minimización y el último aplicado al equilibrado.

• Minimización

– minimize: asigna número de iteraciones en el cuál los átomos varían sus posiciones para buscar el mínimo local en el potencial

Page 9: Manual VMD

– reinitvels: Minimización es ejecutado en el sistema después de que todas las velocidades atómicas se les han asignado cero. Este comando reasigna velocidades atómicas tal que el sistema comienza a la temperatura especificada.

• Run: Asigna el número de pasos en cuál corre el equilibrado de Dinámica Molecular (ene ste

caso 2500 pasos es equivalente a 5000 fs o 5 ps)

PASO 3. Una vez asignados los parámetros, corremos nuestra simulación con la siguiente línea de comando.

charmrun ++local +pN namd2 ubq_ws_eq.conf > ubq ws_eq.log &

N: número de core

PASO 4. Análisis

Para hacer el análisis cargue los siguientes archivos en vmd .

vmd ubq_ws.psf ubq_ws_eq.dcd

Usted puede ver la simulación molecular:

Luego, para graficar tiempo de simulación versus energía

Extensions � Analysis � NAMD Plot

3.2 Ubiquitina en una Caja de Agua: Simulación en condiciones periódica de borde En esta sección, examinarás la minimización y equilibrado de la ubiquitina en una caja de agua en condiciones

periódica de borde

PASO 1. Dirigirse al directorio /1-3-box, aquí encontrarás el archivo de configuración llamado ubq_wb_eq.conf ,

para la minimización y el equilibrado de la ubiquitina en una esfera de agua.

Los archivos de salidas para la minimización y el equilibrado de la ubiquitina en una esfera de agua estará

ubicado en este directorio, el archivo de configuración, es sólo un archivo de entrada, que contiene todas las

instrucciones necesarias para correr la simulación. Además, encontrarás en el directorio /1-3-box archivo pdb

(ubq_wb.pdb), psf (ubq_wb.psf) y archivo de parámetros (par_all27_prot_lipid.inp). Podras comprobar usando

el comando ls

Paso Alternativo 1.1 Fijar backbone de la proteína usando el script fix_backbone.ucl. Esto se realiza previo a la Minimización

del sistema

1.2 Fijar Restraint a los Carbono alfa de los aminoácidos usando el script restraint_ca.tcl Esto se realiza previo a

la Equilibrado del sistema

PASO 2. Abrir el archivo de configuración, ubq_wb_eq.conf , con un editor de texto gedit

El archivo de configuración contiene algunos comandos que son diferentes archivo de configuración de la

esfera de agua

La sección “SIMULATION PARAMETERS”, hay tres nuevas categoría de parámetros que han sido añadidas.

Page 10: Manual VMD

Periodic Boundary Conditions

– Los tres vectores bases de la celda periódica entregan la forma y el tamaño de la celda

periódica. Ellos eson cellBasisVector1, cellBasisVector2, and cellBasisVector3. – cellOrigin: especifica las coordenadas del centro de la celda periódica en ángstrom – wrapWater: Este comando es usado junto a condiciones periódicas de borde. – wrapAll: Es lo mismo a wrapWater: pero es usado a todas las moléculas

PME (full-system periodic electrostatics) PME (Particle Mesh Ewald o grilla de partículas) Este método es útil para considerar las

interacciones electrostáticas en el sistema cuando está presente las condiciones periódicas de borde. La suma de Ewald es eficiente para el cálculo de fuerza en el sistema periódico. La grilla de partículas es una grilla en 3D creada en el sistema, cuya carga del sistema está distribuida. Desde estas cargas, potenciales y fuerzas en el sistema es determinada.

– PME: indica sí o no la simulación usa el método de suma de Ewald, usa valores yes o no

– PMEGridSpacing: Asigna un radio mínimo entre el número de puntos de la grilla a lo largo

de cellBasisVector. – Uno puede definir el tamaño de la grilla PME manualmente PMEGridSizeX,

PMEGridSizeY, y PMEGridSizeZ. Esto asigna el tamaño de la grilla PME cellBasisVector1,

2 y 3, respectivamente

Constant Pressure Control (volumen variable)

– useGroupPressure: NAMD calcula la presión del sistema basados en la fuerza entre átomos

y su energía cinética. El comando específica si la interacción que implica hidrógenos debería

ser contado para todos los átomos de hidrógenos o simplemente para un grupos de átomos

de hidrógenos, usa valores yes o no. Debes asignar yes si rigidBonds son asignados

– useFlexibleCell: Especifica sí o no quieres permitir las tres dimensiones de la celda periódica

varía. Usa valores yes o no – useConstantArea: NAMD permite mantener el área seccional x – y sea constante mientras

varía la dimensión z. Usa valores yes o no – langevinPiston: Especifica sí o no, la simulación usa Piston Langevin para controlar la presión

del sistema. Usa valores yes o no – langevinPistonTarget: Indica la presión (en bar) con el cual el prisrton Langevin se mantiene

– langevinPistonPeriod: asigna un tiempo constante de oscilación en fs para piston Langevin

– langevinPistonDecay: asigna un tiempo constante de Camping en fs para piston Langevin

– langevinPistonTemp: asigna temperatura en K para piston Langevin.

Output

– xstFreq: archivo que contiene un registro de los parámetros de la celda periódica. Este

comando especifica por cada cuánto time steps la configuración debe ser registrada.

PASO 3. Una vez asignados los parámetros, corremos nuestra simulación con la siguiente línea de comando.

charmrun ++local +pN namd2 ubq_wb_eq.conf > ubq_wb_eq.log & N: número de core

PASO 4. Análisis

Para hacer el análisis cargue los siguientes archivos en vmd .

vmd ubq_wb.psf ubq_wb_eq.dcd

Page 11: Manual VMD

Usted puede ver la simulación molecular:

Luego, para graficar tiempo de simulación versus energía

Extensions � Analysis � NAMD Plot