PROGRAMACION DINÁMICA PROBABILISTA

INSTITUTO TECNOLÓGICO SUPERIOR

DE CALKINI EN EL ESTADO DE CAMPECHE

INGENIERÍA INDUSTRIAL

VII SEMESTRE GRUPO “B”

ALUMNO:WILLIAM HUMBERTO CAAMAL EK

MAESTRO:ING. RICARDO GOMEZ KU

MATERIA:INVESTIGACION DE OPERACIONES II

MATRICULA: “1734”

CALIFICACION DE LA EXPOSICION:

CALIFICACION DE LA INVESTIGACION DOCUMENTAL:

CALKINI, CAMPECHE A 9 DE SEPTIEMBRE DEL 2010

Página 1

INDICE

Introducción……………………………………………………………….. 3

Contenido de la PDP………………………………………………………… 4-9

Conclusión……………………………………………………………………….. 10

Fuentes bibliograficas……………………………………………………………11

Página 2

INTRODUCCION

La PROGRAMACION DINÁMICA es una herramienta que es muy útil para

poder resolver problemas de nodos, de inversión, de inventario estos ejercicios

son útiles para nosotros como futuros ingenieros industriales, para tomar la

mejor decisión que nos lleve a reducir gastos de transporte, de insumos y

mejorar los procesos productivos de nuestra empresa.

La programación dinámica se subdivide en la deterministica y la probabilística,

en este documental se hablara de la segunda que es La programación

dinámica probabilística difiere de la programación dinámica determinística en

que el estado de la etapa siguiente no queda completamente determinado por

el estado y la decisión de la política en el estado actual. En lugar de ello existe

una distribución de probabilidad para lo que será el estado siguiente. Sin

embargo, esta distribución de probabilidad todavía esta completamente

determinada por el estado y la decisión de la política del estado actual.

La programación dinámica sirve para resolver problemas en los que el costo

del periodo actual o el estado del siguiente periodo son aleatorios. A estos

problemas se les conoce como problemas de programación dinámica

probabilística (PDP). En una PDP, por lo general el objetivo de quien toma la

decisión es minimizar el costo esperado en que se incurre o maximizar la

recompensa esperada obtenida en un determinado horizonte de tiempo.

Página 3

PROGRAMACION DINÁMICA PROBABILISITCA (PDP)

En este capitulo se explica como usar la programación dinámica para resolver problemas en los que el costo del periodo actual o el estado del siguiente periodo son aleatorios. A estos problemas se les conoce como problemas de programación dinámica probabilística (PDP). En una PDP, por lo general el objetivo de quien toma la decisión es minimizar el costo esperado en que se incurre o maximizar la recompensa esperada obtenida en un determinado horizonte de tiempo.

La programación dinámica probabilística difiere de la deterministica en que los estados y los retornos o retribuciones en cada etapa son probabilísticos. La programación dinámica probabilística se origina en especial en el tratamiento de modelos estocásticos de inventario y en los procesos markovianos de decisión.

UN JUEGO ALEATORIO En una variación del juego de la ruleta rusa, se hace girar una rueda con marcas de n números consecutivos: 1 a n, en su periferia. La probabilidad de que la rueda se detenga en el número i después de un giro es pi. Un jugador paga $x por el privilegio de hacer girar la rueda un máximo de m giros. La recompensa para el jugador es doble de la cantidad obtenida en el último giro. Suponiendo que el juego se repite (hasta con m giros cada vez) una cantidad razonablemente grande de veces, propone una estrategia optima para el jugador.Se puede formular el problema como un modelo de programación dinámica con las siguientes definiciones:

1. la etapa i se representa con el giro i, i = 1, 2,…., m.2. las alternativas en cada etapa incluye hacer girar la rueda una vez más o

terminar el juego.3. El estado j del sistema en la etapa i se representa con uno delos números de

1 a n que se haya obtenido en el ultimo giro.

Sea fi(j) = ingreso máximo esperado cuando el juego esta en la etapa (el giro) i y el resultado del ultimo giro fue j.En este caso se tiene que

(Recompensa esperada en la etapa i si termina el juego

dado el resultado j del ultimo giro.) = si continua el juego

Entonces, la ecuación recursiva se puede describir como sigue:

Página 4

La lógica de la ecuación recursiva es que en el primer giro (i = 1), el estado del sistema es j = 0, por que acaba de comenzar el juego. En consecuencia, f1(0) = p1f2(1) + p2f2(2) + … + Pnf2(n). Después del ultimo giro (i = m), el juego debe terminar independientemente del resultado de j del m-esimo giro. Por tanto, fm+1(j) = 2j.Los cálculos recursivos comienzan con fm+1 y terminan con f1(0),produciendo m+1 etapas de cómputo. Como f1(0) es el ingreso esperados por los m giros, y dado que el juego cuesta $x, el ingreso neto es f1(0) – x.

EjemploSuponga que el perímetro de la rueda de la ruleta rusa esta marcado con los números 1 a 5. La probabilidad de detenerse en el numero i es p1 = 0.3, p2 = 0.25, p3 = 0.2, p4 = 0.15 Y p5 = 0.1.El jugador paga $5 para hacer un máximo de cuatro giros. Determine la estrategia óptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.Etapa 5 f5(j) = 2j

Etapa 4

F4 (j) = máx. {2j, p1f5 (1) + p2f5 (2) + p3f5 (3) + p4f5 (4) + p5f5 (5)} = máx. {2j, 0.3 X 2 + 0.25 X 4 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = máx. {2j, 5}

Ingreso esperado

Solución óptimaResultado j del giro 3 Terminar Girar F4 (j) Desición

1 2 5 5 Girar

Página 5

2 4 5 5 Girar3 6 5 6 Terminar4 8 5 8 Terminar5 10 5 10 Terminar

Etapa 3

F3 (j) = máx. {2j, p1f4 (1) + p2f4 (2) + p3f4 (3) + p4f4 (4) + p5f4 (5)} = máx. {2j, 0.3 X 5 + 0.25 X 5 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = máx. {2j, 6.15}

Ingreso esperado

Solución óptimaResultado j del giro 2 Terminar Girar F3(j) Desición

1 2 6.15 6.15 Girar2 4 6.15 6.15 Girar3 6 6.15 6.15 Girar4 8 6.15 8.00 Terminar5 10 6.15 10.00 Terminar

Etapa 2

F2 (j) = máx. {2j, p1f3 (1) + p2f3 (2) + p3f3 (3) + p4f3 (4) + p5f3 (5)} = máx. {2j, 0.3 X 6.15 + 0.25 X 6.15 + 0.2 X 6.15 +0.15 X 8 + 0.1 X 10} = máx. {2j, 6.8125}

Ingreso esperado

Solución óptimaResultado j del giro 1 Terminar Girar F3(j) Desición

1 2 6.8125 6.8125 Girar2 4 6.8125 6.8125 Girar3 6 6.8125 6.8125 Girar4 8 6.8125 8.0000 Terminar5 10 6.8125 10.0000 Terminar

Etapa 1

F1 (0) = p1f2 (1) + p2f2 (2) + p3f2 (3) + p4f2 (4) + p5f2 (5) = 0.3 X 6.8125 + 0.25 X 6.8125 + 0.2 X 6.8125 +0.15 X 8 + 0.1 X 10 = 7.31

Página 6

La única opción disponible al iniciar el juego es girar.De acuerdo con los cuadros anteriores, la solución óptima es:

Giro núm. Estrategia óptima1 Comienza el juego, girar2 Continuar si el giro 1 produce 1, 2 ó 3. Si no, terminar el juego3 Continuar si el giro 2 produce 1, 2 ó 3. Si no, terminar el juego4 Continuar si el giro 3 produce 1, 2 ó 3. Si no, terminar el juego Ingreso neto esperado = $7.31 - $5.00 = $2.31

sea

fondos esperados máximos para los años i, i+1, … y n, dada xi al

comenzar el año iPara la condición k del mercado,

Como la condición del mercado k se presenta con la probabilidad Pk, la ecuación recursiva de programación dinámica es la siguiente:

En donde porque después del año n no se hace inversión. Por lo

anterior

Sea

Entonces se obtiene

Ejemplo 15.2-1En este modelo de inversión, hay que suponer que se desea invertir 10 000 durante los 4 años veniders. Hay 50% de probabilidades de que el dinero aumente el doble, 20% de probabilidades de salir a mano y 30% de probabilidades de perder la cantidad invertida. Proponer una estrategia optima de inversión.Al usar la notación de modelo se tiene que

Página 7

C= 10000 n= 4 m=3P1=0.4 P2=0.2 P3=0.4R1=1 R2=0 R3=-1

ETAPA 4

Entonces

La solución optima se resume como sigue:

Estado

X4 1.2 X3

ETAPA 3

=1.44 x3Asi se llega a

Estado

X3 1.44 x3 x3

ETAPA 2

=1.728 X2Entonces se obtiene

Estado

X2 1.728 x2 x2

ETAPA 1

Página 8

=2.0736x1 Y así se obtiene

Entonces, la política optima de inversión se puede resumir: como sigue

para i = 1 a 4, la solución optima es invertir todos los fondos

disponibles al iniciar cada año. Los fondos acumulados al final de 4 años son 2.0736x1 = 2.0736 ($10,000) = $20,736.En realidad, se puede demostrar por inducción que el problema tiene la

siguiente solución general en la etapa

CONJUNTO DE PROBLEMAS 15.2ª

1. En el ejemplo 15.2-1, determine la estrategia optima de inversión,

suponiendo que las probabilidades y el ingreso varían durante los 4

años, de acuerdo con los datos siguientes:

Año r1 r2 r3 P1 P1 P3

1 2 1 0.5 0.1 0.4 0.52 1 0 -1 0.4 0.4 0.23 4 -1 -1 0.2 0.4 0.44 0.8 0.4 0.2 0.6 0.2 0.2

2. Está disponible un compartimiento de 10 m3 para guardar tres artículos. Los volúmenes necesarios para guardar una unidad de los artículos 1,2 y 3 son 2, 1 y 3 m3, respectivamente. La demanda probabilística de los artículos es la siguiente:

Probabilidad de la demandaNúm. De unidades

Art. 1 Art. 2 Art

1 0.5 0.3 0.32 0.5 0.4 0.23 0.0 0.2 0.5

Página 9

4 0.0 0.1 0.0

Los costos de escasez por unidad de los artículos 1, 2 y 3 son $8, $10 y $5, respectivamente.¿Cuántas unidades de cada artículo se deben de guardar en el compartimiento?

CONCLUSION

La programación dinámica es una técnica matemática que a menudo resulta

útil a tomar una sucesión de decisiones interrelacionadas. Proporciona un

procedimiento sistemático para determinar la combinación de decisiones que

maximice la efectividad global.

Contrastando con la programación lineal, no existe un planteamiento

matemático estándar "del" problema de programación dinámica. Más bien, la

programación dinámica es un tipo general de enfoque para resolver problemas

y las ecuaciones particulares usadas deben desarrollarse para que se ajusten a

cada situación individual. Por lo tanto, se requiere un cierto grado de ingenio y

de visión de la estructura general de los problemas de programación dinámica,

a fin de reconocer cuando un problema se puede resolver mediante los

procedimientos de esta programación y cómo se haría. Probablemente se

puedan desarrollar mejor estas aptitudes por medio de una exposición de una

amplia variedad de aplicaciones de la programación dinámica y de un estudio

de las características que son comunes a todas estas.

Por fortuna, la programación dinámica suministra una solución con mucho

menos esfuerzo que la enumeración exhaustiva. (Los ahorros de cálculo serían

enormes para versiones más grandes de un problema.) La programación

dinámica parte de una pequeña porción del problema y encuentra la solución

óptima para este problema más pequeño.

Entonces gradualmente agranda el problema, hallando la solución óptima en

curso a partir de la anterior, hasta que se resuelve por completo el problema

original. En seguida se dan los detalles involucrados en la implementación de

esta filosofía general.

Página 10

FUENTES BIBLIOGRAFICAS

Cap. 1.4 programación dinámica probabilística

Cap. 15 pág. 547 al 553Inv. de operaciones 7 ediciónHamdy a. taha

Capitulo 19 pág. 1016 al 1019 Investigación de operaciones

Página 11

Documents

PROGRAMACION DINÁMICA PROBABILISTA