27
Tema 2 etodos de resoluci´on de Ecuaciones no Lineales 1. Generalidades. Orden de convergencia Nos planteamos en este tema el problema de la resoluci´ on aproximada de Ecuaciones no Lineales. Para plantear el problema, suponemos dada una funci´ on real de variable real f definida en un conjunto D R. El problema que queremos resolver se escribe: Hallar x D tal que f (x)=0, (1.1) En general supondremos que D es un intervalo abierto de R y que la funci´ on f es, al menos, continua en D. Un caso particular importante de ecuaci´on de la forma (1.1) es aqu´ el en el que f es un polinomio de grado n 2, en cuyo caso el problema adopta la forma a n x n + a n-1 x n-1 + ... + a 1 x + a 0 =0, (1.2) siendo los a k , k =0, 1, ..., n, umeros reales dados, y a n 6=0. Este ´ ultimo tipo de ecuaciones ha sido muy estudiado y de ´ el son bien conocidos los siguientes hechos: si n = 2, se tiene la f´ ormula de resoluci´ on, conocida de todos, a 2 x 2 + a 1 x + a 0 =0 x = -a 1 ± p a 2 1 - 4a 2 a 0 2a 2 , que expresa el valor exacto de la soluci´ on. Desde el punto de vista del An´alisis Num´ eri- co, el ´ unico tipo de errores que se introducen con esta f´ormula son los errores de redondeo debidos a las operaciones aritm´ eticas. si n = 3 ´o 4, existen tambi´ en f´ ormulas que expresan el valor exacto de la o las solu- ciones de (1.2), mediante sumas, productos y ra´ ıces de los coeficientes. Son f´ ormulas complicadas y dif´ ıcilmente aplicables en la pr´ actica. si n 5, se sabe que no existen f´ormulas como las anteriores y, en general, las ra´ ıces de estos polinomios no pueden ser calculadas de manera exacta. 1

Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2

Metodos de resolucion de Ecuacionesno Lineales

1. Generalidades. Orden de convergencia

Nos planteamos en este tema el problema de la resolucion aproximada de Ecuaciones noLineales. Para plantear el problema, suponemos dada una funcion real de variable real fdefinida en un conjunto D ⊆ R. El problema que queremos resolver se escribe:

Hallar x ∈ D tal que f(x) = 0, (1.1)

En general supondremos que D es un intervalo abierto de R y que la funcion f es, al menos,continua en D.

Un caso particular importante de ecuacion de la forma (1.1) es aquel en el que f es unpolinomio de grado n ≥ 2, en cuyo caso el problema adopta la forma

anxn + an−1x

n−1 + ...+ a1x+ a0 = 0, (1.2)

siendo los ak, k = 0, 1, ..., n, numeros reales dados, y an 6= 0.Este ultimo tipo de ecuaciones ha sido muy estudiado y de el son bien conocidos los

siguientes hechos:

si n = 2, se tiene la formula de resolucion, conocida de todos,

a2x2 + a1x+ a0 = 0⇔ x =

−a1 ±√a21 − 4a2a0

2a2,

que expresa el valor exacto de la solucion. Desde el punto de vista del Analisis Numeri-co, el unico tipo de errores que se introducen con esta formula son los errores deredondeo debidos a las operaciones aritmeticas.

si n = 3 o 4, existen tambien formulas que expresan el valor exacto de la o las solu-ciones de (1.2), mediante sumas, productos y raıces de los coeficientes. Son formulascomplicadas y difıcilmente aplicables en la practica.

si n ≥ 5, se sabe que no existen formulas como las anteriores y, en general, las raıcesde estos polinomios no pueden ser calculadas de manera exacta.

1

Page 2: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

2 Calculo Numerico I.

En consecuencia, se hace necesario desarrollar procedimientos de calculo aproximado delas soluciones, tanto para las ecuaciones polinomicas, como, con mayor razon, para las nolineales en general.

Antes que nada, hagamos notar que la ecuacion (1.1) puede ser escrita de distintas formasequivalentes, por ejemplo g(x) = x, o g(x) = h(x).

Ejemplo 1.1 Si consideramos la ecuacion

x log x− 1 = 0,

teniendo en cuenta que para que este definido el logaritmo como un numero real, x ha deser estrictamente positivo, dicha ecuacion puede ser escrita de varias maneras equivalentes.Por ejemplo en la forma

log x− 1/x = 0,

o tambien en la forma de ecuacion de punto fijo (vease mas adelante) dada por x = 1/ log x,o en la forma log x = 1/x, que es del tipo g(x) = h(x).

En los dos primeros casos, el problema de hallar la solucion x de f(x) = 0 puede serinterpretado geometricamente como el de encontrar la abscisa del punto de corte de la curvade ecuacion en el plano cartesiano y = f(x) con el eje OX, es decir con la recta y = 0. Enel caso en que la ecuacion se escribe en forma g(x) = x, se puede interpretar de manerageometrica el problema como el de hallar la abscisa del punto de corte de la curva y = g(x)con la bisectriz del primer cuadrante, es decir, la recta y = x. Finalmente, si la ecuacion seha escrito en la forma g(x) = h(x), el significado geometrico consiste en hallar la abscisa delpunto de corte de las curvas de ecuaciones y = g(x) e y = h(x).

En particular, denominaremos ecuacion de punto fijo a una igualdad de la forma

g(x) = x. (EPF )

Hagamos notar que existen muchas maneras de escribir una ecuacion dada en la forma(EPF ):

Ejemplo 1.2 Si consideramos la ecuacion polinomica x3 − 3x2 + x − 2 = 0, teniendo encuenta que la o las soluciones de la misma no pueden ser x = 0, esta puede ser escrita demanera equivalente en distintas formas de (EPF ). Por ejemplo

x = −x3 + 3x2 + 2, (EPF )1

o dividiendo por x, se obtiene x2 − 3x+ 1− 2/x = 0, con lo que despejando,

x =1

3

(x2 + 1− 2

x

). (EPF )2

Tambien, se puede dividir la ecuacion de partida por x2, obteniendose x−3+1/x−2/x2 =0, con lo que despejando,

x = 3− 1

x+

2

x2. (EPF )3

Page 3: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 3

Por supuesto, tambien se puede escribir la ecuacion en la forma

x = x+ (x3 − 3x2 + x− 2)h(x), (EPF )4

siendo h cualquier funcion real continua en todo R tal que h(x) 6= 0 para todo x ∈ R.Desde el punto de vista del Analisis Numerico, estas cuatro formas no son equivalentes.

Con unas se aproxima la solucion buscada de manera mas rapida y con menos coste decalculos que con otras.

A continuacion, vamos a realizar algunas consideraciones generales sobre el problema (1.1).A cualquier solucion de la citada ecuacion, es decir, a cualquier x ∈ R tal que f(x) = 0, sele denomina un cero o una raız de f .

Comencemos introduciendo el concepto de orden de multiplicidad de un cero de unafuncion f .

Definicion 1.3 Sean (a, b) ⊂ R un intervalo abierto, f : (a, b) → R una funcion continuaen (a, b) y m ≥ 1 un numero entero. Se dice que α ∈ (a, b) es un cero de f de multiplicidadm, si la funcion f puede ser escrita en la forma

f(x) = (x− α)mq(x) ∀x ∈ (a, b) \ {α}, (1.3)

con q una funcion definida en (a, b) \ {α} tal que existe

lımx→α

q(x) ∈ R \ {0}.

En el caso m = 1 diremos que α es un cero simple de f .

Observacion 1.4 Dados f : (a, b) → R una funcion y α ∈ (a, b) un cero de f , en generalno podemos asignar un orden al cero α de f en los terminos de la Definicion 1.3. Bastaconsiderar f(x) =

√|x− 1| (funcion continua en R) y α = 1.

Respecto del concepto de orden de multiplicidad de un cero, se tienen los siguientesresultados.

Proposicion 1.5 Sean f ∈ C1(a, b)1 y α ∈ (a, b). La funcion f tiene un cero simple (i.e.de multiplicidad 1) en α, si y solo si

f(α) = 0 y f ′(α) 6= 0. (1.4)

1 Recordemos que, dado n ≥ 0 un numero entero, usaremos la notacion{C0(a, b) = {f / f : (a, b)→ R, y f es continua en (a, b)} si n = 0,

Cn(a, b) = {f / f ∈ C0(a, b) y existen dif/dxi ∈ C0(a, b) ∀i : 1 ≤ i ≤ n} si n ≥ 1.

Page 4: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

4 Calculo Numerico I.

Demostracion. Supongamos en primer lugar que f tiene un cero simple en α. En tal caso,evidentemente f(α) = 0. Ademas, f puede ser escrita en la forma (1.3), y en consecuencia,la funcion

q(x) =f(x)

x− α, x ∈ (a, b) \ {α},

con lo que, teniendo en cuenta que f(α) = 0, se tiene

0 6= lımx→α

q(x) = lımx→α

f(x)− f(α)

x− α= f ′(α).

Recıprocamente, supongamos que se satisface (1.4). Consideremos la funcion q definidapor

q(x) =f(x)

x− α, x ∈ (a, b) \ {α}.

Evidentemente se satisface

f(x) = (x− α)q(x), x ∈ (a, b) \ {α}.

Ademas,

lımx→α

q(x) = lımx→α

f(x)− f(α)

x− α= f ′(α) 6= 0,

de donde se obtiene el resultado.

La propiedad anterior puede ser generalizada al caso m ≥ 2:

Proposicion 1.6 Sean m ≥ 2 entero, f ∈ Cm(a, b) y α ∈ (a, b). La funcion f tiene un ceroen α de multiplicidad m si y solo si

f(α) = f ′(α) = ... = fm−1)(α) = 0, fm)(α) 6= 0.

Demostracion. Se deja como ejercicio.

Ejemplo 1.7 Aplicando el resultado anterior deducimos que α = 0 es un cero simple de lafuncion f(x) = senx. Del mismo modo α = 0 es un cero doble (de multiplicidad m = 2) dela funcion g(x) = cos x− 1.

Es importante resaltar que en este curso nos vamos a limitar a la aproximacion de raıcessimples de ecuaciones no lineales.

En cualquier proceso de calculo de raıces de una ecuacion no lineal se distinguen tresfases: localizacion, separacion y aproximacion.

1. En la fase de localizacion se busca conocer un intervalo donde se encuentra una ovarias soluciones de la ecuacion, haciendo uso para ello de metodos analıticos, tablas,representacion aproximada, etc.... El propio origen de la ecuacion (fısico, tecnico, ...)puede dar indicaciones de donde se encuentran las soluciones. Observese que despuesde esta fase habremos dado respuesta al problema de la existencia de raıces de laecuacion (1.1).

Page 5: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 5

2. La separacion consiste en encontrar subintervalos que contengan una y solo una solucionde la ecuacion, ello es fundamental en el caso de raıces muy proximas. En general, sepuede conseguir la separacion combinando el teorema de Bolzano y la Proposicion 1.10.Cuando se ha conseguido esto, se dice que la solucion esta aislada. Ello no siempre sepuede conseguir, ası por ejemplo si consideramos la funcion

f(x) =

{x sen(1/x), si x 6= 0,0, si x = 0;

la solucion x = 0 de la ecuacion f(x) = 0 no puede ser aislada.

Observese que despues de esta fase conoceremos el numero de soluciones que poseela ecuacion (1.1).

3. En la fase de aproximacion, se construye una sucesion de valores que converja hacia lasolucion buscada, ello se realiza, habitualmente, mediante un metodo iterativo. Noso-tros vamos a estudiar metodos iterativos de los denominados de un paso o un puntoinicial.

Para la primera fase (localizacion de raıces) utilizaremos el Teorema de Bolzano:

Teorema 1.8 Sean a, b ∈ R, con a < b, y f : [a, b] → R una funcion continua en [a, b] talque f(a)f(b) ≤ 0. Entonces, existe α ∈ [a, b] tal que f(α) = 0.

Es importante destacar que si cambiamos la hipotesis f(a)f(b) ≤ 0 por la condicionf(a)f(b) < 0 (siendo f una funcion continua en [a, b]), entonces podemos concluir que existeα ∈ (a, b) tal que f(α) = 0.

En la fase de separacion utilizaremos basicamente la monotonıa de la funcion en sudominio. Recordemos lo siguiente:

Definicion 1.9 Sean I ⊂ R un intervalo no degenerado, i.e., un intervalo que no se reducea un punto, y f una funcion real definida en dicho intervalo.

a) Se dice que f es creciente (respectivamente, decreciente) en el intervalo I, si paracualesquiera x1, x2 ∈ I con x1 < x2, se tiene f(x1) ≤ f(x2) (respectivamente, f(x1) ≥f(x2)). Se dice que f es monotona en I si es creciente en I o si decreciente en I.

b) Se dice que f es estrictamente creciente (respectivamente, estrictamente decreciente)en el intervalo I, si para cualesquiera x1, x2 ∈ I con x1 < x2, se tiene f(x1) < f(x2)(respectivamente, f(x1) > f(x2)). Se dice que f es estrictamente monotona en I si esestrictamente creciente en I o estrictamente decreciente en I.

De la definicion, deducimos el resultado siguiente

Proposicion 1.10 Sean I ⊂ R un intervalo no degenerado y f : I → R una funcion real.Si f es estrictamente monotona en I, entonces la ecuacion (1.1) tiene a lo mas una solucionen el intervalo I.

Page 6: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

6 Calculo Numerico I.

Demostracion. La prueba del resultado es directa: Por reduccion al absurdo, supongamosque f posee dos ceros distintos en I, α1, α2 ∈ I, y, por fijar ideas, supongamos que f esestrictamente creciente en I y α1 < α2. De aquı,

0 = f(α1) < f(α2) = 0

que, evidentemente, es absurdo.

Observacion 1.11 Es bien conocido que si f es derivable en el intervalo I y f ′(x) > 0en todo punto x ∈ I, entonces f es estrictamente creciente en I. Analogamente, sif ′(x) < 0 en todo punto x ∈ I, entonces f es estrictamente decreciente en I.

En consecuencia, si f ′ es siempre positiva en I, o siempre negativa en I, entonces laecuacion (1.1) tiene a lo mas una solucion en dicho intervalo.

Si f es monotona en I, pero no estrictamente monotona, entonces la ecuacion (1.1)puede tener infinitas soluciones en este intervalo.

Las consideraciones anteriores no son validas para la ecuacion de punto fijo g(x) = x.La funcion g puede ser estrictamente monotona, pero la (EPF ) puede tener infinitassoluciones. Ası por ejemplo, si consideramos la funcion g(x) = x+ 1

2senx, su derivada

es g′(x) = 1 + 12

cosx > 0 en todo punto x ∈ R. En consecuencia, esta funcion ges estrictamente creciente en I = R, pero la ecuacion g(x) = x ⇔ senx = 0, tieneinfinitas soluciones en R, dadas por xk = kπ, k ∈ Z.

En la fase de aproximacion de raıces utilizaremos los llamados metodos iterativos deun paso. Estos se definen:

Definicion 1.12 Un metodo iterativo es un proceso constructivo que genera una sucesion{xk}k≥0. Supongamos dados x0 ∈ R un punto y G : D ⊆ R → R una funcion. Un metodoiterativo de un paso (o de un punto inicial) es un metodo iterativo que genera una sucesionpor recurrencia mediante la formula{

x0 ∈ R dado,

xk+1 = G(xk), ∀k ≥ 0.(1.5)

Ası pues, un metodo iterativo de un paso depende de la formula (1.5) que se utilice, ytambien del punto inicial x0 que se tome. Cuando lo planteamos, el metodo iterativo debedar respuesta a las siguientes cuestiones:

1. Bien definido: El primer problema que se presenta con todo metodo iterativo deun paso es saber si partiendo de x0, con el esquema (1.5) se construye una verdaderasucesion. Ası por ejemplo, si consideramos la sucesion definida por recurrencia mediantela formula

xk+1 = 3− 3

xk, k ≥ 0,

(G(x) = 3 − 3/x) y partimos de x0 = 2, es inmediato ver que se van obteniendosucesivamente, x1 = 3/2, x2 = 1, x3 = 0, y en consecuencia x4 no esta definida. Enconsecuencia, en este caso diremos que el metodo iterativo esta mal definido.

Page 7: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 7

2. Convergencia del metodo: Una vez que el metodo iterativo proporciona una suce-sion {xk}k≥0 cabe plantearse si la sucesion es convergente. Por ejemplo, si consideramosx0 = −1 y consideramos (1.5) con

G(x) = cos

((1 + x)π

2

),

obtenemos la sucesion xk = (−1)k+1 que, evidentemente, es oscilante.

3. Convergencia: Cuando usamos un metodo iterativo para aproximar una raız α de f ,debemos analizar si la sucesion generada converge hacia ese cero α.

4. Velocidad de convergencia: Queremos determinar el numero de iteraciones que hayque hacer para que el error que se cometa sea menor que una cantidad ε > 0 prefijada.

5. Orden de convergencia: Queremos conocer como evoluciona el error en el curso delas iteraciones.

En este Tema vamos estudiar dos metodos iterativos de un paso para los que responde-remos a estas cuestiones.

Observacion 1.13 Es importante resaltar que el metodo iterativo (1.5) esta bien definidocuando se puede demostrar que los puntos xk que va generando estan en el dominio de Gpara cualquier k ≥ 0. En particular el metodo iterativo de un paso estara bien definido si lafuncion G satisface imag (G) ⊆ dom (G) ≡ D.

En lo que sigue vamos a considerar una funcion f : D → R definida en D ⊆ R y α ∈ Dun cero de f en D (es decir, una solucion de la ecuacion (1.1)). Ası, introducimos

Definicion 1.14 1. Se dice que el metodo iterativo dado por la formula (1.5) tiene lapropiedad de convergencia global hacia α ∈ R en D ⊂ R, si para todo dato inicialx0 ∈ D la sucesion {xk}k≥0 esta bien definida, {xk}k≥0 ⊂ D y es convergente hacia α.

2. Se dice que el metodo iterativo (1.5) tiene la propiedad de convergencia local haciaα ∈ R si existe un numero δ > 0 tal que para cualquier x0 ∈ [α − δ, α + δ] ∩ D lasucesion {xk}k≥0 esta bien definida, {xk}k≥0 ⊂ [α − δ, α + δ] ∩ D y es convergentehacia α.

3. Se dice que α es un punto atractivo para el metodo iterativo (1.5) si el metodo iterativotiene convergencia, al menos local, en D hacia el cero α. En caso contrario, diremosque α es un punto repulsivo para dicho metodo.

Observese que distintas raıces de una misma ecuacion pueden ser unas atractivas y otrasrepulsivas para un mismo metodo iterativo (veremos ejemplos de ello en clase de problemas).

Otra propiedad importante de los metodos iterativos es el llamado orden de conver-gencia del metodo. En cierto sentido, el orden de convergencia proporciona una medida dela velocidad de convergencia de la sucesion construida con el metodo hacia su lımite.

Page 8: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

8 Calculo Numerico I.

Definicion 1.15 Sean {xk}k≥0 una sucesion de numeros reales, p > 0 un numero real yα ∈ R tal que lım xk = α. Se dice que la sucesion tiene orden de convergencia al menos p siexisten un numero entero k0 ≥ 0 y un numero real C > 0 (0 < C < 1 si p = 1) tales que

|xk+1 − α| ≤ C|xk − α|p para todo k ≥ k0.

Notese que en la definicion precedente, p no tiene que ser necesariamente un numeroentero. En la terminologıa clasica, si p = 1, 2 o 3, se habla de convergencia al menos lineal,cuadratica o cubica, respectivamente. Si p < 1, o si p = 1 y C ≥ 1, se dice que la convergenciaes sublineal, y si p > 1 se dice que la convergencia es superlineal.

Observacion 1.16 Es interesante resaltar que no toda sucesion convergente tiene asignadoun orden de convergencia en el sentido de la definicion anterior. Por ejemplo, la sucesion

0, 1, 1,1

2,

1

22,1

3,

1

33, ...,

1

n,

1

nn, ...,

converge a cero, pero|x2k+1||x2k|p

=1/(k + 1)

1/kpk,

sucesion que converge a +∞ cuando k →∞, cualquiera que sea p > 0.

Podemos caracterizar el orden de convergencia de una sucesion. Se tiene:

Proposicion 1.17 Sean {xk}k≥0 una sucesion de numeros reales, p > 0 un numero real yα ∈ R tal que lım xk = α y con xk 6= α para todo k ≥ 0. Entonces, la sucesion {xk}k≥0 tieneorden de convergencia al menos p si y solo si

lım sup|xk+1 − α||xk − α|p

= L < +∞ (L < 1 si p = 1). (1.6)

Demostracion. En primer lugar, observese que se tiene |xk − α| 6= 0 para cualquier k ≥ 0por lo que los cocientes que apareceran a continuacion estan bien definidos.

Si el orden de convergencia es al menos p, existe un entero k0 ≥ 0 y una constante C > 0(C < 1 si p = 1) tal que

|xk+1 − α||xk − α|p

≤ C para todo k ≥ k0.

En consecuencia

lım sup|xk+1 − α||xk − α|p

= L ≤ C

de donde deducimos (1.6).Recıprocamente, supongamos que se tiene (1.6). Fijemos ε > 0 (con L+ ε < 1 si p = 1).

Entonces, utilizando las propiedades de los lımites superiores, existe un entero k0(ε) ≥ 1 talque

|xk+1 − α||xk − α|p

≤ L+ ε para todo k ≥ k0(ε).

Page 9: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 9

Basta tomar C = L + ε para deducir que {xk}k≥0 tiene orden de convergencia al menos p.Esto acaba la prueba.

Observese que en el caso en que exista lım|xk+1 − α||xk − α|p

, la proposicion anterior afirma que

la sucesion {xk}k≥0 tiene orden de convergencia al menos p si y solo si

lım|xk+1 − α||xk − α|p

= L < +∞ (L < 1 si p = 1).

Definicion 1.18 Sean {xk}k≥0 ⊂ R una sucesion, p > 0 un numero real y α ∈ R tal quelım xk = α. Supongamos que xk 6= α para cualquier k ≥ 0. Entonces, se dice que la sucesiontiene orden de convergencia (exactamente) p si existe

lım|xk+1 − α||xk − α|p

= L ∈ (0,+∞) (L ∈ (0, 1) si p = 1). (1.7)

En tal caso, a la constante L definida por (1.7) se le denomina la constante asintotica delerror.

Observacion 1.19 Observese que si una sucesion {xk}k≥0 converge hacia α con orden deconvergencia p (y xk 6= α para cualquier k ≥ 0), entonces para cualquier q > 0 existe

lım|xk+1 − α||xk − α|q

=

+∞ si q > p,L si q = p,0 si q < p.

Por otro lado, dada una sucesion {xk}k≥0 convergente hacia α, en general esta no tieneun orden de convergencia en el sentido de la Definicion 1.18 (ver ejemplos mas abajo).

Ejemplo 1.20 1. Consideremos la sucesion {xk}k≥1 con xk = 1k. Evidentemente, existe

el lımxk = 0, pero es facil comprobar que no tiene un orden de convergencia hacia 0pues

lım|xk+1||xk|

= 1 (p = 1 y L = 1)

pero, como L = 1, no podemos decir que la sucesion converge con orden 1 (lineal). Porotro lado,

lım|xk+1||xk|p

=

{0 si p < 1,∞ si p > 1.

2. Consideremos ahora la sucesion {xk}k≥1 con xk = 12k

. Es facil comprobar que la sucesionconverge hacia 0 con orden de convergencia exactamente 1. Efectivamente

lım|xk+1||xk|

=1

2∈ (0, 1).

Como ya hemos dicho, el orden de convergencia de una sucesion mide la velocidad de con-vergencia de la sucesion hacia su lımite. En el siguiente ejemplo pondremos de manifiestoeste hecho:

Page 10: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

10 Calculo Numerico I.

Ejemplo 1.21 Consideremos la sucesion {xk}k≥0 definida por recurrencia (algoritmo deHeron para x = 1),

x0 = 2, xk+1 =x2k + 1

2xk, ∀k ≥ 0.

1. En primer lugar, es facil ver que la sucesion {xk}k≥0 esta bien definida. Efectivamente,por induccion no es difıcil probar que

xk > 0, ∀k ≥ 0.

2. Veamos que {xk}k≥0 es convergente probando que la sucesion es monotona y acotada.Observese que

xk+1 − xk =1− x2k

2xk, ∀k ≥ 0,

ası, para comprobar la monotonıa de la sucesion, estudiemos la cantidad 1−x2k. Ası, si k ≥ 1,

1− x2k = 1−(x2k−1 + 1

2xk−1

)2

= −(x2k−1 − 1

2xk−1

)2

.

Utilizando las igualdades anteriores es facil ver (por induccion) que la sucesion es monoto-na decreciente. Por otro lado, de la segunda igualdad tambien deducimos

1 ≤ xk ≤ x0 = 2, ∀k ≥ 0,

es decir, la sucesion {xk}k≥0 esta acotada.Deducimos por tanto que existe lımxk = l. Veamos cuanto vale este. De la acotacion

obtenida para xk, se tiene que l ∈ [1, 2]. Por otro lado, tomando lımite en la formula derecurrencia obtenemos

l =l2 + 1

2l⇐⇒ l = 1.

3. Veamos ahora que la sucesion {xk}k≥0 converge hacia 1 con orden de convergencia 2(convergencia cuadratica). Para ello, calculemos el lımite

lım|xk+1 − 1||xk − 1|2

= lım1

2xk=

1

2.

Como hemos dicho anteriormente este orden de convergencia mide la velocidad con la quela sucesion se acerca hacia su lımite. Veremos esto en el siguiente punto.

4. Calculemos cuantas iteraciones k son necesarias para que el error |xk − 1| sea menor que10−4. Teniendo en cuenta que xk ≥ 1 para todo k ≥ 0, es facil ver la desigualdad

|xk − 1||xk−1 − 1|2

=1

2xk−1≤ 1

2, ∀k ≥ 1,

es decir,

|xk − 1| ≤ 1

2|xk−1 − 1|2, ∀k ≥ 1.

Page 11: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 11

Razonando por induccion y teniendo en cuenta que x1 = 5/4, tambien se deduce

|xk − 1| ≤ 1

2

1

22

1

222· · · 1

22k−2 |x1 − 1|2k−1

=1

22k−1−11

22k=

1

23(2k−1)−1, ∀k ≥ 1.

Observese que aseguramos que |xk − 1| ≤ 10−4 si calculamos k tal que

1

23(2k−1)−1≤ 10−4 ⇐⇒ k ≥ 1 +

1

log 2ln

[1

3

(1 +

4 log 10

log 2

)]⇐⇒ k ≥ 3′2517405377 . . .

Basta por tanto tomar k = 4. Ası, en la cuarta iteracion del metodo podemos asegurar queel error cometido es menor que 10−4. (En este ejemplo tan sencillo es posible calcular el errorexacto que, de hecho, es mejor que la cota obtenida:

x1 = 1, 25 y |x1 − 1| = 0′25,

x2 = 1, 025 y |x3 − 1| = 0′25 · 10−1,

x3 = 1, 0003048780488 · · · y |x3 − 1| = 0′3049 · 10−3,

x4 = 1′00000004647 . . . y |x4 − 1| = 0′4647 · 10−7).

2. Metodo de biseccion

El metodo de biseccion (o de dicotomıa) es un metodo de aproximacion de raıces de unafuncion que esta basado en el Teorema de Bolzano. Para presentarlo supongamos dados unintervalo cerrado [a, b] ⊂ R (con a < b) y una funcion f : [a, b] → R continua en [a, b] yconsideremos la ecuacion (1.1). Supondremos en esta seccion las hipotesis

Hipotesis: Supongamos que f es continua en [a, b] y f(a)f(b) < 0. Como aplicacion delTeorema de Bolzano (Teorema 1.8), sabemos que existe un punto α ∈ (a, b) tal que f(α) = 0.Supongamos que dicho cero α es el unico cero de f en [a, b].

Bajo las condiciones precedentes, vamos a construir una sucesion de intervalos encajados

[a, b] = [a0, b0] ⊃ [a1, b1] ⊃ [a2, b2] ⊃ · · · ⊃ [ak, bk] ⊃ . . . ,

que siempre contienen al punto α. Para ello razonamos del siguiente modo:

Etapa 1. Tenemos que f(a0)f(b0) = f(a)f(b) < 0. Sea

x0 =a0 + b0

2.

Si f(x0) = 0, ya hemos encontrado la solucion α = x0.

Si f(x0) 6= 0, entonces se pueden presentar dos casos:

a) Si f(a0)f(x0) < 0, tomamos a1 = a0 y b1 = x0.

b) Si f(a0)f(x0) > 0, entonces f(x0)f(b0) < 0, y tomamos a1 = x0 y b1 = b0.

Page 12: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

12 Calculo Numerico I.

Tanto en el caso a) como en el b), el intervalo [a1, b1] construido satisface [a1, b1] ⊂ [a0, b0],f(a1)f(b1) < 0 (y por tanto, α ∈ (a1, b1)) y

b1 − a1 =1

2(b0 − a0) =

1

2(b− a).

Etapa k. Supongamos que f(ak−1)f(bk−1) < 0. Sea

xk−1 =ak−1 + bk−1

2.

Si f(xk−1) = 0, ya hemos encontrado la solucion α = xk−1.Si f(xk−1) 6= 0, entonces se pueden presentar dos casos:

a) Si f(ak−1)f(xk−1) < 0, tomamos ak = ak−1 y bk = xk−1.

b) Si f(ak−1)f(xk−1) > 0, entonces f(xk−1)f(bk−1) < 0, y tomamos ak = xk−1 y bk = bk−1.

Nuevamente, tanto en el caso a) como en el b), el intervalo [ak, bk] satisface [ak, bk] ⊂[ak−1, bk−1], f(ak)f(bk) < 0 (y por tanto, α ∈ (ak, bk)) y

bk − ak =1

2(bk−1 − ak−1), ∀k ≥ 1.

Mediante este algoritmo, o bien en un numero finito de etapas se ha encontrado la raızα de f en (a, b) o, en caso contrario, construimos una sucesion de intervalos encajados{[ak, bk]}k≥0 que satisfacen: ak ≤ ak+1, bk+1 ≤ bk y α ∈ (ak, bk) ∀k ≥ 0,

bk − ak =1

2k(b− a) ∀k ≥ 0.

En particular, deducimos que la sucesion {ak}k≥0 es monotona creciente, {bk}k≥0 es monotonadecreciente y

0 ≤ α− ak ≤1

2k(b− a) y 0 ≤ bk − α ≤

1

2k(b− a) ∀k ≥ 0.

Por tanto lım ak = α y lım bk = α.Despues de haber efectuado k pasos, se puede tomar como aproximacion de la raız α de

f en (a, b) el valor xk =ak + bk

2que, evidentemente satisface lımxk = α. De hecho, podemos

acotar el error absoluto cometido por

|xk − α| ≤1

2k+1(b− a).

Tenemos ası descrito el metodo de biseccion o dicotomıa.

Page 13: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 13

Observacion 2.1 El metodo de biseccion presenta varios inconvenientes. Es lento (de he-cho, la convergencia del algoritmo no llega a ser lineal), ya que no aprovecha ninguna otrapropiedad de f que no sea el signo de la misma. Es un metodo en que pasa desapercibido sise acerca uno mucho o no a la solucion, y es computacionalmente costoso, ya que hay queefectuar muchas comparaciones.

Sin embargo, el metodo de biseccion presenta tambien algunas ventajas. Ası, es siempreconvergente en el intervalo en el que se aplica. Ademas, tiene una expresion explıcita de lacota del error (lo que permite saber a priori el numero de etapas k a aplicar para obteneruna aproximacion de la raız α con una precision ε > 0 prefijada).

3. Metodos de primer orden: el metodo de las aproxi-

maciones sucesivas

Consideremos a, b ∈ R, con a < b, y g : [a, b]→ R una funcion continua en [a, b]. En estaseccion estudiaremos el llamado metodo de las aproximaciones sucesivas (MAS). Se trata deun metodo iterativo de un paso aplicable a ecuaciones que se escriben en la forma:

x = g(x). (EPF )

Definicion 3.1 Sea α ∈ [a, b]. Se dice que α es un punto fijo de g si g(α) = α, es decir, siα es solucion de la ecuacion (EPF ).

Los puntos fijos de g geometricamente corresponden a las abcisas de los puntos de corteentre la grafica de la recta y = x y la grafica y = g(x).

Ası, el metodo de las aproximaciones sucesivas (MAS) aplicado a la ecuacion (EPF )tiene la forma: {

x0 ∈ [a, b] dado,

xk+1 = g(xk), ∀k ≥ 0.(MAS)

Observese en primer lugar que para que (MAS) este bien definido se debe tener que xk ∈ [a, b]para cualquier k ≥ 0.

Comencemos analizando la existencia y/o unicidad de puntos fijos de la funcion g. Setiene:

Proposicion 3.2 (existencia de solucion para (EPF )) Sean a, b ∈ R, con a < b, yg : [a, b]→ R una funcion continua en el intervalo [a, b]. Supongamos que se tiene

(g(a)− a)(g(b)− b) ≤ 0. (3.8)

Entonces, existe al menos un α ∈ [a, b] tal que g(α) = α.

Demostracion. Basta aplicar el Teorema de Bolzano (Teorema 1.8) en el intervalo [a, b] ala funcion h(x) = g(x)− x.

Observacion 3.3 Es facil comprobar que una condicion suficiente para que se satisfaga (3.8)es que g([a, b]) ⊆ [a, b].

Page 14: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

14 Calculo Numerico I.

Pasemos a continuacion a analizar la unicidad de solucion de la ecuacion (EPF ). Paraello, introduzcamos la siguiente definicion:

Definicion 3.4 Sean dados a, b ∈ R, con a < b, y g : [a, b]→ R una funcion. Se dice que ges contractiva en el intervalo [a, b], si existe una constante L ∈ [0, 1) tal que

|g(x)− g(y)| ≤ L|x− y| ∀x, y ∈ [a, b]. (3.9)

En tal caso, a L se la denomina una constante de contractividad para g en [a, b].

Ejemplo 3.5 La funcion g : [1, 2]→ R dada por

g(x) =x

2+

1

x, ∀x ∈ [1, 2],

es contractiva en [1, 2] pues

|g(x)− g(y)| =∣∣∣∣12 − 1

xy

∣∣∣∣ |x− y| ≤ 1

2|x− y|, ∀x, y ∈ [1, 2].

Ası, g es contractiva en [1, 2] con constante de contractividad asociada L = 1/2 ∈ (0, 1).

Observacion 3.6 1. Si g es contractiva en g con constante de contractividad L ∈ [0, 1),entonces

|g(x)− g(y)| ≤ L|x− y| < |x− y| ∀x, y ∈ [a, b] con x 6= y. (3.10)

En particular, la distancia entre las imagenes g(x) y g(y) es menor que la distanciaentre x e y: la funcion g “contrae” las distancias.

2. Observese que la condicion (3.9) implica la condicion (3.10). En particular ambascondiciones implican la continuidad uniforme de la funcion g en el intervalo [a, b].El recıproco no es cierto; basta considerar g(x) =

√|x| en el intervalo [−1, 1] que es

uniformemente continua en [−1, 1] pero no es contractiva en el intervalo (ver relacionde problemas).

3. La constante L de contractividad asociada a una funcion g contractiva en el intervalo[a, b] puede ser interpretada geometricamente como una cota superior de la pendientede las rectas secantes a la grafica de la curva y = g(x) en el intervalo [a, b].

Proposicion 3.7 (unicidad de solucion para (EPF )) Sean a, b ∈ R, con a < b, y g :[a, b]→ R una funcion contractiva en [a, b]. Entonces, existe a lo mas una solucion de (EPF )en [a, b] (o dicho de otro modo, g posee, a lo sumo, un punto fijo en [a, b]).

Demostracion. Supongamos que α1, α2 ∈ [a, b] son dos puntos fijos distintos de g en [a, b].Entonces,

0 < |α1 − α2| = |g(α1)− g(α2)| ≤ L|α1 − α2| < |α1 − α2|,donde L ∈ [0, 1) es una constante de contractividad de g en [a, b]. Evidentemente esto esabsurdo.

Una condicion suficiente para que una funcion sea contractiva en un intervalo [a, b], vienedada en la siguiente proposicion:

Page 15: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 15

Proposicion 3.8 Sea g : [a, b] → R una funcion continua en el intervalo [a, b] y derivableen (a, b). Supongamos que satisface la condicion

L := supx∈(a,b)

|g′(x)| < 1.

Entonces, g es contractiva en el intervalo [a, b], siendo L una constante de contractividadpara g en [a, b].

Demostracion. Sean x, y ∈ [a, b]. Aplicando el Teorema del Valor Medio a la funcion gdeducimos que existe un punto z ∈ (a, b) tal que

|g(x)− g(y)| = |g′(z)(x− y)| ≤ L|x− y|.

De esta desigualdad deducimos la prueba.

Pasemos a continuacion a analizar la convergencia del metodo (MAS) presentado ante-riormente. El resultado que sigue, proporciona convergencia global de (MAS) y acotaciondel error.

Teorema 3.9 (convergencia global de (MAS) y acotacion del error) Sean a, b ∈ R,con a < b, y g : [a, b]→ R dados. Supongamos que g([a, b]) ⊆ [a, b] y que g es contractiva enel intervalo [a, b], con constante de contractividad L ∈ [0, 1). Entonces,

1. La funcion g posee un unico punto fijo α en [a, b].

2. El metodo de aproximaciones sucesivas (MAS) esta bien definido en [a, b], i.e., paratodo x0 ∈ [a, b] se tiene que {xk}k≥0 ⊂ [a, b].

3. El metodo de aproximaciones sucesivas (MAS) es globalmente convergente en [a, b]hacia α con orden de convergencia al menos 1.

4. Se tienen las siguientes acotaciones del error absoluto:

|xk − α| ≤ Lk|x0 − α| ∀k ≥ 0 y ∀x0 ∈ [a, b] (cota a priori), (3.11)

|xk − α| ≤Lk

1− L|x1 − x0| ∀k ≥ 0 y ∀x0 ∈ [a, b] (cota a posteriori). (3.12)

Demostracion. En primer lugar, al ser g una funcion contractiva en el intervalo [a, b]deducimos que g es tambien continua en [a, b]. Veamos la prueba de los puntos del enunciado:

El primer punto es consecuencia directa de las Proposiciones 3.2 y 3.7 (vease la Obser-vacion 3.3). Por otro lado, teniendo en cuenta la hipotesis g([a, b]) ⊆ [a, b], es facil deducirque para cualquier x0 ∈ [a, b] el metodo esta bien definido y satisface

{xk}k≥0 ⊂ [a, b].

Pasemos a continuacion a probar el punto 3. Para ello, probemos la estimacion (3.11).Fijemos x0 ∈ [a, b] arbitrario. Se tiene,

|xk − α| = |g(xk−1)− g(α)| ≤ L|xk−1 − α| ≤ · · · ≤ Lk|x0 − α|.

Page 16: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

16 Calculo Numerico I.

Observese que en la desigualdad anterior estamos usando de manera reiterada que, paracualquier k ≥ 0, xk ∈ [a, b] y que g es contractiva en [a, b].

Teniendo en cuenta que L ∈ [0, 1), deducimos que lımxk = α y, por tanto, tenemos queel metodo (MAS) es globalmente convergente en el intervalo [a, b]. Por otro lado, tenemos

|xk − α| ≤ L|xk−1 − α|, ∀k ≥ 1.

De aquı deducimos que el metodo tiene orden de convergencia al menos 1. Tenemos probadoel punto 3 y la desigualdad (3.11).

Para finalizar probemos la estimacion (3.12). Sea m ≥ 0. Entonces,

|xm+1 − xm| = |g(xm)− g(xm−1)| ≤ L|xm − xm−1| ≤ · · · ≤ Lm|x1 − x0|,

(de nuevo hemos usado que, para cualquier m ≥ 0, xm ∈ [a, b] y que g es contractiva en[a, b]). Por otro lado, si tomamos k,m con m > k ≥ 0, aplicamos la desigualdad triangulary tenemos en cuenta la desigualdad anterior, podemos escribir

|xm − xk| ≤ |xm − xm−1|+ |xm−1 − xm−2|+ · · ·+ |xk+2 − xk+1|+ |xk+1 − xk|

≤(Lm−1 + Lm−2 + · · ·+ Lk+1 + Lk

)|x1 − x0| =

(Lk − Lm

1− L

)|x1 − x0|

≤ Lk

1− L|x1 − x0|.

Sabemos que lımm→∞ xm = α, ası, si en la desigualdad precedente tomamos lımm→∞ obten-dremos la estimacion (3.12). Esto finaliza la prueba.2

Observacion 3.10 Las acotaciones del error dadas en las desigualdades (3.11) y (3.12)muestran que la convergencia del metodo sera mejor cuanto mas proxima este la constantede contractividad L a 0.

Ejemplo 3.11 Consideremos la ecuacion de punto fijo e−x = x en el intervalo [1/2, log 2]y veamos que este intervalo es un intervalo de convergencia global para (MAS), es decir,comprobemos que g(x) = e−x satisface en [1/2, log 2] las condiciones del Teorema 3.9.

En primer lugar, la funcion g ∈ C1[1/2, log 2], es decir, g es continua y derivable en[1/2, log 2] y g′ es continua en [1/2, log 2]. De hecho,

g′(x) = −e−x < 0, ∀x ∈ [1/2, log 2].

En particular, g es estrictamente decreciente en el intervalo y se tiene

g([1/2, log 2]) = [g(log 2), g(1/2)] = [1/2, e−1/2] ⊂ [1/2, log 2].

Tenemos ası una de las hipotesis del Teorema 3.9 que hay que comprobar.

2Otra forma de probar la cota a posteriori es con ayuda de la siguiente desigualdad: |x0−α| = |x0±x1−α| ≤ |x0 − x1|+ |x1 − α| y que |x1 − α| ≤ L|x0 − α|, de donde (1− L)|x0 − α| ≤ |x0 − x1|. Esto unido a lacota a priori tambien implica la cota a posteriori.

Page 17: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 17

Veamos ahora que g es contractiva en [1/2, log 2] y calculemos una constante de contrac-tividad asociada. Para ello, aplicaremos la Proposicion 3.8:

maxx∈[1/2,log 2]

|g′(x)| = maxx∈[1/2,log 2]

e−x = e−1/2 = L < 1,

y por tanto se satisfacen todas las condiciones del Teorema 3,9.Apliquemos a continuacion el (MAS) partiendo de x0 = 1/2 para aproximar el unico

punto fijo α de g en [1/2, log 2]. En concreto, calculemos el numero de iteraciones k para queel error absoluto cometido sea menor que 10−3. Con este fin usaremos la estimacion (3.12):

|xk − α| ≤Lk

1− L|x1 − x0| =

e−k/2

1− e−1/2

∣∣∣∣e−1/2 − 1

2

∣∣∣∣ =2−√e

2(√e− 1)ek/2

.

Ası, garantizamos que el error sea menor que 10−3 si calculamos k tal que

2−√e

2(√e− 1)ek/2

≤ 10−3 ⇐⇒ k ≥ 2 log

((2−

√e) 103

2(√e− 1)

)= 11′2 . . .

En concreto, si tomamos k = 12 y aproximamos α por

x12 = 0′567067351853728 . . .

garantizamos que el error absoluto cometido es menor que 10−3.

A continuacion daremos un resultado de convergencia local para (MAS). En este resul-tado no supondremos hipotesis globales en el intervalo, solo una propiedad sobre la derivadaen el punto fijo de la funcion. Se tiene:

Teorema 3.12 (convergencia local de (MAS)) Sea I ⊂ R un intervalo abierto y g :I → R una funcion tal que existe α ∈ I verificando g(α) = α. Supongamos que existe δ > 0tal que (α− δ, α + δ) ⊂ I y g ∈ C1(α− δ, α + δ). Supongamos tambien que

|g′(α)| < 1.

Entonces, α es un punto atractivo para (MAS), es decir, existe ρ ∈ (0, δ) tal que paracualquier x0 ∈ [α − ρ, α + ρ] (MAS) esta bien definido y genera una sucesion {xk}k≥0 quesatisface lım xk = α. Ademas, existe una constante L ∈ [0, 1) (que depende de ρ y |g′(α)|)tal que

|xk − α| ≤ Lk|x0 − α| ∀k ≥ 0 y ∀x0 ∈ [α− ρ, α + ρ],

|xk − α| ≤Lk

1− L|x1 − x0| ∀k ≥ 1 y ∀x0 ∈ [α− ρ, α + ρ].

Demostracion. La prueba es una consecuencia del Teorema 3.9 aplicado en un intervalo(que tendremos que encontrar) [α − ρ, α + ρ]. Como |g′(α)| < 1, existe ρ ∈ (0, δ) tal queg ∈ C1([α− ρ, α + ρ]) y

|g′(x)| < 1, ∀x ∈ [α− ρ, α + ρ].

Page 18: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

18 Calculo Numerico I.

Como consecuencia de la Proposicion 3.8 obtenemos que g es contractiva en el intervalo[α− ρ, α + ρ] y

L = maxx∈[α−ρ,α+ρ]

|g′(x)| = |g′(x)| < 1, con x ∈ [α− ρ, α + ρ],

es una constante de contractividad asociada.Por otro lado g([α − ρ, α + ρ]) ⊆ [α − ρ, α + ρ] pues, fijado x ∈ [α − ρ, α + ρ], existe

ξ ∈ (α− ρ, α + ρ) tal que

|g(x)− α| = |g(x)− g(α)| = |g′(ξ)||x− α| ≤ L|x− α| ≤ Lρ < ρ.

Se tiene ası la propiedad.Podemos aplicar el Teorema 3.9 a g en el intervalo [α − ρ, α + ρ] obteniendo la prueba

del resultado.

En relacion con el resultado anterior, tambien es posible dar condiciones suficientes paraque un punto fijo α de una funcion g sea repulsivo para el (MAS)

Proposicion 3.13 Sea I ⊂ R un intervalo abierto y g : I → R una funcion tal que existeα ∈ I verificando g(α) = α. Supongamos que existe δ > 0 tal que (α − δ, α + δ) ⊂ I yg ∈ C1(α− δ, α + δ). Supongamos tambien que para una constante C > 1 se tiene

|g′(x)| ≥ C ∀x ∈ (α− δ, α + δ).

Entonces, α es un punto repulsivo para (MAS).

Demostracion. Razonemos por reduccion al absurdo. Si α es un punto atractivo para(MAS) aplicado a g. Entonces, existe ρ ∈ (0, δ) tal que para cualquier x0 ∈ [α− ρ, α+ ρ] elmetodo (MAS) esta bien definido, genera una sucesion {xk}k≥0 ⊂ [α−ρ, α+ρ] y lımxk = α.Tomemos x0 ∈ [α − ρ, α + ρ] con x0 6= α. Utilizando el Teorema del Valor Medio para lospuntos xk y α podemos escribir

|xk − α| = |g(xk−1)− g(α)| = |g′(ξk)||xk−1 − α|, ∀k ≥ 1,

donde ξk es un punto que esta entre xk y α, es decir ξk ∈ [α − ρ, α + ρ] ⊂ (α − δ, α + δ).Utilizando la hipotesis sobre |g′(x)| obtenemos

|xk − α| ≥ C|xk−1 − α|, ∀k ≥ 1.

Observese que podemos seguir aplicando el razonamiento anterior (la sucesion satisface{xk}k≥0 ⊂ [α− ρ, α + ρ]), obteniendo

|xk − α| ≥ Ck|x0 − α|, ∀k ≥ k0.

Al ser C > 1 y x0 6= α obtenemos que lım |xk − α| = ∞ y esto es, evidentemente absurdo.Tenemos ası la prueba.

Como hemos comentado anteriormente, (MAS) es un metodo iterativo de orden de con-vergencia al menos 1 (lineal). En algunos casos el orden de convergencia es mayor. Veamosesto en el siguiente resultado:

Page 19: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 19

Teorema 3.14 Sean m ∈ N, α, δ ∈ R, con δ > 0, y g : I = (α− δ, α+ δ)→ R una funciontal que g(α) = α. Supongamos que (MAS) es localmente convergente en I hacia el puntofijo α de g. Entonces,

1. Si m ≥ 2, g ∈ Cm(I) y

g′(α) = g′′(α) = · · · = gm−1)(α) = 0,

entonces (MAS) tiene orden de convergencia al menos m hacia α.

2. Si m ≥ 1, g ∈ Cm(I),

g′(α) = g′′(α) = · · · = gm−1)(α) = 0 y gm)(α) 6= 0,

(con |g′(α)| < 1 si m = 1), entonces la sucesion {xk}k≥0 generada por el (MAS)cumple que, o bien existe k0 ≥ 0 tal que xk = α para todo k ≥ k0, o bien xk 6= α paratodo k ≥ 0 y dicha sucesion tiene orden de convergencia exacta m hacia α.

Demostracion. Probemos cada una de las partes del resultado:

1. Como (MAS) es localmente convergente en I, existe ρ ∈ (0, δ) tal que para cualquierx0 ∈ [α− ρ, α+ ρ] (MAS) genera una sucesion {xk}k≥0 ⊂ [α− ρ, α+ ρ] tal que lımxk = α.Por otro lado, g ∈ Cm(I) y, por tanto podemos hacer un desarrollo de Taylor3 hasta el ordenm. Ası, fijado k ≥ 0, existe ξk (que esta entre xk y α, es decir, ξk ∈ [α− ρ, α + ρ]) tal que

|xk+1 − α| = |g(xk)− g(α)| = 1

m!|gm)(ξk)||xk − α|m ∀k ≥ 0. (3.13)

Si tomamos C = maxx∈[α−ρ,α+ρ]

|gm)(x)|/m! (observese que g ∈ Cm(I) y por tanto gm) es continua

en [α− ρ, α + ρ]), entonces, de la desigualdad anterior obtenemos

|xk+1 − α| ≤ C|xk − α|m, ∀k ≥ 0.

De esta desigualdad deducimos el primer punto.

2. Sea {xk}k≥0 una sucesion generada para el (MAS) tal que lımxk = α. Hay dos posibilida-des: o bien existe k0 ∈ N tal que xk = α para todo k ≥ k0, o bien para todo k ∈ N, se tieneque xk 6= α. Si ocurre esto ultimo, por (3.13), dado que lımk ξk = α, se tiene

lım|xk+1 − α||xk − α|m

=1

m!lım |gm)(ξk)| =

1

m!|gm)(α)| 6= 0.

De este modo deducimos el segundo punto y la prueba del resultado.

3Teorema de Taylor (e.g. cf. [T. Apostol, Calculus Vol. 1, Th.7.6, p.342 y Sec.7.7, p.347]) Sean I ⊂ R un

intervalo, a ∈ I, f ∈ Cn+1(I). Entonces, dado x ∈ I, existe c entre x y a tal que f(x) =∑n

j=0fj)(a)

j! (x−a)j +

En(x) siendo el error (en su expresion mas simple, pues hay varias posibles) En(x) = fn+1)(c)(n+1)! (x− a)n+1.

Page 20: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

20 Calculo Numerico I.

4. Metodos de segundo orden: metodo de Newton y

variantes

En esta seccion volveremos de nuevo al estudio de la ecuacion (1.1), donde supondremosque la funcion f esta definida en el intervalo [a, b] (con a, b ∈ R y a < b). Supongamos quef admite una raız α en el intervalo (a, b). Nuestro primer objetivo es construir un metodoiterativo de orden al menos cuadratico (orden 2) que aproxima a dicha raız de f . La idease basa en escribir de manera equivalente la ecuacion (1.1) como (EPF ) para una nuevafuncion g y aplicar los resultados de la seccion anterior. Razonamos del siguiente modo:

Sea h : [a, b] → R una funcion definida en [a, b] tal que h(x) 6= 0 en el intervalo [a, b].Evidentemente la ecuacion (1.1) equivale a

x− h(x)f(x) = x, (EPF )h

es decir, equivale a (EPF ) para la funcion g : [a, b]→ R dada por g(x) = x− h(x)f(x).La idea del metodo de Newton consiste en determinar h de tal modo que al aplicar el

(MAS) a la ecuacion (EPF )h, resulte un metodo convergente de al menos segundo orden.Para ello, teniendo en cuenta el Teorema 3.14, parece natural pedir que se tenga g ∈ C2[α−ρ, α + ρ] (con ρ > 0 tal que [α − ρ, α + ρ] ⊆ [a, b]) y g′(α) = 0. Teniendo en cuenta queg′(x) = 1− h′(x)f(x)− h(x)f ′(x) y que f(α) = 0, deducimos que h ha de satisfacer

h(α)f ′(α) = 1.

Si suponemos que f ′(x) 6= 0 para cualquier x en [a, b], basta tomar como funcion h(x) =1/f ′(x). Ası, la anterior ecuacion (EPF )h se escribe

x− f(x)

f ′(x)= x,

ecuacion para la que el (MAS) adopta la formax0 ∈ [a, b] dado,

xk+1 = xk −f(xk)

f ′(xk), ∀k ≥ 0.

(MN)

Este metodo iterativo (MN) recibe el nombre de Metodo de Newton.

Observacion 4.1 1. El metodo de Newton tiene una interpretacion geometrica sencilla,que en realidad esta en el origen historico del mismo. En efecto, en cada etapa k, el valorxk+1 corresponde a la abscisa del punto de corte con el eje OX de la recta tangentea la curva y = f(x) en el punto (xk, f(xk)) (esta recta viene dada por y − f(xk) =f ′(xk)(x − xk)). Esta interpretacion geometrica justifica que el metodo de Newtontambien reciba el nombre de metodo de la tangente.

2. Observese que para poder aplicar el metodo de Newton en el intervalo [a, b] es necesarioque la funcion f sea al menos derivable en [a, b] y que f ′(x) 6= 0 para todo x ∈ [a, b].

Page 21: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 21

3. Si f ∈ C3([a, b]) cumple que f ′(x) 6= 0 en [a, b], entonces automaticamente g(x) =

x− f(x)f ′(x)∈ C2([a, b]) y por el Teorema 3.14 se tiene que el (MN) tiene orden al menos

dos.

Comencemos estudiando un resultado de convergencia global del (MN) en el intervalo[a, b] sin imponer que f ∈ C3. Se tiene:

Teorema 4.2 (Convergencia global del (MN)) Sean a, b ∈ R, con a < b, y f ∈ C2([a, b])tal que

(i) f(a)f(b) < 0,

(ii) f ′(x) 6= 0, para todo x ∈ [a, b],

(iii) el signo de f ′′(x) es constante en [a, b] (es decir, o f ′′(x) ≥ 0 para todo x ∈ [a, b], of ′′(x) ≤ 0 para todo x ∈ [a, b]),

(iv) si c ∈ {a, b} es tal que |f ′(c)| = mın(|f ′(a)|, |f ′(b)|), entonces

|f(c)||f ′(c)|

≤ b− a.

Entonces se tiene:

1. La funcion f tiene una unica raız α en [a, b], i.e., existe un unico α ∈ [a, b] tal quef(α) = 0.

2. El (MN) esta bien definido, i.e. para todo x0 ∈ [a, b] se tiene {xk}k≥0 ⊂ [a, b].

3. El (MN) es globalmente convergente en [a, b] hacia α, i.e., para todo x0 ∈ [a, b] se tieneque existe lım xk = α.

4. El (MN) tiene convergencia al menos cuadratica en [a, b]. De hecho, si se m1 y M2

estan dadas por:m1 = mın

x∈[a,b]|f ′(x)| y M2 = max

x∈[a,b]|f ′′(x)|, (4.14)

entonces se tienen las siguientes acotaciones del error absoluto:

|xk+1 − α| ≤M2

2m1

|xk − α|2, ∀k ≥ 0, (4.15)

|xk+1 − α| ≤M2

2m1

|xk+1 − xk|2, ∀k ≥ 0. (4.16)

Demostracion. Veamos cada uno de los puntos del enunciado:

1. En primer lugar, de las hipotesis (i) y (ii) deducimos que podemos aplicar las Propo-siciones 1.8 y 1.10 deduciendo que f tiene un unico cero α en [a, b].

Por otro lado, las hipotesis (i)–(iv) hacen que, geometricamente, haya cuatro situacionesposibles:

Page 22: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

22 Calculo Numerico I.

1) f(a) < 0 (y, en consecuencia, f(b) > 0 y f ′(x) > 0 en [a, b]) y f ′′(x) ≤ 0 para todox ∈ [a, b],2) f(a) < 0 (y, ası, f(b) > 0 y f ′(x) > 0 en [a, b]) y f ′′(x) ≥ 0 para todo x ∈ [a, b],3) f(a) > 0 (y, en consecuencia, f(b) < 0 y f ′(x) < 0 en [a, b]) y f ′′(x) ≤ 0 para todox ∈ [a, b],4) f(a) > 0 (y, en consecuencia, f(b) < 0 y f ′(x) < 0 en [a, b]) y f ′′(x) ≥ 0 para todox ∈ [a, b].

Nosotros probaremos el teorema en la primera situacion. El resto de configuraciones sepueden demostrar de manera analoga (queda como ejercicio para el lector la prueba enlas tres restantes situaciones), o bien ser llevados al caso 1) mediante cambios de variablesadecuados (ver [3]).

A partir de ahora supondremos que f(a) < 0, f(b) > 0 y f ′′(x) ≤ 0 para todo x ∈ [a, b].En tal caso, por (ii) obtenemos que f ′(x) > 0 para todo x ∈ [a, b] y, al ser f ′′(x) ≤ 0, f ′ esno creciente en [a, b]. Deducimos que la hipotesis (iv) se reescribe: c = b y

f(b)

f ′(b)≤ b− a. (4.17)

2. Veamos que el (MN) esta bien definido. Introduzcamos la funcion g : [a, b] → Rdefinida por

g(x) = x− f(x)

f ′(x), ∀x ∈ [a, b].

De las hipotesis del enunciado deducimos que g ∈ C1([a, b]). Evidentemente, el (MN) esel (MAS) aplicado a esta funcion g y xk+1 = g(xk) para k ≥ 0. Ası, para ver que (MN)esta bien definido, veamos que g([a, b]) ⊆ [a, b]. Para ello, observemos que

g′(x) = 1− (f ′(x))2 − f(x)f ′′(x)

(f ′(x))2=f(x)f ′′(x)

(f ′(x))2, ∀x ∈ [a, b],

y, en consecuencia, como suponemos f ′′(x) ≤ 0 para todo x ∈ [a, b], tenemos{g′(x) ≥ 0 ∀x ∈ [a, α) (g es creciente en [a, α]),

g′(x) ≤ 0 ∀x ∈ (α, b] (g es decreciente en [α, b]).

Veamos que g([a, b]) ⊆ [a, b]:

Si x ∈ [a, α], entonces g(a) ≤ g(x) ≤ g(α) = α < b. Como

g(a) = a− f(a)

f ′(a)> a,

deducimos que a < g(x) ≤ α < b para cada x ∈ [a, α].

Si x ∈ [α, b], entonces g(b) ≤ g(x) ≤ g(α) = α < b. Como c = b, de (4.17) deducimos

g(b) = b− f(b)

f ′(b)≥ a.

Tambien en este caso deducimos que a ≤ g(x) ≤ α < b para cada x ∈ [α, b].

Page 23: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 23

Observese que en realidad hemos probado que

a ≤ g(x) ≤ α, ∀x ∈ [a, b]. (4.18)

En particular, deducimos que (MN) esta bien definido. Esto prueba el punto 2.

3. Pasemos a probar que el metodo es globalmente convergente en [a, b] hacia α. Para ello,veamos primero que, a partir del primer termino, la sucesion generada por (MN) es crecientey esta acotada superiormente. Efectivamente, si x0 ∈ [a, b], usando (4.18) obtenemos quex1 = g(x0) ∈ [a, α]. Utilizando de nuevo (4.18) y un razonamiento de induccion conseguimos

{xk}k≥1 ⊂ [a, α].

En particular la sucesion {xk}k≥1 esta acotada.Tambien {xk}k≥1 es creciente pues, si k ≥ 1 se tiene

xk+1 = g(xk) = xk −f(xk)

f ′(xk)≥ xk.

En la formula anterior hemos utilizado que {xk}k≥1 ⊂ [a, α] y que f(x) ≤ 0 en [a, α].Resumiendo, la sucesion {xk}k≥1 ⊂ [a, α] es monotona creciente y esta acotada superior-

mente. Ası, existe el lımitelım xk := α ≤ α.

En tal caso, tomando lımites en la igualdad

xk+1 = xk −f(xk)

f ′(xk),

obtenemos

α = α− f(α)

f ′(α),

es decir, f(α) = 0 o, equivalentemente, α = α. Obtenemos ası la prueba del tercer punto delenunciado.

4. Estudiemos el orden de convergencia. Aunque g′(α) = 0 (lo que sugiere que el ordende convergencia del metodo sera al menos cuadratico), no podemos aplicar el Teorema 3.14pues, en principio g no pertenece a C2([a, b]). Estudiaremos directamente el error absolutodel metodo:

De la expresion de xk+1 deducimos

f(xk) + f ′(xk)(xk+1 − xk) = 0, ∀k ≥ 0. (4.19)

Por otra parte, realizando un desarrollo de Taylor de f(α) hasta el orden 2 (observese quef ∈ C2([a, b]) tambien obtenemos:

0 = f(α) = f(xk) + f ′(xk)(α− xk) +1

2f ′′(θk)(α− xk)2, ∀k ≥ 0,

donde θk es un punto situado entre α y xk (y, por tanto en [a, b]). Restando las dos expresionesobtenemos

f ′(xk)(α− xk+1) +1

2f ′′(θk)(α− xk)2 = 0.

Page 24: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

24 Calculo Numerico I.

Despejando xk+1 − α, tomando valores absolutos y usando (4.14) deducimos (4.15). Enparticular esta desigualdad (4.15) prueba que el metodo de Newton (MN) es de orden almenos cuadratico.

Para obtener (4.16), volvemos a hacer un desarrollo de Taylor de segundo orden def(xk+1):

f(xk+1) = f(xk) + f ′(xk)(xk+1 − xk) +1

2f ′′(θk+1)(xk+1 − xk)2, ∀k ≥ 0,

donde ahora θk+1 es un nuevo punto situado entre xk+1 y xk (y, de nuevo, en el intervalo[a, b]). Usando (4.19) deducimos

f(xk+1) =1

2f ′′(θk+1)(xk+1 − xk)2.

Por otra parte, aplicando el teorema del valor medio en los puntos xk+1 y α tenemos:

f(xk+1) = f(xk+1)− f(α) = f ′(θk+1)(xk+1 − α),

donde θk+1 es un punto intermedio entre xk+1 y la raız α. Igualando estas dos formulas ydespejando xk+1 − α obtenemos:

xk+1 − α =f ′′(θk+1)

2f ′(θk+1)(xk+1 − xk)2

Tomando valores absolutos y usando (4.14) obtenemos (4.16). Esto finaliza la prueba delresultado.

Observacion 4.3 1. Analizando la demostracion del resultado anterior deducimos quela hipotesis (iv) puede ser reescrita de manera equivalente del siguiente modo:

(iv) si c ∈ {a, b} es tal que |f ′(c)| = mın(|f ′(a)|, |f ′(b)|), entonces, tomando x0 = c, setiene x1 ∈ [a, b].

2. De la demostracion anterior tambien se deduce que, bajo las condiciones del Teore-ma 4.2, la sucesion {xk}k≥1 que genera el metodo de Newton (MN) es monotona apartir del primer termino. Efectivamente, hemos visto que en la primera de las cuatrossituaciones descritas al inicio de la prueba, la sucesion {xk}k≥1 es monotona creciente.En las otras tres es posible comprobar que la sucesion sigue siendo monotona (crecienteo decreciente).

3. La acotacion del error (4.16) (estimacion “a posteriori”) es un test de parada parael metodo. Supongamos que queremos calcular una aproximacion de la raız α con unerror menor que ε > 0, entonces iterarıamos el metodo hasta un termino k ≥ 1 quesatisfaga

M2

2m1

|xk − xk−1|2 < ε.

Page 25: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 25

4. La condicion (iv) del enunciado del Teorema 4.2 limita el tamano del intervalo [a, b] aconsiderar. En concreto, el punto c es el extremo “malo”del intervalo y la condicion (iv)se puede reescribir diciendo que si tomamos x0 = c, entonces el punto x1 no se sale delintervalo [a, b]. El otro extremo del intervalo [a, b] es el extremo “bueno”: si tomamoscomo x0 ese punto, la sucesion sera monotona y convergera hacia α. Vemos este puntoen el siguiente resultado.

Corolario 4.4 (Regla de Fourier) Consideremos una funcion f ∈ C2([a, b]) tal que sa-tisface las hipotesis (i), (ii) y (iii) del Teorema 4.2. Sea x0 = a o x0 = b tal que se tiene4

f(x0) > 0 si f ′′(x) ≥ 0 para todo x ∈ [a, b], o f(x0) < 0 si f ′′(x) ≤ 0 para todo x ∈ [a, b].Entonces, la sucesion {xk}k≥0 generada por el metodo (MN) esta bien definida, es

monotona, {xk}k≥0 ⊂ [a, b] y es convergente hacia α (la unica raız de f en [a, b]) con ordende convergencia al menos cuadratica. Ademas, se tienen las estimaciones de error (4.15)y (4.16).

Demostracion. Probemos el resultado en la primera situacion de las cuatro descritas alinicio de la prueba del Teorema 4.2. En estas condiciones c = b y x0 = a. Recordemos queen este caso la funcion g dada por

g(x) = x− f(x)

f ′(x), ∀x ∈ [a, b].

es creciente en el intervalo [a, α] y, ademas, la sucesion {xk}k≥0 es monotona creciente,esta contenida en el subintervalo [a, α] (por tanto esta acotada) y converge hacia α. Lasestimaciones (4.15) y (4.16) se prueban analogamente a como se hizo anteriormente. Estoacaba la prueba.

El ultimo Teorema que probaremos en este Tema nos proporciona un resultado de con-vergencia local para el metodo de Newton (MN). Se tiene:

Teorema 4.5 (Convergencia local del (MN)) Consideremos el intervalo abierto (a, b)y una funcion f ∈ C2(a, b). Supongamos que existe α ∈ (a, b) tal que f(α) = 0 y f ′(α) 6= 0.Entonces, el metodo (MN) es localmente convergente en (a, b), i.e., existe ρ > 0 tal que elmetodo (MN) esta bien definido en [α − ρ, α + ρ] y es convergente en [α − ρ, α + ρ] haciaα. Ademas, o bien existe k0 ≥ 0 tal que xk = α para todo k ≥ k0, o bien xk 6= α para todok ≥ 0 y

lım|xk+1 − α||xk − α|2

=|f ′′(α)|2|f ′(α)|

, ∀x0 ∈ [α− ρ, α + ρ] \ {α}. (4.20)

Ası, la convergencia hacia α es de orden al menos dos, y si f ′′(α) 6= 0, el metodo (MN)tiene convergencia (exactamente) cuadratica (p = 2).

Demostracion. La prueba es consecuencia del Teorema 3.12. Efectivamente, como f ∈C2(a, b) y f ′(α) 6= 0, existe δ > 0 tal que (α − δ, α + δ) ⊂ (a, b) y f ′(x) 6= 0 para todox ∈ (α− δ, α + δ). Ası, la funcion

g(x) = x− f(x)

f ′(x), ∀x ∈ (α− δ, α + δ),

4Si f ′′(x) ≡ 0 en todo el intervalo, f es una lınea recta y el (MN) lleva directamente a la solucion porcualquier extremo que se empiece.

Page 26: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

26 Calculo Numerico I.

esta bien definida en el intervalo y satisface g ∈ C1(α − δ, α + δ), g(α) = α y g′(α) = 0.Podemos aplicar directamente a g el Teorema 3.12 concluyendo que existe ρ ∈ (0, δ) tal queel metodo (MN) esta bien planteado en [α− ρ, α+ ρ] y es convergente hacia la raız α de f .Tenemos ası la primera parte del enunciado.

Probemos a continuacion la segunda parte del Teorema. Sea x0 ∈ [α−ρ, α+ρ]. Entoncesla sucesion generada por el metodo (MN) esta bien definida, {xk}k≥0 ⊂ [α − ρ, α + ρ] ysatisface lımxk = α. Las estimaciones probadas en el Teorema Global de Convergencia delMetodo de Newton son validas aquı igualmente, de donde deducimos que existe un punto ξkque esta entre α y xk tal que

xk+1 − α =1

2

f ′′(ξk)

f ′(xk)(xk − α)2,

es decir, que o bien existe un k0 ≥ 0 tal que xk0 = α y por tanto tambien xk = α para todok ≥ k0 o bien xk 6= α para todo k ≥ 0, en cuyo caso,

xk+1 − α(xk − α)2

=1

2

f ′′(ξk)

f ′(xk), ∀k ≥ 0.

Como en particular se tiene que lım ξk = α, tomando lımite en la expresion anterior inferimosla igualdad (4.20). Esto finaliza la prueba del resultado.

Observacion 4.6 Observemos que si en la parte final del resultado anterior tuvieramosf ′′(α) = 0, cabrıa esperar “mayor convergencia” , del tipo al menos p con p > 2. Si fuera elcaso, serıa convergencia supercuadratica.

Concretamente, si f ∈ C3, la convergencia serıa de orden al menos 3. En efecto, de laprueba anterior se deduce que

xk+1 − α(xk − α)2

=1

2

f ′′(ξk)

f ′(xk)

con ξk entre xk y α. Por tanto, |ξk −α| ≤ |xk −α|. Ademas, por el teorema del valor medio,

f ′′(ξk) = f ′′(ξk)− 0 = f ′′(ξk)− f ′′(α) = f ′′′(ck)(ξk − α),

donde ck es un valor entre ξk y α. Por tanto, de ambas expresiones concluimos que

lım sup|xk+1 − α||xk − α|3

= lım sup1

2

|f ′′′(ck)(ξk − α)||f ′(xk)(xk − α)|

≤ |f′′′(α)|

2|f ′(α)|.

Terminamos el Tema presentando dos variantes del metodo de Newton (MN). Se tratadel metodo de la secante y del metodo regula falsi. Pasemos a describirlos brevemente sinrealizar un analisis de su convergencia:

Metodo de la secante: Este algoritmo es un metodo iterativo de dos pasos. Se tratade una variacion del metodo de Newton donde se construye el punto xk+1 como laabscisa del punto de corte entre el eje OX y la recta secante a la curva y = f(x)que pasa por los puntos (xk, f(xk)) y (xk−1, f(xk−1)) (recordemos que en el metodo

Page 27: Tema 2 M etodos de resoluci on de Ecuaciones no Lineales · Tema 2: M etodos de resoluci on de Ecuaciones no Lineales. 3 Por supuesto, tambi en se puede escribir la ecuaci on en la

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 27

de Newton el punto xk+1 es la abscisa del punto de corte entre el eje OX y la rectatangente que pasa por el punto (xk, f(xk))). Ası, este metodo tiene la forma:

x0, x1 dados,

xk+1 = xk − f(xk)xk − xk−1

f(xk)− f(xk−1), ∀k ≥ 1.

(MS)

Regula falsi: Se trata de una variante del metodo anterior y, en algun sentido, recuerdaal metodo de dicotomıa (biseccion). Supongamos dados x0 y x1 tales que x0 < x1 yf(x0)f(x1) < 0 y calculemos x2 como la abscisa del punto de corte entre el eje OX y lasecante a f que pasa por los puntos (x0, f(x0)) y (x1, f(x1)). Utilizando los tres puntosx0, x1 y x2 (x0 < x2 < x1) seleccionamos el subintervalo ([x0, x2] o [x2, x1]) donde hayaun cambio de signo de f en los extremos. El nuevo punto x3 se construirıa repitiendoen el nuevo intervalo el proceso anterior. Evidentemente este nuevo algoritmo es unmetodo iterativo de dos pasos.

Referencias

[1] A. Aubanell, A. Benseny & A. Delshams, Utiles basicos de Calculo Numerico, Labor,Barcelona 1993.

[2] F. Garcıa & A. Nevot, Metodos Numericos, Universidad Pontificia de Comillas, Madrid,1997.

[3] P. Henrici: Elementos de Analisis Numerico, John Wiley and Sons-Ed. Trillas, Mexico,1972.

[4] J. A. Infante y J. M. Rey, Metodos Numericos: Teorıa, problemas y practicas conMATLAB , Ediciones Piramide, Madrid, 1999.

Como bibliografıa complementaria se pueden consultar:

[5] K.E. Atkinson, An introduction to Numerical Analysis, Wiley, New York 1978.

[6] R.L. Burden & J.D. Faires, Metodos Numerico, International Thomson Editores SpainParaninfo, Madrid, 2004.

[7] D. Kincaid & W. Cheney, Analisis Numerico, Addison-Wesley Iberoamericana, Wil-mington, 1994.