12
Demografía Matemática Proyecto final Bogotá D.C., Colombia, mayo de 2018 Análisis de deserción académica de estudiantes del programa peama de la Universidad Nacional de Colombia a través del uso de modelos de sobrevida en tiempo discreto Analysis of Academic Drop-outs of National University of Colombia peama program students through the use of Discrete-Time Survival Models Andrés Nicolás López López a , Martín Andrés Macías Quintero b Departamento de Estadística, Facultad de Ciencias, Universidad Nacional de Colombia, Bogotá, Colombia Resumen El análisis de la deserción académica es un asunto de gran importancia para la comunidad uni- versitaria puesto que permite estudiar las condiciones socioeconómicas y académicas del estudiante en relación con su trayectoria educativa. Su impacto contribuye a trazar políticas públicas tendientes a disminuir las problemáticas que afectan el normal desarrollo del devenir estudiantil, desde sus dis- tintas dimensiones (social, económica y académica) (Rodríguez et al. 2010). En este sentido, interesa determinar y cuantificar los factores de riesgo que promueven y los de protección que atenúan la des- vinculación total y/o parcial de los estudiantes durante su permanencia en la Universidad Nacional de Colombia, en particular, para los estudiantes del Programa Especial de Admisión y Movilidad Académica peama. El programa peama se caracteriza por tener tres etapas de desarrollo: inicial, de movilidad y final. En la etapa inicial, los estudiantes reciben clases en las sedes de frontera a las que fueron admitidos (Amazonía, Caribe, Orinoquía y Tumaco); en la fase de movilidad, los estudiantes son asignados a sedes centrales donde se ofrezca el programa al cual fueron admitidos y en la fase final, retornan a las sedes de presencia nacional con el fin de realizar su trabajo de grado, preferentemente, en temas de interés para su región. Esta población está expuesta a situaciones de vulnerabilidad críticas debido a su procedencia fronteriza en las dimensiones anteriormente expuestas. La hipótesis que se intenta probar es que la movilidad tiene un efecto significativo en la desvinculación definitiva. Para esta investigación, se propone analizar las cohortes de 2008-I a 2018-I de los estudiantes del programa peama mediante un modelo de análisis de supervivencia de tiempo discreto (Willett & Singer 1995). La ventaja que presenta la metodología utilizada es considerar la naturaleza longitudi- nal de los datos frente a técnicas transversales utilizadas en estudios similares (Rodríguez et al. 2010). Palabras clave : Deserción académica, desvinculación, modelos de sobrevida en tiempo discreto. a Estudiante MSc. en Estadística. E-mail: [email protected] b Estudiante MSc. en Estadística. E-mail: [email protected] 1

Análisisdedeserciónacadémicadeestudiantesdelprograma peama ...estadisticas.unal.edu.co/fileadmin/user_upload/Desercion... · 2018. 7. 17. · de la población en estudio (Rodríguez

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • Demografía MatemáticaProyecto final

    Bogotá D.C., Colombia, mayo de 2018

    Análisis de deserción académica de estudiantes del programapeama de la Universidad Nacional de Colombia a través del uso

    de modelos de sobrevida en tiempo discreto

    Analysis of Academic Drop-outs of National University of Colombia peama programstudents through the use of Discrete-Time Survival Models

    Andrés Nicolás López Lópeza, Martín Andrés Macías Quinterob

    Departamento de Estadística, Facultad de Ciencias, Universidad Nacional de Colombia, Bogotá, Colombia

    Resumen

    El análisis de la deserción académica es un asunto de gran importancia para la comunidad uni-versitaria puesto que permite estudiar las condiciones socioeconómicas y académicas del estudianteen relación con su trayectoria educativa. Su impacto contribuye a trazar políticas públicas tendientesa disminuir las problemáticas que afectan el normal desarrollo del devenir estudiantil, desde sus dis-tintas dimensiones (social, económica y académica) (Rodríguez et al. 2010). En este sentido, interesadeterminar y cuantificar los factores de riesgo que promueven y los de protección que atenúan la des-vinculación total y/o parcial de los estudiantes durante su permanencia en la Universidad Nacionalde Colombia, en particular, para los estudiantes del Programa Especial de Admisión y MovilidadAcadémica peama.

    El programa peama se caracteriza por tener tres etapas de desarrollo: inicial, de movilidad y final.En la etapa inicial, los estudiantes reciben clases en las sedes de frontera a las que fueron admitidos(Amazonía, Caribe, Orinoquía y Tumaco); en la fase de movilidad, los estudiantes son asignados asedes centrales donde se ofrezca el programa al cual fueron admitidos y en la fase final, retornan a lassedes de presencia nacional con el fin de realizar su trabajo de grado, preferentemente, en temas deinterés para su región. Esta población está expuesta a situaciones de vulnerabilidad críticas debidoa su procedencia fronteriza en las dimensiones anteriormente expuestas. La hipótesis que se intentaprobar es que la movilidad tiene un efecto significativo en la desvinculación definitiva.

    Para esta investigación, se propone analizar las cohortes de 2008-I a 2018-I de los estudiantes delprograma peama mediante un modelo de análisis de supervivencia de tiempo discreto (Willett &Singer 1995). La ventaja que presenta la metodología utilizada es considerar la naturaleza longitudi-nal de los datos frente a técnicas transversales utilizadas en estudios similares (Rodríguez et al. 2010).

    Palabras clave: Deserción académica, desvinculación, modelos de sobrevida en tiempo discreto.

    aEstudiante MSc. en Estadística. E-mail: [email protected] MSc. en Estadística. E-mail: [email protected]

    1

  • 2 Andrés Nicolás López López & Martín Andrés Macías Quintero

    1. Introducción

    Programa especial de admisión y movilidad académica – peama

    El Programa Especial de Admisión y Movilidad Académica – peama– fue creado por la UniversidadNacional de Colombia a través del Acuerdo No. 025 de 2007 del Consejo Superior Universitario, conel objetivo de colaborar activamente con el desarrollo social de las regiones fronterizas, a través de laformación profesional de habitantes de zonas apartadas del país y preparar profesionales competentes ysocialmente responsables (Universidad Nacional de Colombia 2007). El programa consiste en la ofertade programas curriculares de pregrado de las sedes Bogotá, Manizales, Medellín y Palmira a bachilleresresidentes en las regiones de influencia de las Sedes de Presencia Nacional (Amazonía, Caribe, Orinoquíay Tumaco).

    Entre los aspectos más relevantes para la creación del Programa están: la escasa oferta de programasde pregrado en las regiones de frontera, la dificultad económica para llevar carreras completas a lasregiones de frontera, una posible saturación del mercado laboral por la reducida oferta de programas depregrado, el desarrollo regional que supone la presencia de diferentes áreas del conocimiento, entre otros.El programa peama tiene las siguientes etapas de formación:

    1. Etapa inicial. Una vez admitido, el estudiante inicia estudios en la Sede de Presencia Nacional, endonde cursará algunas asignaturas. Esta etapa inicial podrá variar para cada estudiante según sudesempeño en el examen de admisión, los requerimientos del programa curricular al que haya sidoadmitido y de acuerdo con la disponibilidad de los programas que se puedan ofrecer en la Sede dePresencia Nacional.

    2. Etapa de movilidad. El estudiante iniciará movilidad a las sedes donde se ofrece el programaseleccionado, una vez esté nivelado con sus similares de la sede andina. Como parte de la movilidadacadémica, el estudiante continuará los cursos del plan de estudios establecido, en la sede que ofreceel programa en el cual fue admitido.

    3. Etapa final. Para terminar el programa, el estudiante se desplazará a la Sede de Presencia Nacionalcon el fin de realizar su trabajo de grado. Cuando esto no sea posible, el estudiante deberá hacersu trabajo de grado, preferentemente, en temas de interés para su región.

    Hasta el primer semestre del 2012 se ofrecieron 56 programas curriculares a través del programa enlas áreas de Ciencias, Ciencias Agropecuarias, Ciencias Humanas y Sociales e Ingenierías. A través dela resolución de Rectoría 1385 del 25 de octubre de 2012 (Universidad Nacional de Colombia 2012), laUniversidad Nacional de Colombia incluyó una nueva oferta de programas curriculares de pregrado através del peama, en las áreas de Ciencias Humanas y Sociales y Ciencias de la Salud. Así mismo, seincluye en este mismo acto administrativo la oferta de carreras del área de las artes. A partir del segundosemestre de 2012 se incluyó dentro de la oferta del peama las áreas de ciencias de la salud y artes.

    El cupo inicial de admisión hasta la convocatoria 2012-02 fue de hasta dos cupos por carrera, con uncupo total de admisión de setenta. En 2012, a través de la Resolución 1385 de 2012, se amplió a trescupos por carrera y un cupo máximo de admisión de noventa estudiantes.

    Deserción académica

    La misión de la universidad se enfoca en la formación de profesionales competentes y socialmenteresponsables. En procura de este objetivo es importante realizar un seguimiento a la dinámica académicade ingreso, permanencia y graduación, de tal forma que los diferentes esfuerzos que implica este segui-miento, se vean reflejados en retener la mayor cantidad de estudiantes, minimizando el nivel de deserciónacadémica.

    El propósito y los diferentes esfuerzos de la Universidad van encaminados a brindar condicionesfavorables para que los estudiantes puedan culminar satisfactoriamente sus estudios. La Universidad,como centro de investigación y formación académica, en su labor de enseñanza, pone a disposición de losestudiantes herramientas para apoyar su proceso formativo, el cual es dirigido por docentes con amplio

    Demografía Matemática (2018)

  • Deserción Académica peama Universidad Nacional de Colombia 3

    dominio del conocimiento que transmiten. Todo este material y los diferentes esfuerzos administrativosrepresentan una inversión para la institución, con lo que se espera que exista una retribución mediante losresultados académicos. En consecuencia, los empeños y las herramientas brindadas por la Universidad asícomo los planes académicos requieren una constante evaluación para determinar el grado de cumplimientode las metas y los objetivos propuestos.

    La oferta de pregrados para los estudiantes peama comprende los 73 programas (exceptuando medi-cina) en todas las áreas del conocimiento. Para cada uno de ellos se contempla una duración determinadade acuerdo con el plan de estudios y sus contenidos programáticos. Sin embargo, al contrastar con laexperiencia de los estudiantes, se verá en qué programas y bajo qué escenarios las condiciones estipuladasen el diseño de planes de mejoramiento han sido efectivas.

    La Universidad se ha preocupado por realizar investigaciones sobre los fenómenos de deserción, rezagoy graduación que permitan a cada facultad reforzar las medidas preventivas ante la deserción. En el año2007 se publicó un estudio en el que se tomaron las cohortes de estudiantes de pregrado que ingresaronentre los periodos 1996-1 y 1998-3 de diferentes sedes a nivel nacional. El periodo de observación fue de14 semestres. Adicionalmente se diseñó una encuesta para recolectar información complementaria sobrecondiciones previas al ingreso y del desarrollo de la vida académica, la cual se aplicó a una muestrade la población en estudio (Rodríguez et al. 2007). Las situaciones que resultaron ser determinantesen la deserción fueron las relacionadas con la absorción de los programas y la posibilidad de dedicarseexclusivamente al estudio.

    En el año 2010 el estudio se enfocó en la graduación, deserción y rezago de los estudiantes de lascohortes comprendidas entre el año 2004 y 2007 de los programas de posgrado de las sedes Bogotá,Medellín, Manizales y Palmira. Se analizaron la desvinculación temporal y definitiva por separado. Lafacultad de Ciencias se ubicaba entre las facultades con mayor índice de deserción, situación que tambiénse estudió y evidenció para programas de pregrado. Se pudo ver que la gran mayoría de estudiantes desertóen su primera interrupción. Los hallazgos revelaron que el género, la edad y el hecho de tener una becaconstituyen factores asociados con las probabilidades de grado y deserción. La metodología estadísticaempleada para el modelamiento en ambos estudios fue la regresión logística (Rodríguez et al. 2010).

    Se pueden identificar varios fenómenos en la dinámica de ingreso y salida de los estudiantes: los queingresan al programa y por alguna razón se desvinculan parcialmente o de forma definitiva; aquellos quellegan a graduarse en el tiempo previsto o aquellos que prolongan su permanencia en la universidad másallá de los tiempos establecidos por los planes de estudio. En particular, el interés se centrará en analizarel tiempo hasta la ocurrencia de desvinculación en general, es decir, sin discriminar el carácter temporalo definitivo de la desvinculación, teniendo en cuenta la influencia de algunas variables sociodemográficas.La metodología propuesta dentro del análisis es la construcción de un modelo logístico de riesgo discretocon efecto continuo. Se toman como referencia los datos correspondientes al censo de los estudiantes queingresaron entre el periodo académico 2008-I al 2017-III de la Universidad Nacional de Colombia.

    El estudio se realizará tomando como referencia los conjuntos de datos proporcionadas por la DirecciónNacional de Planeación y Estadística de la Universidad Nacional de Colombia en las cuales se detallainformación de los estudiantes por cohorte en cada programa de pregrado para la población analizada.

    Más allá de los objetivos de este estudio se encuentra una consecuencia indirecta que se refiere a pro-poner lineamientos encaminados a optimizar la permanencia y graduación de los estudiantes. Se esperaque este documento permita trazar estrategias en ese sentido. En el documento inicialmente se presentauna breve descripción de la metodología empleada, a continuación se exponen las consideraciones meto-dológicas que guían el estudio. En la sección 4 se presenta la aplicación de la metodología en el contextodel estudio, para finalmente presentar discusiones referentes a los resultados.

    Demografía Matemática (2018)

  • 4 Andrés Nicolás López López & Martín Andrés Macías Quintero

    2. Justificación

    En Colombia, el abandono de las aulas universitarias llega al 50% (Diaz & Garzón 2013) y una de lasestrategias que se propuso la Universidad Nacional de Colombia para combatir esta problemática fue lacreación de un programa que permitiera a jóvenes de regiones apartadas acercarse a la Universidad pararesignificar su proyecto de vida.

    Dentro del marco de la evaluación de los productos ofrecidos por la Universidad, se encuentra lavaloración del flujo de estudiantes que participan en programas de pregrado. Dentro de esa revisióninteresa examinar aspectos relacionados con la calidad educativa y el nivel de deserción, así como laconcordancia de la oferta académica con las necesidades de los profesionales en su entorno laboral y,por último, la compensación entre la inversión realizada en herramientas y espacios de formación y laproducción intelectual.

    En el presente estudio se explora el fenómeno de deserción académica considerando la desvinculaciónya sea temporal o definitiva de estudiantes a los programas de posgrado, con lo cual se busca cuantificarla influencia de factores determinantes, en términos del tiempo, que potencian la ocurrencia del eventoy a los cuales se debe prestar especial atención con el fin de minimizar la desvinculación académica ycontrolar el tiempo que toma graduarse.

    Se aborda la evaluación del equilibrio entre la capacidad de la Universidad en el sentido de retenerestudiantes que ingresan a programas de pregrado y la posibilidad de que ellos terminen de forma satis-factoria el plan de estudios. Esto permitirá que los entes administrativos responsables, tengan bases paraafrontar las demás problemáticas planteadas anteriormente, al igual que otros interrogantes que surjan deeste análisis. Se espera, además, que este estudio sea insumo para comprender el comportamiento generalde la deserción y brinde información no disponible para la Universidad, de la misma forma que ayude aestablecer una base para posibles estudios futuros.

    Objetivos

    Caracterizar el fenómeno de deserción académica en estudiantes peama de la Universidad Nacional deColombia, para las cohortes comprendidas entre 2008-I a 2017-III, en términos del tiempo que transcurrehasta su desvinculación.

    Objetivos específicos

    • Identificar los factores académicos que influyen en el tiempo de permanencia hasta la desvinculaciónde un programa de pregrado para los estudiantes peama de las cohortes de interés, a través de laevaluación de la significancia de sus parámetros asociados en el modelo estimado.

    • Describir la población de estudio a través de las variables académicas disponibles.

    3. Metodología

    Un acercamiento al problema de interés a partir de métodos tradicionales en estadística trata lavariable respuesta como dicotómica describiendo si el individuo presenta o no la característica de interés.En el contexto del presente estudio, a partir del análisis de regresión logística se buscaría la posibleasociación entre el estado de deserción y un conjunto de covariables observadas de potencial importanciapara la descripción del fenómeno.

    Es claro que estudiantes recientemente vinculados en el programa han estado una menor cantidadde tiempo expuestos al riesgo de deserción respecto a estudiantes más antiguos, por lo cual, aunquepueden o no desertar en el futuro, estos estudiantes aún no han sido observados por un periodo suficientede tiempo dada la información incompleta inherente en los datos. Bajo el enfoque tradicional estosindividuos serían retirados de la muestra. Por otra parte, podría asumirse que al continuar en riesgo dedesercion, eventualmente algunos de los individuos con información incompleta llegarán a dicho estado

    Demografía Matemática (2018)

  • Deserción Académica peama Universidad Nacional de Colombia 5

    y asumir cierta cantidad de estos estudiantes como desertores en el último periodo de observación. Estono solamente es subjetivo respecto a la decisión del número de individuos a considerar como futurosdesertores sino que además desconoce la naturaleza longitudinal de los datos, en los cuales cada uno delos desertores entraron en dicho estado en diferentes momentos de su vida académica. Por otra parte,obviar la estructura longitudinal de los datos dificulta la incorporación de posibles predictores de interésque varían en función del tiempo. El cambio de sede para los estudiantes del programa peama no siempreocurre en el mismo semestre y puede ser un factor importante al momento de la deserción.

    Como se resaltó anteriormente, existen situaciones de estudiantes que no presentan el evento duranteel tiempo de observación o durante el tiempo de su participación dentro del estudio, ya sea porque parasu caso en particular no presenta el evento, no ha transcurrido el tiempo necesario o porque se pierde elseguimiento del estudiante. Esto corresponde a casos de censura dentro del fenómeno en estudio, puesse tiene información incompleta. La metodología seleccionada involucra tanto la información de los casosen los cuales ocurrió el evento como los casos de censura. Además, contempla la longitudinalidad de losdatos, lo cual significa una ganancia respecto a modelos de regresión, modelos lineales generalizados logito análisis discriminante.

    3.1. Censura

    Si el estado del sujeto es «activo» porque en la última observación no se había producido el evento dedesvinculación, se trata de un tiempo incompleto o censurado (censored time). Estas observaciones llama-das incompletas por la derecha aportan información para estimar las probabilidades de supervivencia, yes una de las diferencias del análisis de supervivencia respecto de otros estudios. Los tiempos censuradospueden tener varios orígenes, por ejemplo sujetos retirados vivos o perdidos.

    De esta forma, la variable indicadora de no censura está dada por:

    δi =

    {1 si Ti ≤ Ci0 si Ti > Ci

    (1)

    con Ci el tiempo de censura para el individuo i, Ti tiempo hasta el evento del individuo i.

    Gráfica 1: Diagrama tiempos. Gráfica 2: Diagrama centrado de tiempos.

    En las gráfica 1 se aprecia el diagrama del comportamiento de los datos a analizar. Cada estudianteingresa a la Universidad junto con los demás estudiantes de su cohorte en tiempos diferentes dependiendode la cohorte y cada estudiante puede tener un tiempo diferente de censura. Los individuos 3 y 4 iniciany presentan el evento en diferentes periodos. Mientras que los individuos 1 y 2 son datos censurados, unode ellos porque se termina el periodo de estudio y hasta ese momento no se ha observado la ocurrenciadel evento.

    Demografía Matemática (2018)

  • 6 Andrés Nicolás López López & Martín Andrés Macías Quintero

    3.2. Análisis de sobrevida discreto

    El análisis de sobrevida es una colección de procedimientos estadísticos para el análisis de datos enlos cuales la variable de interés es el tiempo T hasta que ocurre un evento. Dentro de las motivacionespara su implementación se encuentra la situación en la cual el tiempo hasta la ocurrencia del evento nose distribuye de forma simétrica y por otro lado, cuando se presenta censura (a derecha, izquierda o porintervalo) en los datos (Kleinbaum & Klein 2012). El enfoque principal de esta técnica es la estimaciónde la función de sobrevida S(t) (el complemento de la función de distribución para la variable aleatoriaT corresponde a la probabilidad de que un individuo sobreviva al tiempo t y de la función de riesgo h(t)(riesgo instantáneo en t de observar el evento dada supervivencia previa) modelando su heterogeneidadobservada en función de covariables de importancia para la descripción del fenómeno de interés.

    En la descripción del fenómeno de interés, es importante resaltar que la variable respuesta es eltiempo, en semestres, de deserción para los estudiantes de cada una de las sedes de presencia nacional coninformación suficiente para realizar un seguimiento que permita observar experiencias de vida académicacompletas de los estudiantes. Dentro de las funciones que caracterizan la distribución de la variablealeatoria T en tiempo discreto, como el tiempo a deserción en semestres, se encuentran nuevamente lafunción de sobrevida y la función de riesgo. Esta última para el caso discreto se define como la probabilidaden t del evento para un individuo dada supervivencia previa (Klein & Moeschberger 2003). A diferenciadel caso continuo, la función de riesgo discreta denota una probabilidad, definida como

    h(t) = P (T = t|T ≥ t) (2)

    Con lo cual, desde la etapa inicial de vinculación en la sede de presencia nacional correspondiente hastala etapa final en la que se espera que cada estudiante culmine con éxito el programa, el registro semestralde cada individuo es almacenado, junto a información auxiliar del mismo en el semestre indicado. Seobserva la necesidad de implementar un análisis de sobrevida, sin embargo, al notar que la variablerespuesta de interés es discreta, es necesario adaptar la metodología continua para el análisis discretomediante análisis de sobrevida en tiempo discreto.

    En el análisis de supervivencia, la variable respuesta T se puede definir de acuerdo con la formacomo ha sido medida (Singer & Willet 2003). Para una variable aleatoria discreta T pueden existir dossituaciones:

    1. Cuando T es estrictamente discreta, es decir, que el evento ocurre únicamente en tiempos específicos(t0, t1, t2, . . .) y el tiempo de supervivencia se analiza como resultados ordenados, por ejemplo,número de nacimientos, número de semestres o número de lactancias. (McCullagh 1980)

    2. Cuando T es una variable continua pero los tiempos están agrupados en intervalos de la forma(0, t1], (t1, t2], . . . , (tj−1, tj ]. En este caso la variable respuesta tiempo, está definida como tj , si eltiempo observado ocurre dentro del intervalo (tj−1, tj ]. (Singer & Willet 2003)

    En general, se caracteriza la distribución de la variable respuesta en términos de la función de riesgo (1)y el modelamiento del tiempo al evento se hace en términos de esta función. Diferentes modelos estadísticosse han propuesto en la literatura para el análisis de supervivencia en tiempos discretos. (Kalbfleisch& Prentice 1973) propusieron una versión del modelo de riesgos proporcionales para datos agrupados,(McCullagh 1980) planteó un modelo de regresión logística ordinal, (Singer & Willet 2003, Willett &Singer 1995) consideraron un enfoque basado en un modelo de regresión logística binaria para estimar losefectos de covariables en la función de riesgo. Esta última aproximación será la que se utilizará en estetrabajo.

    3.2.1. Modelo Logit

    La función de riesgo discreta h(tij) para el individuo i en el periodo de tiempo j introduce la hetero-geneidad observada a través de predictores asociados X1ij , . . . , Xpij con la ocurrencia del evento como

    htij = P (Ti = j|T ≥ t,X1ij = x1ij , . . . , Xpij = Xpij) (3)

    Demografía Matemática (2018)

  • Deserción Académica peama Universidad Nacional de Colombia 7

    Se nota que la expresión anterior incluye predictores que pueden o no variar en el tiempo discretopara cada individuo. Al determinar la forma funcional de la relación entre las covariables y la función deriesgo, especificar de manera completamente general el efecto del tiempo y utilizar una función de enlacelogit se obtiene

    logit(hij) = [α1D1ij + . . .+ αJDJij ] + [β1X1ij + . . .+ βpXpij ] (4)

    Donde las variables indicadoras temporales Dk indexan los J diferentes tiempos discretos, especifi-cando así el efecto discreto del tiempo en la función de riesgo. Para el presente estudio se cuenta conuna gran cantidad de efectos fijos temporales, uno por cada posible semestre observado llegando inclusohasta 18 semestres para algunos estudiantes, lo cual puede afectar la estimación del efecto para los demáspredictores del modelo en la función de riesgo. Por esta razón, el efecto de las variables Dk en la funciónde riesgo es aproximado mediante una especificación alternativa en formas polinomiales

    logit(h(tij)) = [α0 + α1(tj) + . . .+ αn(tj)n] + [β1X1ij + . . .+ βpXpij ] (5)

    La obtención de los parámetros del modelo para la ecuación (4) puede realizarse mediante una rutinade regresión logística dónde la variable respuesta es la indicadora del evento de interés en un conjunto dedatos adaptado a nivel individuo-periodo como se describe a continuación.

    3.2.2. Transformación individuo-periodo del conjunto de datos

    El uso de análisis de supervivencia con tiempos discretos requiere que el conjunto de datos originalessea adaptado a un formato de individuo-periodo (Singer & Willet 2003). Esta transformación es nece-saria para la aplicación de métodos estadísticos de regresión logística tradicionales en el modelamientodiscreto del tiempo de supervivencia. En esta transformación cada individuo tiene múltiples registros quedependerán del tiempo hasta el evento. Por ende, cada tiempo discreto (semestre) observado para cadaindividuo en cada periodo, le corresponde una variable respuesta binaria (o indicador) que denota laocurrencia o no del evento objeto de estudio en determinado momento del tiempo. Es decir, el indicadorasignará el valor de 0 a cada observación hasta la fecha que ha sido observado y en el último registroasignará el valor de 1 si el individuo experimentó el evento y el valor de 0 en el caso de ser una observacióncensurada. Esta transformación requiere cuidado especial con respecto a las censuras que se deben reflejaren la última observación de cada individuo.

    Una vez ha sido depurada la información y se han realizado diferentes validaciones de consistencia dela misma, el insumo final para estudiar el fenómeno de deserción académica consiste en un registro discretosemestral de la experiencia de vida de cada individuo inscrito en el programa peama. La informaciónes segmentada para caracterizar el comportamiento de los individuos en las diferentes sedes de frontera,obteniendo así una base de datos a nivel individuo-periodo por sede de frontera, la cual es utilizada alajustar el modelo lineal discreto a la función de riesgo.

    3.3. Consideraciones metodológicas

    Dentro del fenómeno de estudio, se identifican los siguientes escenarios: estudiantes graduados, estu-diantes activos y los desvinculados ya sea de forma definitiva o temporal. El interés del presente estudio esanalizar el tiempo medido en semestres de matrículas efectivas desde la vinculación del estudiante hastala ocurrencia del evento desvinculación.

    Una vez el estudiante se ha graduado, o ha desertado del programa, su registro desaparece de la base,por lo cual, potenciales desertores son detectados al perder el registro de los mismos en un semestre deter-minado. Los potenciales desertores son comparados con la base de datos de graduaciones del programa,la cual contiene el nombre y fecha de graduación de cada graduado. Es importante resaltar que entre losestudiantes graduados aquellos que culminaron sus estudios profesionales sin interrupciones, por defini-ción, tienen un tiempo de deserción igual a cero. Por otra parte, estudiantes graduados pudieron haberdesertado durante su carrera profesional una o varias veces, por lo que el tiempo a deserción es diferentea cero para cada uno de las deserciones anteriores al grado, la última potencial deserción corresponde asu graduación, la cual tiene un tiempo igual a cero.

    Demografía Matemática (2018)

  • 8 Andrés Nicolás López López & Martín Andrés Macías Quintero

    Los potenciales desertores que efectivamente desertaron en la base individuo periodo contienen infor-mación valiosa respecto a las características, semestre a semestre (incluyendo el semestre de deserción) delos mismos. Se busca relacionar esta información con el estado de deserción para encontrar característicasdeterminantes de los desertores en cada una de las sedes de frontera estudiadas.

    3.3.1. Población de estudio

    Los individuos corresponden a los estudiantes matriculados a programas de pregrado del programapeama en el periodo 2008-I a 2017-III de la Universidad Nacional de Colombia. Los conjuntos de datosfueron proporcionadas por la Dirección Nacional de Planeación y Estadística de la Universidad Nacionalde Colombia, en las cuales se especifica la información por estudiante para cada cohorte y programa.

    3.3.2. Variables

    La información auxiliar disponible de los estudiantes peama es bastante amplia para los últimossemestres del programa, sin embargo, para semestres más antiguos la disponibilidad de información esmucho más limitada y presenta una gran cantidad de problemas de consistencia en el almacenamiento.Las variables comunes encontradas son principalmente de tipo socioeconómico y académicas, se incluyen:

    1. NOMBRE. Nombre de cada estudiante.

    2. PERIODO. Periodo en el que el estudiante se encuentra matriculado.

    3. EVENTO. Ocurrencia o no ocurrencia de deserción por parte del individuo en el periodo dado.

    4. SEMESTRE. Semestre cursado por el estudiante. Esta característica es variable en el tiempo.

    5. GENERO. Sexo del estudiante. Esta característica es constante en el tiempo.

    6. ESTRATO MÍNIMO AGRUPADO. Estrato mínimo observado por el estudiante agrupado endos niveles diferenciados: bajo (estrato 0, 1 y sin estratificar) y otros (estrato 2 en adelante). Laclasificación fue determinada a partir del Puntaje Básico de Matrícula (PBM) de los estudiantes delprograma que contaban con esta información. El objetivo de esta variable es clasificar de maneradiferenciada los estudiantes respecto a su estrato socioeconómico con la información más completadisponible. Esta característica es constante en el tiempo.

    7. SEDE DE ORIGEN. Sede de presencia nacional dónde el estudiante inició sus estudios. Esta ca-racterística es constante en el tiempo.

    8. CAMBIO DE SEDE. Variable indicadora de cambio de sede del estudiante en un periodo deter-minado. Esta característica es variable en el tiempo.

    Para los estudiantes del programa que cuentan con más de dos semestres observados, se incluyen lasvariables:

    1. CAMBIO DE SEDE 1 Rezago 1 de la variable de cambio de sede. Esta variable describe si elsemestre anterior al actual el estudiante realizó cambio de sede.

    2. CAMBIO DE SEDE 2 Rezago 2 de la variable de cambio de sede. Esta variable describe si el añoanterior al actual el estudiante realizó cambio de sede.

    Por otra parte, para las 4 sedes de presencia nacional, una de ellas (Tumaco) no presenta un registrosuficiente para poder evidenciar la experiencia de vida académica completa de ninguno de sus estudiantes,por lo cual se restringe el análisis a las demás sedes. Finalmente, los estudiantes en los que en ningúnsemestre se reporta su estratificación socio económica son retirados de la población de estudio.

    Demografía Matemática (2018)

  • Deserción Académica peama Universidad Nacional de Colombia 9

    4. Resultados y Conclusiones

    En las gráficas 3 a 5 se presenta la función de riesgo estimada para los estudiantes de las diferentessedes de frontera estudiadas: Amazonia (AMZ), Orinoquía (ORI) y Caribe (CAR). Se observa cómo existeun decaimiento del riesgo discreto estimado de deserción estudiantíl (lineas continuas) a medida quetranscurren los semestres, posteriormente se nota un aumento en el riesgo de deserción para los semestresfinales. Adicionalmente, algunos de los estudiantes originarios de esta sede llegan a estar vinculados ensu programa de pregrado hasta por 20 semestres antes de alcanzar su grado o su primera deserción. Esimportante diferencial el aumento de riesgo de los primeros semestres con respecto al aumento de losúltimos semestres, en los primeros semestres el conjunto de estudiantes en riesgo de deserción es muchomás grande que en los últimos semestres, implicando un aumento en la variablidad de las estimacionesdel riesgo discreto para los últimos periodos de observación. El riesgo discreto para las distintas sedeses similar durante los primeros semestres, los últimos semestres presentan diferencias marcadas por lavariabilidad en la estimación.

    Gráfica 3: Riesgo discreto. AMZ Gráfica 4: Riesgo discreto. ORI Gráfica 5: Riesgo discreto. CAR

    Este fenómeno es comúnmente observado en el análisis de supervivencia, dado que a medida que pasael tiempo, los individuos presentan el evento de interés o son censurados, por lo cual el conjunto enriesgo se hace cada vez más pequeño, llevando a estimaciones puntuales del riesgo cada vez más volátiles.Para el modelamiento de la deserción de los estudiantes peama, al tener bastantes tiempos discretos dedeserción, la especificación de las variables indicadoras en (4) es poco parsimoniosa y el modelamientoalternativo a partir de formas polinomiales presentado en (5) es adoptado. La gráficas 3 a 5 presentanadicionalmente el polinomio ajustado a la función de riesgo (líneas punteadas) para controlar el efectotemporal en el modelo sin utilizar la especificación general en (4). La representación polinomial específicapara cada sede de frontera es seleccionada mediante el criterio de información de Akaike (AIC) entrelas diferentes especificaciones alternativas (constante, lineal, cuadrática, cúbica y polinomial de cuartoorden) presentadas en la tabla 1.

    Representación Temporal Parámetros AIC-AMZ AIC-ORI AIC-CARConstante 1 3725.5 3980.1 1167.8Lineal 2 3594.3 3866.2 1107.9

    Cuadrática 3 3571.8 3816.1 1108.1Cúbica 4 3572.8 3806.8 1109.44 orden 5 3572.9 3808.5 1108.1

    Tabla 1: Comparación de representaciones suavizadas polinomiales para el efecto temporal para cada sede.

    Se resalta en la tabla 1 el modelo seleccionado para el efecto de semestre en cada una de las sedesde frontera de interés como aquel que minimiza el criterio de información AIC. Estos polinimios sonajustados junto a las potenciales covariables de importancia en la descripción de la función de riesgo.

    Demografía Matemática (2018)

  • 10 Andrés Nicolás López López & Martín Andrés Macías Quintero

    En una primera aproximación en el modelamiento de las funciones discretas de riesgo se considera elmodelo logit lineal (5) con los predictores X1i sexo (1 si el individuo i es hombre y 0 si es mujer), X2iestrato mínimo observado (1 si el estrato mínimo observado del individuo i es bajo y 0 si el estrato esotro) y X3ij cambio de sede (1 si el individuo i en el semestre j se encuentra en una sede diferente a lade origen y 0 si se encuentra en la misma sede en la cual inició sus estudios). Para cada una de las sedesde presencia nacional los modelos ajustados están dados por:

    • Para Amazonía,

    logit(h(tij)) = [α0 + α1tj + α2t2j ] + [β1X1i + β2X2i + β3X3ij ] (6)

    • Para Orinoquía,

    logit(h(tij)) = [α0 + α1tj + α2t2j + α3t3j ] + [β1X1i + β2X2i + β3X3ij ] (7)

    • Para Caribe,logit(h(tij)) = [α0 + α1tj ] + [β1X1i + β2X2i + β3X3ij ] (8)

    Al ajustar los modelos propuestos (ver tabla 2, columnas 2, 4 y 6) se observa en general una diferenciaen la deserción para el sexo al controlar por las demás variables del modelo, presentando un aumentodel riesgo de deserción para los hombres respecto a las mujeres en todas las sedes consideradas. Enparticular, el menor incremento de riesgo para los hombres se encuentra en la sede ORI, la cual presentaun incremento en el riesgo de deserción para hombres de un 41% respecto a las mujeres. Por otra parte,al controlar por las demás variables del modelo, el efecto del estrato socioeconómico mínimo observado nopresenta diferencias significativas en el riesgo de deserción estudiantil en las diferentes sedes a excepciónde CAR. En esta sede de frontera, el estrato mínimo observado presenta un factor protector ante ladeserción, con una disminución aproximada del 30% en la misma.

    Parámetro AMZ (6) AMZ (9) ORI (7) ORI (10) CAR (8) CAR (11)α0 -1.279 -4.998 -1.421 -6.445 -1.716 -3.616α1 -0.292 0.806 -0.526 1.319 -0.147 -0.024α2 0.014 -0.046 0.053 -0.127 – –α3 – – -0.002 0.004 – –β1 0.407 0.231 0.346 0.361 0.767 0.747β2 -0.014 0.071 0.140 0.047 -0.366 -0.334β3 -0.275 0.452 -0.382 -0.003 -0.366 1.196β4 – -0.571 – 0.078 – -0.125β5 – -0.915 – -1.246 – -0.560

    Tabla 2: Modelos ajustados para las diferentes sedes.

    Interesantemente, el efecto del cambio de sede para los modelos 6 a 8 al controlar por las demásvariables del modelo es protector para la deserción estudiantil. Es decir, a partir del momento en el quelos estudiantes realizan su movilidad académica, estos estudiantes presentan un menor riesgo de deserciónrespecto a los que se mantienen en su sede de origen. Este efecto significativo benefactor para la variablede cambio de sede se presenta por la alta deserción observada durante el primer semestre de los estudiantesde sedes de frontera.

    Al retirar los estudiantes que desertan en el mismo semestre de su ingreso a la universidad de lapoblación de estudio, no sólo se busca determinar de manera más clara el efecto del cambio de sede en ladeserción estudiantil, sino que además esto permite la incorporación de información auxiliar adicional enel modelamiento de la función de riesgo. Se adiciona en una segunda aproximación el estado de cambiode sede 1 y 2 semestres anteriores al actual. La utilización de estos rezagos de la variable X3ij permiteincorporar el efecto posterior del cambio de sede para los estudiantes del programa en el modelamientode la función de riesgo discreta. Es claro que estas variables no están disponibles para estudiantes conuno o dos semestres cursados, por lo cual son retirados del análisis.

    Demografía Matemática (2018)

  • Deserción Académica peama Universidad Nacional de Colombia 11

    Al incorporar las variables rezagadas X(1)3ij y X(2)3ij de la variable X3ij , un modelo para las funciones

    discretas de riesgo en cada una de las sedes de presencia nacional está dado por:

    • Para Amazonía,

    logit(h(tij)) = [α0 + α1tj + α2t2j ] + [β1X1i + β2X2i + β3X3ij + β4X3ij(1) + β5X3ij

    (2)] (9)

    • Para Orinoquía,

    logit(h(tij)) = [α0 + α1tj + α2t2j + α3t3j ] + [β1X1i + β2X2i + β3X3ij + β4X3ij

    (1) + β5X3ij(2)] (10)

    • Para Caribe,

    logit(h(tij)) = [α0 + α1tj ] + [β1X1i + β2X2i + β3X3ij + β4X3ij(1) + β5X3ij(2)] (11)

    A partir de los modelos propuestos, se observa que para los estudiantes con una duración mayor ados semestres en el programa peama en las 3 diferentes sedes de frontera, el sexo del estudiante yel estrato mínimo observado al controlar por las demás covariables del modelo conservan las mismasrelaciones respecto al modelamiento con el conjunto completo de datos (ver tabla 2, columnas 3, 5 y 7).Sin embargo, para la sede AMZ se observa ahora que el cambio de sede presenta un factor de riesgo enlugar de uno protector para los estudiantes, incrementando su probabilidad de deserción en un 57% apartir del semestre de cambio de sede. El efecto del primer rezago en esta sede evidencia que, una vez elestudiante ha estado un semestre en la sede de llegada, su riesgo disminuye cerca de un 40% respecto alaumento del riesgo observado al momento de su llegada. Finalmente, después de un año de permanenciaen la sede de llegada, hay nuevamente una disminución importante en el riesgo de deserción.

    Para la sede ORI, aunque el cambio de sede no afecta de manera importante su riesgo de deserción enel mismo semestre de cambio de sede, un semestre posterior a la movilidad, hay un aumento del riesgoen un 9%. Después de este primer semestre riesgoso para los estudiantes de la sede ORI posterior a lamovilidad, existe una disminución en el riesgo de deserción cercana al 68%. Una situación similar sepresenta para los estudiantes de la sede CAR, con un mayor riesgo de deserción al realizar el cambio desede.

    El diagnóstico de residuales para los modelos finales 9, 10 y 11, al igual que el modelamiento dela función de riesgo, es realizado a nivel persona periodo. A partir de la estimación de los errores delmodelo mediante de los residuales deviance, estimados para evaluar la predicción de modelos con variablesde respuesta discretas. En este sentido, no se observaron residuales especialmente problemáticos queevidencien un mal ajuste de los datos.

    5. Limitaciones y recomendaciones

    El análisis se podría enriquecer si se contara con variables socio-demográficas adicionales a las variablesasociadas al proceso académico con las que se contaba inicialmente. El inconveniente radica en que lacalidad de la información recolectada para estudiantes de pregrado del peama no es validada, por otrolado, es susceptible de cambios durante el estudio del estudiante.

    Se recomienda mayor rigurosidad y cuidado en la construcción de los conjuntos de datos para evitarincongruencias, que como en el presente estudio, retrasaron la ejecución del análisis. Se requiere además,una adecuada actualización de la información.

    Podría ser de interés diferenciar el comportamiento de la desvinculación de forma temporal y definitiva,así como la diferencia entre los graduados y aquellos que culminaron sus estudios pero aún no han obtenidoel grado de forma oficial.

    En la metodología planteada se considera la ocurrencia de los eventos de interés (Graduación y Desvin-culación) y se construyeron los respectivos modelos, sin embargo, se podría explorar la regresión Cox paracaso discreto considerando la metodología de riesgos en competencia donde múltiples eventos compitenpara dar por finalizado el tiempo de vida del individuo u objeto de análisis. Lo anterior permitirá tener

    Demografía Matemática (2018)

  • 12 Andrés Nicolás López López & Martín Andrés Macías Quintero

    una aproximación al fenómeno teniendo en cuenta que ambos eventos pueden ocasionar que el estudiantese retire de la universidad, pero sólo será el que primero ocurra.

    La información semestre a semestre del estudiante, teniendo en cuenta el registro de su historial dedesvinculación y semestres de inactividad y reingreso, se puede aprovechar para la construcción de tablasde vida multiestado que permitirán describir el fenómeno incluyendo las reservas de cupo.

    Referencias

    Diaz, D. B. & Garzón, L. P. (2013), ‘Elementos para la comprensión del fenómeno de la deserción uni-versitaria en colombia. más allá de las mediciones.’, Cuadernos Latinoamericanos de Administración9(16), 55–66.

    Kalbfleisch, J. D. & Prentice, R. L. (1973), ‘Marginal likelihoods based on cox’s regression and life model’,Biometrika 60(2), 267–278.

    Klein, J. & Moeschberger, M. (2003), Survival analysis Techniques for Censored and Truncated Data,second edn, Springer, New York.

    Kleinbaum, D. & Klein, M. (2012), Survival analysis, third edn, Springer, New York.

    McCullagh, P. (1980), ‘Regression models for ordinal data’, Journal of the royal statistical society. SeriesB (Methodological) pp. 109–142.

    Rodríguez, A., Pérez, R., López, J. & Durán, D. (2010), Permanencia estudiantil en los postgrados de laUniversidad Nacional de Colombia, Vol. I, UNAL, Bogotá.

    Rodríguez, A., Pérez, R., Reverón, C. & Durán, D. (2007), Cuestión de supervivencia: Graduación,deserción y rezago en la Universidad Nacional de Colombia, Vol. I, UNAL, Bogotá.

    Singer, J. & Willet, J. (2003), Applied Longitudinal Data Analysis, OXFORD University Press, New York.

    Universidad Nacional de Colombia (2007), Resolución 025 de 2014, Consejo Superior Universitario, Bo-gotá, Colombia.

    Universidad Nacional de Colombia (2012), Resolución 1385 de 2012, Rectoría, Bogotá, Colombia.

    Willett, J. B. & Singer, J. D. (1995), ‘It’s déjà vu all over again: Using multiple-spell discrete-time survivalanalysis’, Journal of Educational and Behavioral Statistics 20(1), 41–67.

    Demografía Matemática (2018)