9
"#$%&’($)*) +*’$*#, -./%&0 )& -1*2&3*/* "#$%&’(%) *# +)$,-.’*)(’/ 0&1#&%#(2’ #& "%/.#$’/ 300 "#$#/.(# !"#$ %&’($)" *+,-.& */ 0120304325678 9$)(" !+:";" <"(=$,+ %/ 0120304325>10 ?)@=A B(&+A)" C+#D$&&+A"# E/ 0120304325625 F":=" %)=A+) *$(=A" G/ 0120304327586

mineriadatos

Embed Size (px)

DESCRIPTION

libro donde se detalla la mineria de datos

Citation preview

!

!

"#$%&'($)*)!+*'$*#,!-./%&0!)&!-1*2&3*/*!"#$%&'(%)!*#!+)$,-.'*)('/!

0&1#&%#(2'!#&!"%/.#$'/!

300!!"#$#/.(#!

!

!

!"#$!%&'($)"!*+,-.&!*/! ! 0120304325678!

9$)("!!+:";"!<"(=$,+!%/!!!!!!!!0120304325>10!

?)@=A!B(&+A)"!C+#D$&&+A"#!E/! 0120304325625!

F":="!%)=A+)!*$(=A"!G/! ! 0120304327586!

! ! ! ! ! !

!

!

INTRODUCCIONCada día las grandes entidades publicas y privadas, acceden a grandes bancos de informa-ción, ya sea para obtener datos estadísticos, o para realizar operaciones con ellas, que por lo general, así sucede, con ella ser realizan la toma de decisiones dentro de la institución. Seria absurdo pensar que solo se desean poseer los datos y la información almacenada y no realizar ningun evento con ellas. Es por eso que en Sistemas de Información, se pretende implementar el paradigma del buen manejo y administración de información, ya que con ella se genera recursos econó-micos y ventajas competitivas a una determinada entidad.

No obstante la Minería de Datos o Datamining, rompe el modelo de información, llegado a tal extremo, que se presenta información real, para realizar una toma de decisiones, en forma masiva, que permiten generar grandes ventajas y poseer una organización eficiente, a comparación de otras. Pero para ello, se debe invertir en la implementación de equipo tecnológico y humano con los conocimientos adecuados para la solidez de nuestra infor-mación.

Por ello se detallan, los conceptos básicos para generar Minería de datos y los requeri-mientos que se necesitan para implementarla.

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 3

De forma general, los datos son la materia prima bruta. En el momento de que el usuario les atribuye algún significado especial pasa a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo representa

un valor agregado, entonces se refiere al conocimiento.Este conocimiento, esta ligado a los sistemas estratégicos que las propias empresas emplean para la toma de decisiones, en la cual puedan generar grandes ingresos y por ende el alto crecimiento que ella conlleva

Ejemplo DataminigPor ejemplo, una cadena de

supermercados del Medio Oeste de Estados Unidos, utiliza la capacidad de minería de datos, para analizar los patrones de compra locales. Descubrieron que cuando los hombres compran pañales, los jueves y sábados, también tienden a comprar cervezas. Un análisis posterior mostró que estos compradores normalmente hacían sus compras semanales de los sábados. Los jueves, sin embargo, solo se compraban algunos artículos. El minorista llego a la conclusión de que han comprado cerezas para tenerlo disponible el fin de semana. La cadena de supermercados podría utilizar este descubrimiento de diversas maneras para incrementar los ingresos. Por ejemplo, mover el mostrador de cervezas mas cerca del mostrador de pañales y se venderían las cervezas a precio completo los jueves.

Datamining o minería de datos, es el conjunto de técnicas y tecnologías que permiten explorar grandes base de datos, de manera automática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de practicas estadísticas y en algunos casos, de algoritmos de búsqueda próximos a la inteligencia artificial y a las redes neuronales.

DEFINICION Y ESTRATEGIADataminig o Mineria de Datos, como estrategia en la Empresa

DATAMINIG

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 4

INNOVACIÓN CONTINUA

Datos, Informacion y conocimiento

DATO:

Los datos son los hechos, números, o texto que pueda ser procesada por un orde-nador. Hoy en día, las orga-nizaciones se están acumu-lando grandes y crecientes cantidades de datos en dife-rentes formatos y diferentes bases de datos. Esto incluye:

Los datos operacionales o transaccionales, tales como, ventas, costos, inven-tarios, nómina y contabili-dad de datos fuera de ope-ración, tales como ventas de la industria, los datos de previsiones, y los datos ma-cro económicos los metada-tos - datos sobre los datos en sí, tales como el diseño lógico de bases de datos o datos de las definiciones del diccionario de datos.Los patrones, asociaciones, o las relaciones entre todos estos datos pueden propor-cionar información.

EN DATAMININGAunque la minería de datos es un termino relativamente nuevo, la tecnología no lo es. Las empresas han utilizado los ordenadores de gran al-cance para tamizar a través de volúmenes de datos de escáner de supermercados y analizar los informes de in-vestigación de mercados du-rante años. Sin embargo, las continuas innovaciones en el poder, equipo de proce-samiento, almacenamiento en disco y software de esta-dística están aumentando drásticamente en la preci-sión de análisis, mientras se reduce el coste.

Ejemplos Datos

OPERACIONALES O TRANSACCIONALES

Por ejemplo, el análisis de punto de venta de datos de transacción de la venta

puede dar información sobre los productos que se venden y cuándo.

EjemplosCONOCIMIENTO

información resumida sobre las ventas en supermercados al por menor

pueden ser analizados a la luz de los esfuerzos de promoción que facilitan el conocimiento de comportamiento de compra del consumidor. Así, un fabricante o distribuidor puede determinar qué elementos son los más susceptibles a los esfuerzos de promoción.

Conocimiento:La información puede ser convertida en co-nocimiento de los pa-trones históricos y las tendencias futuras.

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 5

LOS ALMACENES DE DATOSLos vertiginosos avances en la captura de

datos, potencia de procesamiento, transmisión de datos, y las capacidades de almacenamiento se permite a las organizaciones a integrar sus diferentes bases de datos en almacenes de datos. Almacenamiento de datos se define como un proceso de gestión de datos centralizada y la recuperación. Almacenamiento de datos, como la minería de datos, es un término relativamente nuevo, aunque el concepto en sí ha estado presente durante años. Almacenamiento de datos representa una visión ideal de mantener un repositorio central de todos los datos de la organización. La centralización de los datos es necesaria para maximizar el acceso de usuarios y el análisis. Los espectaculares avances tecnológicos hacen que esta visión una realidad para muchas

empresas. E, igualmente dramáticos avances en el software de análisis de datos permiten a los usuarios acceder a estos datos libremente. El software de análisis de datos es lo que apoya la minería de datos.

QUE PUEDE HACER LA MINERÍA DE DATOS?

POR EJEMPLO:Blockbuster Entertainment, a traves de su base de datos, revisa el historial de alquiler de vídeo para recomendar el alquiler para los clientes individuales. American Express puede sugerir pro-ductos a sus titulares de tarjetas basadas en el análisis de sus gastos mensuales.

La extracción de datos se utiliza principalmente al día de hoy por empresas con un fuerte foco en el cliente - al por menor, finan-cieros, de comunicación y orga-nizaciones de marketing. Esto permite a estas empresas para determinar las relaciones entre los factores "internos" como el precio, posicionamiento del

producto, o las habilidades del personal, y factores "externos" tales como los indicadores eco-nómicos, la competencia, y la demografía de los clientes. Y, que les permite determinar el impacto en las ventas, la satis-facción del cliente, y las ganan-cias corporati-vas. Por último, les permite "ba-jar" en una in-formación su-maria para ver en detalle los datos transac-cionales.

Con la minería de datos, un mi-norista puede usar los puntos de venta de registros de compras de los clientes para enviar pro-mociones específicas basadas en el historial de compras de un individuo. Por la minería de da-tos demográficos de comentario

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 6

Wal Mart es pionera en la minería de datos masivos pa-ra transformar sus relaciones con los proveedores.

WalMart captura los puntos de operaciones de venta de más de 2.900 tiendas en 6 países y transmite continua-mente estos datos a su masiva 7,5 terabytes de almacena-miento de datos Teradata. WalMart permite que más de 3.500 proveedores, para ac-ceder a los datos sobre sus productos y realizar los análi-sis de datos. Estos proveedo-res utilizan esta información para identificar los patrones de compra del cliente a nivel

de visualización de la tienda. Ellos usan esta información para gestionar el inventario de la tienda local e identificar nuevas oportunidades de co-mercialización. En 1995, los ordenadores WalMart proce-sado más de 1 millón consul-tas complejas de datos.

Analizar los datos de software de aplicación.

Presentar los datos en un formato útil, como un gráfico o tabla

Proporcionar acceso a los datos a los analistas de ne-gocios y profesionales de tecnología de la información

Almacenar y gestionar los datos en un sistema de base de datos multi-dimensional

De extracción, transforma-ción y carga de datos de la transacción en el sistema de almacenamiento de datos.

Sera esto los servidores utilizados por Walmart?... que opina ud....?

OTRO EJEMPLO DE LO QUE SE PUEDE REALIZAR CON LA MINERIA DE

Gran poder... que se obtiene a la hora de implementación de Dataminig en cualquier empresa, ya que con una buena estrategia de marketing las empresas pueden generar ventajas competitivas

Componentes de la Minería de Datos

¿Cómo funciona la minería de datos?Si bien la tecnología de información a gran escala ha ido evolucionando transacción separada y sistemas de análisis, la minería de datos propor-ciona el vínculo entre los dos. Software de minería de datos analizan las relaciones y patro-nes en los datos de transacción almacenada basado en preguntas abiertas de los usuarios. Existen varios tipos de software de análisis que están disponibles

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 7

TIPOS DE SOFTWARE DE ANÁLISIS

Estadística.Aprendizaje Automático.Redes Neuronales.

TIPOS DE RELACIONES EN EL FUNCIONAMIENTO DE LA MINERIA DE DATOS

Clases: Los datos almacenados se utiliza para localizar los datos en los grupos

Por ejemplo, una cadena de restaurantes po-dría poseer datos de compra de los clientes para determinar cuando los clientes de la visita y lo que normalmente ordenan. Esta información podría utilizarse para aumentar

Clusters: elementos de datos se agrupan de acuerdo a las relaciones lógicas o las

Por ejemplo, los datos pueden ser extraí-dos para identificar los segmentos de mercado o de las afinidades de los con-sumidores.

Asociaciones: Los datos pueden ser ex-traídos para identificar las asociaciones

La cerveza ejemplo de pañal es un ejem-plo de la minería asociativa.

UNIVERSIDAD MARIANO GÁLVEZ 21 DE AGOSTO DE 2009

PÁGINA 8

¿Qué infraestructura tecno-lógica se requiere?

Hoy en día, las aplicaciones de minería de datos están disponibles en todos los sis-temas de tamaño para main-frame, cliente / servidor, y las plataformas de PC. Sis-tema de precios van desde varios miles de dólares para las más pequeñas aplicacio-nes de hasta $ 1 millón de terabytes para las más grandes.

Tamaño de la base de datos: más datos están siendo proce-sados y mantenidos, el más po-deroso del sistema requerido.

Complejidad de la consul-ta: la más compleja de las consultas y mayor el número de consultas están siendo procesados, el más poderoso del sistema requerido.

Almacenamiento de bases de datos relacionales y la tecnolo-gía de gestión es adecuada para aplicaciones de minería de datos

de muchos menos de 50 giga-bytes. Sin embargo, esta in-

fraestructura debe ser significa-tivamente mejorado para sopor-tar grandes aplicaciones. Algu-nos fabricantes han añadido

capacidades de indexación am-plia para mejorar el rendimiento de la consulta. Otros usan nue-vas arquitecturas de hardware, tales como los procesadores en paralelo masivo (MPP) para

lograr el orden de magnitud de las mejoras en el tiempo de con-sulta. Por ejemplo, los sistemas de MPP de cientos de NCR en-

lace de alta velocidad de los procesadores Pentium para al-

canzar los niveles de rendimien-to superiores a las de los más

grandes superordenadores.

Dataminig, esta íntimamente ligado a la tecnología, que utiliza como he-rramienta primordial para el alma-cenamiento de datos.

La minería de datos, genera venta-jas competitivas a las empresas siempre y cuando se administre y maneje de manera correcta la in-formación que se posee.

La creación de alianzas entre enti-dades es uno de los puntos fuertes que datamining pretende seguir en las empresas

Conclusiones