Lean Six Sigma Feat Big Data Mining

Embed Size (px)

Citation preview

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    1/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    W

    Lean Six Sigma encontra Big Data Mining

    Introduoo

    Nos anos recentes o Lean Seis Sigma se consolidou, amplamente, como a principal metodologiapara melhoria do desempenho nas Indstrias , tendo, ainda, rompido a barreira do segmento de ser-vios, onde os seus benefcios j se encontram amplamente difundidos.

    Sua abordagem orientada a dados para resoluo de problemas, suportada por ferramentas esta-tsticas especialistas, tais como MINITAB, SigmaXL, entre outras, que viabilizam transformar solu-es estatsticas em solues pticas.

    Executar, com xito, um projeto Lean Six Sigma requer o tratamento dos dados, ao longo do ciclode vida do projeto (DEMAIC) com vistas a atingir os seguintes objetivos em cada faze:

    Extrair, transformar e analisar um volume de dados; Explorar e descobrir as sadas criticas para a qualidade (CTQ) Identificar os Pprocessos crticos para os CTQ Encontrar algumas poucas variveis de entrada vitais para o desempenho da sada crtica para a

    qualidade. Encontrar o desempenho timo dos fatores crticos (as poucas variveis vitais) Implementar mudanas nos processos Controlar os fatores e monitorar as sadas crticas CTQ

    Em outras palavras, o Lean Six Sigma uma abordagem sistemtica, orientada por dados para solu-o de problemas, que dividida em dois processos: definir, medir, analisar, melhorar, controlar(DMAIC) e definir, medir, analisar, projetar, verificar (DMADV) .

    O DMAIC um sistema de melhoria de processos existentes que procura por melhorias especficas,atravs de projetos de interveno. J o DMADV, tambm chamado de DFSS Design for Six Sigma um sistema de melhoria utilizado para desenvolver novos produtos, processos ou nveis de qualidadeSix Sigma. As principais etapas de um projeto Lean Six Sigma DEMAIC so:

    Fase Descries Principais etapasDefinir Definir os objetivos do

    projeto e o cliente/

    requisitos de negcios

    - Define os requisitosdos clientes eestabelecer.- Definir as metase os objetivos do projeto.- Definir o processode mapeamento do fluxo de neg-

    cios.

    Medir Medir o processo paradeterminar o desempe-nho

    - Selecione acaracterstica de sada (as CTQs).- Avaliar as especificaes de desempenho.- Validar os sistemas de medio.- Estabelecer acapacidade de processo (para o

    CTQs).

    Analisar Analisar e determinarospoucos vitais para amelhoria do processo

    - Definiros objetivos de desempenho.- A telao potencial CTPs.- Analisaras fontes de variabilidade.

    Melhorar Melhorar o processo,eliminandodesperdcioe variao

    - Melhor ideia.- Analisar Projeto modelo.- Validar o modelo.-

    Identificar as condies ideais

    .

    Controle Controle omelhordesempenho do pro-cesso

    - Determinar a capacidade de processo (CTPs).- Implementar os controles de processo.- O documentoo que voc aprendeu.Wh

    itePaper

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    2/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    Projetos Lean Six Sigma que tratam de solues em plantas industriais, com monitoramentos em tem-

    po real ou aplicaes de monitoramentos de equipamentos (cada vez mais comuns) em tempo real,como, por exemplo, monitoramento de turbinas de avio em vo, prospeco de petrleo, etc, e mes-mo algumas aplicaes transacionais, como contact centers, transaes financeiras por EDI, come-am a pegar carona na exploso da tecnologia do BIG DATA para soluo dessas novas deman-

    das que tem se apresentado, e novos desafios paraos profissionais envolvidos

    De fato, as solues das ferramentas estatsticas,utilizadas hoje, tem dificuldades em lidar com umgrande volume de dados analticos e no suportamdiversas funcionalidades, tais como redes neurais,rvore de deciso, etc.

    Nesse sentido, o Lean Six Sigma busca uma formade se apropriar desse avano tecnolgico, incorpo-rando as ferramentas de Data Mining para tratarbancos de dados muito grandes, mesmo aqueles queno possuem todos os atributos definidos no conceitode BIG DATA, representado pelos trs Vs : volu-me, variedade e velocidade

    Embora as razes da minerao de dados remontem dcada de 1980, o campo de estudo ainda est emsua infncia. Ele ainda est sendo definido, e refina-do. Em 1999, contudo, algumas grandes empresas,

    incluindo a fabricante automobilstica (sempre eles!) Daimler-Benz , o provedor de seguros OHRA, a fabri-cante de software e hardware NCR Corp. e a fabricante de software SPSS, Inc. comearam a a trabalharem conjunto para formalizar e padronizar uma abordagem para a minerao de dados.

    O resultado do trabalho foi o lanamento do CRISP-DM, CRoss-Industry Standard Process for DataMining. Um modelo para tratamento de grandes volumes de dados, organizados em um Framework divi-

    dido em 6 etapas:

    1.CRISP-DM 1: Compreenso do Negcio2.CRISP-DM 2: Compreenso dos Dados3.CRISP-DM 3: Preparao dos Dados4.CRISP-DM 4: Modelagem5.CRISP-DM 5: Avaliao6.CRISP-DM 6: Implementao

    importante, contudo, compreender que a utiliza-o conjunta das metodologias Lean Six Sigma eo BIG DATA MINING (termo que prefiro usar aoinvs de simplesmente DATA MINING ou BIG DA-TA, pois um no vive sem o outro) no esgotam osseus respectivos campos de atuao, que faz comque ambas trilhem seus caminhos de sucesso namelhoria do desempenho das organizaes.

    A compreenso das fases da metodologia de mi-nerao de dados, nos termos em que foi consoli-dada no CRISP-DM fundamental para entendercomo as duas metodologias podem trabalhar jun-tas para potencializar os resultados de melhoria,

    em um campo especifico de suas aplicaes.

    Dessa forma, antes de entender de que maneira cada fase do CRISP DM se adequa a cada fase doDEMAIC, preciso entender o que trata cada fase do CRISP DM:W

    hitePaper

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    3/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    1.CRISP-DM 1Compreenso do NegcioO primeiro passo no CRISP-DM, a compreenso do negcio, ou seja, compreenso organiza-cional, uma vez que no so todos os tipos de organizao que podem usar a minerao dedados para responder a perguntas e resolver problemas.

    Esta etapa fundamental para um resultado bem-sucedido, mas muitas vezes ignorada, namedida em que as pessoas tentam, indistintamente mergulhar na minerao de dados. Isso natural, estamos muitas vezes ansiosos para gerar algum resultado interessante; queremos en-contrar respostas.

    Na verdade, voc pode coletar dados 7 por 24, mas se voc no souber o que quer saber, sevoc no definiu quaisquer questes a responder, ento, os esforos da sua minerao de da-dos no traro resultados.

    2. CRISP-DM 2 Compreenso dos DadosComo a compreenso organizacional, o entendimento dos dados uma atividade preparatriae, por vezes, o seu valor fica disperso entre as pessoas. Anos atrs, quando os trabalhadoresno tinham o seu prprio computador na sua mesa, os dados eram centralizados. Se vocnecessitava de informaes de uma empresa, voc poderia solicitar um relatrio ou fazeruma consulta a informaes de um banco de dados central (ou buscava em um arquivo fixo).O advento do computador pessoal, estao de trabalho, laptop, tablet e smartphone, promo-veu a morte da centralizao dos dados. Como as unidades de disco rgido tornaram-semaiores e mais baratas, e com um software como o Microsoft Excel, os dados foram se tor-nando cada vez mais acessveis e mais fceis de serem usados; os dados comearam a sedispersar por toda a empresa.

    Isto criou um problema de dadosmulti-facetados. Por outro lado, acentralizao dos dados, simples-mente, no seria suficiente. Huma abundncia de perguntasque surgem quando os dados deuma organizao so reunidosnum servidor. Para onde foram osdados? Quem os coletou? Houveum mtodo padro de coleta? Oque significam as diferentes linhase colunas? H acrnimos ou abre-viaturas que so desconhecidasou pouco claras? preciso fazeralgum trabalhos de investigaona fase de preparao dos dados. Muitas vezes, preciso consultar especialistas no assuntode diversos departamentos para desvendar, como os dados foram coletados, e a forma comoelas foram codificados e armazenados. muito importante que se verifique a exatido e aconfiabilidade dos dados.

    3. CRISP-DM 3 Preparao dos DadosOs dados esto em muitas formas e formatos. Alguns dados so numricos, alguns esto em

    pargrafos de texto, e outros esto em forma de desenho, tais como grficos, figuras e ma-pas. Alguns dados so anedticos ou narrativas, tais como observaes sobre uma pesquisade satisfao do cliente ou a transcrio de um depoimento da testemunha. Os dados queno esto em linhas ou colunas de nmeros no so descartados pois podem ser amparada

    pelas ferramentas de data mining.A Preparao dos dados envolve uma srie de atividades. Elas podem incluir juntar dois oumais conjuntos de dados, reduzir s variveis que so de interesse em um determinado proje-to, depurao e minerao de dados, limpeza de anomalias, tal como falta de dados, ou re-W

    hitePaper

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    4/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    formatao de dados para fins de consistncia, etc. Os resultados de um exerccio de minera-

    o de dados produzem tanto melhores resultados quanto mais coerentes eles so.

    4. CRISP-DM 4: ModelagemUm modelo, na minerao de dados, uma representao computadorizada das observaesdo mundo real. Os modelos so aplicao de algoritmos para procurar, identificar, e exibirquaisquer padres ou mensagens em seus dados. Existem dois tipos bsicos ou de tipos demodelos de minerao de dados: aqueles que classificam e aqueles que predizem.

    Como voc pode ver, existe uma certa sobreposio entre os diferentes tipos de modelos deminerao de dados. Por exemplo, rvore de deciso um modelo preditivo utilizado para de-terminar quais atributos de um determinado conjunto de dados so os mais fortes indicadoresde um determinado resultado. O resultado geralmente expresso como a probabilidade de queuma observao vai cair em uma determinada categoria. Assim, rvores de deciso so de

    natureza preditiva, mas tambm podem ajudar a classifica -los. Os modelos ainda podem sersimples ou complexos. Eles podem conter apenas um nico processo ou fluxo, ou podem con-ter sub-processos.

    5. CRISP-DM 5: AvaliaoTodas as anlises de dados tm o potencial de fornecerem falsos positivos. Mesmo um mode-lo que no acuse falsos positivos podem no encontrar quaisquer padres interessante. Issopode acontecer em face de o modelo no estar bem configurado para encontrar padres, pe-lo uso de tcnicas erradas, ou simplesmente pode no haver nada de interessante nos da-dos.

    A fase de Avaliao existe especificamente para determinar o quo importante o modelo, e

    o que se pode fazer com ele. Ela pode ser realizada usando-

    se um nmero de tcnicas, tantode natureza matemtica quanto lgica. Para alguns modelos, o poder ou a fora indicados portestes estatstica tambm sero considerados. Alm destas medidas no entanto, o modelo deavaliao dever tambm incluir um aspecto humano. Como os indivduos adquirem experin-cia e especializao em sua rea, eles tero conhecimento operacional que no podem sermensurveis no sentido matemtico, mas que so indispensvel para a determinao do valorde um modelo de minerao de dados .

    6. CRISP-DM 6: ImplementaoEsta a fase de implementao. As atividades nessa fase incluem a configurao para auto-matizao do modelo, a integrao com os sistemas de informao operacional ou sistemas

    de informao gerencial, alimentando novos modelo de aprendizagem, monitorao e medi-o.

    Metodologia SIx Sigma usando Minerao de Dados

    As tcnicas de consolidao e extrao de dados, viabilizadas pelos softwares de minerao dedados e utilizadas como ferramentas do Lean Six Sigma, suportam potentes funcionalidades e ma-nuseio de dados analticos que as ferramentas estatsticas no possuem.

    importante, nesse ponto, considerar que as ferraments estatsticas no possuem esses atributos,no por serem inferiores s ferramentas de minerao de dados, mas porque seu posicionamentode utilidade no necessariamente o mesmo que das ferramentas de minerao, de maneira que

    no so substitudas por elas em algumas fases do projeto.

    Em geral, as vantagens das ferramentas de minerao em comparao s ferramentas estatsticas doLean Six sigma so:W

    hitePaper

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    5/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    Ampliam o escopo de anlise da quantidade de dados;

    Maior independncia para hipteses estatsticas (embora perca em rigor); Suplemento de ferramenta de anlise

    Fcil de desenvolver um modelo de predio no linear;

    Integrao da manipulao de dados pela anlise de um nico diagrama de fluxo;

    Guardar e partilhar anlise fluxo dos dados;

    Excelente interface de usurio, como diagrama de fluxo, etc.

    Como diagrama de fluxo, etc.

    Diante de tudo que foi dito, possvel integrar as metodologias, em suas diversas fases, conforme oquadro sumrio apresentado abaixo:

    DEMAIC

    CRISP DM

    BenefcioFase Descrio Fase Atividade

    Definir

    Definir os objetivos do

    projeto e o cliente/

    requisitos de negcios

    CRSIP DM-1

    Compreenso do Neg-

    cio para responder as

    perguntas e resolver

    problemas

    Identificar a viabilidade

    de utilizao de Data

    Mining

    Medir

    Medir o processo para

    determinar o desempe-

    nho

    CRISP DM-2CRISP DM-3

    Manipulao, organiza-

    o, seleo e limpeza

    dos dados

    Manipulao eficiente

    dos dados para melho-

    ria de sua qualidade

    Analisar

    Anlise exploratria

    CRISP DM-4-

    Mtodo de visualizaoutilizando anlises explo-

    ratrias interativas

    Fcil de explorar gran-

    de nmero de variveise anlises grficas

    interativas

    Algumas variveis

    Vitais

    Descubrir as poucas

    variveis vitais Vital

    poucos usando, rvore

    de deciso, regresso etc.

    Solues robustas para

    hipteses estatsticas,

    de fcil implementa-

    o, usando mtodos

    objetivos.

    Modelagem

    Utilizao

    de regresso,rvore de

    deciso, redes neurais

    modelo complexos erelaes no-lineares

    Fcil de desenvolver,

    mais precisos e mode-

    los generalistas

    Melhorar Otimizao CRISP DM-5

    Encontrar os limites de

    capacidade dos processos

    atravs dos algoritmo

    IGN (Interactive Group

    Node)

    Os limites timos da

    capacidade so especi-

    ficados pelo algortimo

    do da minerao de

    dados.

    Simulao

    Especificao da capa-

    cidade ideal do proces-

    so sem experimento

    Controlar

    Controlar odesempe-

    nho do processo melho-

    rado

    CRISP DM-6

    Implementao do mo-delo da Minerao de

    dados para o processo

    otimizado

    Automao e integra-o do monitoramento

    das sadas e controle

    das variveisWhitePaper

  • 7/29/2019 Lean Six Sigma Feat Big Data Mining

    6/6

    www.portfoliosigma.net br.linkedin.com/in/pbandeira10/

    natural que essa abordagem consolidada das metodologias encontre diferentes resistncias, dos

    dois lados do balco. possvel que , at mesmo, se enfrente reao contrria de grupos que podemsentir que os seus postos de trabalho esto ameaados por esta nova ferramenta. Profissionais jexperientes e maduros em lidar, com sucesso, com projetos Lean Six Sigma, passam a ser confronta-dos com a necessidade de novos conhecimentos que no dominam.

    Por outro lado, a fora e o impacto da comunicao de grandes players da indstria do BIG DATA,tem o poder de construir uma percepo, nos executivos, Chairmen e tomadores de deciso, de que agesto do BIG DATA traz solues suficientes para uma gesto eficiente das organizaes.

    Contudo, entendemos que a construo dos mapas de fluxo de processo, as solues rpidas e f-ceis do lean, a validao das variveis pelo RUMBA, a anlise do modo de falha, entre outras tecnicasutilizadas nos projetos Lean Six Sigma, ainda so de fundamental importncia para um esforo demelhoria bem sucedido.

    Portfolio Sigma

    umconjuntode iniciativas quetem comoMisso promover umambiente corporativoque sejacapazdereduzir asbarreirasdeen- tradaparaaimplementaoerealizaodamelhoriadedesem-penhodonegcio, baseadonametodlologiaLean SixSigma, quese desdobramapartirdaconscien-tizaodeexecutivos, formaodepessoal, institucionalizaaodeRoteirospara levantamento,definio, escolha, categorizao, hierarquizao eimplementaao dosProjetosdeMelhoria

    Paulo Bandeira

    Profissional com slida e diferenciada experincia em empresa de porte do segmento de servios deTecnologia, e Distribuio de Produtos, responsabilizando-se pela gesto dosgcios, planejamento,

    desenvolvimento e implementao de aes estratgicas. Cumpriu papeis como CHAMPEON eBLACK BELT, como facilitador de conhecimento. Desenvolveu a metodologia PORTFOLIO SIGMA,com base nos conceitos e tecnicas LEAN e SIX SIGMA, para implantao de um modelo completo doLEAN SIX SIGMA.

    Ocupou diversos cargos de direo nas reas Finaceira, de Planejamento, Estratgia e Gesto deNegcios.

    Formao tcnica em ELETRNICA, acadmica em ENGENHARIA CIVIL pela UFRJ, com Ps Gra-duao em Finanas pela PUC e MBA pela COPPEAD - UFRJ;Formao, ainda em COACHING pela SOCIEDADE BRASILEIRA DE COACHING. Auto didata emvrias reas do conhecimento de GESTO DE NEGCIOS.

    WhitePaper