Upload
wellingtonmartins
View
214
Download
0
Embed Size (px)
Citation preview
8/18/2019 TCC - Wellington Martins
1/11
1
FACULDADE ANHANGUERA DE BAURU
WELLINGTON MARTINS ALVES
DESENVOLVIMENTO E ANÁLISE DE WEB CRAWLING - SELENIUME HTMLUNIT EM TAREFAS REPETITIVAS
BAURU
8/18/2019 TCC - Wellington Martins
2/11
2
2015
8/18/2019 TCC - Wellington Martins
3/11
3
WELLINGTON MARTINS ALVES
PROJETO DE ANÁLISE E DESENVOLVIMENTO
DESENVOLVIMENTO E ANÁLISE DE WEB CRAWLING - SELENIUME HTMLUNIT EM TAREFAS REPETITIVAS
Projeto de Análise e Desenvolvimentoapresentado ao Curso de Ciência daComputação da Instituição Anhanguera Bauru.
8/18/2019 TCC - Wellington Martins
4/11
4
BAURU
2015
8/18/2019 TCC - Wellington Martins
5/11
5
SUMÁRIO
SUMÁRIO 3
1. INTRODUÇO 3
1.1 PROBLEMA 3
2. OBJETIVOS !
2.1 OBJETIVO GERAL OU PRIMÁRIO !
2.2 OBJETIVOS ESPEC"FICOS OU SECUNDÁRIOS !
3. JUSTIFICATIVA 5
!. METODOLOGIA 5
5. RESULTADOS ESPERADOS #
#. REFER$NCIAS #
1. INTRODUÇO
Vivemos em um mundo onde cada ve o tempo ! mais precioso" o conceito
de web crawling consiste em resgatar in#ormaç$es automaticamente de web sites.
% conceito proposto ! e&empli#icar as vantagens e desvantagens das duas
principais tecnologias em web crawling para 'ava" Selenium e HTMLUNIT " sendo
em teste #uncionais.
8/18/2019 TCC - Wellington Martins
6/11
6
Como já dito utiliaremos como (ase a linguagem 'ava" con#orme ran)ing
disponi(iliado pelo site Redmonk 'ava ! a segunda linguagem mais utiliada no
mundo" somente atrás do 'ava*cript" desta #orma iremos automatiar tare#as
repetitivas.
+sta automatiação visa su(stituir um #uncionário por um ro(, desenvolvido com
as tecnologias propostas.
-.-PROBLEMA
Como cada ve mais o mundo e o mercado demandam agilidade e e#iciência" o
web crawling supri uma grande uantidade dessa necessidade" traendo resultados
com precisão e assertividade.
/oje possu0mos um am(iente de tra(alho com várias pessoas e&ecutando
tare#as repetitivas" sejam elas" consultas em web sites" preenchimento de
#ormulários" no modelo atual possu0mos pro(lemas com atraso" #alta de um
#uncionário" ociosidade" podemos elencar at! má vontade por parte de um
#uncionário descontente" sem contar o #ator humano ue podemos ter #alhas em
alguma parte da e&ecução da tare#a.
/oje os custos para manter um #uncionário com impostos" salário entre outros
gastos ! alt0ssimo e tam(!m para demitir este #uncionário descontente e&istirá um
gasto ainda maior com rescisão" multa de 123 4uarenta por cento5 so(re o FGTS
entre outros encargos decorrentes do desligamento de ualuer #uncionário.
2. OBJETIVOS
8/18/2019 TCC - Wellington Martins
7/11
7
6.- OBJETIVO GERAL OU PRIMÁRIO
+&por a e#icácia do web crawling em su(stituir #uncionários ue e&ecutam tare#as
repetitivas" visando assertividade" per#ormance e di#iculdade de implementação de
cada tecnologia.
6.6 OBJETIVOS ESPEC"FICOS OU SECUNDÁRIOS
• Desenvolvimento dos web crawlings para ue e&ecutem
consultas por nome no site do 7' de *ão Paulo" usando o
Html Unit e o Selenium.
• 7estes de e&ecução dos crawlings, para ue todas as
e&ceç$es ue possam interromper a e&ecução de nosso ro(,
sejam devidamente tratadas" dei&ando a e&ecução totalmente
automática.
• +&ecução dos ro(,s" com par8metros conhecidos ue
resultem uma massa de resultados signi#icativa.
• Veri#icar o tempo m!dio da e&ecução dos ro(,s em 9
e&ecuç$es em cada tecnologia" sendo tam(!m 9 e&ecuç$es
manuais #eitas por um voluntário humano.
• :erar dados" grá#icos e outras #erramentas para e&empli#icar
os resultados o(tidos.
8/18/2019 TCC - Wellington Martins
8/11
8
3. JUSTIFICATIVA
% mercado (usca hoje #aer mais com menos" um conceito simples ue
mostra o uão e#iciente e essencial ! o conceito de automação de atividades
repetitivas" su(stituir euipes com ;2 pessoas por dois ou três ro(,s ue iram
e&ecutar a mesma atividade ue essas pessoas" por!m com e&trema assertividade
e produtividade inigualável" visto ue o ro(, irá tra(alhar 61 horas por dia < dias por
semana ocasionando uma redução de custos e&pressiva su(stituindo ;2
#uncionários.
*em contar com a possi(lidade de investimento em outras áreas da empresa"
visto ue e&istirá uma redução de gastos e&pressiva" visto ue sem os ;2
#uncionários serão menos ;2 estaç$es de tra(alho 4mesa" cadeira" monitor"
computador" mouse" teclado" ...5 isto e&empli#ica o tamanho do corte de gastos ue
pode ser alcançado com a automatiação das atividades repetitivas.
A(rindo um leue gigantesco de oportunidade para ue o dinheiro
economiado nestes setores" sejam investidos em áreas cujo o aproveitamento"necessidade e retorno serão mais rentáveis e essenciais.
Com a utiliação de tecnologias predominantes no mercado" teremos m0nimos
pro(lemas uanto a parada na e&ecução dos web crawling " teremos somente ue
para a e&ecução caso algum #ator e&terno ocorra 4e&. ueda de energia" ueda da
cone&ão com internet" alteração no sistema ou web site no ual ! #eita a automação5
Caso e&ista um pro(lema uanto alteraç$es no sistema ou web site, em ue#ora #eita a automação con#orme e&emplo citado acima" a manutenção ! simples e
rápida" sendo aplicada em um c=digo e replicado para os demais.
8/18/2019 TCC - Wellington Martins
9/11
9
!. FUNDAMENTAÇO TE%RICA
A(ai&o segue um e&emplo dos (en#ic0os uanto a automatiação de
processos segundo Sana! Mo"a#atra autor do livro $usiness %rocess &utomation.
7he (ene#its o# (usiness process automation are signi#icant. Consolidatingmultiple (usiness processes through automation provides man> (ene#its anddelivers a strong return on the investment that the organiation encounters.?educed costs associated @ith additional applications and maintenance#ees. ?educed I7 sta## time supporting" maintaining and providing training on
numerous applications. *impli#> client interactions through various @e((ased services. +nhance data sharing" colla(oration and s>nerg> (et@een(usiness groups. :enerate metrics and reports on productivit>" trends" andper#ormance to manage @or)#lo@ and resources e##ectivel> and optimieteam e##ectiveness. 4S&N'&( M)H&%&TR&" 622" 65.
Como e&posto na citação acima temos como principal ponto" a redução de
gastos com treinamento e um aumento na produtividade e visi(ilidade.
%ther (ene#its o# process automation includes repeata(ilit>" automaticremediation" accurac>" #le&i(ilit>" audit a(ilit>" scripting" o## shoring" visi(ilit>"
(readth o# solution" time to mar)et" support availa(ilit> reuirements"scala(ilit>" capacit> planning" continuous upgrades" monitoring o# #ree space"alerting" reporting accurac> and proactive trou(leshooting. 4S&N'&( M)H&%&TR&" 622" 65.
7emos como outros (ene#0cios" assertividade" #le&i(ilidade" visi(ilidade de
soluç$es" tempo de mercado" escala(ilidade" capacidade de planejamento"
atualiaç$es continuas" monitoramento do espaço livre" alertas" reporta pro(lemas
com pro atividade e assertividade.
5. METODOLOGIA
*erá realiado o desenvolvimento dos c=digos" e&ecução dos sistemas"
análise dos resultados e ela(oração de um relat=rio com e&pondo os pontos
positivos e negativos de cada tecnologia.
8/18/2019 TCC - Wellington Martins
10/11
10
#. RESULTADOS ESPERADOS
+speramos ue os resultados uanto as tecnologias de web crawling, se
mostrem in#initamente superiores uanto a interação humana.
+&pondo de #orma clara e impactante os (ene#0cios na automação de
atividades repetitivas.
&. CRONOGRAMA DE DESENVOLVIMENTO
'()*+, 1 Calendário de e&ecução das atividades do Projeto e do7ra(alho de Conclusão de Curso
ATIVIDADE2015 201#
A G O
S E T
O U T
N O V
D E -
J A N
F E V
M A R
A B R
M
A I
J U N
+scolha do tema E E
?evisão (i(liográ#ica E E E
+la(oração do projeto E E E E
+ntrega do projeto E
+la(oração da monogra#ia 47CC5 E E E
?ealiação dos cap0tulos E E E E
?ealiação da conclusão e introdução E E
Correção de te&tos E E E E E E E E E
+la(oração de elementos pr! e p=ste&tuais
E E
+ntrega da monogra#ia E
8/18/2019 TCC - Wellington Martins
11/11
11
De#esa da monogra#ia E
. REFER$NCIAS
*%:?ADF. ?+DG%H. THE REDMON/ PROGRAMINGLANGUAGE RAN/INGS JUNE 2015. Dispon0vel emJKhttpJLLredmon).comLsograd>L62-9L2