Saberqué esCloudera.Concretamente laversión deAzure
Comodesplegarloen lanube
Módulos principales
Alfinaldelasesión serás capaz de:
● Cloudera Manager● ResourceManager● NameNode● Standby NameNode● JournalNodes● ZooKeeper● Oozie● ImpalaCatalog Server● ImpalaState Store● JobHistory Server
● DataNode● NodeManager● RegionServer● ImpalaDaemon
• Archivos muy grandes• Accesos secuenciales• Máquinas ‘commodity’• Muchos ficheros grandes
• Acceso rápido a datos.• Baja latencia.• Muchos ficheros pequeños• Múltiples escrituras
simultáneas• Modificaciones arbitrárias
de los datos
• hdfs dfs -copyFromLocal <localsrc>URI• hdfs dfs -copyToLocal [-ignorecrc][-crc]URI<localdst>• hdfs dfs -put <localsrc>URI• hdfs dfs -get[-ignorecrc][-crc]URI<localdst>• hdfs dfs -getmerge <src><localdst>[addnl]• hdfs dfs -moveFromLocal <localsrc><dst>• hdfs dfs -ls [-R]<args>• hdfs dfs -cat URI[URI...]• hdfs dfs -text <src>
• hdfs dfs -tail [-f]URI• hdfs dfs -mkdir <paths>• hdfs dfs -cp URI[URI...]<dest>• hdfs dfs -mvURI[URI...]<dest>• hdfs dfs -rm [-skipTrash][-R]URI[URI...]• hdfs dfs -expunge• hdfs dfs -touchz URI[URI...]• hdfs dfs -test-[ezd]URI• hdfs dfs -count [-q]<paths>