Archivi tag: Hadoop

Hadoop

A brief history of “Big Data”

Il mondo dei “Big Data” è qualcosa di talmente vasto e complesso da rendere la sua stessa comprensione una “mission impossible” peri nuovi arrivati.

Da dove nasce Hadoop? perché era importante creare HBase? perché MapReduce sta lasciando il posto a Spark? da dove nascono i vari Pig, Hive, Impala, Oozie, Sqoop, Zookeeper, YARN?

Questa presentazione vi guiderà attraverso la storia di questo nuovo fenomeno…

Spark

Spark-HBase Connector

Torno a scrivere su Nerdammer, dopo una lunga assenza, per parlare delle nuove tendenze del mondo Big Data. L’ultimo articolo su Hadoop pubblicato su questo blog risale forse a un anno fa, quando la parola Big Data cominciava a essere più presente su Twitter, e quel famoso framework (MapReduce) veniva proposto come soluzione universale per l’elaborazione di quantità enormi di dati, con potenzialità teoricamente infinite.

Continua a leggere

tunnel-data

Hadoop e “Big Data”

Si dice che il 2014 sarà l’anno del Big Data… qualunque cosa questo significhi…

HadoopBig Data è una parola che va molto di moda, anche se ognuno di noi ha un’idea diversa sul suo significato. Analizzare “big data” significa estrarre conoscenza da grandi moli di dati, come possono essere i dati generati dal crawling di una gran quantità di siti internet, dai post nei social network di un gruppo cospicuo di persone, dalle variazioni di valore delle azioni in borsa nel corso degli anni per un numero consistente di titoli.

Il problema nasce proprio da qui… quanto grande ? che significa cospicuo ? 1 terabyte può essere considerato “big data” ? e 10 terabyte ?

Continua a leggere