Archivi tag: Spark

Hadoop

A brief history of “Big Data”

Il mondo dei “Big Data” è qualcosa di talmente vasto e complesso da rendere la sua stessa comprensione una “mission impossible” peri nuovi arrivati.

Da dove nasce Hadoop? perché era importante creare HBase? perché MapReduce sta lasciando il posto a Spark? da dove nascono i vari Pig, Hive, Impala, Oozie, Sqoop, Zookeeper, YARN?

Questa presentazione vi guiderà attraverso la storia di questo nuovo fenomeno…

Spark

Spark-HBase Connector

Torno a scrivere su Nerdammer, dopo una lunga assenza, per parlare delle nuove tendenze del mondo Big Data. L’ultimo articolo su Hadoop pubblicato su questo blog risale forse a un anno fa, quando la parola Big Data cominciava a essere più presente su Twitter, e quel famoso framework (MapReduce) veniva proposto come soluzione universale per l’elaborazione di quantità enormi di dati, con potenzialità teoricamente infinite.

Continua a leggere