9
Apache Spark ™ je hiter in splošen motor za obsežno obdelavo podatkov.Hitro zaženite programe do 100x hitreje kot Hadoop MapReduce v pomnilniku ali 10x hitreje na disku.Spark ima napredni izvedbeni mehanizem DAG, ki podpira ciklični pretok podatkov in računalništvo v pomnilniku.
apache-spark
Spletna stran:
http://spark.apache.orgKategorije
Alternativa Apache Sparku za Linux
18
Apache Hadoop
Apache Hadoop je odprtokodni programski okvir, ki podpira podatkovno intenzivne distribuirane aplikacije, licencirane po licenci Apache v2.
1
Disco MapReduce
Disco je lahek, odprtokodni okvir za porazdeljeno računalništvo, ki temelji na paradigmi MapReduce in je zapisan v Python-u.