Disco MapReduce

Disco MapReduce

Disco je lahek, odprtokodni okvir za porazdeljeno računalništvo, ki temelji na paradigmi MapReduce in je zapisan v Python-u.
Disco je izvedba mapreduce za porazdeljeno računalništvo.Disco podpira vzporedne izračune v velikih zbirkah podatkov, shranjenih v nezanesljivih skupinah računalnikov, kot v prvotnem okviru, ki ga je ustvaril Google.Zaradi tega je odlično orodje za analizo in obdelavo velikih naborov podatkov, ne da bi se morali bati s težavami, povezanimi z distribucijo, kot so komunikacijski protokoli, uravnavanje obremenitve, zaklepanje, načrtovanje opravil in odstopanje napak, ki jih ureja Disco.

Spletna stran:

Lastnosti

Kategorije

Alternativa Disco MapReduceu za Mac

Apache Hadoop

Apache Hadoop

Apache Hadoop je odprtokodni programski okvir, ki podpira podatkovno intenzivne distribuirane aplikacije, licencirane po licenci Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ je hiter in splošen motor za obsežno obdelavo podatkov.SpeedRun programi do 100 krat hitreje kot Hadoop MapReduce v pomnilniku ali 10x hitrejši na disku.
dispy

dispy

dispy je ogrodje Python za vzporedno izvajanje računov, tako da jih porazdeli po več procesorjev na enem stroju (SMP), med številne stroje v grozdu ali ...