Disco MapReduce

Disco MapReduce

Disco je lahek, odprtokodni okvir za porazdeljeno računalništvo, ki temelji na paradigmi MapReduce in je zapisan v Python-u.
Disco je izvedba mapreduce za porazdeljeno računalništvo.Disco podpira vzporedne izračune v velikih zbirkah podatkov, shranjenih v nezanesljivih skupinah računalnikov, kot v prvotnem okviru, ki ga je ustvaril Google.Zaradi tega je odlično orodje za analizo in obdelavo velikih naborov podatkov, ne da bi se morali bati s težavami, povezanimi z distribucijo, kot so komunikacijski protokoli, uravnavanje obremenitve, zaklepanje, načrtovanje opravil in odstopanje napak, ki jih ureja Disco.
disco-mapreduce

Spletna stran:

Lastnosti

Kategorije

Alternativa Disco MapReduceu za vse platforme s katero koli licenco

Apache Hadoop

Apache Hadoop

Apache Hadoop je odprtokodni programski okvir, ki podpira podatkovno intenzivne distribuirane aplikacije, licencirane po licenci Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ je hiter in splošen motor za obsežno obdelavo podatkov.SpeedRun programi do 100 krat hitreje kot Hadoop MapReduce v pomnilniku ali 10x hitrejši na disku.
Amazon Kinesis

Amazon Kinesis

Storitve Amazon Kinesis olajšajo delo s pretakanjem podatkov v realnem času v AWS oblaku.
  • Plačljiva
  • Web
dispy

dispy

dispy je ogrodje Python za vzporedno izvajanje računov, tako da jih porazdeli po več procesorjev na enem stroju (SMP), med številne stroje v grozdu ali ...