apache-hadoop

Star

Here are 73 public repositories matching this topic...

gangodu / cloud

Star

AWS Cloudera Hadoop setup with H2O, Spark, MR

aws aws-lambda aws-s3 bigdata java-8 aws-ec2 mapreduce big-data-analytics maven-pom apache-hadoop

Updated Apr 24, 2017
Java

Trisha11r / covid_data_analysis_mapreduce

Star

COVID-19 data analysis with MapReduce

database-management data-analysis java-8 hadoop-mapreduce hadoop-hdfs apache-hadoop covid-2019

Updated Jun 18, 2020
Java

sawadogosalif / Big-Data-Technologies

Star

Big Data Technologies can be defined as software tools for analyzing, processing, and extracting data from an extremely complex and large data set with which traditional management tools can never deal

apache-spark apache-kafka apache-hive apache-hadoop apache-hbase pysark

Updated Apr 30, 2022
Python

smohammadhejazi / mapreduce-on-twitter-dataset

Star

Applying MapReduce in Java on a Twitter dataset using Apache Hadoop

mapreduce-java apache-hadoop

Updated Feb 6, 2022
Java

TrentBrunson / TrentBrunson.github.io

Star

My portfolio | under development

python nlp flask aws machine-learning django big-data spark yarn deep-learning analytics tensorflow pytorch pyspark webscraping apache-hadoop google-colab

Updated Mar 7, 2023
HTML

shuuji3 / spark-ceph-connector

Star

🌟Spark Ceph Connector: Implementation of Hadoop Filesystem API for Ceph

spark apache-spark hadoop ceph apache-hadoop

Updated Aug 25, 2020
Scala

kowaalczyk / spark-minimal-algorithms

Star

An python implementation of Minimal Mapreduce Algorithms for Apache Spark

python spark apache-spark algorithms python3 pyspark hadoop-mapreduce apache-hadoop minimal-algorithms

Updated Jun 22, 2020
Python

unobatbayar / big-data-processing

Star

Learning Apache Hadoop for Big Data. Moreover, exploring Map Reduce, Apache Spark RDD, Distributed Processing and Stream Processing

big-data map-reduce apache-hadoop

Updated May 27, 2020
Python

luckyp71 / hadoop-hbase-phoenix-zookeeper-integration

Star

Hadoop, HBase, Phoenix, and Zookeeper Integration

phoenix big-data hadoop bigdata hbase zookeeper apache-phoenix apache-zookeeper apache-hadoop

Updated May 13, 2018
Shell

Umer86 / Dice-Big-Data-Certification

Star

This repository contains all the material related to this big data certification.

yarn hive impala pyspark hdfs mapreduce databricks sqoop apache-hadoop

Updated Nov 7, 2022

berksudan / Analysis-on-Big-Data-with-Hadoop

Star

Implementation of Statistical Methods via Hadoop Map-Reduce Library.

hadoop bigdata mapreduce hadoop-mapreduce mapreduce-java apache-hadoop

Updated Dec 9, 2019
Java

Bahaabrougui / Big-Data-Smart-Cars-Pipeline-ServerSide

Star

Big Data pipeline for real-time sensor fusion and predective analysis.

java couchdb docker apache-spark yarn cloudera hdfs apache-kafka apache-hadoop

Updated Jul 1, 2022
Java

rachmanz / WSL2DW

Star

Intalasi WSL2 untuk Praktikum ABD

derby-database apache-hive apache-hadoop

Updated Mar 7, 2024

shawnzhu / docker-hive-1

Star

Docker image for Hive Metastore

apache-hive apache-hadoop

Updated Oct 19, 2020
Dockerfile

0LIFR1 / runtime-analytics

Star

Batch processing runtime analytics

python sql big-data spark pandas apache-hadoop

Updated Dec 27, 2022

aaqib-ahmed-nazir / BDA_Assignment02

Star

This repository aims to develop a basic search engine utilizing Hadoop's MapReduce framework to index and process extensive text corpora efficiently. The dataset used for this project is a subset of the English Wikipedia dump, totaling 5.2 GB in size. The project focuses on implementing a naive search algorithm to address challenges in information.

python search-engine hadoop jupyter-notebook python3 mapreduce search-algorithm jupiter-notebook apache-hadoop mapreduce-python