IMPLEMENTASI APACHE SPARK PADA BIG DATA BERBASIS HADOOP DISTRIBUTED FILE SYSTEM

SEVIAN OLIVIANDI

Informasi Dasar

18.04.213
C
Karya Ilmiah - Skripsi (S1) - Reference

Big data merupakan kumpulan data dalam skala besar, yang mempunyai karakteristik data yang variatif, sangat cepat pertumbuhannya dan kompleks datanya. Data yang kompleks merupakan data yang tidak terstruktur yang perlu diolah khusus dengan suatu infrastruktur yang dapat mengelola data dalam volume besar. Pada tugas akhir ini digunakan metode MapReduce untuk memudahkan komputasi yang akan dilakukan pada suatu big data. MapReduce merupakan suatu model pemrograman untuk menulis aplikasi yang dapat memproses suatu big data secara paralel pada beberapa node. MapReduce memberikan kemampuan analitis untuk menganalisis volume besar data yang kompleks. Platform yang digunakan adalah Hadoop, Hadoop mempunyai algoritma MapReduce sendiri. Tugas akhir ini akan menganalisis performa dari Hadoop MapReduce dan membandingkannya dengan Apache Spark yaitu platform yang dibuat untuk memproses suatu big data yang dikembangkan berdasarkan Hadoop MapReduce dengan peningkatan performa pemrosesan. Skenario yang digunakan adalah memproses wordcount suatu data dengan besar data yang berbeda yang bertujuan untuk menganalisis response time dan penggunaan hardware dari kedua platform tersebut.

Kata kunci: Big Data, Apache Spark, MapReduce, Hadoop

Subjek

BIG DATA
 

Katalog

IMPLEMENTASI APACHE SPARK PADA BIG DATA BERBASIS HADOOP DISTRIBUTED FILE SYSTEM
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

SEVIAN OLIVIANDI
Perorangan
Andrew Brian Osmon
 

Penerbit

Universitas Telkom, Sistem Komputer
Bandung
2018

Koleksi

Kompetensi

  • CEG3F3 - APLIKASI MOBILE
  • SK3023 - ARSITEKTUR JARINGAN
  • CEG3C3 - DESAIN BASIS DATA
  • CEG2A3 - PEMROGRAMAN BERORIENTASI OBJEK
  • CEG3E3 - SISTEM OPERASI

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini