Kamis, 11 Mei 2017

Klasifikasi menggunakan metode Decision Tree dan Naive Bayes

Kali ini saya akan melakukan klasifikasi serta membandingkan dua metode yang akan saya gunakan dalam melakukan klasifikasi. Dua metode tersebut adalah Decision Tree dan Naive Bayes. Untuk data saya akan menggunakan dari link ini http://archive.ics.uci.edu/ml/datasets/Glass+Identification. Saya akan mencoba menentukan klasifikasi gelas berdasarkan atribut-atribut yang terdapat dari data.

Terdapat langkah utama dalam melakukan klasifikasi yaitu mempelajari model dan menggunakan model. Mempelajari model merupakan aktivitas untuk menjelaskan pola yang sudah ditentukan. Menggunakan model untuk menentukan suatu objek yang belum diklasifikasikan. Melakukan klasifikasi membutuhkan Training Set serta Test Set. Namun, karena saya tidak mendapatkan Test Set pada link tersebut maka saya akan membagi data menjadi 70% untuk Training Set dan 30% untuk Test Set. Pada kali ini saya akan memakai Weka 3.8 sebagai alat bantu dalam melakukan klasifikasi.

Sebelum melakukan klasifikasi saya akan menjelaskan sedikit mengenai Decision Tree dan Naive Bayes. Decision Tree sebuah struktur yang dapat digunakan untuk membagi kumpulan data ang besar menjadi himpunan-himpunan record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Data dalam Decision Tree biasanya dinyatakan dalam bentuk tabel dengan atribut dan record. Metode Naive Bayes menggunakan perhitungan probabilitas dalam pelaksanaanya. Konsep dasar yang digunakan oleh Naive bayes adalah Teorema Bayes. Cara kerjanya menghitung peluang dari satu kelas dari masing-masing kelompok atribut yang ada, dan menentukan kelas mana yang paling optimal.

1. Data Pre-processing
Pertama saya akan mendownload data dari link dan pilih Data Folder maka akan muncul gambar seperti dibawah ini. Klik glass.names untuk melihat spesifikasi data. Kemudian akan terlihat atribut yang digunakan pada data. Terlihat dari informasi ini bahwa saya harus melakukan klasifikasi untuk menentukan 1 dari 7 tipe gelas yang ada.


Setelah itu klik glass.data untuk melihat data dan copy paste data tersebut pada Notepad++.


Ganti semua “,” menjadi “;” dan ganti semua “.” menjadi “,”. Kemudian simpan file tersebut dalam format .csv.



Buka file .csv pada aplikasi excel dengan memanfaatkan fitur From Text. Kemudian isi nama kolom ID, Refractive Index, Sodium, Magnesium, Aluminum, Silicon, Potassium, Calcium, Barium, Iron, Type of glass. 



Data pada kolom Type of glass ubah “1” “2” “3” “4” “5” “6” “7” menjadi “building_windows_float_processed” “building_windows_non_float_processed” “vehicle_windows_float_processed” “vehicle_windows_non_float_processed“containers” “tableware” “headlamps” secara berurutan. Khusus “4” diubah menjadi “vehicle_windows_non_float_processed“containers” tidak ada karena tidak ada nilai 4 pada data ini. 



Karena data ini terurut berdasarkan Type of glass maka saya akan mengacak susunan baris data agar semua nilai pada kolom Type of glass dapat di Training dan di Test. 



Pada data ini terdapat 11 atribut. Namun, saya tidak akan menggunakan atribut ID pada proses klasifikasi karena atribut ID tidak memiliki peran penting penting pada proses ini. Kemudian saya menyimpan data tersebut dengan format .csv. Buka file pada Notepad++ dan ubah “,” menjadi “.” serta “;” menjadi “,” agar data bisa dibaca pada Weka. 



Buka Weka dan buka file tadi pada Weka.




2. Klasifikasi
Diawal saya tadi mengatakan bahwa saya akan menggunakan 2 metode yaitu Decision Tree dan Naive Bayes. Decision Tree menjadi metode pertama yang saya pilih. Pada Weka klik Classify dan pada bagian Classifier pilih J48. Di bagian Test option klik Percentage split dan isi nilai 70. Karena sesuai yang saya katakan diawal saya akan menggunakan 70% data untuk dijadikan Training Set. Setelah itu klik Start untuk melakukan klasifikasi. 





Didapat tingkat kebenaran data sebasar 60.9% dan tingkat kesalahan sebesar 39,1%. Kemudian untuk model didapat sebagai berikut.





Decision Tree bisa menampilkan pohon yang dapat memudahkan kita melihat model. Namun, rumitnya model membuat gambar tidak dapat terlihat dengan jelas. 



Decision Tree sudah, sekarang kita beralih ke metode Naive Bayes. Pada bagian Classifier pilih NaiveBayes. Klik Start untuk memulai klasifikasi. 




Metode Naive Bayes mendapatkan tingkat kebenaran 51.6% dan tingkat kesalahan 48.4%. Ini menunjukkan tingkat kebenaran yang lebih rendah dari metode Decision Tree. Berikut model yang dihasilkan.







3. Kesimpulan
Berdasarkan klasifikasi yang sudah dilakukan didapat bahwa tingkat kebenaran metode Decision Tree sebesar 60.9% lebih baik dari tingkat kebenaran Naive Bayes sebesar 51.6%. Walaupun begitu, nilai 60.9% masih rendah. Saran saya adalah mencoba metode lain yang mendapatkan tingkat kebenaran diatas 70% atau membutuhkan lebih banyak data pada Training Set sehingga algoritma dapat belajar lebih banyak data. 



Jika ingin file dalam format pdf bisa download disini

Minggu, 22 November 2015

Multiprotocol Label Switching

MPLS (Multiprotocol Label Switching). MPLS adalah suatu metode forwarding, yang memungkinkan suatu router akan meneruskan suatu paket dengan hanya melihat label yang melekat pada paket tersebut, sehinggap tidak perlu lagi melihat alamat IP tujuan. MPLS merupakan teknologi penyampain paket pada jaringan backbone berkecapatan tinggi. MPLS berada di antara lapisan kedua (Data-link Layer) dan ketiga (Network Layer).

Teknik pelabelan yang dipakai bukanlah teknik yang baru. Frame Relay dan ATM menggunakan teknik ini untuk memindahkan frame atau sel pada suatu jaringan, dimana pada Frame Relay panjang frame disesuaikan dengan besarnya paket dan pada ATM panjangnya frame tetap. Selain itu Frame Relay dan ATM memiliki kesamaan yaitu penggantian label pada setiap hop di jaringan. Proses seperti ini tidak terjadi pada proses penerusan paket di jaringan IP, dimana pada jaringan IP tidak terjadi penggantian alamat tujuan, tetapi melihat alamat dari tujuan paket itu sendiri kemudian dicocokkan dengan table routing untuk kemudian di teruskan ke hop selanjutnya, dengan proses seperti itu maka waktu yang dibutuhkan dalam proses penerusan paket menjadi lama. Atas dasar itulah maka teknologi MPLS ini dibuat.

Cara kerja MPLS yang pertama control plane. Proses ini memiliki tugas untuk melaksanakan binding label MPLS ke rute yang terdapat pada routing table. Setelah itu rute yang sudah dilabel akan didistribusikan ke router yang dapat melakukan MPLS. Ada dua protokol yang menangani proses ini yaitu LDP (Label Distribution Protocol) yang bertanggung jawab untuk mengatur pemberian label pada rute dan TGP (Tag Distribution Protocol) yang bertanggung jawab untuk binding label MPLS ke rute.

Kedua ada data plane. Proses ini melakukan forwarding paket berdasarkan label. Ketentuan forwarding paket ke tujuan berdasarkan informasi yang terdapat pada LFIB. MPLS control plane bertanggung jawab untuk menjaga dan memelihara LFIB. 

MPLS memiliki beberapa komponen yaitu :

1    MPLS node

Router pada jaringan MPLS yang akan meneruskan paket yang diterimanya berdasarkan label.

2    MPLS label

Merupakan deretan bit informasi yang ditambahkan pada header suatu paket data dalam MPLS.  Label MPLS atau yang disebut juga MPLS header ini terletak di antara header data-link layer dan header network layer.

3    MPLS Ingress node/Egress node

Mpls ingress : mpls node yang mengatur trafik saat paket memasuki jaringan mplsIngress node biasa disebut juga PE (Provider Edge) router.

Mpls egress : mpls node yang mengatur trafik saat paket meninggalkan jaringan mpls, Egress node biasa disebut juga PE (Provider Edge) router.

4    LSP (Label switch Path)
   
Jalur yang terbentuk dari dari serangkaian label swithing hop, dimana paket diteruskan berdasarkan table FEC (forward equivalent Class) dari satu mpls node ke mpls node yang lain.

5    LSR (Label Switching Router)
                 
Router yang mendukung MPLS forwarding. LSR biasa disebut juga P (Provider) router.

6    LER (Label Edge Router )

MPLS node yang menghubungkan sebuah MPLS domain dengan node yang berada diluar MPLS domain.

MPLS memiliki keunggulan seperti penataan lalu lintas dan penggunaan bandwidth dapat dikendalikan sepenuhnya, memiliki keamanan yang bagus, arsitektur MPLS menggunakan label untuk membedakan klien yang satu dengan klien yang lainnya, fleksibel.

Referensi

Selasa, 08 September 2015

TUGAS JARINGAN KOMPUTER II


Non-return to Zero (NZR) Encoding

 
Non-return to Zero (NZR) pengkodean ini digunakan pada transmisi antarmuka synchronus dan asynchronous. Dengan NRZ, sebuah 1 bit logic dikirim sebagai nilai yang tinggi dan logis 0 bit dikirim sebagai nilai yang rendah (tidak benar-benar di-encoding semua). Sinyal penerima mungkin kehilangan sinkronisasi ketika menggunakan NRZ untuk encode link synchronus. Persoalan lain dengan NRZ adalah pengurutan data jumlah yang sama 1 dan 0 akan menghasilkan DC level, dan NRZ membutuhkan bandwidth yang besar. Dari 0 Hz (mengandung hanya 1 atau hanya 0) sampai setengah dari rate data (untuk urutan 10101010).

Selasa, 01 September 2015

5 Jenis Delay



Packetization Delay

Delay yang dibutuhkan untuk proses pembentukan paket IP dari informasi user. Delay ini hanya terjadi sekali saja yaitu di source informasi.

OSI Layer

Layar OSI merupakan model arsitektural yang dikembangkan oleh ISO (International Organization for Standardization). OSI memiliki kepanjangan Open System Interconnection. Tujuan penggunaan model OSI adalah mempemudah designer jaringan dalam  memahami fungsi dari tiap layer yang berhubungan dengan aliran komunikasi data.