Data Preparation: Pembersihan Data dari Missing dan Noise, serta Pemilihan Atribut yang Relevan

แชร์
ฝัง
  • เผยแพร่เมื่อ 10 ก.พ. 2025
  • Data Preparation
    Hukum ke 3 dari 9 hukum data mining menurut Tom Khabaza (Tom Khabaza, Nine Laws of Data Mining, 2010 ): Data preparation is more than half of every data mining process. Kita akan menghabiskan 50% usaha dan energi kita untuk urusan data preparation atau preprocessing ketika mengolah data menjadi pengetahuan.
    Materi ini adalah lanjutan materi data mining, setelah konsep dijelaskan, 5 peran data mining diuraikan, kemudian praktek dilakukan dengan Rapidminer. Materi data prepraration akan menguraikan tentang apa yang harus dilakukan supaya kita bisa menyiapkan data, membersihkan data, dan mengurangi noise. Dan akhirnya kita bisa mendapatkan data yang relatif bersih dan rapi, yang kemudian siap diolah menggunakan algoritma data mining.
    Download slide dan dataset: romisatriawaho...
    Romi Satria Wahono Institute
    Blog: romisatriawahon...
    TH-cam: / romisatriawahono
    Facebook: / romisatriawahono
    Instagram: / romisatriawahono
    Twitter: / romisw

ความคิดเห็น • 57

  • @muhammadrusdianto7697
    @muhammadrusdianto7697 4 ปีที่แล้ว +3

    Mantaap.. ini nih yg saya tunggu2. Thanks prof. 🙏
    Ditunggu seri selanjutnya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว +1

      siap lanjut mas

    • @muhammadrusdianto7697
      @muhammadrusdianto7697 4 ปีที่แล้ว +2

      @@RomiSatriaWahono Prof.. file data examination download dimana ya? (1:01:40) gak ada di file romi-dataset.zip dari web romisatriawahono.net/dm/.

  • @hasbifirmansyah10
    @hasbifirmansyah10 ปีที่แล้ว +1

    Ketika kuliah gak mudeng mudeng, eh setelah lulus sekian lama dengan mengamati tiap detail penjelasannya dengan pelan pelan baru mudeng Pak 😂😂

  • @wiwieksuristiyanti7776
    @wiwieksuristiyanti7776 3 ปีที่แล้ว

    Terima kasih, Pak Romi... Barokallah selalu buat Pak Romi...

  • @KebijaksanaanSejati
    @KebijaksanaanSejati 4 ปีที่แล้ว

    Alhamdulilah yg ditunggu sudah muncul mantap Pak Romi

  • @suyatnompd6369
    @suyatnompd6369 4 ปีที่แล้ว

    Mantap Pak Romi ini yang saya tunggu-tunggu..

  • @nikomangrustini7553
    @nikomangrustini7553 2 ปีที่แล้ว +1

    Ijin bertanya pak, apakah bisa dibuatkan tutorial preprocessing menggunakan google colabs pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  2 ปีที่แล้ว +1

      googling saja mbak, banyak kok, konsep preprocessing itu sama, hanya praktiknya agak beda di tiap tools ..

  • @denisutaji2094
    @denisutaji2094 4 ปีที่แล้ว

    sangat mencaerahkan, terima kasih Prof.

  • @SUPRIYANTO-od6gt
    @SUPRIYANTO-od6gt 3 ปีที่แล้ว

    ijin download materi bapak romi, terima kasih atas ilmunya

  • @payobelajar
    @payobelajar 4 ปีที่แล้ว

    terima kasih ilmunya pak romi sangat bermanfaat, izin download materi ya

  • @SekolahOtodidak
    @SekolahOtodidak 4 ปีที่แล้ว

    Terima kasih pak. Untuk buku belajar data mining berbahasa indonesia mulai dari pemula ke mahir, mohon rekomendasinya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      pakai buku textbooks bahasa inggris saja mqs ... lebih solid dan sistematis... dan juga diupdate terus setiap 3-4 tahun sekali

  • @efiddwiagustono1254
    @efiddwiagustono1254 3 ปีที่แล้ว +1

    pak romi, apakah PCA hanya bisa digunakan untuk data numeric saja? saya coba dengan data nominal ada notif "regular attributes must be of type numeric"

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 ปีที่แล้ว +2

      naaah sudah tahu jawabannya ... hehehe

  • @sukrisno-6331
    @sukrisno-6331 4 ปีที่แล้ว

    Izin download ilmunya lagi Pak Romi

  • @dukun4310
    @dukun4310 2 ปีที่แล้ว

    terima kasih pak Romi, apakah algoritma deep learning seperti ccn dan lstm bisa di impelmentasikan pada aplikasi rapidminer ini.?

    • @RomiSatriaWahono
      @RomiSatriaWahono  2 ปีที่แล้ว

      sebagian ada sebagai operator di rapid miner .

  • @ardiantanjung7246
    @ardiantanjung7246 3 ปีที่แล้ว

    Terima kasih pak, semoga ada pembahasan text mining^^

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 ปีที่แล้ว

      saya bahas di ujung materi lain sepertinya ... coba ditelusuri saja

    • @ardiantanjung7246
      @ardiantanjung7246 3 ปีที่แล้ว

      @@RomiSatriaWahono oh setelah saya liat definisi text mining, di wiki. ternyata sudah include (dijelaskan) dalam video ini. terima kasih pak ^^

    • @ardiantanjung7246
      @ardiantanjung7246 3 ปีที่แล้ว

      @@RomiSatriaWahono saya mampu mengerjakan tugas 1 ^_^ dalam waktu 1 jam haha

  • @fandyfirmansyah6707
    @fandyfirmansyah6707 11 หลายเดือนก่อน

    Izin bertanya pak bagaimana cara Kita tentukan data yang kita punya ini harus kita Reduction baik itu feature selection atau ekstrasi

    • @RomiSatriaWahono
      @RomiSatriaWahono  11 หลายเดือนก่อน

      pahami konsep data preprocessing yg sudah aku jelaskan

  • @sitihotijah8129
    @sitihotijah8129 2 ปีที่แล้ว

    Pak mau tanya, feature selection untuk cluster bisa menggunakan yg mana ya?
    Saya sdh coba pakai forward selection dengan kmeans dan menggunakan cluster distance performance tp eror
    Mohon pencerahannya

    • @RomiSatriaWahono
      @RomiSatriaWahono  2 ปีที่แล้ว

      errornya apa dicek dan dipecahkan sesuai dengan pesan errornya

  • @rizalpurnama3535
    @rizalpurnama3535 4 ปีที่แล้ว

    Maap mau tanya lagi pak..
    Pak saya kan mau mining data transaksi untuk mencari hubungan antar barangnya dengan FP-GROWTH.
    Ada 1000 item barang atau ada 1000 kolom di dataset Saya.
    Masalahnya adalah pas kita import dataset, semua type atribut default.nya polynomial, dan Saya kan harus ngerubah ke binominal.
    Pertanyaanya sy ngerubah type atributnya itu emng satu" sesuai sama tutorial pak Romi atau ada cara yang lebih cepat ?
    Kalo ada, pake operator apa pak?
    Sy sudah cari operator Change type Polynomial to Binominal g ada .
    Berhubung ini kolomnya ada banyak bgt, dan butuh makan waktu klo ngerubah satu persatu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      lha datanya sebenarnya gimana bentuknya? dia bener2 polynominal?

    • @rizalpurnama3535
      @rizalpurnama3535 4 ปีที่แล้ว

      @@RomiSatriaWahono datanya mentahnya emng polynomial Pak, contohnya ga cuma 0 dan 1 tapi ada juga 2, 3 dst..
      Klo untuk datanya itu bisa sy preprocessing dulu, tapi untuk penentuan tipe atributnya yng sy bingung,
      Gmn cara ganti ke binominal sekaligus.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      data binominal itu 0 dan 1 atau beli dan tidak .... jangan2 salah data, fp growth itu data transaksi beli dan tidak lho ...

  • @rionorman
    @rionorman 4 ปีที่แล้ว

    Pak Romi,
    Saya tanya, terkadang ada data yang memiliki ciri yang sama namun berbeda pada label.
    Misalkan
    No X Y Z Label
    ----------------------------------------
    1. a c e Y
    2. a c e N
    3. a c e N
    apa yang harus dilakukan terhadap data tersebut? Apakah yang nomor 1 dirubah labelnya jadi N karena dominan N pada ciri tersebut?
    Terima Kasih Pak

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      hmmmm harusnya dibiarkan saja ... nanri algoritma yg akan memfilter sendiri kondisi itu ....

    • @rionorman
      @rionorman 4 ปีที่แล้ว

      @@RomiSatriaWahono baik terima kasih Pak

  • @kautsarmuhammad6519
    @kautsarmuhammad6519 4 ปีที่แล้ว

    Masih belum ngerti pak untuk istilah over fitting kenapa kurang direkomendasikan. Bisa kasih analogi gak pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      dibaca lagi slideku ya mas ... dan didengarkan ulang youtubenya ....

  • @christofelgrant6798
    @christofelgrant6798 3 ปีที่แล้ว

    halo pak romi, ijin bertanya? apakah ada jawaban dari ketiga soal ujian yang ada di slide?

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 ปีที่แล้ว

      coba dijawab dulu ... kirim ke aku via telegram saja hasilnya nanti kita diskusi ...

  • @freskarolansa9126
    @freskarolansa9126 4 ปีที่แล้ว

    Pak ijin bertanya..Setelah model Kita hasilkan dengan menggunakan Rapidminer apakah bisa Kita deploy ke website atau ke mobile Pak? Mohon penjelasan Pak 🙏
    Terima kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 ปีที่แล้ว

      search dengan rapidminer model deployment .. banyak library dan API yg bisa baca model yg dihasilkan rapidminer

  • @rizalpurnama3535
    @rizalpurnama3535 4 ปีที่แล้ว

    Pak mau tanya, sy kan mau nyoba Asosiasi pake fp-grwoth.
    Data transaksi saya seperti ini :
    Nota01 || Sabun
    Nota01 || Handuk
    Nota02 || Handuk
    Nota02 || Sikat
    Saya mau rubah datanya jadi kyak contoh dataset transaksi dari pak Romi, jadi kyak gini .
    Nota. || Sabun || Handuk || Sikat
    Nota01 || 1 || 1 || 0
    Nota02 || 0 || 1 || 1
    Caranya gmn pak, pake operator apa?
    Soalnya sy coba cari d google dan TH-cam kesulitan ga bisa Nemu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      lihat di youtubeku yg sebelumnya deh ... udah aku bahas .. itu tipe data dibuat binominal saja mas ...

  • @rionorman
    @rionorman 4 ปีที่แล้ว

    Pak Romi,
    Mau tanya lagi, kalo ada 10 feature/ciri apakah semuanya harus digunakan?
    Boleh dipilih beberapa saja?
    Metode apa yang digunakan untuk memilihnya?
    Terima kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว

      diikuti videonya ya ... kan udah aku bahas ....

  • @awosono
    @awosono 3 ปีที่แล้ว

    Izin bertanya pak, untuk Data Analyst apakah pembelajarannya hampir sama seperti Data Scientinst kebetulan saya lulusan Ekonomi dan sangat tertarik untuk mempelajari Data Analyst. Terima Kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 ปีที่แล้ว

      Banyak naming yg digunakan utk menyebut jobdesc yg dekat, monggi disimak yg 7 tren profesi computing

  • @rizalpurnama3535
    @rizalpurnama3535 4 ปีที่แล้ว

    Terimakasih pak Romi atas ilmunya..😊
    Mau tanya pak, itu Folder examination.nya bisa didownload dmn ya pak?
    Soalnya di folder romi-dataset.RAR yng sy download g ada.🙏🏻🙏🏻

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 ปีที่แล้ว +1

      romi-dataset.zip mas ... harusnya ada

    • @muhammadrusdianto7697
      @muhammadrusdianto7697 4 ปีที่แล้ว

      @@RomiSatriaWahono up.. saya juga gak nemu foldernya pak.