SKLearn 13 | Naive Bayes Classification | Belajar Machine Learning Dasar

แชร์
ฝัง
  • เผยแพร่เมื่อ 29 ก.ค. 2024
  • Salam Indonesia Belajar!!!
    Classification dengan Naive Bayes.
    Video ini adalah video ketigabelas, dari video berseri atau playlist bertema Belajar Machine Learning dengan Python.
    Dalam sesi belajar kali ini kita akan mempelajari:
    00:00 - Intro
    01:41 - Pengenalan Bayes Theorem | Teori Bayes | Conditional Probability
    03:59 - Pengenalan Naive Bayes Classification
    05:40 - Pengenalan Prior Probability
    07:02 - Pengenalan Likelihood
    09:28 - Pengenalan Evidence | Normalizer
    10:57 - Pengenalan Posterior Probability
    13:18 - Studi kasus Naive Bayes Classification
    16:39 - Penjelasan Algoritma yang Naive
    18:44 - Persiapan Dataset | Wisconsin Breast Cancer Dataset | UCI Machine Learning
    26:06 - Implementasi Naive Bayes Classification dengan Scikit-Learn
    Apa itu Scikit-Learn?
    Scikit-Learn merupakan module dalam pemrograman Python yang memfasilitasi kita untuk mengerjakan berbagai machine learning project. Awalnya Scikit-Learn ini digarap sebagai bagian dari Google Summer of Code projec pada tahun 2007. Istilah Scikit sendiri merupakan kependekan dari SciPy Toolkits; karena memang project ini diperuntukkan sebagai extension untuk SciPy yang merupakan Scientific module dalam pemrograman python. Code base dari project ini lalu ditulis ulang dan mulai dibentuk tim khusus untuk mengembangkan project ini dengan lebih serius. Di awal tahun 2010, project Scikit-Learn ini dirilis ke publik dan berhasil menarik banyak contributor yang akhirnya menjadikan project ini terus berkembang sampai saat ini. Bahkan di tahun 2012, Scikit-Learn dikenal sebagai machine learning library yang paling populer dan well maintained.
    Materi dalam seri pembelajaran ini kami susun sedemikian rupa agar mudah diikuti, dan selalu kami awali dengan materi2 yang sifatnya mendasar terlebih dahulu. Kami berharap materi pembelajaran Machine Learning Dasar ini dapat bermanfaat dan membantu proses belajar kalian.
    Bilamana ada pertanyaan ataupun masukan terkait materi yang kami sampaikan, kalian dapat mengajukan pertanyaan dan masukan kalian, melalui kolom komentar video. Kami akan selalu berusaha untuk merespon setiap pertanyaan dan masukan yang kalian ajukan.
    Bagi teman-teman yang ingin mentraktir kami, silakan untuk memanfaatkan link Saweria berikut ini: saweria.co/belajaridn
    Bagi teman-teman yang tertarik, silakan untuk bergabung juga dengan Discord server Indonesia Belajar: / discord
    Dataset Breast Cancer: archive.ics.uci.edu/ml/datase...)
    Links terkait:
    - Scikit-Learn: scikit-learn.org/stable/index...
    - SciPy: www.scipy.org/
    - Matplotlib: matplotlib.org/
    - Pandas: pandas.pydata.org/
    - Anaconda: www.anaconda.com/
    - Referensi Naive Bayes Classifier: en.wikipedia.org/wiki/Naive_B...
    - Referensi Prior Probability: en.wikipedia.org/wiki/Prior_p...
    - Referensi Likelihood: en.wikipedia.org/wiki/Likelih...
    - Referensi Posterior Probability: en.wikipedia.org/wiki/Posteri...
    Keywords:
    - Belajar Machine Learning Dasar
    - Belajar Machine Learning Pemula
    - Tutorial Machine Learning Dasar
    - Belajar Machine Learning dengan Python
    - Tutorial Machine Learning dengan Python
    - Belajar Scikit-Learn
    - Belajar Data Science
    - Belajar Naive Bayes
    - Belajar Classification Task
    #NaiveBayes #MachineLearning #Classification

ความคิดเห็น • 54

  • @izal3046
    @izal3046 3 ปีที่แล้ว +6

    Mantap nih, baru kmaren liat tf idf skrg nbc. Kbteluan lg mengerjakan klasifikasi nbc dengan pembobotan tf idf. Semoga membantu

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Wah bisa pass banget moment nya :)

    • @izal3046
      @izal3046 3 ปีที่แล้ว +1

      Sekalian boosting nbc menggunakan adaboost dong haha

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Bertahap ya, supaya beginners friendly :)

    • @hafidzmaulana6714
      @hafidzmaulana6714 ปีที่แล้ว

      Ijin tanya, apakah nilai dari perhitungan tfidf-nya dipakai dalam klasifikasi Naive bayesnya? Kalau tidak, apakah data yg dipakai brasal dari data hasil pelabelan?

  • @TheMisterDonald
    @TheMisterDonald 3 ปีที่แล้ว +2

    Mantab mas keluarkan ilmu mu semua mas.. Semoga bermanfaat mas

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Semoga bermanfaat ya 😊🙏

    • @TheMisterDonald
      @TheMisterDonald 3 ปีที่แล้ว +1

      Kalau mau memprediksi posisi toko akan rame apa ngak bisa kah dengan bayes dengan feature misal posisi dekat jalan raya, dekat sekolah dsb

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Naive Bayes ini terbilang sukses dalam melakukan klasifikasi email spam dan bukan spam. Kualitas hasil prediksi akan banyak dipengaruhi oleh kualitas dataset yang digunakan.

    • @TheMisterDonald
      @TheMisterDonald 3 ปีที่แล้ว +1

      Kalau cuma spam dan bukan spam bukannya cenderung ke logistic y mas

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Naive Bayes sebenarnya memiliki kisah yang sangat menarik dalam sejarah perkembangan Machine Learning karena penerapannya untuk spam filtering.
      en.m.wikipedia.org/wiki/Naive_Bayes_spam_filtering

  • @farhanroy7211
    @farhanroy7211 3 ปีที่แล้ว +1

    mantap pak. semangat buat videonya...

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว +1

      Siap.. Semoga bisa bermanfaat ya 😊🙏

  • @rabz749
    @rabz749 2 ปีที่แล้ว +1

    terima kasih mas, sangat membantu untuk tugas kuliah saya

    • @belajaridn
      @belajaridn  2 ปีที่แล้ว

      Sama-sama, senang bisa membantu 😊☕🙏

  • @delvi7045
    @delvi7045 3 ปีที่แล้ว +1

    mantabs

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Kali ini rilis malam hari 😁

  • @harrymaringantua71
    @harrymaringantua71 3 ปีที่แล้ว +1

    Semangat ngontennya mas, saya benar2 terbantuu 🙏

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Ha3... Siap, kami juga senang bisa menghasilkan materi belajar yang bermanfaat 😊🙏

  • @ajitegar7738
    @ajitegar7738 2 ปีที่แล้ว +3

    Mau tanya pak,
    Perbedaan dari algoritma Naivebeyes classification dan algoritma Naivebeyes Regression gimana ya ?

    • @belajaridn
      @belajaridn  2 ปีที่แล้ว

      Beda pada implementasi saja, yang satu untuk menyelesaikan classification task dan yang satunya lagi untuk regression task 😊☕

    • @ajitegar7738
      @ajitegar7738 2 ปีที่แล้ว +1

      @@belajaridn regression tidak butuh label kelas ya pak ?. atau lebih ke unsurpervised Learning ?

    • @belajaridn
      @belajaridn  2 ปีที่แล้ว

      @@ajitegar7738 tetap butuh kok mas, Naive Bayes ini masuk dalam kategori supervised learning.

    • @ajitegar7738
      @ajitegar7738 2 ปีที่แล้ว +1

      Baik pak, terimakasih sudah paham 🙏

    • @belajaridn
      @belajaridn  2 ปีที่แล้ว

      Sama-sama, senang bisa membantu. Coba simak video pertama. Di sana saya sudah jelaskan secara global.

  • @andiindahayulestari8451
    @andiindahayulestari8451 2 ปีที่แล้ว +1

    kak mohon saran nya analisis sentimen bagusnya pake apa yah? Mau pake NBC sudah banyak yg pake, saran untuk pembeda biar beda dari yang lain kak🙏

  • @freakiesjunkies4711
    @freakiesjunkies4711 3 ปีที่แล้ว +1

    next unsuperv yg hirarki clustering. sukses!

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Siap, tapi kami coba ulas yang supervised learning dulu ya. Masih terdapat banyak model supervised learning yang belum kami bahas.

  • @bimakurniawan3444
    @bimakurniawan3444 2 ปีที่แล้ว +1

    Pak apa metode ini dapat digunakan untuk klasifikasi warna berdasarkan 3 parameter (RGB)

  • @titusyory2870
    @titusyory2870 2 ปีที่แล้ว

    Mau bertanya Pak, apakah Naive Bayes harus dilakukan normalisasi data apabila menggunakan data numerik yang tiap featuresnya memliki range cukup jauh seperti pada KNN? Terima Kasih bila berkenan menjawab Pak.

  • @latifahkhasanah2634
    @latifahkhasanah2634 2 ปีที่แล้ว

    Pada saat bagian
    model.fit(X_train,y_train)
    kenapa ada muncul tulisan seperti ini ya?
    ValueError: could not convert string to float: 'P'
    apakah data yg digunakan harus ada numeriknya? jenis data saya kategorik semua

  • @ranggakcs
    @ranggakcs 2 ปีที่แล้ว +1

    Pak, kalau isi fiturnya nominal atau bukan angka, apakah harus dirubah dulu ya, sebelum masuk ke naive bayesnya?

  • @spiritwin2548
    @spiritwin2548 3 ปีที่แล้ว +1

    bg mau nanya kalau kita udah save model dengan naive bayes, lalu kita ingin melakukan predict sama data yang baru dengan model yang ktia buat, untuk data baru kita perlu melakukan tfidf gak bg lalu melakukan predict ke data yang baru ?

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Perlu, karena data baru tersebut harus memiliki features dengan struktur yang serupa dengan struktur dari dataset yang kita gunakan sewaktu training model.

    • @ranggakcs
      @ranggakcs 2 ปีที่แล้ว

      proses memasukan data baru ke tf idf-nya apakah sama seperti proses awal memasukan data latih ya pak?

  • @tazkiyatunnia
    @tazkiyatunnia 3 ปีที่แล้ว

    bang nanya, kalok klasifikasi nbc pengujiannya pake cross validation bisa ga si? semoga dijawab

  • @MSyukronNawawi
    @MSyukronNawawi 3 ปีที่แล้ว +1

    maaf mau tanya kalo di implementasi kan di prediksi penjualan terlaris bisa kah? jika bisa untuk data targetnya sperti apa ya pak. mohon pencerahannya , saya sedang skripsi untuk metode ini. jika berkenan ingin di buatkan video nya juga, terimakasih pak . salam sukses

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Ada baiknya pelajari dulu dasar2 machine learning. Naive Bayes merupakan model Machine Learning untuk classification task. Nah kalau boleh tahu, apakah studi kasus dalam skripsi mu adalah classification?

    • @MSyukronNawawi
      @MSyukronNawawi 3 ปีที่แล้ว

      @@belajaridn oh iya baik pak🙏 melihat penelitian sebelum nya untuk menggunakan KNN dan outputnya mengclasifikasikan produk terlaris,cukup laris dan kurang laris🙏 mohon pencerahannya pak🙏 terimaksih banyak

  • @hellothere-tn4pw
    @hellothere-tn4pw 2 ปีที่แล้ว +1

    pak, saya udah mencari random_state maksudnya apa, tapi saya belum begitu paham juga pak, jadi maksud parameter random_state itu apa ya pak?

    • @belajaridn
      @belajaridn  2 ปีที่แล้ว

      Random state ini istilah lain untuk random seed number. Ini biasa digunakan ketika kita membutuhkan mekanisme pengacakan (randomization) yang replicable atau bisa diulang dengan hasil yang konsisten ☺️☕🙏

  • @nurfauziahmakmur583
    @nurfauziahmakmur583 ปีที่แล้ว

    kak kenapa data setnya linknya tidak bisa diakses apakah ada link baru?

  • @muhammadzidan6708
    @muhammadzidan6708 ปีที่แล้ว

    Mau tanya pak, itu kok bisa ppt didalamnya ada jupyter notebooknya, jadinya enak gitu penyampaiannya. Itu gimana ya caranya pak??

    • @belajaridn
      @belajaridn  ปีที่แล้ว

      Slide presentasinya memang berbasis Jupyter Notebook. Saya pernah buatkan panduannya juga di channel Indonesia Belajar ini 😊🙏

  • @AgiAdityaAgasi
    @AgiAdityaAgasi 3 ปีที่แล้ว +1

    Ga sekalian interpretasi hasilnya om.

    • @belajaridn
      @belajaridn  3 ปีที่แล้ว

      Untuk interpretasi, rencana akan ada playlist khusus yang berisi studi kasus. Playlist belajar machine learning Python ini kami fokuskan untuk memperkenalkan konsep dan praktek dasar machine learning dulu. Sangaja kami buat sederhana agar beginners friendly 😊🙏