Tutorial Klasifikasi K-Nearest Neighbor (K-NN) dengan Python | KMMI Data Mining with Python 2021

แชร์
ฝัง
  • เผยแพร่เมื่อ 3 ม.ค. 2025

ความคิดเห็น •

  • @febbisenalestari
    @febbisenalestari  11 หลายเดือนก่อน +1

    Maaf ada ralat ya temen-temen
    Menit ke 17:32 itu harusnya stop = x_set[:, 1].max()+1
    Mohon maaf atas kesalahannya & terima kasih bagi yg sudah mengoreksi ☺️🙏

  • @BangunWatono
    @BangunWatono 2 ปีที่แล้ว +1

    Mantab sekali penjelasannya. Terima kasih. Sangat membantu kak

  • @dewianggraini7192
    @dewianggraini7192 3 ปีที่แล้ว +1

    Mantap👍

  • @rafidimas578
    @rafidimas578 3 ปีที่แล้ว +2

    Semangat kak👏👏👏

  • @MUHAMMADEDISARWO
    @MUHAMMADEDISARWO ปีที่แล้ว +3

    kak mau tanya dong kenapa di proses KNN ada yg mencari jarak ecuilden dan ada yg engga tapi di vidio kakaknya tidak terdapat jarak ecuilden terimakasih

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Kalau ada bagian mencari jarak euclidean, berarti coding KNN-nya dilakukan secara manual. Kalau dalam video saya pakai function KNN yang sudah ada di library Sklearn, jadi tinggal panggil functionnya saja

  • @Ekrmdn19
    @Ekrmdn19 8 หลายเดือนก่อน +1

    kak izin bertanya kenapa pada visualisasi darta (grafik) saya error pada bagian 'x_set, y_set = x_train, y_train'

  • @dhxx2905
    @dhxx2905 11 หลายเดือนก่อน +1

    Maaf mau nanya.. itu di awal kan sumbu y atau variabel dependennya kan pump ya? Tapi di grafik sumbu y nya kok temp ya?

    • @dhxx2905
      @dhxx2905 11 หลายเดือนก่อน

      Sama mau tanya lagi waktu meshgrid itu x set yg baris kedua yg stop bukan [ : , 1] ?

    • @febbisenalestari
      @febbisenalestari  11 หลายเดือนก่อน

      Sumbu Y grafik dan variabel Y (dependen) itu 2 hal yg berbeda. Di grafik sumbu X-nya Moisture & sumbu Y-nya Temp karena kita ingin tahu jika nilai dua variabel independen tsb ditarik garis lurus pada grafik akan bertemu di mana. Nah, titik temunya itu yg menjadi nilai Pump, nanti dia berada di area class 0 atau 1.
      Untuk stop x set baris kedua, iya yang benar [:, 1], ada typo di sana. Terima kasih koreksinya :)

    • @dhxx2905
      @dhxx2905 11 หลายเดือนก่อน

      @@febbisenalestari oh ya i see thanks kak

  • @Dihyo_
    @Dihyo_ ปีที่แล้ว +1

    izin bertanya ka, kalau misal data pada kolom x nya lebih dari 2 bisa atau tidak? kalau misalkan bisa apa ada jumlah maksimalnya?

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Bisa. Nggak ada jumlah maksimal pastinya sih, hanya saja kalau atributnya banyak, apakah keseluruhan atribut tersebut penting dan berpengaruh ke kelas/label. Kalau atributnya terlalu banyak tapi sebenarnya nggak penting, itu nanti malah bisa bikin performa model kurang bagus

    • @Dihyo_
      @Dihyo_ ปีที่แล้ว

      @@febbisenalestari oke baik makasih infonya ka

  • @bestiadhelfiariani1924
    @bestiadhelfiariani1924 ปีที่แล้ว +1

    Kak izin bertanya untuk codingan terakhir terkait plot.. Saya memiliki data beasiswa dengan 5 variabel kak.. Nah itu bagaimana caranya untuk membuat code nya kak apalgi ada plot utk x dan y dimana berarti memakai 2 variabel ya kak.. Jadi bagaimana dengan plot 5 variabel tersebut kak.. Terimakasih kak..

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Visualisasi data/plot yang seperti itu memang bisanya hanya untuk 2 atribut kak, karena plot itu kan terdiri dari 2 dimensi aja (x dan y). Kalau tetap mau pakai plot seperti itu untuk dataset 5 atribut berarti dimensi/atributnya harus dikurangi. Kalau aku baca-baca referensi, pengurangan dimensi itu bisa pakai algoritma Principal Component Analysis (PCA). Aku belum pernah coba sih, tapi mungkin bisa dicari referensi terkait itu. Semoga membantu ya..

  • @partoflife6963
    @partoflife6963 ปีที่แล้ว +1

    Kak mau nanya, mohon dijawab, apa bisa tutor kakak ini diterapkan untuk melakukan klasifikasi objek pada sebuah gambar? Mohon infonya kak

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Tutorial yang kubuat itu untuk dataset berbentuk tabel/dataframe, kalau untuk data gambar ada caranya sendiri karena beda karakteristik dataset.

    • @navessajulieth7878
      @navessajulieth7878 11 หลายเดือนก่อน

      kk dh dpt tutornya ?

  • @muammarrezapahlawan8715
    @muammarrezapahlawan8715 2 ปีที่แล้ว +1

    mbak coba dataset yg lain donk

  • @alhumam90
    @alhumam90 2 ปีที่แล้ว +1

    kk kok aku di kode yang terakhir ada attribute error line 5
    plt.contourf...
    AttributeError: module 'matplotlib' has no attribute 'contourf'

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Pastikan import library-nya sudah lengkap ya, untuk matplotlib disertai pyplot juga
      import matplotlib.pyplot as plt

  • @nama-my9ks
    @nama-my9ks ปีที่แล้ว +1

    Izin bertanya kak, kalo mau input nilai baru gimana ya kak?

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Maksudnya nilai baru itu nilai yang dimasukkan ke dataset atau nilai yang mau diprediksi kelasnya?

    • @nama-my9ks
      @nama-my9ks ปีที่แล้ว

      @@febbisenalestari yang mau di prediksi kak

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Pakai function predict() di modelnya. Misal data barunya 30 dan 50, secara umum prediksinya seperti ini:
      prediksi = classifier.predict([[30, 50]])
      print("Hasil Prediksi = ", prediksi)
      Tapi perlu diingat bahwa di video nilai atribut distandardisasi pakai StandardScaler, sehingga nilai barunya juga harus distandardisasi sebelum diprediksi. Caranya bisa seperti ini:
      databaru = sc.transform([[30, 50]])
      prediksi = classifier.predict(databaru)
      print("Hasil Prediksi = ", prediksi)

    • @nama-my9ks
      @nama-my9ks ปีที่แล้ว

      @@febbisenalestari makasih banyak kak

  • @yuanwararrasyid5178
    @yuanwararrasyid5178 ปีที่แล้ว +1

    Kak kalo atributnya ada 3 ap bisa menggunakan metode KNN?

  • @syifafauziah7879
    @syifafauziah7879 2 ปีที่แล้ว +1

    Ka mau tanya klasifikasi detailnya gak ada ya yg menjelaskan, yang terklasifikasi apa saja

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Halo, maaf baru membalas 🙏
      Berdasarkan dataset yg digunakan, data terklasifikasi menjadi 2, yaitu 0 dan 1. Karena dataset tsb bermaksud utk menentukan apakah tumbuhan sudah perlu disiram berdasarkan moisture & temp-nya, maka dapat dikatakan bahwa label 0 berarti tanaman belum perlu disiram, sedangkan 1 berarti tanaman perlu disiram. Apakah seperti itu yg dimaksud? Semoga membantu 😊

    • @yourmine2922
      @yourmine2922 2 ปีที่แล้ว

      @@febbisenalestari jadi kak kesimpulannya tanaman harus disiram atau belom kak

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      @@yourmine2922 Tergantung hasil prediksi, kalau 0 berarti belum waktunya disiram, kalau 1 berarti sudah waktunya disiram

  • @kimroses14
    @kimroses14 ปีที่แล้ว +1

    kak, kalo di scaling datanya error itu gimana kak? soalnya udah ngikutin rumus kakak, terima kasih kak btw videonya sangat membantu😊❤

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Pesan errornya apa, Kak? ☺

    • @wahyukanaufaleila9195
      @wahyukanaufaleila9195 ปีที่แล้ว

      @@febbisenalestari AttributeError: 'StandardScaler' object has no attribute 'transforms' , gitu ka gmn ya?

    • @wahyukanaufaleila9195
      @wahyukanaufaleila9195 ปีที่แล้ว

      maaf kak udah bisa ternyata ketambahan satu s nya

  • @rezimaharani6140
    @rezimaharani6140 ปีที่แล้ว +1

    Mau tanya dong kak

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Silakan kak

    • @rezimaharani6140
      @rezimaharani6140 ปีที่แล้ว

      @@febbisenalestari kenapa saya waktu scalling data gak bisa yah katanya " tidak dapat mengubah string menjadi float: 'Kopi Durian Ukuran 200 g" kopi durian ini jenis produk yang saya upload kak gimana ya solusinya 🙏

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Karena scaling data hanya bisa dilakukan pada data numerik. Data string (kata/kalimat) tidak bisa

  • @lixaa3520
    @lixaa3520 4 หลายเดือนก่อน +1

    Kk itu kan kk x nya ada 2, misal yg x nya 4 gimana ya kk codingan untuk grafiknya

    • @febbisenalestari
      @febbisenalestari  4 หลายเดือนก่อน

      @@lixaa3520 Grafik untuk 4 atribut bisa pakai pair plot. Kalau mau tetap pakai scatter plot berarti harus dilakukan reduksi dimensi, salah satunya pakai algoritma PCA. Bisa coba dicari tau dulu tentang hal tersebut, disesuaikan dgn kebutuhan

  • @arismihadjami8764
    @arismihadjami8764 2 ปีที่แล้ว +1

    kalau hitung presisi dan recallnya codingannya gimana ka

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Bisa pake classification_report. Ada di menit 15:10

    • @arismihadjami8764
      @arismihadjami8764 2 ปีที่แล้ว

      Udah ka kurang teliti kemarin wkwk makasih ya ka :)

  • @SA-ARIEFADEIRAWAN
    @SA-ARIEFADEIRAWAN 2 ปีที่แล้ว +1

    buat yang p=2 di memanggil function knn itu fungsinya p=2 buat apa ka?

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      p itu power parameter dari metric yg digunakan. p = 2 itu parameter dari metric minkowski atau euclidean

  • @erlitasofhianti8041
    @erlitasofhianti8041 2 ปีที่แล้ว +1

    Kak mau tanya dong, mohon di respon yaa🙏🏻

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Mau tanya apa kak? Ku jawab sepemahamanku ya 😊

  • @afandikaputrasulistiya4328
    @afandikaputrasulistiya4328 ปีที่แล้ว +1

    kak mau tanya dpt dataset nya dimana?

  • @latifahayusafitri
    @latifahayusafitri ปีที่แล้ว +1

    kak kl datanya gada missing itu gapapa kah?

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Nggak ada missing gimana maksudnya? Nggak ada missing value kah? Dataset yang dipake untuk bikin model memang harus lengkap dan nggak ada yang missing kak. Kalau ada missing value harus di-preprocessing dulu

  • @adisyahputra3801
    @adisyahputra3801 2 ปีที่แล้ว +1

    assalamualaikum kak saya ada skripsi ini. saya mau nanya kak ini rumusahan maslah nya apa yah ?
    semoga fast respon terimakasih kak

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Waalaikumsalam
      Utk tutorial di atas aku cuma download dataset random di Kaggle, jadi nggak mengusung masalah apa2. Tapi kalau diliat dari datasetnya ttg Intelligent Irrigation System, ini tuh data untuk menentukan kapan tanaman akan diairi/disiram secara otomatis berdasarkan moisture & temp-nya. Jadi, pengairan otomatis ini digunakan utk mengatasi masalah pengairan di lahan pertanian/perkebunan, bisa karena keterbatasan air di daerah tsb sehingga penggunaan air harus bener2 di-manage, atau karena menghindari gagal panen akibat tanaman yg kekurangan/kelebihan air. Bisa juga karena jumlah tanaman yg banyak sehingga bakal makan waktu & tenaga kalau harus disiram secara manual. Kalau ttg kenapa milih KNN, KNN itu simpel, bisa melatih data dgn cepat, & efektif utk data training yg banyak.
      Apakah seperti itu yg ditanyakan? Semoga membantu kak

  • @sadako1316
    @sadako1316 2 ปีที่แล้ว +1

    Kak kok grafiknya error yah? Itu knp yah kak

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      Keterangan errornya apa kak?
      Biasanya karena ada typo pengetikan

    • @sadako1316
      @sadako1316 2 ปีที่แล้ว

      @@febbisenalestari kak metode ini bisa digunakan untuk, penerapan algoritma knn untuk prediksi tingkat resiko penyebaran covid 19??? Tolong kak dibantu jawab :(

    • @febbisenalestari
      @febbisenalestari  2 ปีที่แล้ว

      @@sadako1316 Secara konsep bisa kak, sama saja, tinggal menyesuaikan dengan bentuk data & jumlah kolom. Mungkin yang berbeda ada di bagian grafik karena dalam tutorial saya grafik tersebut untuk data dengan 2 atribut

  • @rramengvrl
    @rramengvrl ปีที่แล้ว +1

    kak kalau attribut class/labelnya sudah dicantumkan -1 tapi yg keluar malah atribut lain, dan y itu berisi dari atribut bukan class, maka harus di scalling atau tidak perlu?

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      -1 itu jika classnya berada di kolom paling kanan dataset. Kalau letak kolomnya tidak di situ tinggal disesuaikan saja. Yang pasti class tidak perlu di-scalling

  • @partoflife6963
    @partoflife6963 ปีที่แล้ว +1

    Kak mau nanya, mohon dijawab, apa bisa tutor kakak ini diterapkan untuk melakukan klasifikasi objek pada sebuah gambar? Mohon infonya kak

    • @febbisenalestari
      @febbisenalestari  ปีที่แล้ว

      Tutorial yang kubuat itu untuk dataset berbentuk tabel/dataframe, kalau untuk data gambar ada caranya sendiri karena beda karakteristik dataset.

    • @navessajulieth7878
      @navessajulieth7878 9 หลายเดือนก่อน

      ​@@febbisenalestari halo ka, bisa buat tutornya ngga ? makasi kaa