Pertemuan 10 - Klastering Data dengan K-Means menggunakan Python | Python Data Mining 2021 | K-MEANS
ฝัง
- เผยแพร่เมื่อ 18 พ.ค. 2021
- Kuliah Online Data Mining tentang Klastering Data dengan K-Means dan Implementasi Aplikasi Data Mining sederhana menggunakan pemrograman Python. Mudah belajar Python untuk Data Mining.
Download data yang digunakan (Dataku.txt):
drive.google.com/file/d/1hTLW...
Download data yang digunakan (Konsumen.csv):
drive.google.com/file/d/1aR8d...
Terimakasih sudah mengikuti kuliah online & tutorialnya.
Subscribe, Share, Like dan Comment jika dirasa bermanfaat, untuk terus mendukung channel ini.
Kunjungi video perkuliahan lainnya di:
/ juntazeniarja
#KuliahOnline #DiRumahAja #SamaSaya #DataMining #DataMining2021 #DataMiningBasic #DataMiningIndonesia #DataMiningTutorial #DataMiningRapidminer #DataMiningClassification #DataMiningConcept #DataMiningAlgorithm #DataMiningTechniques #DataMiningBusiness #Rapidminer #RapidminerStudio #RapidminerIndonesia #RapidminerBasics #RapidminerTutorial #RapidminerAutoModel #RapidminerDataMiningTutorial #Python #DataScience #DataScience2021 #DataScienceIndonesia #JuntaZeniarja
Keren videonya kak
terimakasih pak, sangat membantu👍
sama-sama. terus dukung dan support ya
ijin sy download ya materinya untuk latihan.. saya subscribe dan sy doakan bapak sehat selalu. ditunggu pencerahan berikutnya. terimakasih
Silahkan mas
Lanjut terus pak dengan cpntoh kasus , insya allah sy pantau terus :) . Trims ilmunya
Dtggu utk sesi selanjutnya mas. Semoga bermanfaat..
@@juntazen siap nanti sy bawa satu kelas kesini pak nongkrongin chanel bapak :)
ijin bertanya pak, seandainya data cluster diisikan datanya misalkan sesuai contoh diawal gajih :1000, pengeluatran:2000 , untuk menambahkan data ini kmeans = KMeans(n_clusters=2)
bagaimana caranya pak
dengan menambahkan data pada baris terakhir di dataframe bisa dengan cara ini :
dataku.loc[len(dataku)] = [input("Input Gaji = "), input("Input Pengeluaran = ")]
bisa dicek disini:
colab.research.google.com/drive/1trA1a7TrXBHdQYNAQhjlbrh9DNoi79xn?usp=sharing
Pak, maaf mau bertanya apakah perulangan untuk mencari dari centroid awal hingga centroid akhir beserta prosesnya bisa digunakan dalam file .csv? jika bisa, bagaimana ya pak contohnya?
terima kasih pak sebelumnya
bisa dibuatkan formulanya di excel kak, nanti bisa dibuat sendiri sesuai dengan perhitungan di video
pak mau tanya, untuk mengetahui hasil data apa saja yg masuk ke cluster tsb bagaimana ya?
bisa menggunakan : print(kmeans.labels_), dicek disini mb => colab.research.google.com/drive/11enMbQNfqU3SxCClZLOVmYKb92kyOkg-?usp=sharing
Mohon maaf, izin bertanya pak. Jika kita ingin tahu, list yang masuk kedalam cluster 1, cluster 2, dst caranya bagaimana ya pak? Terima kasih sebelumnya
bisa menggunakan : print(kmeans.labels_), dicek disini mb => colab.research.google.com/drive/11enMbQNfqU3SxCClZLOVmYKb92kyOkg-?usp=sharing
@@juntazen Baik, terima kasih banyak Pak atas jawabannya, sangat membantu
pak mau bertanya, untuk dataku.txt itu dataset tentang apa ya?
dataset sampel klastering
ijin bertanya pak, apakah pada titik-titik di hasil clustering itu bisa diubah jadi nama datanya? misalnya saya pakai dataset yg isinya: nama, penghasilan, dan pengeluaran. jadi nantinya hasil clustering bisa nunjukin misalnya di titik paling atas ada "nama orang A", "nama orang B", dst
bisa ditambahkan text mas, misal dengan pyplot.text, bisa dipelajari pada dokumentasi matplotlib disini : matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.text.html
@@juntazen terima kasih pak, sudah bisa
Pak numpang nanya, kalau data ada beberapa file bisa di Cluster tidak pak? Terima kasih pak
bisa, tetapi sebaiknya waktu pengolahan dijadikan satu
pak mau nanya, kalau penerapannya menggunakan satu dimensi data, itu alur pemrogramannya jadi bagaimana pak?
Kalau untuk satu dimensi data itu kurang maksimal dalam hal klasterisasinya, sehingga biasanya minimal menggunakan 2 dimensi data yang digunakan. Kalau utk contoh alur pemrogramannya tinggal diganti untuk seleksi kolomnya saja.
Pak misalkan kita mau mengklasterkan produk laku dan tidak laku, berarti k=2 ya pak ? Untuk menentukan k itu apakah ada ketentuan yg baku pak ?
bisa menggunakan *Elbow Method* untuk menentukan K yang terbaik
Izin bertanya pak. Bolehkah materi yang bapak bawakan saya jdikan skripsi? Tentunya dengan data yang berbeda.
Boleh. Silahkan dikembangkan kembali
Apa ini bisa dibuat ke tampilan web menggunakan streamlit pak?
bisa mas
pak boleh request materi clustering kmedoid pak
Terus dukung channel ini utk berkembang, semoga segera terealisasi request nya.
Kalo boleh buat konten " Penerapan metode fuzzy c-means pada python" Kak
ditunggu nanti ya kak, masuk antrian playlist dl, dukung terus agar selalu konsisten buat video-video pembelajaran yg bgs, terimakasih.
pak, video pertemuan 4, 8, 9 nya ko disembunyikan?
Bukan disembunyikan tetapi tdk dibuat oleh saya tp tim lain.
pak aplikasi apa aja yg diperlukan
bisa langsung menggunakan Google Colabs secara cloud (colab.research.google.com/) atau bisa menginstal terlebih dahulu python dan Anaconda untuk bisa menggunakan jupyter notebook atau jupyter lab.
Pak boleh minta source codenya pak
bisa dicek disini mas => drive.google.com/drive/folders/1u3SoMpVfFsjFYNQVQ8MpN-qOGaejjNpN?usp=sharing