Kalau pada data numerical bagaimana ya ? kalau di contoh video kan fitur umur sudah ada pengelompokan 40. Nah kalau data nya benar2 numerikal seperti 10, 20, 30, 40, 50, 60 dll gitu bagaimana ya ? apakah dilakukan pengelompokkan ? jika iya bagaimana caranya ? Terimakasih
Halo mas, saya sangat tertarik dengan penjelasan nya. Saya juga udah baca bukunya mas Irwan sudah sangat jelas sekali. saya ingin bertanya, dari pengaman mas rian, kan untuk menyeleksi atribut tersebut ada banyak metode (chi square, feature importance, correlation matrix with heatmap, forward selection & backward) atau juga SVM, ANN, PSO dan Information Gain. Manakah yang paling bagus digunakan dan alasannya Mas? Semoga Mas Irwan membaca pertanyaan ini ya Mas. Salam Sehat
Mau nanya bang, kalo dataset yg kita punya belum punya class/label itu gimana.. Apa dataset itu bener" ga bisa digunakan buat algoritma knn, apa harus di klusterisasi untuk mendapatkan class nya
bang, saya barusan ngitung information gain dan hasilnya masing masing 0.253, 0.095, 0.029. Apakah bisa memprediksi dengan nilai tersebut? kok kelihatannya kecil banget ya bang nilainya?
Coba totalin semua information gain yg kamu dapat berdasarkan berapa banyak atribut yg kamu punya. Kalau hasilnya 1 berarti uda cocok itu. Interval nya memang dari 0 - 1.
information gain memang rentang nilainya segitu, karena didapatkan dari entropi yang punya range nilai 0 - 1. Lebih mudah sebenernya ngitung information gain berdasarkan entropi jumlah kelas - weighting average atribute.
Mantap penjelasannya
Kalau pada data numerical bagaimana ya ? kalau di contoh video kan fitur umur sudah ada pengelompokan 40. Nah kalau data nya benar2 numerikal seperti 10, 20, 30, 40, 50, 60 dll gitu bagaimana ya ? apakah dilakukan pengelompokkan ? jika iya bagaimana caranya ? Terimakasih
Saran: Speed sebaiknya dikurangi pada bagian tertentu
Halo mas, saya sangat tertarik dengan penjelasan nya. Saya juga udah baca bukunya mas Irwan sudah sangat jelas sekali. saya ingin bertanya, dari pengaman mas rian, kan untuk menyeleksi atribut tersebut ada banyak metode (chi square, feature importance, correlation matrix with heatmap, forward selection & backward) atau juga SVM, ANN, PSO dan Information Gain.
Manakah yang paling bagus digunakan dan alasannya Mas?
Semoga Mas Irwan membaca pertanyaan ini ya Mas.
Salam Sehat
tergantung kasusnya mas. ga bisa klaim ini lebih bagus atau itu lbh bagus.
Gila.. Keren sih
metode K-NN apakah termasuk juga pak ?
Gan, jika information gain digunakan untuk seleksi atribut sekaligus menentukan root untuk ID3 apakah bisa ?
tentu saja bisa. karena sebenarnya IG itu untuk memberikan peringkat. dan peringkat teratas adalah root.
kak mau tanya, untuk information gain untuk analisis sentiment gmn ya?
uda dapat jawabannya kak?
Kalau kasusnya klasifikasi teks dengan term sebagai feature gimana ya mas?
ud dapat jawabannya bang?
@@saraswatiyogaandriyani8182 sudah
@@tyoistyo boleh dibantu caranya bang?
kalo boleh tau gmn bg bentuk tabelnya? terimakasih sebelumnya
@@tyoistyo kak boleh dishare caranya kah?
bang gimana jika semua entropiynya nilainya 0 kecuali total ?
iya bang, gimana kalo semua nilai entropi nya 0? kecuali total nya? apa bisa dilanjut?
information gain dan mutual information itu sama ya bang?
iya betul sama. lebih lengkapnya bisa cek di sini machinelearningmastery.com/information-gain-and-mutual-information/
@@Irwansight tapi bang waktu saya ngitung pakai cara abang, dan saya pakai library mutual info dari sklearn hasilnya beda bang
Mau nanya bang, kalo dataset yg kita punya belum punya class/label itu gimana..
Apa dataset itu bener" ga bisa digunakan buat algoritma knn, apa harus di klusterisasi untuk mendapatkan class nya
bisa pake teknik crowdsourcing atau klaster dulu di awal untuk dapet kelasnya
@@Irwansight kek k-means gitu ya? Buat video klastering dong bang
@@Irwansight dapetin dataset repository yg udah punya label dimana bang
@@kouseigaming23 di UCI Repository juga banyak
@@Irwansight terima kasih sudah dibalas
bang, saya barusan ngitung information gain dan hasilnya masing masing 0.253, 0.095, 0.029. Apakah bisa memprediksi dengan nilai tersebut? kok kelihatannya kecil banget ya bang nilainya?
Coba totalin semua information gain yg kamu dapat berdasarkan berapa banyak atribut yg kamu punya. Kalau hasilnya 1 berarti uda cocok itu. Interval nya memang dari 0 - 1.
@@yorisgarfield9988 barusan saya jumlahin hasilnya cuma 0.377, apakah ini akan akurat?
information gain memang rentang nilainya segitu, karena didapatkan dari entropi yang punya range nilai 0 - 1. Lebih mudah sebenernya ngitung information gain berdasarkan entropi jumlah kelas - weighting average atribute.
cari aja jurusan kebidanan