bang saya mau nanya nih masih bingung pas labelingnya.. apakah target/output harus selalu 1 dimensi ?? terus kalo features/input harus selalu 2 dimensi bang??
Betul, sekumpulan nilai features selalu ditampung dalam numpy array 2 dimensi sedangkan sekumpulan nilai target selalu ditampung dalam numpy array 1 dimensi.
Penjelasan memang cukup sederhana. Tapi yang perlu diperhatikan adalah. Cara menganalisa nilai2 evaluasi akurasi, precision, recall, f1_score, mcc. Apa manfaat dan implikasinya bila score yg didapatkan dg nilai tertentu.
Pak, saya sudah nonton sampai sejauh ini dan sangat membantu & clear penjelasannya, mohon untuk dilanjutkan terus setelah sesi 16, untuk materi Machine Learning yang lebih advance dan penerapannya, terimakasih...
@@belajaridn siap Pak.... semangat terus, mungkin minta rekomendasinya setelah menamatkan sesi ini saya harus belajar kemana lagi untuk materi lanjutannya ya?
Terima kasih pak untuk ilmu dan tutorialnya sangat lengkap dan rinci. saya masih awam mengenai mechine learning, namun cukup banyak mendapatkan pencerahan dan pemahaman. izin request pak, untuk menambahkan dengan algoritma Neural Network Backpropagation 🙏
Sebelumnya saya mengucapkan Terima Kasih atas share ilmunya, Saya ingin bertanya kak, mechine learning itu bisa membuat suggest/saran yang seharusnya kita lakukan setelah pembuatan model? Regards,
27:52 pak izin bertanya nilai np.array dari X_test dan y_test itukan terdiri dari 4 datapoint ya? Nah 4 datapoint itu terserah dari kita apa gimana pak? Maksudnya jumlah datapoinnya kita yang tentukan sendiri atau gimana pak? Trus nilai2 yg [168, 65], [180, 96 ] dst kita juga yg menetukan sendiri ya pak?
Data points untuk materi ajar ini sengaja dibuat kecil agar konsep yang disampaikan bisa dipelajari dengan lebih mudah. Dalam real world scenario, jumlah data points nya bisa ribuan atau bahkan ratusan juta 😊
pak, izin bertanya: jika nilai target nya tidak hanya 2, misal 5. apakah tetap pakai LabelBinarizer? dan pada saat training model, terjadi error "ValueError: Found input variables with inconsistent numbers of samples..." terimakasih sebelumnya pak Budi
LabelBinarizer sesuai dengan namanya hanya untuk keperluan target label yang biner (hanya dua nilai). Untuk target label dengan nilai lebih dari dua bisa menggunakan fungsi lain.
mas mau nanya dong,kan MCC untuk test performa binary classifier, dalam kasus ku classifiernya ada 3, jadi nggak aku transform ke binary untuk kasus seperti itu apa bisa ya?
Pak apakah ada sumber bacaan di internet untuk cara membaca hasil dari evaluasi untuk model ML dari setiap fungsi yang digunakan? Selain dari Scikitlearn.
Misalkan untuk contoh kasus (tinggi, berat, jk) ditambah sebuah feature (parameter) yaitu usia, bagaimana caranya KNN dapat digunakan untuk memprediksi tinggi badan maksimum seseorang ? Terimakasih.
Untuk prediksi tinggi badan akan termasuk dalam regression task. Materi berikutnya akan membahas topik ini :) Saat ini materi sedang masuk tahap verifikasi untuk memastikan tidak terdapat kesahalan yang berpotensi menyesatkan :D
Kalau terkait perhitungan distance, Euclidean Distance bisa menangani lebih dari satu features :) Hanya saja untuk contoh di sini kita awali dengan dua features dulu.
Pak mau tanya, Kenapa waktu preprocessing data ketika coding nya " xtrain = np.array(sensus_df[['berat', 'tinggi',]]) " terus dilanjutkan prediksi dengan tinggi 155 ; berat badan = 70 hasilnya jadi pria Tapi, ketika code diatas saya sesuaikan dengan coding bapak yang ini " X_train = np.array(sensus_df[['tinggi', 'berat']]) " dengan prediksi tinggi dan berat badan sama hasilnya menjadi wanita Apakah posisi feature berpengaruh saat preprocessing seperti coding diatas Mohon pencerahanya pak Terima kasih 🙏🙏🙏🙏
Izin bertanya, Pak. Dari contoh dataset iris, ada total 150 data, 3 data-target/label. Nah dari 150 data itu, jumlah data untuk setiap label itu seimbang (50 data per label) dan akurasinya didapat diatas 80%. Misalkan kita mengumpulkan data sendiri, tetapi jumlah data untuk setiap label tidak berimbang, apa akan memengaruhi tingkat akurasinya? Jika iya, bagaimana solusinya kira-kira, ya, Pak? Terima kasih sebelumnya, Pak.
Izin tanya Pak Budi... Saya belum memperhatikan video tutorial di Pytonic Way atau struktur data Python seperti yang disarankan Pak Budi. Tapi apakah pungsi print(f'') ada penjelasannya di kedua video tersebut?Terima kasih sebelumnya Pak Budi
bang mau tanya di menit 17:40.. reshapenya kalo lebih dari 2 gimana ya?? itu kan pria dan wanita sedangkan data saya tentang agama, agama di data saya ada 7
Array pada menit tersebut perlu direshape karena hanya terdiri dari satu baris saja, sehingga array yg terbentuk adalah array 1D, padahal Scikit Learn membutuhkan sekumpulan nilai features dalam format array 2D.
Bisa, tetapi tentunya dengan jenis visualisasi yang sesuai. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas topik visualisasi data dengan Matplotlib. Semoga bisa bermanfaat 😊☕🙏
indonesia belajar .. di sistem saya tercatat historikal pasien..baik quantitatif maupun kualitatif... jadi scara logika bisa kita lihat kecendrungan pasien akan masuk ke kelompok pasien penyakit x atau y dst..inincontoh aja..dan bisa dilihat kecendrungan pemakaian obatnya apa...bisa dihubungkan ke perencanaan stok obat..demografi..dll...imajinasi aja batasannya
@@belajaridn ok p saya coba klik..maklum lah..saya agak gaptek sosmed.......😁😁😁... pas paparan materi ibu inggriani di bukalapak itu terkesan saya. istilah computational thinking....saya sendiri mmg cmn lulusan teknik mesin tapi mmg hobi komputer otodidak sejak smp kelas 1 ..dan..amaze juga ternyata belia pengguna LOGO dengan Turtle nya ...wkwkwk..programming saya pertama itu dan juga applesoft basic......pake Apple ][ e taon 85 ..😂😂...
bang, nilai target apakah selalu 2 nilai saja? apakah semisal nilainya tidak teratur seperti data berupa (1,2,3,4,5.....,x) bisa dijadikan sebagai nilai target?
Nilai target class nya tidak mesti dua mas, bisa juga lebih dari dua class ☺️☕🙏 Untuk kasus yang memang hanya memiliki dua class saja dikenal dengan istilah binary classification.
@@belajaridn kalau pakai lebih dari 2 bisa pakai apa ya bang? aku coba pakai label encoder di nilai target malah muncul "too many indices for array: array is 1-dimensional, but 2 were indexed". mohon pencerahannya bang😅
Kita bila load terlebih dahulu dataset nya ke dalam Pandas Dataframe. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas Pandas Dataframe.
Setelah modelnya kita training, maka model tersebut bisa kita deploy di production. Kebetulan kami pernah mengundang seorang machine learning engineer dari Gojek untuk berbagi insight terkait ini pada salah satu sesi podcast Indonesia Belajar. Semoga bisa membantu :)
Besok kami juga merilis sesi podcast bersama seorang Machine Learning Engineer dari Google Singapore untuk bahas topik ML Ops. Ini juga sangat terkait dengan pertanyaanmu tadi 😊☕
kak untuk penentuan nilai k nya ini apakah terserah kita atau ada metode khusus untuk menentukan nilai k nya kak? Soalnya bisa jadi setiap orang akan memilih nilai k yang berbeda2 Terima kasih kak
Di sini perlu dipahami dulu perbedaan antara classification task dan regression task. Cara melakukan evaluasi pada kedua task tersebut tentunya berbeda.
@@belajaridn setelah saya putar ulang saya mulai paham pak. Klasifikasi itu variabel labelnya harus kategori. Namun yang saya ambigu regresi variabel labelnya harus berupa floating point. Nah floating point ini yang bikin agak membingungkan bisa dijelaskan pak apa maksudnya ? Terima kasih.
Pak apakah data mining dan machine learning masih berhubungan? Soalnya saya lagi bljr data mining tapi kok di machine learning ada juga materinya ya? Sperti regresi linier, euclidean dll?
Pertanyaan bagus yang jawaban membutuhan pengetahuan dasar seputar numpy array. Kami cukup kesulitan untuk menjawab melalui komentar, untuk itu kami akan coba buatkan satu video singkat untuk menjawab pertanyaan ini.
Saya punya pertanyaan Pak, saat prediksi jenis kelamin, saat saya melakukan lb.inverse_transform(y_new), outputnya tetap array([1]), tetapi di tutorial bapak nilainya berubah menjadi menjadi array(['wanita']). Kok saya gak berubah ya pak?
Kami pernah jelaskan ini di playlist Pandas Data Frame. Coba cek playlist nya saja. Sebenarnya sebelum mempelajari Scikit Learn, kami selalu merekomendasikan untuk belajar Python Pandas terlebih dahulu 😊🙏
Jumlah neighbors akan bergantung pada data yang kita miliki. Lebih banyak neighbors tentunya akan membantu performa prediksi. Hanya saja, jumlah neighbors yang terlalu banyak juga dapat menurunkan performa. Di sini dibutuhkan experimentation dan familiarity dengan dataset yang kita miliki.
Sama-sama, coba simak juga beberapa sesi podcast seputar data science yang ada di channel Indonesia Belajar ini untuk mendapatkan gambaran yang lebih baik terkait data science di industri 😊☕
bang saya mau nanya nih masih bingung pas labelingnya.. apakah target/output harus selalu 1 dimensi ?? terus kalo features/input harus selalu 2 dimensi bang??
Betul, sekumpulan nilai features selalu ditampung dalam numpy array 2 dimensi sedangkan sekumpulan nilai target selalu ditampung dalam numpy array 1 dimensi.
@@belajaridn baik terimakasih banyak bang.. sukses selalu
Sama-sama, terima kasih untuk pertanyaan nya juga. Ini juga bakal ditanya mahasiswa saya di kampus juga :)
Penjelasan memang cukup sederhana. Tapi yang perlu diperhatikan adalah. Cara menganalisa nilai2 evaluasi akurasi, precision, recall, f1_score, mcc. Apa manfaat dan implikasinya bila score yg didapatkan dg nilai tertentu.
Terima kasih untuk masukannya 😊🙏
Mantap, baru bisa nyimak nih
Semoga bermanfaat ya. KNN untuk regression task juga sudah tersedia :)
Thank you bang. Akhirnya ngerti konsep nya.
Sama-sama, senang bisa membantu 😊☕🙏
penjelasannya sangat lengkap... mantap
Terima kasih, memang akan kami pergunakan untuk mengajar di kampus juga.
Semnoga bisa bermanfaat bagi banyak orang :)
Terima kasih pak, penjelasannya sangat mudah dimengerti, sehat selalu pak🙏
Senang bisa membantu 😊☕🙏
Pak, saya sudah nonton sampai sejauh ini dan sangat membantu & clear penjelasannya, mohon untuk dilanjutkan terus setelah sesi 16, untuk materi Machine Learning yang lebih advance dan penerapannya, terimakasih...
Baik, tapi belum bisa dalam waktu dekat mengingat load pekerjaan saya yang cukup tinggi sekarang ini 😅🙏
@@belajaridn siap Pak.... semangat terus, mungkin minta rekomendasinya setelah menamatkan sesi ini saya harus belajar kemana lagi untuk materi lanjutannya ya?
Saya sangat merekomendasikan untuk ambil beberapa kelas di Coursera.
Pak ijin untuk next video penjelasan classification menggunakan xgboost
Siap, saat ini saya masih menyiapkan materi terkait AdaBoost. Masih putar otak untuk menjelaskan dengan cara yang sesederhana mungkin.
tutorial mantul banget, mohon pak di bahas selanjutnya model klasifikasi yg sering di pakai di Indonesia C4.5 & Naive Bayes, hehehe...
Siap... Bertahap ya.
Setuju bgt C4.5 decision tree
Siap, bertahap ya. Kami mencoba menyusun materinya agar beginners friendly :)
wih kereen min , mungkin kalo ada versi jst atau ann sangat membantu
Saat ini kami coba fokuskan pada materi dasar machine learning terlebih dahulu 😊☕
Terima kasih pak untuk ilmu dan tutorialnya sangat lengkap dan rinci. saya masih awam mengenai mechine learning, namun cukup banyak mendapatkan pencerahan dan pemahaman. izin request pak, untuk menambahkan dengan algoritma Neural Network Backpropagation 🙏
Sama-sama, senang bisa membantu 😊☕🙏
Mantap! semangat terus bikin videonya!
Siap... Materi selanjutnya penerapan KNN pada regression tasks :)
@@belajaridn owh siapp betul karena divideo dibilang bisa 22nya ya
Betul mas :)
Ka, klo data nya berupa image classification yg disimpan di lokal disc. Untuk memasukan ke dataset dalam program bagaimana ya ka?
Kak request tutorial pemprograman menggunakan metode naive bayes dan seleksi fitur information gain kak
Bertahap ya, seri belajar ini memang ditujukan untuk memulai perjalanan dalam bidang machine learning :)
Pak izin bertanya, untuk model evaluasi, apa bedanya menggunakan r2_squared dengan accuracy_score
bang saya mau nanya bagaimana untuk mendeteksi data berikutnya adalah data anomali
Sebelumnya saya mengucapkan Terima Kasih atas share ilmunya, Saya ingin bertanya kak, mechine learning itu bisa membuat suggest/saran yang seharusnya kita lakukan setelah pembuatan model?
Regards,
27:52 pak izin bertanya nilai np.array dari X_test dan y_test itukan terdiri dari 4 datapoint ya? Nah 4 datapoint itu terserah dari kita apa gimana pak? Maksudnya jumlah datapoinnya kita yang tentukan sendiri atau gimana pak? Trus nilai2 yg [168, 65], [180, 96 ] dst kita juga yg menetukan sendiri ya pak?
Data points untuk materi ajar ini sengaja dibuat kecil agar konsep yang disampaikan bisa dipelajari dengan lebih mudah. Dalam real world scenario, jumlah data points nya bisa ribuan atau bahkan ratusan juta 😊
bang ada tutorial knn dengan database sql ngga ya bang klo bisa yg postgre atau yang lain juga gpp..
Topik SQL pernah kami bahas juga di channel Indonesia Belajar. Coba cek saja di daftar playlist kami.
pak, izin bertanya: jika nilai target nya tidak hanya 2, misal 5. apakah tetap pakai LabelBinarizer?
dan pada saat training model, terjadi error "ValueError: Found input variables with inconsistent numbers of samples..."
terimakasih sebelumnya pak Budi
LabelBinarizer sesuai dengan namanya hanya untuk keperluan target label yang biner (hanya dua nilai). Untuk target label dengan nilai lebih dari dua bisa menggunakan fungsi lain.
Bang boleh kah kasih demo untuk menggunakan K-NN untuk Image Classification, Butuh bantuan untuk tugas kuliah
Bang kalau error: No module name scipy.partial
solusinya gimana bang? padahal udah di uninstall/install&upgrade terbaru package scipynya
mas mau nanya dong,kan MCC untuk test performa binary classifier, dalam kasus ku classifiernya ada 3, jadi nggak aku transform ke binary untuk kasus seperti itu apa bisa ya?
Untuk classification, data target yang seimbang apa sangat mempengaruhi hasil akurasi prediksi?
Apakah bisa diperjelas apa yang dimaksud dengan data target yg berimbang di sini?
Pak apakah ada sumber bacaan di internet untuk cara membaca hasil dari evaluasi untuk model ML dari setiap fungsi yang digunakan? Selain dari Scikitlearn.
Saya sangat merekomendasikan buku ini: themlbook.com/
maaf, mau nanya, kalau klasifikasi fingerprint dengan KKN, bisa nggak, atau dengan library yg lain
Bisa dicoba sih mas. Perlu didefinisikan terlebih dahulu feature set nya dan juga target label nya 😊☕
apa KNN bisa menjadi model yang berperan sama untuk membangun garis lurus sama seperti LinearRegression?
KNN tidak menggunakan persamaan garis dalam melakukan prediksi, melainkan memanfaatkan nilai dari sejumlah data points terdekat (neighbours).
@@belajaridn terimakasih atas jawabannya.
Sama-sama, semoga membantu ya 😊🙏
Kak mau tanya, kalo metode KNN ini cocok buat regresi juga kah? Biasanya regresi itu berkaitan dengan prediksi harga, cuaca, gaji
KNN juga bisa diterapkan untuk regresi. Terkait efektifitas, tentunya akan sangat bergantung pada karakteristik dari dataset yang kita miliki 😊☕
Mas, kalau untuk prediksi jumlah wisatawan ataupun hasil keuntungan objek wisata. Pakai data apa saja yak ?,.
Tentunya menggunakan dataset terkait wisata mas :)
Misalkan untuk contoh kasus (tinggi, berat, jk) ditambah sebuah feature (parameter) yaitu usia,
bagaimana caranya KNN dapat digunakan untuk memprediksi tinggi badan maksimum seseorang ? Terimakasih.
Untuk prediksi tinggi badan akan termasuk dalam regression task. Materi berikutnya akan membahas topik ini :)
Saat ini materi sedang masuk tahap verifikasi untuk memastikan tidak terdapat kesahalan yang berpotensi menyesatkan :D
Kalau terkait perhitungan distance, Euclidean Distance bisa menangani lebih dari satu features :)
Hanya saja untuk contoh di sini kita awali dengan dua features dulu.
Pak mau tanya,
Kenapa waktu preprocessing data ketika coding nya " xtrain = np.array(sensus_df[['berat', 'tinggi',]]) " terus dilanjutkan prediksi dengan tinggi 155 ; berat badan = 70 hasilnya jadi pria
Tapi, ketika code diatas saya sesuaikan dengan coding bapak yang ini " X_train = np.array(sensus_df[['tinggi', 'berat']]) " dengan prediksi tinggi dan berat badan sama hasilnya menjadi wanita
Apakah posisi feature berpengaruh saat preprocessing seperti coding diatas
Mohon pencerahanya pak
Terima kasih 🙏🙏🙏🙏
Izin bertanya, Pak. Dari contoh dataset iris, ada total 150 data, 3 data-target/label. Nah dari 150 data itu, jumlah data untuk setiap label itu seimbang (50 data per label) dan akurasinya didapat diatas 80%. Misalkan kita mengumpulkan data sendiri, tetapi jumlah data untuk setiap label tidak berimbang, apa akan memengaruhi tingkat akurasinya? Jika iya, bagaimana solusinya kira-kira, ya, Pak? Terima kasih sebelumnya, Pak.
Izin tanya Pak Budi...
Saya belum memperhatikan video tutorial di Pytonic Way atau struktur data Python seperti yang disarankan Pak Budi. Tapi apakah pungsi print(f'') ada penjelasannya di kedua video tersebut?Terima kasih sebelumnya Pak Budi
Ini terkait f string, salah satu teknik pemformatan string di Python. Penjelasan detailnya ada di salah satu video dalam playlist Pythonic 😊☕
@@belajaridn siaaap
bang mau tanya di menit 17:40.. reshapenya kalo lebih dari 2 gimana ya?? itu kan pria dan wanita sedangkan data saya tentang agama, agama di data saya ada 7
Array pada menit tersebut perlu direshape karena hanya terdiri dari satu baris saja, sehingga array yg terbentuk adalah array 1D, padahal Scikit Learn membutuhkan sekumpulan nilai features dalam format array 2D.
Kak, bagaimana me-visualisasi data jika data features-nya lebih dari dua? Apa bisa?
Bisa, tetapi tentunya dengan jenis visualisasi yang sesuai. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas topik visualisasi data dengan Matplotlib. Semoga bisa bermanfaat 😊☕🙏
@@belajaridn Baik Kak. Terima kasih, ilmunya sangat bermanfaat ...
@@lathifahhanum3794 Sama-sama, senang bisa membantu 😊☕🙏
sepertinya cocok buat modeling karakter pasien ini ya pak..
....ayo kalau mau ikut riset....😁😁😁😁
indonesia belajar .. di sistem saya tercatat historikal pasien..baik quantitatif maupun kualitatif... jadi scara logika bisa kita lihat kecendrungan pasien akan masuk ke kelompok pasien penyakit x atau y dst..inincontoh aja..dan bisa dilihat kecendrungan pemakaian obatnya apa...bisa dihubungkan ke perencanaan stok obat..demografi..dll...imajinasi aja batasannya
@@belajaridn ok p saya coba klik..maklum lah..saya agak gaptek sosmed.......😁😁😁... pas paparan materi ibu inggriani di bukalapak itu terkesan saya. istilah computational thinking....saya sendiri mmg cmn lulusan teknik mesin tapi mmg hobi komputer otodidak sejak smp kelas 1 ..dan..amaze juga ternyata belia pengguna LOGO dengan Turtle nya ...wkwkwk..programming saya pertama itu dan juga applesoft basic......pake Apple ][ e taon 85 ..😂😂...
bang, nilai target apakah selalu 2 nilai saja? apakah semisal nilainya tidak teratur seperti data berupa (1,2,3,4,5.....,x) bisa dijadikan sebagai nilai target?
Nilai target class nya tidak mesti dua mas, bisa juga lebih dari dua class ☺️☕🙏
Untuk kasus yang memang hanya memiliki dua class saja dikenal dengan istilah binary classification.
@@belajaridn kalau pakai lebih dari 2 bisa pakai apa ya bang? aku coba pakai label encoder di nilai target malah muncul "too many indices for array: array is 1-dimensional, but 2 were indexed". mohon pencerahannya bang😅
Mestinya bisa mas. Coba cek lagi nilai parameter nya, apakah sudah oke semua?
bagaimana jika menggunakan dataset (exel/csv) pak? apakah codingannya sama? kalau misalnya beda, bedanya dibagian apa?🙏
Kita bila load terlebih dahulu dataset nya ke dalam Pandas Dataframe. Di channel Indonesia Belajar ini kami juga menawarkan satu seri pembelajaran khusus yang membahas Pandas Dataframe.
kalau untuk data testingnya diperoleh dari mana nggih pak? kok berbeda dengan data yg sudah ada(data training?
kak saya ingin bertanya bagaimana jika label tidak hanya dua selain pria dan wanita?, jadi kategori lebih dari 2
sedangkan untuk multiclass/label classification bagaimana ya kak?
Pak, jika KNN diterapkan pada dataset dengan kelas tidak seimbang, apakah akan menurunkan performanya?
Saya masih bingung sama konsep ML..
Misal kita udh dpt akurasi yg bagus.. terus whats next??
Gimna cara aplikasi in algoritma tersebut?
Setelah modelnya kita training, maka model tersebut bisa kita deploy di production. Kebetulan kami pernah mengundang seorang machine learning engineer dari Gojek untuk berbagi insight terkait ini pada salah satu sesi podcast Indonesia Belajar. Semoga bisa membantu :)
Makasih kak, akhirnya.. menemukan jalan..
Besok kami juga merilis sesi podcast bersama seorang Machine Learning Engineer dari Google Singapore untuk bahas topik ML Ops. Ini juga sangat terkait dengan pertanyaanmu tadi 😊☕
kak untuk penentuan nilai k nya ini apakah terserah kita atau ada metode khusus untuk menentukan nilai k nya kak? Soalnya bisa jadi setiap orang akan memilih nilai k yang berbeda2 Terima kasih kak
Penentuan nilai K ini sifatnya arbritary atau kita yang menentukan. Tentunya dengan melihat ketersediaan data.
Buset, tutorial gratis. Ada rencana bikin kelas khusus tutorial berbayar gak mas?
Sementara belum ada rencana mas. He3 masih mengandalkan donasi saja :)
Saya ingin bertanya kenapa evaluasi modelnya tidak ada menggunakan r2 (R squares) ?
Di sini perlu dipahami dulu perbedaan antara classification task dan regression task. Cara melakukan evaluasi pada kedua task tersebut tentunya berbeda.
@@belajaridn Bukannya sama-sama supervised learning ya pak lalu apa yang membedakan ?
Seharusnya sudah pernah kami jelaskan di video pertama terkait topik pengenalan Machine Learning mengenai perbedaan Regression dan Classification.
@@belajaridn ya pak coba saya dengarkan ulang
@@belajaridn setelah saya putar ulang saya mulai paham pak. Klasifikasi itu variabel labelnya harus kategori. Namun yang saya ambigu regresi variabel labelnya harus berupa floating point. Nah floating point ini yang bikin agak membingungkan bisa dijelaskan pak apa maksudnya ?
Terima kasih.
Pak apakah data mining dan machine learning masih berhubungan? Soalnya saya lagi bljr data mining tapi kok di machine learning ada juga materinya ya? Sperti regresi linier, euclidean dll?
Sangat erat mas hubungannya. Sebagian besar teknik dalam data mining juga berada dalam lingkup Machine Learning.
bang bisa jelaskan apa bedanya reshape(1, -1) dengan reshape(-1, 1) ?? saya masih bingung ini mohon pencerahannya
Pertanyaan bagus yang jawaban membutuhan pengetahuan dasar seputar numpy array. Kami cukup kesulitan untuk menjawab melalui komentar, untuk itu kami akan coba buatkan satu video singkat untuk menjawab pertanyaan ini.
@@belajaridn link video apakah ada pak?
Kebetulan belum saya buatkan videonya 🙏
Saya punya pertanyaan Pak, saat prediksi jenis kelamin, saat saya melakukan lb.inverse_transform(y_new), outputnya tetap array([1]), tetapi di tutorial bapak nilainya berubah menjadi menjadi array(['wanita']). Kok saya gak berubah ya pak?
Coba ditelusuri lagi mas code nya. Mesti ada kekeliruan :)
@@belajaridn iya, ada kekeliruan di saya, terimakasih ya Pak
@@farhanramadhan5924 Sama-sama mas, terus semangat belajar ya :)
@@belajaridn Siap Pak. Sekarang sedang belajar yang Machine learning video ke tujuh
Bang kalau import file .csv gimana ya?
Kami pernah jelaskan ini di playlist Pandas Data Frame. Coba cek playlist nya saja. Sebenarnya sebelum mempelajari Scikit Learn, kami selalu merekomendasikan untuk belajar Python Pandas terlebih dahulu 😊🙏
@@belajaridn Oke makasih ya bang
Sama-sama 😊🙏
Kak saya belum mengerti bagaimana cara menentukan nilai K? Dapat nilai 3 dari mana?
Jumlah neighbors akan bergantung pada data yang kita miliki. Lebih banyak neighbors tentunya akan membantu performa prediksi. Hanya saja, jumlah neighbors yang terlalu banyak juga dapat menurunkan performa. Di sini dibutuhkan experimentation dan familiarity dengan dataset yang kita miliki.
@@belajaridn Baik kak, terima kasih penjelasannya
Sama-sama, coba simak juga beberapa sesi podcast seputar data science yang ada di channel Indonesia Belajar ini untuk mendapatkan gambaran yang lebih baik terkait data science di industri 😊☕
2:36
Apakah datasetnya bisa file.sql ?
Sumber datasetnya bisa beragam, bisa csv, xls, sql, parquet, dan banyak lagi.
masi gangerti maksdnya 'tetangga' itu apa ? :(
Tetangga dalam konteks ini adalah data points yang posisinya berdekatan dengan data point of interest (yang sedang diamati).
@@belajaridn wahh makasih min gercep balesnya
Sama-sama, semoga bisa membantu 😊☕🙏
@@belajaridn pastinyaa dong