Cleaning Data Menggunakan Pandas Tutorial Machine Learning Bahasa Indonesia
ฝัง
- เผยแพร่เมื่อ 4 ต.ค. 2024
- Cleaning data merupakan langkah awal yang harus dilakukan sebelum data tersebut melalui proses training dalam pembuatan model. Data yang dilakukan cleaning akan dilakukan proses seperti cek missing data, drop data, drop attribut sampai encoding nilai pada data. Pada video ini akan membahas bagaimana cara melakukan cleaning data menggunakan pandas, python dan library lainnya.
Selamat Belajar!
=============================================================
sumber data : drive.google.c...
Saya sangat beretimakasih buat masnya 🙏🏽 karena mas udh mau sharing ilmu bahkan sama data prakteknya.. jujur baik bgt 🙏🏽 semoga berkah selalu hidupnya dan channel ini semakin banyak pengikutnya. Semangat konten terus mas 🔥🔥🔥
Terimakasihh banyak, semoga membantu
SANGAT BERMANFAAT SELALU BIKIN KONTEN YA BG INSYALLAH PENONTON SETIA
siap, jangan lupa subscribe like dan share yah ^_^
Semngat mas bikin konten nya.
Saya sudah subscribe.
Semoga semakin berkembang.
terima kasih dukungannya
Alhamdulillah nemu channel ini, channel baru kayaknya. Auto subscribe bang. Thank you Ilmunya :)
Terima kasih gan ^_^
kak saya mau mengganti dan mengidentifikasi data biar lebih rapi dan singkat gitu kak. misal pada suatu row gtu datanya banyak ("apel","pisang", anggur") itu mau saya ganti jadi baris 'Buah-buahan' dengan menggunakan python via google colab. rumus syntax nya seperti apa ya kak?
apakah mksutnya mau dijadikan tabel?
kalo iya coba pakai pandas, misal
import pandas as pd
data = ['apel','jeruk','mangga',.......]
df = pd.DataFrame(data,columns=['Nama_buah'])
@@elektroprogramming iya kak dijadikan tabel
Ada kontak yg bisa dihubungi ngga kak?
bang bisa tolong dishare kembali script nya sama video sblmnya yg mana ya bang
Di tutorial ini kak link nya th-cam.com/video/Q9Kg1XIfZ2o/w-d-xo.htmlsi=JepyhBw3NOMr2p9A
mau nanya mas, kalau datanya beragam gimana ya? misal kek nama dan alamat? kan datanya beragam tuh? klo cuman gender kan paling 0 dan 1 aja, nah klo untuk kasus data beragam kek nama dan alamat itu gimana ya?
Kalau seperti alamat , tidak bisa di lakukan label encoding secara langsung. Kecuali sudah di pisahkan seperti provinsi , kecamatan , dll. Harus dibuat manual. Tapi jika alamat tidak dipakai untuk proses selanjutnya maka dibiarkan saja.
Kayak buat tutor dong gimana cara mendeteksi dataset yang kotor atau tidak
Menariikk, saya siapkan dulu ya
@@elektroprogramming mantab ka setujuu
kenapa ya saya error saar df.drop??
Cek syntax nya lagi dan variable nya disesuaikan
bagaimana dengan data outlier pak?
Data outlier di bisa di drop saja
Karena bisa mengganggu saat fitting model
Kalo librarynya pake pandas aja bisa ga ka?
bisa tapi tidak sampai visualisasi data dan juga tidak bisa melakukan proses yang lebih advance seperti encoding, scaling, dll