Làm sạch dữ liệu trước khi xây dựng mô hình Machine Learning | Data Cleaning in Python
ฝัง
- เผยแพร่เมื่อ 9 ก.พ. 2025
- Data Cleaning là công việc chiếm thời gian nhiều nhất đối với một người DA/DS. Chiếm khoảng 70-80% công suất làm việc. Vì vậy Data Cleaning là phần rất quan trọng và không thể thiếu. Cùng theo dõi video để biết cơ bản về Data Cleaning như thế nào nhé!
Dataset: drive.google.c...
Contact:
Zalo +84869156147
Facebook: / rinnguyen0905
cám ơn Rin Nguyễn đã chia sẽ kiến thức về xử lí dữ liệu. Bạn diễn giải rất dễ hiểu, và chi tiết . Chúc Rin Nguyễn thật nhiều sức khỏe, và có thêm kiến thức hay để chia sẻ đến mọi người .
Cảm ơn bạn vì chiếc video thật tuyệt vời :))))
Tks bạn đã ủng hộ nà
cho em hỏi trong xử lý dữ liệu về khách hàng khi thu thập được trong vài tỉnh 1 số người chỉ viết tên đường 1 số người viết tên quận và tỉnh và 1 số người chỉ viết tên tỉnh thì xử lý dữ liệu như thế nào để làm sạch ạ
15:38 df4 = df3.copy(), cái df3 là cũ nên phải dùng cái df3[~df3['total_sqft'].........
anh có thể sửa chi tiết đoạn code đó được k ạ e cũng đang bị lỗi đoạn đó
A ơi em muốn hỏi trước khi sử dụng PCA em dùng minmaxscaler được k ạ hay nhất định phải dùng standardscaler
thả tym
a ơi cho e hỏi với ạ: với dữ liệu thời tiết dạng numeric thì nên xử lý như thế nào ạ?
code đoạn từ 15:15-15:40 bị lỗi giờ fix như nào vậy ạ
A ơi, nếu với dữ liệu lớn thì làm cách nào ạ?
Big data thì nghĩ đến Hadoop or Spark nha
Xin bài áp dụng lamda. Xem vid quấn quá
Thanks anh. Mình có để dataset phần mô tả ạ