Tahap Persiapan Data (Data Preparation) dalam Data Mining | Pembelajaran Daring Kolaboratif (PDK)

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 ธ.ค. 2024

ความคิดเห็น •

  • @mariadhawe1462
    @mariadhawe1462 11 หลายเดือนก่อน

    Terima kasih pak,atas penjelasannya sangat membantu🙏

  • @nandadevipusparini4587
    @nandadevipusparini4587 11 หลายเดือนก่อน

    videonya sangat membantu sekali dan mudah di pahami

  • @lutfirizaldimahida2405
    @lutfirizaldimahida2405 11 หลายเดือนก่อน

    Terima kasih atas materi yang diberikan saya jadi lebih memahami bagaimana cara mempersiapkan data!

  • @isnanwijayakusuma2865
    @isnanwijayakusuma2865 11 หลายเดือนก่อน

    CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah metodologi populer yang digunakan dalam data mining. Tahapan dalam CRISP-DM adalah sebagai berikut:
    1. **Pemahaman Bisnis (Business Understanding):**
    - Tujuan: Memahami masalah bisnis yang akan dipecahkan dan kebutuhan stakeholder.
    - Kegiatan: Mengidentifikasi tujuan proyek, menentukan kriteria keberhasilan, dan mengumpulkan informasi awal.
    2. **Pemahaman Data (Data Understanding):**
    - Tujuan: Mengumpulkan data yang relevan untuk proyek.
    - Kegiatan: Mengumpulkan data yang diperlukan, mengeksplorasi struktur data, dan memahami karakteristik variabel.
    3. **Persiapan Data (Data Preparation):**
    - Tujuan: Menyiapkan data untuk analisis lebih lanjut.
    - Kegiatan: Membersihkan data, mengatasi nilai-nilai yang hilang, melakukan transformasi, dan memformat data.
    4. **Modeling:**
    - Tujuan: Membangun model yang sesuai dengan tujuan proyek.
    - Kegiatan: Memilih dan menerapkan teknik pemodelan, membagi data menjadi set pelatihan dan pengujian, dan menghasilkan model.
    5. **Evaluasi (Evaluation):**
    - Tujuan: Mengevaluasi kinerja model dan memutuskan apakah model tersebut memenuhi kriteria keberhasilan.
    - Kegiatan: Mengukur kinerja model, menilai kecocokannya dengan tujuan, dan jika perlu, melakukan penyesuaian model.
    6. **Penerapan (Deployment):**
    - Tujuan: Mengimplementasikan model dalam produksi atau lingkungan bisnis.
    - Kegiatan: Menyiapkan model untuk produksi, mengintegrasikannya dengan sistem yang ada, dan memberikan panduan untuk penggunaan.
    7. **Pemeliharaan (Maintenance):**
    - Tujuan: Menjaga kinerja model seiring waktu dan mengadaptasikannya terhadap perubahan yang mungkin terjadi.
    - Kegiatan: Memantau kinerja model, mengatasi isu-isu yang muncul, dan memperbarui model jika diperlukan.
    Tahapan ini membentuk siklus iteratif, dan kesuksesan satu tahap dapat mempengaruhi tahapan lainnya. Metodologi ini memberikan kerangka kerja yang sistematis untuk mengelola proyek data mining dari awal hingga akhir.
    ======================================================
    [CONTOH]
    Tahapan nomor 2 dari metodologi CRISP-DM, yaitu "Pemahaman Data (Data Understanding)," melibatkan pengumpulan data yang relevan untuk proyek. Dalam konteks Sales Forecasting menggunakan metode Simple Exponential Smoothing (SES), Double Exponential Smoothing (DES), dan Triple Exponential Smoothing (TES), tahapan ini dapat dijelaskan sebagai berikut:
    **Contoh Tahapan Nomor 2 (Pemahaman Data):**
    1. **Identifikasi Data yang Diperlukan:**
    - Tentukan variabel-variabel yang diperlukan untuk melakukan peramalan penjualan, seperti tanggal penjualan dan jumlah penjualan.
    2. **Pengumpulan Data:**
    - Kumpulkan data historis penjualan yang mencakup periode waktu yang relevan. Misalnya, data harian atau bulanan penjualan selama beberapa tahun terakhir.
    3. **Eksplorasi Data:**
    - Lakukan eksplorasi awal terhadap data untuk memahami struktur dan karakteristiknya.
    - Identifikasi pola musiman, tren, atau pola lain yang mungkin memengaruhi penjualan.
    4. **Pemahaman Variabel:**
    - Tinjau setiap variabel yang terlibat dalam peramalan, seperti variabel waktu dan variabel target (jumlah penjualan).
    - Analisis statistik awal dapat membantu memahami distribusi dan perilaku variabel.
    5. **Penanganan Data yang Hilang atau Anomali:**
    - Identifikasi dan tangani nilai-nilai yang hilang atau anomali dalam data penjualan.
    - Tentukan apakah diperlukan imputasi atau perbaikan data.
    6. **Penyiapan Data untuk Model:**
    - Persiapkan data dengan memformatnya ke dalam struktur yang sesuai dengan persyaratan model peramalan.
    - Jika diperlukan, buat variabel dummy atau lakukan transformasi data.
    7. **Divisi Data:**
    - Pisahkan data menjadi dua bagian: satu untuk melatih model (training set) dan satu untuk menguji model (testing set).
    - Pastikan bahwa data pada training set mencakup periode yang mencerminkan pola yang ingin diidentifikasi oleh model.
    Tahapan ini memungkinkan pemahaman yang lebih baik tentang data yang akan digunakan untuk melatih dan menguji model peramalan penjualan menggunakan metode Simple Exponential Smoothing, Double Exponential Smoothing, dan Triple Exponential Smoothing.