Skip to content

Repository ini berisi partisipasi saya dalam kompetisi ADIKARA 2024 - Data Mining Competition. Repository ini terkait mengembangkan model prediksi Food Price Index menggunakan dataset spatiotemporal.

License

Notifications You must be signed in to change notification settings

Arfazrll/Data-Mining-Competition

Repository files navigation

🌟 ADIKARA 2024 - Data Mining Competition

ADIKARA 2024 Banner

ADIKARA 2024 - Data Mining Competition! 🏆 Kompetisi ini bertujuan untuk mengasah keterampilan analisis data dalam memprediksi Food Price Index dengan dataset spatiotemporal.


📋 Daftar Isi


🌟 Latar Belakang

Untuk membaca, menganalitis dan menangani data spatiotemporal. Dengan dataset berbasis indeks harga pangan, lalu mengembangkan model yang mendukung pengambilan keputusan terkait data tersebut.


🎯 Tujuan

  • Mengaplikasikan Data dan Machine Learning
  • Meningkatkan teknis dalam data mining
  • Mendukung pengambilan keputusan berbasis data

📂 Struktur Repository

adikara2024-datamining/
├── Notebook File/
│   ├── Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb
│   └── Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb
├── Submission File/
│   ├── submission_Manusia Pelupa_ADIKARA2024.csv
│   └── test_adikara2024_unlabeled.csv
├── adikara2024-datamining/
│   ├── train_adikara2024.csv
│   └── sample_submission_adikara2024.csv
├── LICENSE
├── README.md
└── ...

📊 Dataset

File Deskripsi
train_adikara2024.csv Data pelatihan dengan label Food Price Index
test_adikara2024_unlabeled.csv Data uji tanpa label, digunakan untuk prediksi
sample_submission_adikara2024.csv Contoh format file submission untuk leaderboard

⚠️ Catatan: Pastikan untuk Menggunakan data dengan benar.


📏 Metrik Evaluasi

Menggunakan Symmetric Mean Absolute Percentage Error (sMAPE):

sMAPE Formula

Semakin kecil nilai sMAPE, semakin baik prediksi modelnya.


🚀 Alur Penyelesaian

  1. 📥 Eksplorasi Data
  2. 🛠️ Pre-processing & Feature Engineering
  3. 🧠 Pemodelan
  4. 📊 Evaluasi Model dengan sMAPE
  5. 💾 Eksport Model Terbaik
  6. 🔍 Prediksi Data Uji
  7. 📝 Generate Submission File

📘 Notebook 1 - Pelatihan Model

Nama File: Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb

Notebook ini mencakup:

  • Eksplorasi data (train_adikara2024.csv)
  • Pre-processing (menangani nilai hilang, encoding, dsb.)
  • Pelatihan model dengan algoritma seperti Random Forest, XGBoost, dll.
  • Evaluasi model menggunakan sMAPE
  • Eksport model terbaik

📗 Notebook 2 - Prediksi Submission

Nama File: Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb

Notebook ini mencakup:

  • Membaca file test_adikara2024_unlabeled.csv
  • Mengimpor model terbaik dari Notebook 1
  • Pre-processing data uji
  • Memprediksi Food Price Index
  • Menghasilkan file submission (submission_Manusia Pelupa_ADIKARA2024.csv)

📑 Format Submission

Berikut format yang harus digunakan untuk file submission:

id,FoodPriceIndex
122,20.5
123,21.7
124,19.8

💻 Cara Menjalankan

  1. Clone repository ini:

    git clone https://github.com/YourUsername/adikara2024-datamining.git
    cd adikara2024-datamining
  2. Siapkan lingkungan Python (opsional):

    python -m venv env
    source env/bin/activate  # Untuk Linux/Mac
    env\Scripts\activate   # Untuk Windows
    pip install -r All_Requirements.txt

🛠️ Prasyarat

Pastikan Anda memiliki:

  • Python 3.8 atau lebih baru
  • Library utama seperti pandas, numpy, scikit-learn, xgboost, dll.
  • Jupyter Notebook untuk menjalankan .ipynb file

📂 File Pendukung

File/Fungsi Deskripsi
requirements.txt Daftar library yang diperlukan untuk menjalankan kode
sample_submission.csv Template untuk format submission
train.csv Dataset pelatihan dengan label
test.csv Dataset uji tanpa label

🌐 Teknologi yang Digunakan

  • Python 🐍
  • Jupyter Notebook 📓
  • Machine Learning (Random Forest, XGBoost, dll.) 🤖
  • Pandas & Numpy untuk analisis data 📊
  • Matplotlib & Seaborn untuk visualisasi 📈

  1. Jalankan notebook dengan Jupyter:

    jupyter notebook
  2. Ikuti instruksi pada Notebook1 dan Notebook2 untuk pelatihan serta prediksi.


🔮 Kesimpulan

ADIKARA 2024 - Data Mining Competition memberikan saya peluang luar biasa untuk meningkatkan kemampuan analisis data spatiotemporal dan machine learning. Dengan memanfaatkan metrik evaluasi seperti sMAPE, saya dapat mengembangkan model prediksi yang akurat dan relevan🚀


About

Repository ini berisi partisipasi saya dalam kompetisi ADIKARA 2024 - Data Mining Competition. Repository ini terkait mengembangkan model prediksi Food Price Index menggunakan dataset spatiotemporal.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published