ADIKARA 2024 - Data Mining Competition! 🏆 Kompetisi ini bertujuan untuk mengasah keterampilan analisis data dalam memprediksi Food Price Index dengan dataset spatiotemporal.
- 🌟 Latar Belakang
- 🎯 Tujuan
- 📂 Struktur Repository
- 📊 Dataset
- 📏 Metrik Evaluasi
- 🚀 Alur Penyelesaian
- 📘 Notebook 1 - Pelatihan Model
- 📗 Notebook 2 - Prediksi Submission
- 📑 Format Submission
- 💻 Cara Menjalankan
- 🛠️ Prasyarat
- 📂 File Pendukung
- 🌐 Teknologi yang Digunakan
- 🔮 Kesimpulan
Untuk membaca, menganalitis dan menangani data spatiotemporal. Dengan dataset berbasis indeks harga pangan, lalu mengembangkan model yang mendukung pengambilan keputusan terkait data tersebut.
- Mengaplikasikan Data dan Machine Learning
- Meningkatkan teknis dalam data mining
- Mendukung pengambilan keputusan berbasis data
adikara2024-datamining/
├── Notebook File/
│ ├── Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb
│ └── Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb
├── Submission File/
│ ├── submission_Manusia Pelupa_ADIKARA2024.csv
│ └── test_adikara2024_unlabeled.csv
├── adikara2024-datamining/
│ ├── train_adikara2024.csv
│ └── sample_submission_adikara2024.csv
├── LICENSE
├── README.md
└── ...
File | Deskripsi |
---|---|
train_adikara2024.csv |
Data pelatihan dengan label Food Price Index |
test_adikara2024_unlabeled.csv |
Data uji tanpa label, digunakan untuk prediksi |
sample_submission_adikara2024.csv |
Contoh format file submission untuk leaderboard |
⚠️ Catatan: Pastikan untuk Menggunakan data dengan benar.
Menggunakan Symmetric Mean Absolute Percentage Error (sMAPE):
Semakin kecil nilai sMAPE, semakin baik prediksi modelnya.
- 📥 Eksplorasi Data
- 🛠️ Pre-processing & Feature Engineering
- 🧠 Pemodelan
- 📊 Evaluasi Model dengan sMAPE
- 💾 Eksport Model Terbaik
- 🔍 Prediksi Data Uji
- 📝 Generate Submission File
Nama File: Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb
Notebook ini mencakup:
- Eksplorasi data (
train_adikara2024.csv
) - Pre-processing (menangani nilai hilang, encoding, dsb.)
- Pelatihan model dengan algoritma seperti Random Forest, XGBoost, dll.
- Evaluasi model menggunakan sMAPE
- Eksport model terbaik
Nama File: Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb
Notebook ini mencakup:
- Membaca file
test_adikara2024_unlabeled.csv
- Mengimpor model terbaik dari Notebook 1
- Pre-processing data uji
- Memprediksi Food Price Index
- Menghasilkan file submission (
submission_Manusia Pelupa_ADIKARA2024.csv
)
Berikut format yang harus digunakan untuk file submission:
id,FoodPriceIndex
122,20.5
123,21.7
124,19.8
-
Clone repository ini:
git clone https://github.com/YourUsername/adikara2024-datamining.git cd adikara2024-datamining
-
Siapkan lingkungan Python (opsional):
python -m venv env source env/bin/activate # Untuk Linux/Mac env\Scripts\activate # Untuk Windows pip install -r All_Requirements.txt
Pastikan Anda memiliki:
- Python 3.8 atau lebih baru
- Library utama seperti
pandas
,numpy
,scikit-learn
,xgboost
, dll. - Jupyter Notebook untuk menjalankan
.ipynb
file
File/Fungsi | Deskripsi |
---|---|
requirements.txt |
Daftar library yang diperlukan untuk menjalankan kode |
sample_submission.csv |
Template untuk format submission |
train.csv |
Dataset pelatihan dengan label |
test.csv |
Dataset uji tanpa label |
- Python 🐍
- Jupyter Notebook 📓
- Machine Learning (Random Forest, XGBoost, dll.) 🤖
- Pandas & Numpy untuk analisis data 📊
- Matplotlib & Seaborn untuk visualisasi 📈
-
Jalankan notebook dengan Jupyter:
jupyter notebook
-
Ikuti instruksi pada
Notebook1
danNotebook2
untuk pelatihan serta prediksi.
ADIKARA 2024 - Data Mining Competition memberikan saya peluang luar biasa untuk meningkatkan kemampuan analisis data spatiotemporal dan machine learning. Dengan memanfaatkan metrik evaluasi seperti sMAPE, saya dapat mengembangkan model prediksi yang akurat dan relevan🚀