Berikut adalah rangkuman singkat namun on-point tentang materi yang diminta:
📊 1. Regresi
- Pengertian: Teknik statistik untuk memodelkan hubungan antara variabel independen dan dependen.
- Konsep: Menghitung garis terbaik yang meminimalkan kesalahan antara prediksi dan data aktual (metode kuadrat terkecil).
- Cocok untuk: Data kontinu dengan hubungan linier antara variabel.
- Kelebihan: Sederhana, mudah diinterpretasikan.
- Kelemahan: Tidak efektif untuk data non-linier atau dengan banyak outlier.
🌳 2. Decision Tree
- Pengertian: Model prediktif berbentuk pohon untuk klasifikasi atau regresi.
- Konsep: Membagi dataset berdasarkan atribut menggunakan aturan keputusan (misalnya, Gini Index atau Entropy).
- Cocok untuk: Data kategorikal dan numerik.
- Kelebihan: Mudah dipahami, bekerja dengan data campuran.
- Kelemahan: Rentan terhadap overfitting.
📊 3. Hierarchical Clustering
- Pengertian: Metode klasterisasi untuk mengelompokkan data dalam hierarki.
- Konsep: Menggabungkan atau memecah kelompok data berdasarkan kemiripan.
- Cocok untuk: Data tanpa label dengan hubungan hierarkis.