SCIKIT-LEARN (PHYTON)

 

🔷 APA ITU SCIKIT-LEARN?

Scikit-Learn (atau sering disingkat sklearn) adalah sebuah library open-source untuk machine learning di Python. Library ini menyediakan berbagai algoritma dan tools yang mudah digunakan untuk melakukan analisis data, pemodelan prediktif, klasifikasi, regresi, clustering, dan preprocessing data.


🔷 SEJARAH SINGKAT

  • Scikit-Learn mulai dikembangkan pada tahun 2007 oleh David Cournapeau.

  • Berdasarkan SciPy ecosystem (NumPy, SciPy, matplotlib), dan dirilis secara resmi pada tahun 2010.

  • Sekarang menjadi salah satu library machine learning paling populer di Python.


🔷 FITUR UTAMA SCIKIT-LEARN

1. 📚 Beragam Algoritma Machine Learning

  • Supervised learning: regresi linear, regresi logistik, decision trees, random forests, support vector machines (SVM), k-nearest neighbors (KNN), dll.

  • Unsupervised learning: clustering (K-means, DBSCAN), PCA, dimensionality reduction.

  • Model selection: cross-validation, grid search hyperparameter tuning.

2. 🔧 Preprocessing Data

  • Normalisasi, standarisasi, encoding kategori, imputasi nilai hilang.

  • Pipeline untuk menggabungkan beberapa tahap preprocessing dan modeling.

3. ⚙️ API yang Konsisten dan Mudah

  • Semua estimator (model, transformer) memiliki interface yang sama: .fit(), .predict(), .transform().

  • Mudah dipelajari dan digunakan.

4. 🛠️ Integrasi dengan Ekosistem Python

  • Cocok dipadukan dengan NumPy, pandas, matplotlib untuk analisis dan visualisasi.


🔷 MENGAPA SCIKIT-LEARN POPULER?

  • Ringan dan mudah dipakai, cocok untuk pemula maupun profesional.

  • Dokumentasi sangat lengkap dan tutorial banyak.

  • Cepat untuk prototyping model machine learning klasik.

  • Tidak fokus pada deep learning, tapi sangat solid untuk machine learning tradisional.


🔷 CONTOH KODE SEDERHANA DENGAN SCIKIT-LEARN

python
from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score # Load dataset Iris iris = load_iris() X = iris.data y = iris.target # Split data train-test X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Buat model Random Forest model = RandomForestClassifier(n_estimators=100) # Latih model model.fit(X_train, y_train) # Prediksi y_pred = model.predict(X_test) # Evaluasi akurasi print("Akurasi:", accuracy_score(y_test, y_pred))

🔷 RINGKASAN

AspekKeterangan
PengembangKomunitas open-source
Tahun Rilis2010
Bahasa UtamaPython
FokusMachine learning tradisional (klasifikasi, regresi, clustering)
KelebihanMudah digunakan, API konsisten, dokumentasi lengkap
PenggunaanPrototipe ML, analisis data, pembelajaran mesin klasik

Post a Comment

0Comments

Post a Comment (0)