Machine learning adalah aplikasi kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan algoritma untuk meniru cara manusia belajar yang secara bertahap meningkatkan akurasinya. Machine learning atau ML berfokus pada pengembangan program komputer yang dapat mengakses data dan menggunakannya untuk belajar sendiri.
Proses pembelajaran dimulai dengan pengamatan atau data, seperti pengalaman langsung, atau instruksi untuk mencari pola dalam data dan membuat keputusan yang lebih baik di masa depan berdasarkan contoh yang kita berikan. Tujuan utamanya adalah untuk memungkinkan komputer belajar secara otomatis tanpa campur tangan atau bantuan manusia serta menyesuaikan tindakan yang sesuai.
Baca Juga: Apa Itu Artificial Intelligence?
Namun, dengan menggunakan algoritma klasik machine learning, teks dianggap sebagai urutan kata kunci; sebaliknya, pendekatan berdasarkan analisis semantik meniru kemampuan manusia untuk memahami makna sebuah teks.
Machine learning adalah komponen penting dari bidang ilmu data yang berkembang. Melalui penggunaan metode statistik, algoritma dilatih untuk membuat klasifikasi atau prediksi, mengungkap wawasan utama dalam proyek data mining. Wawasan ini selanjutnya mendorong pengambilan keputusan dalam aplikasi dan bisnis, yang idealnya memengaruhi metrik pertumbuhan utama.
Karena big data akan terus tumbuh dan berkembang, permintaan pasar akan data scientist juga akan meningkat sehingga mengharuskan mereka untuk membantu dalam mengidentifikasi pertanyaan bisnis yang paling relevan dan selanjutnya membutuhkan data untuk menjawabnya.
Istilah-Istilah dalam Machine Learning
- Model: Juga dikenal sebagai "hipotesis", model machine learning adalah representasi matematis dari proses dunia nyata. Algoritma machine learning bersama dengan data pelatihan membangun model machine learning;
- Fitur: Fitur adalah properti atau parameter terukur dari kumpulan data;
- Feature Vector: Ini adalah satu set beberapa fitur numerik. Kita dapat menggunakannya sebagai masukan ke model machine learning untuk tujuan pelatihan dan prediksi;
- Training: Sebuah algoritma mengambil satu set data yang dikenal sebagai "training data" sebagai input. Algoritma machine learning menemukan pola dalam data input dan melatih model untuk hasil yang diharapkan (target). Keluaran dari proses training adalah model machine learning;
- Prediksi: Setelah model machine learning siap, model dapat dimasukkan dengan data input untuk memberikan output yang diprediksi;
- Target (Label): Nilai yang harus diprediksi oleh model machine learning disebut target atau label;
- Overfitting: Ketika sejumlah besar data melatih model machine learning, model tersebut cenderung belajar dari noise dan entri data yang tidak akurat. Di sini model gagal melakukan karakterisasi data dengan benar;
- Underfitting: Ini adalah skenario ketika model gagal menguraikan tren yang mendasari dalam data input. Ini menghancurkan keakuratan model machine learning. Secara sederhana, model atau algoritma tidak cukup cocok dengan data.
Cara Kerja Machine Learning
Ada tiga bagian dalam sistem algoritma machine learning, yaitu:
- Decision process: Secara umum, algoritma machine learning digunakan untuk membuat prediksi atau klasifikasi. Berdasarkan beberapa data input, yang dapat diberi label atau tidak, algoritma Anda akan menghasilkan perkiraan tentang suatu pola dalam data;
- Loss function: Loss function berfungsi untuk mengevaluasi prediksi model. Jika ada contoh yang diketahui, loss function dapat membuat perbandingan untuk menilai keakuratan model;
- Model optimization process: Jika model dapat cocok dengan titik data dalam training set, bobot disesuaikan untuk mengurangi perbedaan antara contoh yang diketahui dan estimasi model. Algoritma akan mengulangi proses evaluasi dan pengoptimalan ini, kemudian memperbarui bobot secara mandiri hingga ambang batas akurasi terpenuhi.
Metode Machine Learning
Klasifikasi machine learning terbagi dalam tiga kategori utama, yakni:
Supervised learning
Supervised learning ditentukan oleh penggunaan kumpulan data berlabel untuk melatih algoritma yang mengklasifikasikan data atau memprediksi hasil secara akurat. Saat data input dimasukkan ke dalam model, bobotnya akan disesuaikan hingga model dipasang dengan tepat. Ini terjadi sebagai bagian dari proses validasi silang untuk memastikan bahwa model menghindari overfitting atau underfitting.
Supervised learning dapat membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar, seperti mengklasifikasikan spam dalam folder terpisah dari kotak masuk Anda. Beberapa metode yang digunakan dalam supervised learning meliputi neural networks, nave bayes, linear regression, logistic regression, random forest, Support Vector Machine (SVM), dan masih banyak lagi.
Mau Berita Terbaru Lainnya dari Warta Ekonomi? Yuk Follow Kami di Google News dengan Klik Simbol Bintang.
Penulis: Patrick Trusto Jati Wibowo
Editor: Puri Mei Setyaningrum
Tag Terkait: