Clock Magic Wand Quran Compass Menu
Image Jaja Jamaludin

Regresi dalam Sains Data

Eduaksi | 2024-04-24 06:53:39

Regresi dalam sains data adalah teknik analisis data yang digunakan untuk memprediksi nilai yang tidak diketahui dengan menggunakan nilai data lain yang terkait dan diketahui. Ada dua jenis regresi yang umum digunakan: regresi linier dan regresi logistik.

Regresi linier menganggap bahwa hubungan antara fitur dan target adalah linier, sedangkan regresi logistik digunakan untuk memprediksi probabilitas dari sebuah kelas dalam klasifikasi biner. Regresi linier memodelkan hubungan antara variabel dependen dan independen dengan menggunakan kombinasi linier, sedangkan regresi logistik adalah algoritme klasifikasi yang tidak dapat memprediksi nilai aktual untuk data kontinu.

Regresi linier memiliki tujuan untuk menemukan suatu fungsi yang memodelkan data dengan meminimalkan error atau selisih antara nilai prediksi dengan nilai sebenarnya. Untuk menggunakan regresi, data harus memenuhi kriteria seperti eksogenitas, linieritas, varians error yang konstan, dan autokorelasi untuk data time series.

Regresi digunakan untuk berbagai jenis bisnis, seperti analisis data untuk memprediksi penjualan produk, prediksi harga saham, dan lain-lain. Pemilihan algoritma regresi yang tepat harus disesuaikan dengan jenis data dan kondisi bisnis yang tersedia. Sumber data yang digunakan dalam algoritma regresi dapat berasal dari berbagai sumber, seperti data internal perusahaan, data eksternal, data sensor, data dari media sosial, dan data dari internet.

Perbedaan antara regresi linier dan regresi logistik terletak pada jenis variabel dependen yang digunakan. Regresi linier digunakan untuk variabel dependen yang berskala data, sementara regresi logistik digunakan untuk variabel dependen yang bersifat dikotomik atau biner. Regresi linier memodelkan hubungan linier antara variabel independen dan variabel dependen, sedangkan regresi logistik adalah algoritme klasifikasi yang digunakan untuk memprediksi probabilitas dari kelas dalam klasifikasi biner. Regresi logistik tidak dapat memprediksi nilai aktual untuk data kontinu, sementara regresi linier dapat digunakan untuk memprediksi nilai kontinu.

 

Disclaimer

Retizen adalah Blog Republika Netizen untuk menyampaikan gagasan, informasi, dan pemikiran terkait berbagai hal. Semua pengisi Blog Retizen atau Retizener bertanggung jawab penuh atas isi, foto, gambar, video, dan grafik yang dibuat dan dipublished di Blog Retizen. Retizener dalam menulis konten harus memenuhi kaidah dan hukum yang berlaku (UU Pers, UU ITE, dan KUHP). Konten yang ditulis juga harus memenuhi prinsip Jurnalistik meliputi faktual, valid, verifikasi, cek dan ricek serta kredibel.

Berita Terkait

Copyright © 2022 Retizen.id All Right Reserved

× Image