Clock Magic Wand Quran Compass Menu
Image Jaja Jamaludin

Sains Data Holistic

Eduaksi | Thursday, 11 Apr 2024, 06:49 WIB

Banyak keterbatasan ilmu data saat ini muncul dari fakta sederhana bahwa ilmu data bukanlah ilmu yang sebenarnya (Donoho, 2017). Atau, mungkin harus kita katakan, belum menjadi ilmu pengetahuan. Wikipedia mendefinisikan sains sebagai: usaha sistematis yang membangun dan mengatur pengetahuan dalam bentuk penjelasan yang dapat diuji dan prediksi tentang alam semesta” .Meski di dalam data pasti ada pengetahuan (konten intelektual). Sains, sebagian besar dipinjam dari statistik dan ilmu komputer. Namun, tidak ada konsensus tentang apa yang merupakan elemen penting dari ilmu data di luar kesatuan statistik dan

ilmu Komputer. Survei sepintas tentang silabus beberapa dari sekian banyak jurusan dan gelar ilmu data program menunjukkan keragaman fokus, seperti yang dikemukakan sebelumnya oleh Donoho (2017). Tentu saja ada, biasanya merupakan topik inti yang mencakup akuisisi data, pengelolaan data, pemrosesan data, dan penyesuaian model dengan algoritme otomatis seperti pembelajaran mesin. Dua perkumpulan profesional besar, Association for Computing Machinery (ACM) dan American Statistical Association (ASA) telah mendukung pedoman kurikulum yang memuat inti ini

topik (Danyluk et al., 2019; De Veaux et al., 2017, masing-masing). Namun, banyak ilmu data

kurikulum gagal memberikan perhatian yang cukup pada motivasi awal yang memunculkan ilmu data—

yaitu perhatian terhadap:

• tujuan pengumpulan data,

• silsilah dan kualitas data,

• makna yang terkandung dalam data,

• validasi model – di luar pemisahan pelatihan/pengujian pada satu kumpulan data,

• penerapan solusi berkelanjutan yang memberikan hasil nyata, dan

• mengkomunikasikan temuan-temuan utama dalam mengatasi masalah awal.

Kami mengusulkan pendekatan holistik terhadap pendidikan ilmu data yang sangat didasarkan pada ilmu pengetahuan metode. Pandangan kami tentang ilmu data holistik memiliki kesamaan dengan diskusi Donoho (2017) tentang data yang lebih besar ilmu pengetahuan (GDS). Hal ini juga dapat dilihat sebagai penerapan disiplin ilmu Statistika yang sedang berkembang Rekayasa (lihat www.ISEA-change.org) hingga Ilmu Data.

Secara khusus, kita mendefinisikan ilmu data holistik sebagai pendekatan interdisipliner terhadap masalah berbasis data pemecahan masalah dan penemuan pengetahuan, yang menerapkan metode ilmiah pada setiap fase siklus hidup pemecahan masalah, mulai dari definisi masalah hingga verifikasi keberlanjutan solusi. Untuk mengajarkan hal ini,

kurikulum ilmu data holistik harus membahas bidang-bidang berikut:

1. Motivasi, definisi masalah dan konteks. Analisis data harus dimotivasi oleh suatu tujuan—

meskipun tujuannya hanyalah menemukan prediksi yang baik versus memahami sebab dan akibat hubungan (Shmueli 2010). Dan itu harus ditempatkan dalam konteks yang jelas di mana hal itu diharapkan untuk melamar dan menginformasikan.

Aplikasi ilmu data yang baik memecahkan masalah yang dijelaskan dengan jelas atau menjawab pertanyaan tertentu. Ini adalah kerja keras yang harus dilakukan sebelum menerapkannyaalat otomatis. Dan itu adalah beberapa materi yang paling sulit dipelajari dan dipelajari oleh siswa menginternalisasi.

2. Data asal dan silsilah. Analisis yang paling canggih tidak ada gunanya jika dijadikan dasar data yang lemah (Knett & Redman, 2019).

Konteks masalah yang ingin diatasi memberi informasi penilaian tentang relevansi dan kualitas data yang diperlukan. Terlalu sering kita melihat data analisis dilakukan secara membabi buta; diterapkan pada data yang tidak sesuai atau penuh dengan kesalahan dan kesenjangan. Sebaliknya, siswa sering kali diberikan data rapi yang siap untuk dimasukkan ke dalam algoritma canggih melewatkan langkah penting dalam bekerja dengan data nyata. Siswa harus belajar mendokumentasikan sumber data mereka dan silsilah. Dan—yang lebih penting lagi—meragukan kesehatan data mereka. Kami berpendapat bahwa data harus dianggap “bersalah sampai terbukti tidak bersalah”.

3. Inferensi ilmiah.

Ini adalah analisis yang langka (dan lemah) yang hanya berlaku pada data yang ada. Siswa harus belajar untuk menghormati dan secara cerdas menggunakan inferensi statistik dan lainnya metode konfirmasi seperti validasi silang. Mereka harus siap untuk memposisikan analisis mereka dalam konteks pemahaman ilmiah atau bisnis yang lebih luas. Hasil yang berbeda dengan hasil lainnya hasil yang terkait memerlukan pandangan yang skeptis, perhatian yang lebih besar, dan (kemungkinan) data yang lebih baik.

4. Interaksi dan keputusan mesin manusia.

Analisis harus merupakan kolaborasi antar manusia analis dan algoritma komputer, dengan algoritma yang berfungsi sebagai alat untuk digunakan manusia. Analis manusialah yang mampu beradaptasi dengan perubahan keadaan dan memahami batasannya model, memahami keterbatasan kumpulan data, mengevaluasi luar biasa dan terpencil nilai-nilai dan mengoreksi, mengecualikan, atau memperhitungkannya, dan memahami kemungkinan yang tidak diinginkan konsekuensi dari model apa pun yang mengoptimalkan satu kriteria.

5. Etika.

Konsekuensi etis dari analisis ilmu data semakin terungkap— biasanya merugikan para analis dan analis. Sekali lagi, kita tidak bisa mengandalkan algoritma dan harus melatih siswa kita untuk berpikir dan berperilaku etis serta menerapkan prinsip-prinsip tersebut pada diri mereka bekerja. Siswa harus diajari untuk bertanya mengapa analisis dilakukan dan mempertimbangkannya konsekuensi etis dari jawabannya.

6. Pemecahan Masalah.

Ya, kita perlu mengajarkan coding, algoritma pembelajaran mesin, dan data besar masalah. Namun hal tersebut tidak boleh menjadi fokus utama silabus Ilmu Data seperti halnya kalkulus harus menjadi fokus utama kurikulum fisika. Mereka adalah alat, dan siswa harus menjadi alatnya penggunanya yang mudah—tetapi pertama-tama mereka harus mempelajari alasan dan cara menggunakannya. Memecahkan masalah yang ada, dengan memberikan solusi berkelanjutan yang menghasilkan dampak nyata, adalah hal yang utama ukuran keberhasilan. Model Netflix, yang dibahas di atas, memenangkan kompetisi bernilai jutaan dolar, dan Meskipun beberapa elemen solusi digunakan oleh Netflix, solusi tersebut tidak menyelesaikan masalah asli Netflix masalah, dan model lengkap tidak pernah diterapkan. Faktanya, keseluruhan model bisnis Netflix segera berubah setelahnya. Haruskah ini dianggap sukses atau gagal?

Disclaimer

Retizen adalah Blog Republika Netizen untuk menyampaikan gagasan, informasi, dan pemikiran terkait berbagai hal. Semua pengisi Blog Retizen atau Retizener bertanggung jawab penuh atas isi, foto, gambar, video, dan grafik yang dibuat dan dipublished di Blog Retizen. Retizener dalam menulis konten harus memenuhi kaidah dan hukum yang berlaku (UU Pers, UU ITE, dan KUHP). Konten yang ditulis juga harus memenuhi prinsip Jurnalistik meliputi faktual, valid, verifikasi, cek dan ricek serta kredibel.

Berita Terkait

 

Tulisan Terpilih


Copyright © 2022 Retizen.id All Right Reserved

× Image