Dengan munculnya kemajuan dalam metode pembelajaran mesin, penambangan data, dan arsitektur komputer, metode ilmiah data telah menjadi pusat perhatian di banyak bidang studi interdisipliner dan bidang studi yang akan datang. Pada awalnya, hal ini mungkin tampak seperti pernyataan liar dari banyak teknokrat yang mencoba memaksakan teknologi baru untuk menyelesaikan permasalahan yang sudah disederhanakan. Lagi pula, untuk apa mencoba memperbaiki sesuatu yang tidak rusak? Namun, mengingat masa depan, dimana data diperkirakan akan berkembang berkali-kali lipat, studi di bidang informatika di bidang apa pun yang mengumpulkan banyak data adalah kebutuhan saat ini. Dalam artikel ini, saya akan fokus pada satu bidang tertentu: ilmu data dalam astronomi.

Pengamatan astronomi mengumpulkan banyak data

Biasanya, studi di bidang astronomi, bahkan sebelum astrofisika menjadi hal yang nyata, melibatkan pengamatan fisik terhadap objek di langit. Ahli astrofisika ternama pertama, Johannes Kepler, dengan data Tycho Brahe, dapat merumuskan hukum gerak planetnya dengan berulang kali mengamati lintasan planet-planet di tata surya kita. Terlintas dalam benaknya dalam proses pengamatan ini bahwa lintasan planet-planet tidak sesuai dengan model geometri lingkaran, meskipun pada saat itu ada kepercayaan umum bahwa semua planet bergerak dalam orbit melingkar.

Memikirkan hal ini hampir empat abad kemudian, saya terpaksa membayangkan proses mengungkap pengetahuan dari alam sebagai data yang cukup ilmiah. Kepler melakukan observasi, memplotnya pada grafik, dan mencoba berbagai model untuk menjelaskan bentuk lintasan. Pada saat itu, hukum gravitasi belum dirumuskan, jadi meskipun belum ada penjelasan yang masuk akal mengapa model heliosentris benar-benar berhasil, kita sudah mengetahui lintasan planet yang berbentuk elips. Satu abad kemudian, ketika Isaac Newton menetapkan hukum gravitasi, langsung terjadi rekonsiliasi antara gagasan yang sangat alami dan dapat dialami di sekitar kita, dan model matematika yang telah ditetapkan seratus tahun sebelumnya.

Saat ini, tentu saja, jumlah observatorium dan astronom observasi jauh lebih banyak. Hal ini mengakibatkan akumulasi berbagai jenis data dalam jumlah besar, dan volume data diperkirakan akan terus meningkat di tahun-tahun mendatang.

Di era di mana kita menyadari lonjakan yang akan datang, akan lebih bijaksana jika kita mengembangkan metode matematis, numerik, dan komputasi untuk memprosesnya.

Saat ini, kita memiliki teknologi untuk memperoleh berbagai jenis data

Satelit dan teleskop saat ini mampu melihat objek bintang dalam spektrum berbeda. Kami dapat menangkap data dalam spektrum optik, ultraviolet, dan inframerah, dan bahkan frekuensi radio.

Data berukuran terabyte hingga petabyte dikumpulkan dalam semua ini (dari survei seperti SDSS, AIS, GALEX, dll.). Pada bulan Oktober 2018, Teleskop Luar Angkasa James Webb, sebuah teleskop inframerah, dijadwalkan untuk diluncurkan. Hal ini diharapkan memungkinkan kita melihat alam semesta dengan cara yang belum pernah ada sebelumnya. Untuk menyusun semua data secara efektif menjadi informasi dan pengetahuan yang berguna, metode penambangan data, yang dirumuskan erat dengan fisika, diperlukan untuk memproses semua data ini secara bersamaan.

Dan kami juga memiliki perangkat keras untuk memproses semua data ini!

Peningkatan dalam komputasi terdistribusi dan komputasi klaster, serta komputasi awan telah berkembang pesat selama dua dekade terakhir! Selain itu, ada banyak insinyur yang terus berupaya untuk membuka potensi pemrosesan GPU. Perusahaan-perusahaan di balik kemajuan arsitektur tersebut, seperti Apache (untuk Spark dan Hadoop), dan NVIDIA (untuk GPU), dan lainnya seperti AWS untuk platform cloud (hanya beberapa di antaranya) bekerja keras untuk meningkatkan efektivitas kerangka kerja mereka, sehingga dapat dengan mudah digunakan untuk memproses aplikasi yang intensif dan big data.

Kesimpulan pemikiran

Dalam proses penemuan ilmu pengetahuan, ada lima tahapan utama yang perlu kita lalui:

  1. Kebutuhan untuk menemukan pengetahuan
  2. Membuat alat untuk menangkap data yang dibutuhkan
  3. Menggunakan alat yang dikembangkan untuk memperoleh data yang dibutuhkan
  4. Memproses data
  5. Penyimpulan ide dan fakta yang efektif setelah pengolahan data

Dalam bidang studi apa pun, proses ini bersifat siklus, dan kami terus berupaya mengungkap fakta tentang dunia di sekitar kami; dan dalam bidang ini, kita berada pada era sains yang krusial karena kita sedang mengalami perubahan paradigma dalam penggunaan alat yang dapat meningkatkan kecepatan dan jumlah komputasi secara signifikan.

Ilmu data dapat sangat mendukung langkah keempat, dan hal ini harus dipandang sebagai keuntungan dalam memajukan bidang astronomi. Infrastruktur komputasi yang lebih baik memungkinkan para astronom mengetahui lebih banyak tentang alam semesta kita melalui pengembangan sistem pakar yang bertanggung jawab.

Meski begitu, kita perlu memberikan ruang yang cukup untuk campur tangan manusia. Berbeda dengan penggunaan ML yang lebih umum saat ini dalam chatbot bantu, pendeteksi objek, peta, dll., sistem dalam astroinformatika harus menjalankan metode yang sejalan dengan pemahaman manusia tentang dunia di sekitar kita (dan ini adalah kasus dengan studi di bidang informatika di bidang apa pun). bidang ilmu pengetahuan alam). Oleh karena itu, fokusnya harus pada pengembangan sistem yang meningkatkan kemampuan manusia dan kemudian berfungsi secara independen, karena imajinasi manusia dan kekuatan inferensi mungkin tidak dapat diprogram.