Bangun Model AI Anda Sendiri untuk Berkontribusi

Simulasi biomedis, bidang interdisipliner yang menggabungkan ilmu komputer, matematika, fisika, biologi, dan kedokteran, memiliki potensi besar untuk penelitian medis. Dengan menerapkan simulasi komputer pada sistem dan proses biologis, simulasi biomedis mengatasi keterbatasan ilmu eksperimental. Hal ini memungkinkan kita mengungkap fenomena baru, mengajukan dan menguji hipotesis, serta merancang pengobatan penyakit yang inovatif. Artikel ini mengeksplorasi dunia simulasi biomedis yang menarik dan menunjukkan bagaimana individu dengan sedikit pengetahuan pengkodean dapat berkontribusi pada perluasan pengetahuan manusia.

Contoh Penerapan Simulasi Biomedis

Simulasi biomedis memanfaatkan kekuatan model AI untuk mengatasi permasalahan biomedis yang menantang dan sulit ditangani secara eksperimental. Berikut beberapa aplikasi penting:

  1. Skrining Virtual untuk Mengidentifikasi Kandidat Obat Potensial: Skrining virtual menggunakan metode AI untuk menyaring database senyawa yang luas dan mengidentifikasi kandidat obat potensial. Pendekatan ini secara signifikan mengurangi waktu dan biaya dibandingkan dengan metode penyaringan eksperimental tradisional. Teknik seperti docking molekuler, simulasi dinamika molekuler, dan algoritma pembelajaran mesin digunakan untuk memprediksi afinitas dan kemanjuran pengikatan senyawa terhadap protein target. Misalnya, dalam penelitian yang diterbitkan dalam Journal of Medicinal Chemistry [1], skrining virtual digunakan untuk mengidentifikasi potensi penghambat SARS-CoV-2 (virus penyebab COVID-19).
  2. Memprediksi Interaksi dan Efek Obat: Simulasi biomedis membantu memprediksi bagaimana obat bermolekul kecil berinteraksi dengan protein atau enzim target, serta bagaimana obat diserap, didistribusikan, dimetabolisme, dan dikeluarkan oleh tubuh. Prediksi ini membantu mengoptimalkan struktur obat, dosis, dan jadwal pemberian dosis, sehingga meningkatkan kemanjuran dan mengurangi efek samping.
  3. Menilai Toksisitas Obat dan Hasil Uji Klinis: Model simulasi membantu memprediksi potensi toksisitas kandidat obat, sehingga memungkinkan peneliti menghilangkan kandidat berbahaya di awal proses pengembangan. Selain itu, simulasi biomedis dapat memprediksi hasil uji klinis, memungkinkan desain uji coba yang lebih efisien dan keputusan yang tepat dari badan pengatur.

Simulasi biomedis menawarkan peluang bagi individu untuk terlibat dalam penelitian biomedis mereka sendiri dengan membangun model AI. Bahkan mereka yang memiliki pengetahuan coding dasar pun dapat memberikan kontribusi yang berharga. Mari kita jelajahi contoh penelitian terbaru.

Pemeriksaan Virtual untuk Mengidentifikasi Potensi Penghambat SARS-CoV-2

Dalam penelitian tersebut [1], para peneliti menggunakan pemeriksaan virtual untuk mengidentifikasi potensi penghambat SARS-CoV-2. Dengan menganalisis sifat kimia dan konfigurasi molekul 3D, simulasi ini menentukan afinitas dan kemanjuran pengikatan molekul obat terhadap virus. Studi ini berhasil mengidentifikasi beberapa kandidat obat yang menjanjikan dari database senyawa yang luas, menunjukkan kekuatan simulasi biomedis dalam mempercepat penemuan obat.

Seperti yang diilustrasikan pada Gambar 1, para peneliti memperoleh nilai afinitas pengikatan molekuler dan data kemanjuran medis dari rumus kimia molekul obat dan konfigurasi molekul 3D.

Dalam penelitian ini, memiliki ikatan yang kuat antara calon molekul obat dan segmen protein target (yaitu SARS-CoV-2 dari COVID-19 di sini) adalah fungsi tujuan simulasi AI dalam penyaringan virtual.

Keempat kandidat molekul obat ditunjukkan pada Gambar 2. Seperti yang dapat dilihat, ukuran molekul-molekul ini cukup tepat agar dapat masuk dengan baik ke dalam rongga target protein SARS-CoV-2 dan, pada saat yang sama, memungkinkan mereka untuk berikatan dengan domain asam amino penting untuk memblokir situs aktif SARS-CoV-2, melalui kombinasi ikatan hidrogen, interaksi penumpukan π−π, dan interaksi ikatan halogen antara molekul obat tamu dan asam amino kritis. protein inang SARS-CoV-2.

Dalam kasus E01, ikatan hidrogen antara atom oksigen karbonil E01 dan proton Glu 166 dari SARS-CoV-2 serta interaksi tumpukan π−π antara cincin aromatik E01 dan 41 SARS-CoV-Nya 2 diidentifikasi per simulasi AI.

Demikian pula, dalam kasus E19, ikatan hidrogen antara atom oksigen karbonil E19 dan proton Glu 166 dari SARS-CoV-2, serta interaksi susunan π−π antara cincin aromatik E19 dan His 41 dari SARS-CoV-2, ditambah interaksi ikatan halogen antara atom klorin E19 dan Gly 143 dari SARS-CoV-2, diidentifikasi berdasarkan simulasi AI.

Dalam kasus E20, terdapat interaksi penumpukan π−π antara cincin aromatik E20 dan His 41 dari SARS-CoV-2 serta ikatan hidrogen antara atom oksigen karbonil E20 dan proton Glu 166 dari SARS. -CoV-2 diidentifikasi per simulasi AI.

Demikian pula, dalam kasus E25, ikatan hidrogen antara atom oksigen karbonil E25 dan proton Glu 166 dari SARS-CoV-2 serta interaksi penumpukan π−π antara cincin aromatik E25 dan katalitik His 41 dari SARS-CoV-2, ditambah ikatan hidrogen antara gugus nitril E25 dan proton Cys 44 dari SARS-CoV-2 diidentifikasi berdasarkan simulasi AI.

Basis data besar senyawa yang digunakan mencakup basis data ZINC yang terkenal, yang berisi jutaan senyawa yang dapat disaring untuk calon obat potensial.

Para peneliti penelitian [1] menyaring lebih dari 1,3 juta senyawa dari database ZINC dan mengidentifikasi beberapa senyawa yang menunjukkan hasil yang menjanjikan secara in vitro. Hanya diperlukan waktu beberapa hari untuk menyelesaikan pemeriksaan virtual (terhadap 1,3 juta senyawa), sedangkan metode eksperimen tradisional memerlukan waktu bertahun-tahun untuk menyelesaikannya. Dalam menghadapi krisis kesehatan masyarakat yang mendesak, seperti merebaknya pandemi COVID-19, kekuatan simulasi biomedis dibandingkan penelitian medis tradisional cukup terlihat.

Lihat Lebih Dekat Model AI Terkait

Untuk melakukan layar virtual, seseorang perlu membangun model AI yang dapat dilatih melalui pembelajaran mesin (ML) untuk memperoleh keterampilan yang diperlukan dalam menganalisis database yang ada. Basis data ini biasanya merupakan kumpulan besar senyawa yang dapat disaring menggunakan teknik penyaringan virtual.

Misalnya, salah satu penelitian yang dipublikasikan di www.nature.com | Laporan Ilmiah, menggunakan kombinasi algoritma docking molekuler dan pembelajaran mesin untuk mengidentifikasi potensi penghambat virus influenza A dari database yang dipilih [2]. Para peneliti melatih model pembelajaran mesin pada serangkaian penghambat virus yang diketahui dan menggunakan model ini untuk memprediksi kemungkinan pengikatan senyawa dalam database ke protein target. Senyawa kandidat teratas kemudian diuji secara in vitro dan in vivo, dan beberapa diantaranya terbukti efektif sebagai penghambat virus.

Salah satu model AI yang umum digunakan dalam simulasi penelitian biomedis adalah Support Vector Machine (SVM). Teknik ini dapat dimasukkan ke dalam proses penyaringan virtual.

Model SVM mempelajari, melalui pelatihan, cara menemukan hyperplane terbaik yang memisahkan kandidat inhibitor yang menjanjikan (jika ada) dari non-inhibitor (misalnya, sisa database ZINC). Setelah SVM dilatih, SVM dapat memprediksi kemungkinan pengikatan senyawa obat ke protein target berdasarkan sifat kimianya.

Kode Python untuk Model SVM 13 baris

Skrip Python singkat ditulis di bawah untuk artikel ini guna mengilustrasikan blok pengkodean minimal yang diperlukan untuk membangun model SVM sederhana. Agar tidak menyusahkan pembaca dengan terlalu banyak detail pengkodean, kami memutuskan untuk menggunakan perpustakaan internal Python untuk menulis skrip (hanya 13 baris) dan kumpulan data langsung — — iris.

# Import the required libraries and function 
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# Load the iris dataset
iris = load_iris()
X = iris.data
y = iris.target

# Split the data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Create an SVM model
svm_model = SVC(kernel='linear', C=1.0)

# Train the SVM model
svm_model.fit(X_train, y_train)

# Predict the classes for the testing data
y_pred = svm_model.predict(X_test)

# Evaluate the performance of the model
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

Dalam skrip singkat ini, pertama-tama kita mengimpor perpustakaan ML dengan Python: sklearn (yaitu, scikit-learn). Lalu kita memuat kumpulan data iris dan membaginya menjadi kumpulan pelatihan dan pengujian menggunakan fungsi train_test_split dari scikit-learn. Kami kemudian membuat model SVM menggunakan fungsi SVC dari scikit-learn dan menentukan kernel linear dan parameter regularisasi C. Model dilatih berdasarkan data pelatihan menggunakan metode fit, dan kelas prediksi untuk data pengujian diperoleh menggunakan metode predict. Terakhir, kami mengevaluasi performa model SVM menggunakan accuracy_score dari modul scikit-learn metrics.

Kumpulan data iris mata adalah salah satu kumpulan data terkecil yang dapat digunakan untuk menguji dan mengevaluasi pengklasifikasinya (yaitu, untuk melakukan penyaringan virtual). Dataset hanya berisi 50 sampel dari masing-masing tiga spesies Iris (Iris setosa, Iris virginica, dan Iris versicolor). Empat fitur terukur dicantumkan untuk masing-masing dari 150 sampel. Yaitu panjang sepal, lebar sepal, panjang kelopak, dan lebar kelopak, disimpan dalam array data 150x4 (numpy.ndarray). Dataset iris digunakan sebagai contoh di sini.

Skrip 13 baris yang ditunjukkan di atas ditulis untuk membantu pembaca memvisualisasikan arsitektur kerangka yang diperlukan untuk penyaringan virtual. Dengan menjalankan kode ini, Anda akan memperoleh skor akurasi (misalnya, “Akurasi: 1.0”) di layar komputer Anda, yang mengonfirmasi performa model.

Kode Python untuk Memvisualisasikan Distribusi Data

Untuk memvisualisasikan distribusi data yang dihasilkan oleh model SVM, Anda dapat menyempurnakan skrip sebagai berikut:

# Import the required libraries and function 
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# Visualize the data distribution
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

# Assign different colors to each class
colors = ['red', 'green', 'blue']

# Plot the data points
for target, color in zip(range(3), colors):
    indices = y == target
    ax.scatter(X[indices, 0], X[indices, 1], X[indices, 2], c=color, label=iris.target_names[target])

# Set labels and title
ax.set_xlabel('Sepal Length (cm)')
ax.set_ylabel('Sepal Width (cm)')
ax.set_zlabel('Petal Length (cm)')
ax.set_title('Data Distribution of Iris Flowers')

# Add a legend
ax.legend()

# Save the 3D plot as a JPG file
plt.savefig('iris_data_distribution.jpg')

# Show the 3D plot
plt.show()

Dalam skrip kedua ini:

  1. Kita mengimpor matplotlib.pyplot dan mpl_toolkits.mplot3d.Axes3D untuk membuat plot sebar 3D.
  2. Setelah mengevaluasi performa model, kami melanjutkan dengan memvisualisasikan sebaran data dengan membuat gambar dan subplot Axes3D untuk plot 3D.
  3. Kami menetapkan warna berbeda untuk setiap kelas menggunakan daftar warna.
  4. Kami membuat array boolean (indeks) untuk setiap kelas guna mengidentifikasi titik data yang sesuai. Kami kemudian menggunakan fungsi sebar untuk memplot titik data dengan warna dan label yang sesuai. Label untuk legenda diatur menggunakan iris.target_names[target].
  5. Sumbu x melambangkan panjang sepal dalam sentimeter, sumbu y melambangkan lebar sepal dalam sentimeter, dan sumbu z melambangkan panjang kelopak dalam sentimeter. Ini adalah tiga dari empat fitur dalam kumpulan data Iris. Kami menetapkan judul plot sebagai “Sebaran Data Bunga Iris”.
  6. Terakhir, kita menambahkan legenda, menyimpan plot (ke dalam format jpg, namun Anda dapat mengubahnya ke format lain jika diinginkan) menggunakan plt.savefig, dan menampilkan plot 3D menggunakan plt. tampilkan().

Dengan menjalankan skrip gabungan (yaitu, yang berisi 'Kode Python untuk Model SVM 13 baris' dan 'Kode Python untuk Memvisualisasikan Distribusi Data'), Anda dapat memvisualisasikan distribusi data dalam plot 3D, menampilkan pemisahan dan distribusi ciri-ciri bunga iris di antara kelas-kelas yang berbeda. Seperti yang diilustrasikan pada Gambar 3, plot tersebut memberikan wawasan tentang bagaimana model SVM memisahkan dan mengklasifikasikan data.

Misalkan tujuan Anda bukan untuk mengklasifikasikan apakah satu bunga termasuk dalam salah satu dari tiga jenis Iris, melainkan untuk menyaring secara virtual satu jenis burung dari banyak jenis lainnya, satu jenis sedan dari semua kendaraan yang dikenal, atau sekumpulan kandidat penghambat virus yang menjanjikan. . Dalam hal ini, Anda perlu mengimpor kumpulan data yang tepat (atau membuatnya sendiri) dan menyesuaikan beberapa hyperparameter dan fungsi kernel yang digunakan, bergantung pada masalah spesifik yang sedang diatasi.

Dengan membahas semua masalah ini, penting untuk menunjukkan bahwa ada cara untuk meningkatkan tingkat kecanggihan model SVM. Misalnya, kita dapat menulis ulang kode untuk memasukkan pembelajaran mendalam ke dalam model SVM dan membangun model Support Vector Machine-Deep Learning (SVM-DL) atau model Support Vector Regression-Deep Learning (SVR-DL). Model AI ini akan menggabungkan kekuatan pembelajaran mendalam dan SVM untuk membawa performa model ke tingkat yang lebih tinggi dan memungkinkan model melakukan tugas klasifikasi dan regresi yang lebih canggih.

Ringkasan

Simulasi biomedis, dengan integrasi simulasi komputer dan model AI, siap merevolusi bidang kedokteran. Dengan memanfaatkan kekuatan AI, para peneliti dapat mengatasi keterbatasan eksperimental, mempercepat penemuan obat, memprediksi interaksi dan efek obat, menilai toksisitas, dan mengoptimalkan uji klinis. Selain itu, individu yang memiliki pengetahuan pengkodean dapat berpartisipasi aktif dalam simulasi penelitian biomedis dengan membangun model AI mereka sendiri.

Seiring dengan terus berkembangnya bidang simulasi biomedis, ini merupakan peluang bagus bagi para peneliti, praktisi, dan peminat untuk mengeksplorasi potensinya dan berkontribusi terhadap pertumbuhannya. Dengan menggabungkan prinsip-prinsip ilmu komputer, matematika, fisika, biologi, dan kedokteran, simulasi biomedis menawarkan jalan yang menjanjikan untuk memperluas pemahaman kita tentang tubuh manusia, menemukan pengobatan baru, dan mentransformasi lanskap layanan kesehatan.

Jika Anda sudah membaca sejauh ini, Anda pasti tertarik dengan simulasi biomedis. Dalam waktu dekat, saya akan mempelajari model SVM-DL dan SVR-DL serta penerapannya dalam simulasi biomedis di artikel yang akan datang.

Referensi

[1] Sarah Huff, Indrasena Reddy Kummetha, Shashi Kant Tiwari, Matthew B. Huante, Alex E. Clark, Shaobo Wang, William Bray, Davey Smith, Aaron F. Carlin, Mark Endsley, dan Tariq M. Rana. Jurnal Kimia Obat 2022 65 (4), 2866–2879.

[2] Zekun Liu1, JunpengZhao1, Weichen Li1, Li Shen1, Shengbo Huang2, JingjingTang2, Jie Duan2, Fang Fang2, Yuelong Huang1, HaiyanChang2, Ze Chen2 & Ran Zhang1. Laporan Ilmiah 2016 | www. alam.com | Laporan Ilmiah | 6:19095 | DOI: 10.1038/srep19095.