Visualisasi Data — KIT Pengembangan — Raspberry — Python

Kit Pengembangan Python untuk Visualisasi dan Pemodelan Data Covid19

Buat Analisis Data Covid-19 Anda dengan metode Anda sendiri

Perkenalan

Pandemi virus corona COVID-19 mempengaruhi 213 negara dan menyebabkan kerusakan serius [worldometer]. Banyak orang sekarat karena tertular; perekonomian dunia terpuruk; pengangguran meningkat jutaan per minggu dan banyak orang menyebabkan kekacauan, mulai memberontak. Oleh karena itu analisis dan simulasi data Covid19 penting untuk memerangi virus SARS-CoV-2. Hal ini penting tidak hanya bagi ahli virologi, dokter, tetapi juga bagi spesialis lain di disiplin ilmu lain dan juga bagi kita semua.

Seseorang dapat menggunakan perangkat lunak penghitungan seperti Microsoft Excel (desktop), LibreOffice (desktop, gratis), Google Sheets (online) untuk memproses data, namun akan lebih baik jika menggunakan pemrograman untuk penghitungan dengan metode yang rumit . Oleh karena itu saya telah mengembangkan paket sumber terbukatavuong/covid19-datakit», yang berlisensi MIT dan ditulis dengan Python. Anda dapat menggunakan kit untuk memvisualisasikan, menganalisis, atau mensimulasikan data sesuai dengan model yang diterapkan di perpustakaan kit. Anda juga dapat menerapkan model Anda sendiri ke dalam kit.

Jadi mari kita lihat cara menggunakannya!

Kit Data Covid19

Pengunduhan dan penanganan data

Covid19-Datakit akan memproses data pandemi virus corona, yang file csvnya dapat diunduh dari Data Sumber Virus Corona, openZH/covid_19 atau dari internet, misalnya. JainXu- daftar.

Datakit Covid19 dapat memproses data file csv dengan struktur dan format sebagai berikut:

  • 1. kolomnya adalah Data-time, Data pada kolom ini akan diplot pada sumbu x. Tanggal-waktu pada kolom pertama harus berformat yyyy-mm-dd, mis. 2020–01–01.
  • Kolom ke-2 adalah data deret waktu yang diplot pada sumbu y.

Jika file csv Anda tidak memenuhi persyaratan tersebut, Anda harus menggunakan Perangkat Lunak penghitungan, seperti MicroSoft Excel, LibreOffice Calc atau Google sheet, untuk mengubah format atau struktur.

KIT — Deskripsi

Sumber terbuka berlisensi MIT tavuong/covid19-datakit memiliki bagian-bagian berikut:

  • covid19-datakit.py adalah dasbor, memiliki antarmuka pengguna dengan dialog untuk mendapatkan lokasi file data-csv dan nilai parameter model. Ia mengatur alur kerja: membaca data, menghitung data dengan modul model dan memvisualisasikan hasilnya di layar komputer atau mencetak hasilnya sebagai gambar (file png). Dasbor memiliki mode “saya” bagi pengguna untuk mengalihkan dasbor agar berfungsi dengan model pemiliknya. Ada juga baris perintah bawaan, sehingga Anda dapat menulis skrip shell untuk memvisualisasikan data dari banyak fitur, misalnya. kasus baru di banyak negara.
  • Perpustakaan kit default adalah modul visual di tavuong_visual.py dan model pengembangan untuk memproses data COVID-19 di tavuong_model.py. Anda dapat menggunakan modul tersebut untuk segera memvisualisasikan data Anda, misalnya. jumlah kasus baru setiap hari atau jumlah perkiraan individu yang terinfeksi setiap hari berdasarkan tingkat kesembuhan (model yang saya kembangkan).
  • Perpustakaan pengguna: adalah modul Anda untuk mengembangkan model Anda sendiri dan presentasi pemilik Anda. Anda dapat menggunakan templat di user_model.pydan di user_visual.py untuk mengembangkan “me-mode”, yang terintegrasi di dasbor, sehingga Anda dapat dapatkan data dan parameter, tanpa harus menulis dialog baru dan mengelola alur kerja.
    Ujilah, Anda akan menyukainya.

Sistem Komputer mana yang dapat menggunakan kit ini?

Untuk menjalankan kit ini, Anda memerlukan Interpreter Python, Anda dapat mengunduh Python dari Python.org untuk"Windows", "Linux/UNIX", "Mac OS X", "Lainnya". Kit ini diuji oleh Windows 10 (PC), oleh “Raspbian Buster dengan desktop dan perangkat lunak yang direkomendasikan” (“Raspberry Pi”) dan “oleh Termux” (unix untuk “Tablet”)

Install

Berikan perintah berikut di Command Prompt (Windows X) atau LX-Terminal (Raspberry PI)

$ github clone https://github.com/tavuong/covid19-datakit.git

$ pip instal numpy

$ pip instal Matplotlib

$ cd ~\covid19-datakit\

$ python .\covid19-datakit.py [oleh PC]

$ python3 .\covid19-datakit.py [oleh Raspberry PI]

Ini akan meminta: lokasi file csv data untuk pembacaan data, negara tempat Anda ingin memvisualisasikan datanya, model visualisasi atau simulasi dan tingkat pemulihan untuk model saya 'gc' atau 'gs', simulasi kasus infeksi dengan perkiraan tingkat pemulihan .

Contoh penggunaan dialog dengan kit

Untuk contoh ini, kami menggunakan file csv di .\covid19-datakit\data\

$ cd ~\covid19-data-kit\

$ python .\covid19-datakit.py [oleh PC]

KIT › File data kasus? .\data\new_cases.csv
( permintaan lokasi file csv )

Daftar negara dari file csv akan dibaca dan ditampilkan:

KIT › negara? World
(permintaan negara-dat yang ingin Anda proses)

Daftar mode visualisasi akan ditampilkan:

ac : kasus aktual: kurva kasus baru setiap hari

sr: jumlah kasus harian

gc : kasus aktual termasuk. perkiraan tingkat pemulihan: ini adalah simulasi

gs : jumlah kasus harian termasuk. perkiraan tingkat pemulihan: ini adalah simulasi

saya : model saya: beralih ke model Anda sendiri

t2 : plot uji

KIT › Apa model penghitungan Anda? sr
( permintaan mode pilihan anda )

Kemudian akan diplot:

Garis komando

Baris perintah baru saja diterapkan. Ini memiliki opsi berikut:

$ python .\covid19-datakit.py -h

datakit-covid19
-i ‹file masukan› -o ‹file keluaran›
-c negara
-m mode
-g pulih

Contoh panggilan gs -mode

$ python .\covid19-datakit.py -i .\data\new_cases.csv -c Italia -o test.png -m gs -g 0.8

Beralih ke Model pengguna: mode saya

Ada modul templat bagi Anda untuk mengembangkan model pemilik Anda yang diintegrasikan sebagai mode “saya” melalui dasbor (covid19-datakit.py).

Dengan memilih “saya” dari permintaan dasbor (covid19-datakit.py), kit akan memanggil modul visual untuk saya -mode:

koleksi_saya_1(x,y,y1,y2,namanegara,gesund).

Namanegara : parameter negara

gesund : tingkat pemulihan

x [ ]: masukan, data waktu dari file csv

y [ ] : masukan, data COVID negara yang dipilih dari file csv, rentang yang sama dengan x [ ]

Y1 [ ] : Bidang buffer yang dihasilkan oleh pembacaan, rentang yang sama dengan x [ ]

y2 [ ] : Bidang buffer yang dihasilkan oleh pembacaan, rentang yang sama dengan x [ ]

Anda sekarang telah menyelesaikan data untuk visualisasi dan/atau untuk pemodelan

Dari y[ ] di my_collection_1(…), Anda dapat menghitung y2 [ ] lainnya dengan memanggil modul:

model_saya_1(y2,y,faktor,Tau,gesund)

Tau : waktu inkubasi, belum dilaksanakan untuk pembacaan dari dashboard

Faktor : R-Factor, belum diterapkan untuk membaca dari dashboard

gesund : tingkat pemulihan, dari permintaan dasbor

y [ ] : input — data covid negara yang dipilih dari file csv

y2 [ ] : keluaran, rentang yang sama dengan y [ ]

Contoh mode saya

Untuk mempelajari kode dua modul templat di user-visual.py dan user_model.py, mulailah contoh ini untuk memahami cara kerjanya.

$ python .\covid19-datakit.py -i .\data\new_cases.csv -c Italia -o test.png -m me -g 0.8

Ringkasan

Paket perangkat lunak covid19-datakit difokuskan pada pemrosesan data-covid19. Mudah digunakan dengan dialog atau dengan baris perintah. Anda dapat mengintegrasikan model Anda sendiri ke dasbor.

Visualisasi dan pemodelan data covid19 terus berkembang, dan akan diupdate kedepannya. Jika Anda telah mengembangkan modul-model atau modul presentasi baru yang menarik, jangan ragu untuk menghubungi saya untuk konsultasi pengembangan dan mungkin dapat menyumbangkan modul Anda ke proyek sumber terbuka dan berlisensi MIT tavuong/ covid19-datakit melalui github.

Selamat bersenang-senang!

Ucapan terima kasih untuk review: Prof.Dr.Kien Pham