การแสดงข้อมูล — ชุดพัฒนา — Raspberry — Python

ชุดพัฒนา Python สำหรับการแสดงภาพและการสร้างแบบจำลองข้อมูล covid19

สร้างการวิเคราะห์ข้อมูล Covid-19 ของคุณด้วยวิธีการของคุณเอง

การแนะนำ

การระบาดใหญ่ของไวรัสโคโรนาสายพันธุ์ใหม่ (โควิด-19) กำลังส่งผลกระทบต่อ 213 ประเทศและก่อให้เกิดการทำลายล้างอย่างร้ายแรง ["เครื่องวัดโลก"] ผู้คนกำลังจะตายจากการติดเชื้อ เศรษฐกิจโลกลดลง การว่างงานเพิ่มขึ้นเป็นล้านต่อสัปดาห์ และผู้คนจำนวนมากก่อให้เกิดความวุ่นวายและเริ่มก่อการจลาจล ดังนั้นการวิเคราะห์และการจำลองข้อมูล Covid19 จึงมีความสำคัญต่อการต่อสู้กับไวรัส SARS-CoV-2 สิ่งนี้ไม่เพียงสำคัญสำหรับนักไวรัสวิทยา แพทย์ แต่ยังสำหรับผู้เชี่ยวชาญในสาขาวิชาอื่นๆ และสำหรับพวกเราทุกคนด้วย

สามารถใช้ซอฟต์แวร์การคำนวณ เช่น Microsoft Excel (เดสก์ท็อป), LibreOffice (เดสก์ท็อป ฟรี) , Google ชีต (ออนไลน์) เพื่อประมวลผลข้อมูล แต่จะเป็นการดีกว่าถ้าใช้การเขียนโปรแกรมสำหรับการคำนวณด้วยวิธีที่ซับซ้อน . ดังนั้นฉันจึงได้พัฒนาแพ็คเกจโอเพ่นซอร์ส tavuong/covid19-datakit ซึ่งได้รับอนุญาตจาก MIT และเขียนด้วย Python คุณสามารถใช้ชุดอุปกรณ์นี้เพื่อแสดงภาพ วิเคราะห์ หรือจำลองข้อมูลตามแบบจำลองที่นำไปใช้ในไลบรารีชุดอุปกรณ์ คุณยังสามารถนำโมเดลของคุณเองไปใช้กับชุดอุปกรณ์ได้

ถ้าอย่างนั้นเรามาดูวิธีใช้งานกัน!

Covid19-ชุดข้อมูล

การดาวน์โหลดและการจัดการข้อมูล

Covid19-Datakit จะประมวลผลข้อมูลการแพร่ระบาดของไวรัสโคโรนา ซึ่งดาวน์โหลดไฟล์ CSV ได้จาก ข้อมูลแหล่งที่มาของไวรัสโคโรนา, openZH/covid_19 หรือจากอินเทอร์เน็ต เช่น JainXu- รายการ

Covid19-datakit สามารถประมวลผลข้อมูลของไฟล์ csv โดยมีโครงสร้างและรูปแบบดังต่อไปนี้:

  • ที่ 1 คอลัมน์คือ Data-time ข้อมูลในคอลัมน์นี้จะถูกพล็อตบนแกน x วันที่-เวลาในคอลัมน์แรกต้องมีรูปแบบ ปปปป-ดด-วว เช่น 2020–01–01.
  • คอลัมน์ที่ 2 เป็นข้อมูลอนุกรมเวลา เขียนจุดบนแกน y

หากไฟล์ CSV ของคุณไม่ตรงกับข้อกำหนดเหล่านั้น คุณควรต้องใช้ซอฟต์แวร์การคำนวณ เช่น MicroSoft Excel, LibreOffice Calc หรือ Google ชีต เพื่อเปลี่ยนรูปแบบหรือโครงสร้าง

KIT - คำอธิบาย

โอเพ่นซอร์ส tavuong/covid19-datakit ที่ได้รับอนุญาตจาก MIT มีส่วนต่างๆ ดังต่อไปนี้:

  • covid19-datakit.py คือแดชบอร์ด มีอินเทอร์เฟซผู้ใช้พร้อมกล่องโต้ตอบเพื่อรับตำแหน่งของไฟล์ data-csv และค่าของพารามิเตอร์ของโมเดล จัดการขั้นตอนการทำงาน: การอ่านข้อมูล การคำนวณข้อมูลด้วยโมดูลโมเดล และการแสดงภาพผลลัพธ์บนหน้าจอคอมพิวเตอร์ หรือพิมพ์ผลลัพธ์เป็นรูปภาพ (ไฟล์ PNG) แดชบอร์ดมี โหมด "ฉัน" เพื่อให้ผู้ใช้สามารถสลับแดชบอร์ดเพื่อทำงานกับรุ่นเจ้าของของตนได้ นอกจากนี้ยังมีบรรทัดคำสั่งในตัว ดังนั้นคุณจึงสามารถเขียนเชลล์สคริปต์เพื่อแสดงภาพข้อมูลของคุณสมบัติต่างๆ มากมาย เช่น เคสใหม่สำหรับหลายประเทศ
  • ไลบรารีชุดเริ่มต้นคือโมดูลภาพใน tavuong_visual.py และการพัฒนาโมเดลเพื่อประมวลผลข้อมูล covid19- ใน tavuong_model.py คุณสามารถใช้โมดูลเหล่านั้นเพื่อแสดงภาพข้อมูลของคุณได้ทันที เช่น ผลรวมผู้ป่วยรายใหม่รายวัน หรือผลรวมผู้ติดเชื้อรายวันโดยประมาณตามอัตราการฟื้นตัว (รูปแบบการพัฒนาของฉัน)
  • ไลบรารีผู้ใช้: เป็นโมดูลของคุณในการพัฒนาโมเดลของคุณเองและการนำเสนอโดยเจ้าของของคุณ คุณสามารถใช้เทมเพลตใน user_model.pyและใน user_visual.py เพื่อพัฒนา "โหมดฉัน" ซึ่งรวมอยู่ในแดชบอร์ด ดังนั้นคุณจึงสามารถ รับข้อมูลและพารามิเตอร์โดยไม่ต้องเขียนกล่องโต้ตอบใหม่และจัดการเวิร์กโฟลว์
    ทดสอบแล้วคุณจะชอบ

ระบบคอมพิวเตอร์ใดที่สามารถใช้ชุดอุปกรณ์นี้ได้?

ในการรันชุดอุปกรณ์ คุณต้องมี Python Interpreter คุณสามารถดาวน์โหลด Python ได้จาก Python.org สำหรับ Windows, Linux/UNIX, Mac OS X, อื่น ๆ ชุดนี้ได้รับการทดสอบโดย Windows 10 (พีซี) โดย “Raspbian Buster พร้อมเดสก์ท็อปและซอฟต์แวร์ที่แนะนำ” (Raspberry Pi) และ โดย Termux (unix สำหรับ แท็บเล็ต)

ติดตั้ง

ให้คำสั่งต่อไปนี้ใน Command Prompt (Windows X) หรือ LX-Terminal (Raspberry PI)

$ โคลน github https://github.com/tavuong/covid19-datakit.git

$ pip ติดตั้งจำนวนมาก

$ pip ติดตั้ง Matplotlib

$ ซีดี ~\covid19-datakit\

$ python .\covid19-datakit.py [โดยพีซี]

$ python3 .\covid19-datakit.py [โดย Raspberry PI]

โดยจะร้องขอ: ตำแหน่งของไฟล์ข้อมูล csv สำหรับการอ่านข้อมูล ประเทศที่คุณต้องการแสดงภาพข้อมูล แบบจำลองการแสดงภาพหรือจำลองและอัตราการกู้คืนสำหรับโมเดล 'gc' หรือ 'gs ' ของฉัน จำลองกรณีการติดไวรัสด้วยอัตราการฟื้นตัวโดยประมาณ .

ตัวอย่างการใช้กล่องโต้ตอบกับชุดอุปกรณ์

สำหรับตัวอย่างนี้ เราใช้ไฟล์ csv ใน .\covid19-datakit\data\

$ ซีดี ~\covid19-data-kit\

$ python .\covid19-datakit.py [โดยพีซี]

KIT › ไฟล์ข้อมูลเคส? .\data\new_cases.csv
( คำขอตำแหน่งของไฟล์ csv )

รายชื่อประเทศจากไฟล์ csv จะถูกอ่านและแสดง:

KIT › ประเทศ? World
(คำขอ Country-dat ที่คุณต้องการดำเนินการ)

รายการโหมดการแสดงภาพจะแสดง:

ac : กรณีจริง: เส้นโค้งกรณีใหม่รายวัน

sr: ผลรวมรายวันของกรณี

gc : กรณีจริงรวม อัตราการฟื้นตัวโดยประมาณ: นี่คือการจำลอง

gs : ผลรวมรายวันของกรณีรวม อัตราการฟื้นตัวโดยประมาณ: นี่คือการจำลอง

ฉัน : โมเดลของฉัน: สลับไปใช้โมเดลของคุณเอง

t2 : แผนทดสอบ

KIT › แบบจำลองการคำนวณของคุณคืออะไร? sr
( คำขอที่คุณเลือกโหมด )

จากนั้นมันจะพล็อต:

บรรทัดคำสั่ง

บรรทัดคำสั่งเพิ่งถูกนำมาใช้ มันมีตัวเลือกดังต่อไปนี้:

$ หลาม .\covid19-datakit.py -h

covid19-datakit
-i ‹inputfile› -o ‹outputfile›
-c ประเทศ
-m โหมด
-g กู้คืน

ตัวอย่างการโทร gs -mode

$ python .\covid19-datakit.py -i .\data\new_cases.csv -c อิตาลี -o test.png -m gs -g 0.8

สลับไปยังผู้ใช้-รุ่น: โหมดฉัน

มีโมดูลเทมเพลตให้คุณพัฒนาโมเดลเจ้าของซึ่งรวมเป็นโหมด "ฉัน" โดยแดชบอร์ด (covid19-datakit.py)

โดยการเลือก “ฉัน” จากคำขอแดชบอร์ด (covid19-datakit.py) ชุดอุปกรณ์จะเรียกโมดูลภาพสำหรับฉัน -โหมด:

my_collection_1(x,y,y1,y2,namecountry,gesund)

ชื่อประเทศ : พารามิเตอร์ประเทศ

เกซุนด์ : อัตราการฟื้นตัว

x [ ]: อินพุต ข้อมูลเวลาจากไฟล์ csv

y [ ] : อินพุต ข้อมูล covid ของประเทศที่เลือกจากไฟล์ csv ช่วงเดียวกันกับ x [ ]

Y1 [ ] : ฟิลด์บัฟเฟอร์ที่สร้างโดยการอ่าน ช่วงเดียวกันกับ x [ ]

y2 [ ] : ฟิลด์บัฟเฟอร์ที่สร้างโดยการอ่าน ช่วงเดียวกับ x [ ]

ตอนนี้คุณได้กรอกข้อมูลสำหรับการแสดงภาพและ/หรือสำหรับการสร้างแบบจำลองเรียบร้อยแล้ว

จาก y[ ] ใน my_collection_1(…) คุณสามารถคำนวณ y2 [ ] อีกอันได้โดยการเรียกโมดูล:

my_model_1(y2,y,ปัจจัย,เทา,เกซุนด์)

Tau : ระยะฟักตัว ยังไม่ได้นำไปใช้เพื่ออ่านจากแดชบอร์ด

ปัจจัย : R-Factor ยังไม่ได้นำมาใช้เพื่ออ่านจากแดชบอร์ด

gesund : อัตราการกู้คืนจากคำขอแดชบอร์ด

y [ ] : input — ข้อมูล covid ของประเทศที่เลือกจากไฟล์ csv

y2 [ ] : เอาต์พุต, ช่วงเดียวกันกับ y [ ]

ตัวอย่างโหมด Me

หากต้องการศึกษาโค้ดของโมดูลเทมเพลตสองโมดูลใน user-visual.py และ user_model.py ให้เริ่มตัวอย่างนี้เพื่อทำความเข้าใจวิธีการทำงาน

$ python .\covid19-datakit.py -i .\data\new_cases.csv -c อิตาลี -o test.png -m me -g 0.8

สรุป

แพคเกจซอฟต์แวร์ covid19-datakit มุ่งเน้นไปที่การประมวลผลข้อมูล covid19 ใช้งานง่ายด้วยกล่องโต้ตอบหรือบรรทัดคำสั่ง คุณสามารถรวมโมเดลของคุณเองเข้ากับแดชบอร์ดได้

การแสดงภาพและการสร้างแบบจำลองข้อมูล covid19 ได้รับการพัฒนาอย่างต่อเนื่อง โดยจะมีการอัปเดตในอนาคต หากคุณได้พัฒนาโมดูลโมเดลหรือโมดูลการนำเสนอที่น่าสนใจใหม่ โปรดอย่าลังเลที่จะติดต่อฉันเพื่อขอคำปรึกษาด้านการพัฒนา และอาจสนับสนุนโมดูลของคุณให้กับโอเพ่นซอร์สและโครงการที่ได้รับใบอนุญาตจาก MIT tavuong/ covid19-datakit บน "github"

มีความสุข!

กิตติกรรมประกาศ: ศาสตราจารย์ ดร.เกียน ฟาม