การใช้ LIT เพื่อสร้างอินเทอร์เฟซแบบภาพเพื่อทำความเข้าใจโมเดลการเรียนรู้ของเครื่องที่ใช้ NLP

NLP (การประมวลผลภาษาธรรมชาติ) เป็นสาขาหนึ่งของ Data Science ที่เกี่ยวข้องกับการทำความเข้าใจและการวิเคราะห์ชุดข้อมูลที่เป็นข้อความ เช่น การวิเคราะห์ความรู้สึก การสร้างแชทบอท โปรแกรมแนะนำ ฯลฯ นี่เป็นหนึ่งในแนวคิดที่ล้ำหน้าที่สุดของปัญญาประดิษฐ์

ด้วยการถือกำเนิดของอัลกอริธึมและเทคโนโลยีที่มากขึ้นเรื่อยๆ การสร้างแบบจำลอง NLP จึงกลายเป็นเรื่องง่าย แต่การทำความเข้าใจแบบจำลองและวิธีการสร้างการคาดการณ์นั้นยังไม่มีการสำรวจ เราจะเข้าใจได้อย่างไรว่าข้อมูลใดที่โมเดลของฉันทำงานได้ไม่ดี โมเดลของฉันมีแนวโน้มที่จะมีพฤติกรรมที่ไม่เป็นมิตรหรือไม่? โมเดลของฉันจะทำงานอย่างไรหากฉันเปลี่ยนรูปแบบของข้อมูลข้อความ

คำถามเหล่านี้สามารถตอบและวิเคราะห์ได้อย่างง่ายดายโดยใช้ LIT เป็นไลบรารี Python แบบโอเพ่นซอร์สที่ใช้ในการสร้างแดชบอร์ดเชิงโต้ตอบที่มองเห็นได้ ซึ่งสามารถใช้เพื่อวิเคราะห์โมเดล NLP การทำนาย พฤติกรรม ฯลฯ ในลักษณะโต้ตอบที่ดึงดูดสายตาและโต้ตอบได้

ในบทความนี้ เราจะสำรวจ LIT และสร้างแดชบอร์ดแบบโต้ตอบสำหรับการวิเคราะห์โมเดล NLP

มาเริ่มกันเลย…

การติดตั้งไลบรารีที่จำเป็น

เราจะเริ่มต้นด้วยการติดตั้ง LIT โดยใช้การติดตั้ง pip คำสั่งที่ระบุด้านล่างจะติดตั้ง LIT โดยใช้ pip

!pip uninstall -y tensorflow-datasets
!pip install lit_nlp tfds-nightly transformers==4.1.1

กำลังดาวน์โหลดตุ้มน้ำหนักโมเดล

ในขั้นตอนแรกนี้ เราจะเริ่มต้นด้วยการดาวน์โหลดตุ้มน้ำหนักโมเดลที่ได้รับการฝึกล่วงหน้า ซึ่งจะใช้สำหรับโมเดลที่เราจะวิเคราะห์

!wget https://storage.googleapis.com/what-if-tool-resources/lit-models/sst2_tiny.tar.gz
!tar -xvf sst2_tiny.tar.gz

การนำเข้าไลบรารีที่จำเป็น

ในขั้นตอนนี้ เราจะนำเข้าไลบรารีทั้งหมดที่จำเป็นในการโหลดชุดข้อมูล โหลดโมเดล NLP ที่มีอยู่จากตัวอย่าง LIT และแสดงผลโดยใช้ LIT

from lit_nlp import notebook
from lit_nlp.examples.datasets import glue
from lit_nlp.examples.models import glue_models
datasets = {'sst_dev': glue.SST2Data('validation')}
models = {'sst_tiny': glue_models.SST2Model('./')}
widget = notebook.LitWidget(models, datasets, height=800)

หลังจากนี้ ขั้นตอนสุดท้ายคือการแสดงผลวิดเจ็ตนี้ในสมุดบันทึก Colab และแสดงภาพแดชบอร์ด

การแสดงแดชบอร์ด

คำสั่งที่ระบุด้านล่างจะแสดงแดชบอร์ดในโน้ตบุ๊กเอง

widget.render()

ในแดชบอร์ดนี้มีส่วนต่างๆ ที่เราสามารถวิเคราะห์ข้อมูลและดูว่ามันทำงานอย่างไร เราสามารถวิเคราะห์ทุกการคาดการณ์แยกกัน และมีตัวเลือกอื่นๆ อีกมากมาย คุณสามารถเห็นภาพฟังก์ชันต่างๆ ได้ในวิดีโอด้านล่าง

ที่นี่คุณจะเห็นว่าเราสามารถวิเคราะห์โมเดล NLP ได้อย่างง่ายดายเพียงใดโดยใช้แดชบอร์ดที่มีการโต้ตอบสูงและดึงดูดสายตา

ลองใช้ชุดข้อมูลต่างๆ สร้างแดชบอร์ดเหล่านี้แล้วแจ้งให้เราทราบความคิดเห็นของคุณในส่วนตอบกลับ

บทความนี้ได้รับความร่วมมือจาก ปิยุช อิงกาเล

ก่อนที่คุณจะไป

ขอบคุณ ที่อ่าน! หากคุณต้องการติดต่อกับฉัน โปรดติดต่อฉันได้ที่ [email protected] หรือใน โปรไฟล์ LinkedIn ของฉัน คุณสามารถดูโปรไฟล์ Github ของฉันสำหรับโครงการวิทยาศาสตร์ข้อมูลต่างๆ และบทช่วยสอนเกี่ยวกับแพ็คเกจได้ นอกจากนี้ อย่าลังเลที่จะสำรวจ "โปรไฟล์ของฉัน" และอ่านบทความต่างๆ ที่ฉันเขียนเกี่ยวกับวิทยาศาสตร์ข้อมูล