ฉันไม่ค่อยมีประสบการณ์กับ Python มากนัก แต่ฉันต้องการทำการวิเคราะห์ข้อมูลด้วยคลังข้อมูล ดังนั้นฉันจึงทำส่วนนั้นใน NLTK Python
ฉันต้องการดูเนื้อหาทั้งหมดและสร้างพจนานุกรมที่มีทุกคำที่ปรากฏในชุดข้อมูลคลังข้อมูล ฉันต้องการที่จะสามารถค้นหาคำในพจนานุกรมนี้และค้นหาจำนวนครั้งที่คำนี้ปรากฏเป็นส่วนใดของคำพูด (แท็ก) ตัวอย่างเช่น หากฉันต้องค้นหาคำว่า 'dog' ฉันอาจจะพบแท็กคำนาม 100 แท็ก และแท็กกริยา 5 แท็ก เป็นต้น
เป้าหมายสุดท้ายคือการบันทึกไฟล์นี้เป็น .txt หรืออะไรบางอย่างจากภายนอก แล้วโหลดมันในโปรแกรมอื่นเพื่อตรวจสอบความน่าจะเป็นของคำที่เป็นแท็กใด
ฉันจะทำสิ่งนี้กับ Counter และ ngrams หรือไม่