Saya tidak terlalu berpengalaman dengan Python, tapi saya ingin melakukan analisis data dengan korpus, jadi saya melakukan bagian itu di NLTK Python.
Saya ingin menelusuri seluruh korpus dan membuat kamus yang berisi setiap kata yang muncul di kumpulan data korpus. Saya ingin dapat mencari sebuah kata di kamus ini dan menemukan berapa kali kata tersebut muncul sebagai bagian dari pidato (tag). Jadi, misalnya, jika saya mencari 'anjing', saya mungkin menemukan 100 tag kata benda dan 5 tag kata kerja, dll.
Tujuan akhirnya adalah menyimpan file ini secara eksternal sebagai .txt atau semacamnya dan memuatnya di program lain untuk memeriksa kemungkinan suatu kata menjadi tag..
Apakah saya akan melakukan ini dengan Counter dan ngrams?