Publikasi tentang topik tersebut 'text-processing'


Stemming dan Lemmatisasi— NLP
Berasal Stemming adalah proses mereduksi kata hingga tercapai kata dasar/kata dasar. Itu memotong huruf-huruf dari akhir. Saat mencari kata kunci tertentu, ia mengembalikan variasi kata tertentu dari dokumen. Misalnya: Mencari kata 'boat', return boating, boater, boating, dll Di sini kata dasar adalah perahu dan sufiks dihilangkan sampai kata dasar tercapai. Ada 2 jenis stemmer: Porter Stemmer Batang Bola Salju Porter Stemmer: Salah satu alat stemming yang paling umum..

Pertanyaan tentang topik tersebut 'text-processing'

Regex Fuzzy, Pemrosesan Teks, Analisis Leksikal?
Saya tidak yakin terminologi apa yang harus dicari, jadi judul saya funky... Inilah alur kerja yang saya dapatkan: Dokumen semi-terstruktur dipindai ke file. File-file tersebut OCR untuk dikirimi teks. Teks diurai menjadi objek Python...
387 dilihat
schedule 30.10.2023

Python: PyEnchant dan Python 64 bit
Saya sedang melakukan pemrosesan teks. Saya memerlukan perpustakaan PyEnchant untuk memverifikasi apakah kata tertentu dalam teks adalah kata bahasa Inggris yang valid. Namun, ini hanya tersedia untuk instalasi Python 32 bit. Saya memerlukan Python...
2787 dilihat
schedule 12.01.2024

Bagaimana cara memproses teks Persia menggunakan Rapid Miner?
Saya sedang mengerjakan proyek klasifikasi Persia. Teks Persia sangat mirip dengan teks Arab. ketika saya menggunakan Tokenize, tidak muncul kata apa pun di halaman daftar kata dan di Halaman Kumpulan Contoh, Gambar di bawah ini akan ditampilkan:...
109 dilihat

bagaimana cara mencetak seluruh blok jika berisi baris tertentu dengan perintah awk?
Saya mencoba memproses informasi jaringan dari lshw -c network dengan perintah awk hasilnya terlihat seperti ini: - *-network:3 description: Ethernet interface product: I350 Gigabit Network Connection vendor: Intel Corporation...
93 dilihat
schedule 17.01.2024