Publikasi tentang topik tersebut 'text-processing'
Stemming dan Lemmatisasi— NLP
Berasal
Stemming adalah proses mereduksi kata hingga tercapai kata dasar/kata dasar. Itu memotong huruf-huruf dari akhir. Saat mencari kata kunci tertentu, ia mengembalikan variasi kata tertentu dari dokumen.
Misalnya: Mencari kata 'boat', return boating, boater, boating, dll
Di sini kata dasar adalah perahu dan sufiks dihilangkan sampai kata dasar tercapai.
Ada 2 jenis stemmer:
Porter Stemmer Batang Bola Salju
Porter Stemmer:
Salah satu alat stemming yang paling umum..
Pertanyaan tentang topik tersebut 'text-processing'
Regex Fuzzy, Pemrosesan Teks, Analisis Leksikal?
Saya tidak yakin terminologi apa yang harus dicari, jadi judul saya funky... Inilah alur kerja yang saya dapatkan:
Dokumen semi-terstruktur dipindai ke file. File-file tersebut OCR untuk dikirimi teks.
Teks diurai menjadi objek Python...
387 dilihat
schedule
30.10.2023
Python: PyEnchant dan Python 64 bit
Saya sedang melakukan pemrosesan teks. Saya memerlukan perpustakaan PyEnchant untuk memverifikasi apakah kata tertentu dalam teks adalah kata bahasa Inggris yang valid. Namun, ini hanya tersedia untuk instalasi Python 32 bit. Saya memerlukan Python...
2787 dilihat
schedule
12.01.2024
Bagaimana cara memproses teks Persia menggunakan Rapid Miner?
Saya sedang mengerjakan proyek klasifikasi Persia. Teks Persia sangat mirip dengan teks Arab. ketika saya menggunakan Tokenize, tidak muncul kata apa pun di halaman daftar kata dan di Halaman Kumpulan Contoh, Gambar di bawah ini akan ditampilkan:...
109 dilihat
schedule
28.10.2023
bagaimana cara mencetak seluruh blok jika berisi baris tertentu dengan perintah awk?
Saya mencoba memproses informasi jaringan dari lshw -c network dengan perintah awk
hasilnya terlihat seperti ini: -
*-network:3
description: Ethernet interface
product: I350 Gigabit Network Connection
vendor: Intel Corporation...
93 dilihat
schedule
17.01.2024