Saya melakukan pemrosesan bahasa alami sederhana menggunakan spacy
. Saya sedang berupaya menyaring kata-kata dengan mengukur kesamaan antar kata.
Saya menulis dan menggunakan kode sederhana berikut yang ditunjukkan dalam dokumentasi spacy, tetapi hasilnya tidak terlihat seperti dokumentasi.
import spacy
nlp = spacy.load('en_core_web_lg')
tokens = nlp('dog cat banana')
for token1 in tokens:
for token2 in tokens:
sim = token1.similarity(token2)
print("{:>6s}, {:>6s}: {}".format(token1.text, token2.text, sim))
hasil kode di bawah ini.
dog, dog: 1.0
dog, cat: 2.307269867164827e-21
dog, banana: 0.0
cat, dog: 2.307269867164827e-21
cat, cat: 1.0
cat, banana: -0.04468117654323578
banana, dog: -7.828739256116838e+17
banana, cat: -8.242222286053048e+17
banana, banana: 1.0
Khususnya, kemiripan antara "anjing" dan "kucing" seharusnya sekitar 0,8, namun nilainya tidak terlalu kecil.
Selain itu, kemiripan antara "anjing" dan "pisang" adalah 0,0 tetapi kemiripan antara 'pisang' dan 'anjing' adalah -7.828739256116838e+17.
Saya tidak tahu bagaimana cara memperbaikinya.
tolong bantu aku.