Saya mencoba membuat Wordcloud yang secara otomatis mengambil kata-kata dari deskripsi pekerjaan dan membuat Wordcloud. Jika Anda memiliki stopwords=None, itu seharusnya menghapus daftar stopwords yang diketahui di wordcloud, tetapi program saya tidak. Saya yakin ini mungkin ada hubungannya dengan cara saya menarik deskripsi pekerjaan dengan sup yang enak. Saya butuh bantuan untuk menarik kata-kata secara berbeda dengan beautifulsoup atau saya tidak menggunakan stopwords dengan benar.
import requests
# pip install bs4
from bs4 import BeautifulSoup
# pip install wordcloud
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# Goes to a job description
url = "https://career.benteler.jobs/job/Paderborn-Head-of-Finance-&-Controlling-North-America-NW/604307901/?locale=en_US"
html_text = requests.get(url).text
soup = BeautifulSoup(html_text, 'html.parser')
# Goes through all the words in the beautiful soup text
combinedWords = ''
for words in soup.find_all('span'):
separatedWords = words.text.split(' ')
combinedWords += " ".join(separatedWords) + ' '
# creates wordcloud
resumeCloud = WordCloud(stopwords=None, background_color='white', max_words=75, max_font_size=75, random_state=1).generate(combinedWords)
plt.figure(figsize=(8, 4))
plt.imshow(resumeCloud)
plt.axis('off')
plt.show()