Итак, у меня есть кадр данных pandas со строками токенизированных строк в столбце с именем story. У меня также есть список слов в списке с именем selected_words. Я пытаюсь подсчитать экземпляры любого из selected_words в каждой из строк в истории столбца.
Код, который я использовал до того, как он работал,
CCwordsCount=df4.story.str.count('|'.join(selected_words))
Теперь это дает мне значения NaN для каждой строки.
Ниже приведены первые несколько строк истории столбца в df4. Фрейм данных содержит чуть более 400 строк статей NYTimes.
0 [it, was, a, curious, choice, for, the, good, ...
1 [when, he, was, a, yale, law, school, student,...
2 [video, bitcoin, has, real, world, investors, ...
3 [bitcoin, s, wild, ride, may, not, have, been,...
4 [amid, the, incense, cheap, art, and, herbal, ...
5 [san, francisco, eight, years, ago, ernie, all...
Это список selected_words
selected_words = ['accept', 'believe', 'trust', 'accepted', 'accepts', 'trusts', 'believes', \
'acceptance', 'trusted', 'trusting', 'accepting', 'believes', 'believing', 'believed',\
'normal', 'normalize', ' normalized', 'routine', 'belief', 'faith', 'confidence', 'adoption', \
'adopt', 'adopted', 'embrace', 'approve', 'approval', 'approved', 'approves']
["it, was, a, curious, choice, for, the, good, ..."]
? - person DarrylG   schedule 13.05.2020