Я хочу подсчитать количество вхождений определенных слов в фрейме данных. Я знаю, используя «str.contains»Количество вхождений определенных слов в pandas dataframe
a = df2[df2['col1'].str.contains("sample")].groupby('col2').size()
n = a.apply(lambda x: 1).sum()
В настоящее время я использую вышеуказанный код. Есть ли способ сопоставления регулярного выражения и получения количества вхождений? В моем случае у меня большой кадр данных, и я хочу совместить около 100 строк.
Это намного опрятно и, вероятно, быстрее, устраняя необходимость '' get''. –
@ Энди Хайден: Предположим, я хочу, чтобы подсчет «привет» и «слово» подсчитывали и печатали «привет» count = 1 ',' "word" count = 1 "? Могу ли я сделать это в одной строке кода? –
Как насчет 'word_regexs = [r'he ', r'wo']', а затем создайте серию с 'pd.Series ((df.words.str.contains (r) .sum() для r в word_regexs), word_regexs, name = 'count') '? –