Я новичок в Python, но, к моему собственному удивлению, я произвел этот рабочий кусок кода:Подсчет слов из файла в Python
if __name__ == "__main__":
with open("wordlist.txt") as infile:
for line in infile:
print(line)
with open ("cv000_29416.txt", "r") as myfile:
data=myfile.read().replace('\n', '')
print (data.count("bad"))
Дело в том, что я хочу, чтобы подсчитать слова из wordlist.txt в cv000_29416.txt.
(Так что wordlist.txt содержит, например, двадцать слов, таких как «bad», «good» и т. Д., А cv000_29416.txt - это длинный текст, и я хочу подсчитать, сколько раз «плохо», «хорошо» и т. Д. в cv000_29416.txt)
Могу ли я вставить это где-нибудь в секундах кода?
Спасибо! и извините за плохой английский
Это потенциально освобождает пространство, отслеживая нежелательные слова. В идеале вы должны были бы подсчитать ТОЛЬКО слова в wordlist.txt – inspectorG4dget
@ inspectorG4dget, это должен был быть довольно большой файл, прежде чем он будет иметь какое-либо значение, счетчик-диктор - это именно то, о чем OP должен учиться в противоположность для использования чего-то типа 'print (data.count (« bad »))' –
Предоставлено: 'data.count (« bad »)' is bad (каламбур не предназначен). Тем не менее, OP может поддерживать dict с ТОЛЬКО требуемыми словами и вручную увеличивать счетчик по мере необходимости. Это сэкономит место и будет намного более масштабируемым (для больших/разреженных файлов). Кроме того, поскольку 'collections' написан на python, это будет не так много быстрее, чем написанный вручную код python – inspectorG4dget