У меня есть текстовый документ, который состоит из нескольких статей, разделенных лексем < нового документа>Как подсчитать статьи и место каждого в списке
Я хотел бы поместить каждую статью в списке
так, например, если у нас есть текстовый файл:
< НОВЫЙ ДОКУМЕНТ> Привет, мир Hello World < НОВЫЙ ДОКУМЕНТ> Early Bird Early Bird
Я хотел List1 быть: Привет, мир Hello World
List2 быть: Early Bird Early Bird
Теперь я не знаю, сколько списков мне нужно создать, поэтому сначала я должен был бы подсчитайте токен < НОВЫЙ ДОКУМЕНТ>.
Во-вторых, я хотел бы разместить каждую статью в списке.
вот моя программа
#program 1
textFile = open("docs.txt" , "r")
lines = textFile.read()
count = 0
#count how many articles there are
for line in textFile:
if line.strip() == '<NEW DOCUMENT>':
count = count + 1
#place articles in lists
textFile.close()
Я получаю 0 для подсчета голосов, и я не знаю, как начать складывать их в списках
Does '< NEW DOCUMENT> 'появляются в строке по отдельности или могут быть другие тексты вместе с ней на этой строке? – inspectorG4dget
Нет, он сам по себе не отображается: Инспектор весов состояния –
Mozein
Оператор '==' проверяет равенство. Я думаю, вы хотите использовать оператор 'in' для тестов на сдерживание. – ILostMySpoon