У меня есть текстовый файл в следующем формате:Чтение структурированный текстовый файл в Python
1. AUTHOR1
(blank line, with a carriage return)
Citation1
2. AUTHOR2
(blank line, with a carriage return)
Citation2
(...)
То есть, в этом файле, некоторые строки начинаются с целым числом, за которым следует точка, пробел, и текст с указанием имени автора; за этими строками следует пустая строка (которая включает возврат каретки), а затем для строки текста, начинающейся с буквенного символа (цитирования статьи или книги).
То, что я хочу, чтобы прочитать этот файл в список Python, присоединившись имена автора и цитаты, так что каждый элемент списка имеет вид:
[ «AUTHOR1 Citation1», «AUTHOR2 Citation2» , '...']
Это похоже на простую проблему программирования, но я не мог решить, какое именно решение. Я попытался сделать следующее:
articles = []
with open("sample.txt", "rb") as infile:
while True:
text = infile.readline()
if not text: break
authors = ""
citation = ""
if text == '\n': continue
if text[0].isdigit():
authors = text.strip('\n')
else:
citation = text.strip('\n'
articles.append(authors+' '+citation)
но список статей содержит авторов и цитаты, хранящиеся в виде отдельных элементов! .
Заранее спасибо за любую помощь в решении этой неприятной проблемы ... :-(
Спасибо, это решило мою проблему! – maurobio
@maurobio Отлично. Не стесняйтесь принять мой ответ. –