В моем классе CS мне было поручено прочитать во всем корпусе пьесы и сонеты Шекспира и распечатать количество раз, когда происходит определенное слово. Может ли кто-нибудь помочь мне снять ноги с земли. Вот первый уровень поэтапного уточнения, который я дал.Токенизация файла
Уровень 0 Определите функцию, которая токенизирует файл, возвращая массив токенов. Прокручивайте массив, печатая каждый токен в строке. Например, ваш специализированный основной может выглядеть примерно так:
def main():
tokens = readTokens("shakespeare.txt")
for i in range(0,len(tokens),1):
print(tokens[i])
Я думаю, мой вопрос заключается в том, как я разметить файл, а затем прочитать его в массив в Python? Извините, если этот вопрос не для чего предназначен этот сайт, я просто ищу какую-то помощь. Благодарю.
Ваш вопрос слишком широк. Дайте некоторые вещи, которые вы пробовали, а что не сработало/частично работало, вы с большей вероятностью получите помощь. –
Как вы определяете «токены» в вашем случае? – poke