У меня есть файл из Moby Project, который сочетает слова с одной или несколькими буквами, указывающими их часть речи. Например:Python dict из файла mobypos.txt
hemoglobin\N
hemogram\N
hemoid\A
hemolysin\N
hemolysis\N
hemolytic\A
hemophile\NA
hemophiliac\N
Гемоглобин является существительное, гематоидный прилагательное и hemophile может быть использован как существительное или прилагательное.
Я создал Dict из этого файла, что пары слова с буквой, обозначающей частями речи, используя следующий код:
mm = open("mobypos.txt").readlines()
pairs = []
for x in mm:
pairs.append(x.split("\\"))
posdict = dict(pairs)
Это работает успешно. Я хочу создать списки, называемые nouns
, verbs
, adjectives
и т. Д., Которые содержат все слова этой части речи. Какой самый быстрый способ сделать это, учитывая, что len(posdict.keys())
возвращает 233340
Почему я хочу использовать 'iteritems' вместо' items'? Это быстрее? –