Хорошо, меня очень интересовала обработка естественного языка в последнее время: однако я использовал C до сих пор для большей части моей работы. Я слышал о NLTK, и я не знал Python, но это кажется очень легким для изучения, и это выглядит как действительно мощный и интересный язык. В частности, модуль NLTK кажется очень и очень приспособленным к тому, что мне нужно делать.Производительность NLTK
Однако при использовании sample code for NLTK и вклеивании этого файла в файл с именем test.py
, я заметил, что для его запуска требуется очень и очень долгое время!
Я звоню его из командной строки следующим образом:
time python ./test.py
А на 2,4 ГГц машина с 4 Гб оперативной памяти с, она занимает 19.187 секунды!
Теперь, может быть, это абсолютно нормально, но у меня создалось впечатление, что NTLK был чрезвычайно fast; Возможно, я ошибался, но есть ли что-то очевидное, что я явно ошибаюсь?
Откуда у вас сложилось впечатление, что NLTK очень быстрый? –
В описании Amazon для «Обработка текста Python с помощью NLTK 2.0»: «Узнайте, как легко обрабатывать огромные объемы данных без потери эффективности или скорости». (Http://www.amazon.com/Python-Text-Processing-NLTK-Cookbook/dp/1849513600). – elliottbolzan