Я хочу выполнить часть тегов и распознавания сущностей в python, подобных функциям Maxent_POS_Tag_Annotator и Maxent_Entity_Annotator openNLP в R. Я бы предпочел код в python, который принимает ввод как текстовое предложение и дает выход как различные функции - как количество «CC», количество «CD», количество «DT» и т. д. CC, CD, DT - это теги POS, используемые в Penn Treebank. Таким образом, должно быть 36 столбцов/функций для тегов POS, соответствующих 36 тегам POS, как в Penn Treebank POS. Я хочу реализовать это на Azure ML «Execute Python Script», а Azure ML поддерживает python 2.7.7. Я слышал, что nltk в python может выполнять эту работу, но я начинаю на python. Любая помощь будет оценена по достоинству.Часть речевых тегов и распознавания объектов - python
0
A
ответ
2
Взгляните на раздел NTLK book, раздел «Сортировка и маркировка слов».
Простой пример, он использует Penn Treebank множества ярлыков:
from nltk.tag import pos_tag
from nltk.tokenize import word_tokenize
pos_tag(word_tokenize("John's big idea isn't all that bad."))
[('John', 'NNP'),
("'s", 'POS'),
('big', 'JJ'),
('idea', 'NN'),
('is', 'VBZ'),
("n't", 'RB'),
('all', 'DT'),
('that', 'DT'),
('bad', 'JJ'),
('.', '.')]
Затем вы можете использовать
from collections import defaultdict
counts = defaultdict(int)
for (word, tag) in pos_tag(word_tokenize("John's big idea isn't all that bad.")):
counts[tag] += 1
получить частоты:
defaultdict(<type 'int'>, {'JJ': 2, 'NN': 1, 'POS': 1, '.': 1, 'RB': 1, 'VBZ': 1, 'DT': 2, 'NNP': 1})
Смежные вопросы
- 1. Часть речевых тегов в OpenNLP против StanfordNLP
- 2. CoreNLP - настройка (часть тегов речевых сообщений)
- 3. Алгоритмы распознавания именных объектов
- 4. Поиск «субъекта» из массива части речевых тегов
- 5. Обзор распознавания имен объектов NLTK
- 6. Улучшение тегов TOS CoreNLP и тегов NER?
- 7. распознавания объектов в андроида
- 8. Лучший способ распознавания объектов?
- 9. Python: Зачистка речевых данные с сайта
- 10. Использование SIFT и OpenCV для распознавания объектов
- 11. Python распознавания речи отсутствует
- 12. Часть речи для неизвестных и известных слов
- 13. Методы распознавания объектов в OpenCV
- 14. Как использовать библиотеку речевых объектов Microsoft для создания wav-файла
- 15. Python - классификатор распознавания изображений
- 16. Маркировка объектов базы данных (строковых тегов) и поиск тегов
- 17. Сравнение двух речевых звуков
- 18. Есть ли доступный CFG (с позиционными тегами - часть речевых тегов) для проверки грамматики предложений на английском языке?
- 19. ASP.NET + Конфигурирование тегов объектов
- 20. извлечения объектов собственных тегов
- 21. PHP STRLEN на речевых знаков и запятых
- 22. Чтение в знак фунта и речевых знаков
- 23. Обработка изображений для распознавания двумерных объектов
- 24. обнаружения объектов/распознавания с помощью MatLab
- 25. Алгоритмы распознавания объектов с открытым исходным кодом
- 26. Каковы современные алгоритмы распознавания планарных объектов?
- 27. Интеграция распознавания объектов в приложение iOS
- 28. Есть ли доступная библиотека обнаружения объектов/распознавания?
- 29. deeplearning4j - используйте Word2Vec для распознавания имен объектов
- 30. Python - смещение времени распознавания речи
Благодаря @hellpanderr. Можете ли вы также рассказать о способах импорта nltk в python? Я новичок в python. Windows 7 - 64 бит. – ankur
@ankur Шаги для импорта nltk в python: 1. откройте окно cmd; 2. команду «cd» на путь установленного Python; 3. команда 'Scripts/pip.exe install ntlk' –
@ PeterPan-MSFT Я использую python 2.7.7. pip не установлен. Он показывает, что ошибка Scripts не распознается как внутренняя или внешняя команда. – ankur