Открываю файл с помощью python, чтобы узнать, присутствует ли в открытом файле предопределенный набор слов. Я взял предопределенный набор слов в списке и открыл файл, который должен быть протестирован. Теперь есть способ извлечь слова в python, а не в строки. Это облегчает мою работу.Извлечь слова из файла
3
A
ответ
7
import re
def get_words_from_string(s):
return set(re.findall(re.compile('\w+'), s.lower()))
def get_words_from_file(fname):
with open(fname, 'rb') as inf:
return get_words_from_string(inf.read())
def all_words(needle, haystack):
return set(needle).issubset(set(haystack))
def any_words(needle, haystack):
return set(needle).intersection(set(haystack))
search_words = get_words_from_string("This is my test")
find_in = get_words_from_string("If this were my test, I is passing")
print any_words(search_words, find_in)
print all_words(search_words, find_in)
возвращает
set(['this', 'test', 'is', 'my'])
True
1
Вы можете сделать несколько вещей
- file.readlines вызова() и разделить весь текст на нужный разделитель, если ваш текст не большой
- вызовов чтения() и сделать это байты в время
Отъезд pydocs для файла - http://docs.python.org/release/2.5.2/lib/bltin-file-objects.html
1
Этот код покажет, какие слова присутствуют в файле, при условии, что слово точно соответствует, и я s не предшествует или не следует пунктуацией или другими символами и имеет один и тот же случай. С некоторой незначительной корректировкой код можно было бы сделать более прощающим.
words = set(['hello', 'world', 'testing'])
f = open('testfile.txt', 'rb')
data = set(f.read().split())
print words.intersection(data)
Смежные вопросы
- 1. sed issue - Извлечь определенные слова из файла
- 2. Извлечь слова из массивов
- 3. Извлечь подобные слова из корпуса
- 4. Извлечь ключевые слова из текста
- 5. Unix - извлечь слова из строки
- 6. строка: извлечь слова из предложения
- 7. Извлечь 2 слова из строки
- 8. Как извлечь шаблон из слова
- 9. Извлечь только слова с апострофом из текстового файла
- 10. Как извлечь ТОЛЬКО слова из txt-файла в Java
- 11. Как извлечь слова из каждой строки csv-файла в python?
- 12. Извлечение слова из текстового файла
- 13. Как извлечь определенные слова из «разобранном» файл
- 14. Как извлечь слова из строки в Java
- 15. Как извлечь слова из строки в Java
- 16. Невозможно извлечь ключевые слова из образа
- 17. извлекать слова из файла
- 18. MD5ing слова из файла
- 19. Извлечь слово из файла
- 20. Извлечь ссылку из файла
- 21. извлечь данные из файла
- 22. Извлечь информацию из файла
- 23. Извлечь информацию из файла
- 24. Извлечь столбцы из файла
- 25. Как Java извлекает слова из текстового файла?
- 26. Извлечь определенные ячейки слова
- 27. Слова из текстового файла C++
- 28. Извлечь ссылку и слово из файла слов
- 29. Извлечь слова между круглыми скобками
- 30. извлечь слова из отрывка на основе размещения слова
идеальное решение ... но что, если файл слишком large..any умное решение – nikhil
(пожав плечами) уверен, разбор файла строка за строкой, накапливая словосочетание, как вы идете. –