В настоящее время я участвую в математике машинного обучения (точнее, НЛП). Хотя в задаче я столкнулся с проблемой. Я хочу, чтобы напечатать строки, содержащие любой из следующих регулярных выражений:python/perl скрипт для извлечения текста
1) fbchat
2) fb_timeline
3) Facebook стене
в отдельные текстовые файлы, один для каждой строки упомянутое выше.
Затем в каждом из полученных текстовых файлов, я хотел бы, чтобы сортировать каждую линию по отношению к нити ID поле базы данных, указанной в самой первой строке messaged.dmp. Я теоретик с очень небольшим опытом программирования.
Загружаемый ссылка на дамп базы данных приводится ниже
Update:
Это сценарий, я пытался написать:
import re
from sys import argv
scrip, file_name = argv
dfile = open(file_name, 'r')
for line in dfile:
if re.match("fbchat", line):
print line
Но сценарий не выполняет ничего ,
Я понимаю, что вы 'теоретический человек с очень меньше программирования experience' но, пожалуйста, обратитесь к [помощь] (http://stackoverflow.com/tour) You не можете задавать «вопросы, которые вы не пытались найти для ответа», вам нужно показать свою работу. –
@KobiK Я обновил свой вопрос ... PLS пройти через –