Я ищу, чтобы оптимизировать список слов для английского языка с использованием СЭД или аналогичное приложение Линукс .. для того, чтобы сделать это, мне нужно:как оптимизировать список слов на английском языке
Удалить строки, содержащие что-нибудь кроме AZ, 0-9, или специальные символы
Удалить URLs - возможно обнаружение символом «\» долго
Удалить линии более 16 символов, а также 4-х символов или короче. (5-16 символов)
Предпочтительно в СЕПГ =)
спасибо!
Вы можете использовать http://gskinner.com/RegExr/ в будущем для создания regexs. Плюс, используя его, вы научитесь делать их с нуля. –