2015-07-14 3 views
0

Я заметил, что различные почтовые клиенты добавляют/добавляют текст в текст, написанный пользователем. Например, Gmail, кажется, предварять следующий текст всех почтовых тел:Очистка электронных писем для электронной системы электронной почты

«О Втр, 14 июл 2015 в 11:41, Jonny Bravo писал:>»

Добавленный текст отличается на основе клиент. Меня это не интересует. Я хотел бы иметь возможность извлечь текст сообщения из текста с помощью подхода, который является относительно кросс-платформенным. Есть ли что-нибудь подобное? Является лучшим решением для очистки текста в каждом конкретном случае?

ответ

1

У нас была такая же проблема в mailparser.io, когда мы разработали фильтр «последнего ответа». Мы получаем очень приличные результаты, просто проверяя набор регулярных выражений.

регулярные выражения, которые мы используем:

'/^(--)$/ms', // -- Signature break 
'/^(-----(.+))$/ms', // ----- reply above 
'/^(From:(.+))$/ms', // From: 
'/^(On\s(.+)wrote:)$/ms', // On DATE, NAME <EMAIL> wrote: 
'/^(Sent from(.+))$/ms', // Sent from (iPhone/iPad/Windows Mail ...) 

С теми, вы должны действительно поймать в большинстве случаев, производимые клиентами электронной почты, которые имеют свой язык установлен на английский.


+0

Я начал строить нечто подобное. Спасибо, что поделились этим со мной. Это сэкономит мне много времени :) – bipvanwinkle

Смежные вопросы