2010-02-19 4 views
0

У меня есть HTML-файл с большим количеством пробелов. Мой вопрос в том, стоит ли удалять этот пробел, чтобы уменьшить размер файла, прежде чем отправить его? Если да, то каков был бы самый быстрый способ удалить пробелы?Удаление пробелов из HTML-адреса электронной почты

В настоящее время это все в C#.

Благодаря мой комментарий ниже не работает должным образом, я сделал это здесь:

<html> 
    <head> 
     <title>test title</title> 
    </head> 
</html> 

Это расстояние до открытия тегов, которые я желающих удалить, если это стоит.

ответ

0

Я думаю, вы имеете в виду удаление вкладок и пробелов в начале каждой строки. Для этого вы можете использовать регулярные выражения. Проверьте пример http://www.regular-expressions.info/examples.html (В разделе «Обрезание пробелов»)

Прежде чем вы это сделаете, я проверил бы, действительно ли большая разница в размере файла.

+0

Если я это сделаю, к сожалению, я выиграл Не знаю. Исходный файл поступает из HTML-редактора, поэтому он отформатирован, поэтому веб-разработчики могут четко его прочитать. –

+0

Пример, на который вы ссылаетесь, - это обрезание пробелов в одной строке. – Oded

+0

Вы можете скопировать HTML в текстовый редактор? Таким образом, вы можете сохранить его как HTML-файл. Затем создайте копию и используйте функцию replace в текстовом редакторе, чтобы удалить пробелы. Затем сравните размеры файлов. – Pbirkoff

0

Вы имеете в виду &nbsp;?
Если да, используйте строку. Функция возврата

+0

Я просто имел в виду пробелы в целом. Это будет выглядеть примерно так: etiojhtat но мне интересно, если удаление ведущих пробелов, если стоит? –

1

Если на самом деле довольно много свободного места, удаление будет хорошим - вы в конечном итоге трассируете меньше по проводу.

Предполагая, что это в основном пробелы, табуляции и возврата каретки, я хотел бы использовать регулярное выражение и заменить пробелом:

RegEx reg = new RegEx("\s"); 
string result = reg.Repalce(myHTML, " "); 

Это также подразумевает, что вы находитесь в контроле ввода HTML, так как вы не должны 't использовать регулярные выражения для синтаксического анализа HTML.

+0

Почему я не должен использовать регулярные выражения для HTML? –

+0

Я не сказал, что вы не должны их использовать, я сказал, что вы не должны _parse_ html с ними. См. Этот классический ответ SO для деталей: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Oded

0

Это не стоит проблем. Вы, по сути, разрушаете любое формирование, которое может иметь файл. Это может быть желательным.

В первый раз, когда вы должны отлаживать файл, когда кто-то сидит и переформатирует его, чтобы прочитать что-то, вы просто потратили впустую в любое время, когда вы его сохранили.

Вы потратите деньги, потраченные на то, чтобы потратить 30 минут на то, чтобы читать.

Вы также будете тратить время на создание потенциально глючного шага, который может случайно удалить допустимый интервал, поскольку использование regex для html не является надежным.

Что вы получите? несколько пробелов и новых строк удалены?

+0

Мы просто удаляем пробелы, чтобы уменьшить размер электронной почты. Мы не собираемся сохранять документ обратно на диск. –

Смежные вопросы