2016-12-28 4 views
0

Это мой первый пост в stackoverflow. Недавно я присоединился к курсу по информационным наукам о Курсере. Будучи студентом на Курсере, я должен был отметить несколько заданий, которые включали вопрос о уценке. Задача попросила всех создать текстовый файл, который можно было бы просмотреть в репо на GitHub. Файл должен был быть отформатирован как вторичный заголовок (##), который имел следующий контент «Это файл уценки». В файлах большинства людей было отображено «2 строки, 27 байтов».GitHub - Язык разметки в текстовом файле - Количество строк

Однако в 2 присваиваниях я увидел следующее: '1 строка, n байтов (n - различные байты). Я понимаю, что байты изменились, потому что не все поместили «Это файл уценки» - кто-то пропустил «a» и т. Д. Однако почему количество строк меняется? Я проверил файл необработанных данных, и все они содержали то же самое. Я совершенно новичок в области науки о данных (старый фон статистики школы), поэтому, если это простой ответ, то извинения за вопрос.

+0

Не могли бы вы предоставить ссылку на такой файл на GitHub? – Mureinik

+0

это может быть конец строки, попробуйте 'dos2unix'. также попробуйте сделать файл снова с нуля. –

+0

@mureinik Привет, Mureinik, я могу предоставить только мою собственную ссылку Github, чтобы показать вам, что я имею в виду. Это [github link] (https://github.com/Louis-York/datasciencecoursera/blob/master/HelloWorld.md). На этой странице вы можете увидеть, что мой файл.md имеет 2 строки. Это было то, что я видел на странице всех, кроме двух человек, где он показывал файл с одной строкой. –

ответ

0

Это почти наверняка связано с концами линии.

Большинство людей, вероятно, включили строку, заканчивающуюся в конце первой строки. Поэтому файл содержит вторую пустую строку. Несколько пользователей не добавили окончания строки (используя ключ [enter] или [return]). Поэтому их файл содержит одну строку.

Обычно считается хорошей формой для включения строки, заканчивающейся в конце последней строки текстового файла. Фактически, многие текстовые редакторы автоматически добавят один для вас, поэтому, вероятно, большинство файлов содержат две строки. Тем не менее, любой достойный анализатор Markdown должен иметь возможность правильно проанализировать файл Markdown, в котором отсутствует строка, заканчивающаяся на последней строке.

Что касается разницы в размере файла (при отсутствии опечаток), это также, вероятно, связано с окончанием строки. В Windows (DOS) система по умолчанию использует два (скрытых) символа для представления окончания строки (обычно это обозначается как \r\n). В то время как во всех других системах (Mac OS, Linux, Unix и т. Д.) Используется только один символ (\n). Опять же, любой достойный анализатор Markdown должен иметь возможность справиться. Но каждый из них дает различное количество символов и, следовательно, другой размер файла.

+0

Большое спасибо Waylan, это имеет смысл. –

Смежные вопросы