Кто-нибудь знает, как пропустить первую строку входного текстового файла в MapReduce? Например, у меня есть следующий входной файл:MapReduce пропустить первую строку входного файла
Student Score
00001 90
00002 95
00003 90
.
.
.
Теперь я хотел бы рассчитывать частоту каждого баллов. Но я должен пропустить первую строчку, которая является названием (Student, Score), правильно? Как я могу это сделать? В contratry, если я хочу добавить строку заголовка в выходной файл MapReduce (Score, Frequency), как я могу это сделать? Заранее спасибо!
Возможный дубликат [Обработка файлов с заголовками в Hadoop] (http://stackoverflow.com/questions/1104336/processing-files-with-headers-in-hadoop) – nelsonda
и возможный дубликат http: // stackoverflow. com/questions/27854919/how-to-skip-header-from-csv-files-in-spark – jimijazz