Я использую hasoop cdh4.1.2, и моя программа mapper - это почти эхо входных данных. Но в моей странице статуса работы, я увиделВыход компрессора Hadoop не работает?
FILE: Number of bytes written 3,040,552,298,327
почти равен
FILE: Number of bytes read 3,363,917,397,416
для картографов, в то время как я уже установил
conf.set("mapred.compress.map.output", "true");
, кажется, их сжатие алгоритма не работает для моей работы? почему это?
благодаря выходные Карта байт = 3219090158272 Снизить воспроизведения в случайном порядке байт = 1514030378633 это средний алгоритм компрессионного по умолчанию не подходит для моих данных (чистый текст) – Shawn
Похоже it.I никогда не используется по умолчанию codec.Can вы держите conf.set ("mapred.map.output.compression.codec", "org.apache.hadoop.io.compress.SnappyCodec"); и снова увидеть цифры? Вы также можете попробовать lzo, если он доступен в вашем дистрибутиве. –