Я пытаюсь выполнить простую программу MapReduce, в которой карта принимает вход, разделяет его на две части (key => String и value => Integer) Редуктор суммирует значения для соответствующего ключа Я получаю ClassCastException каждый раз. Я не могу понять, что в коде вызывает эту ошибкуПолучение java.lang.ClassCastException: класс java.lang.String при запуске простой программы MapReduce
Мой код:
import java.io.IOException;
import java.util.Iterator;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reducer;
import org.apache.hadoop.mapred.Reporter;
import org.apache.hadoop.mapred.TextInputFormat;
import org.apache.hadoop.mapred.TextOutputFormat;
public class Test {
public static class Map extends MapReduceBase implements
Mapper<LongWritable, Text, String, Integer> {
@Override
public void map(LongWritable key, Text value,
OutputCollector<String, Integer> output, Reporter reporter)
throws IOException {
String line = value.toString();
String[] lineParts = line.split(",");
output.collect(lineParts[0], Integer.parseInt(lineParts[1]));
}
}
public static class Reduce extends MapReduceBase implements
Reducer<String, Integer, String, Integer> {
@Override
public void reduce(String key, Iterator<Integer> values,
OutputCollector<String, Integer> output, Reporter reporter)
throws IOException {
int sum = 0;
while (values.hasNext()) {
sum = sum + values.next();
}
output.collect(key, sum);
}
}
public static void main(String[] args) throws Exception {
JobConf conf = new JobConf(Test.class);
conf.setJobName("ProductCount");
conf.setMapOutputKeyClass(String.class);
conf.setMapOutputValueClass(Integer.class);
conf.setOutputKeyClass(String.class);
conf.setOutputValueClass(Integer.class);
conf.setMapperClass(Map.class);
conf.setReducerClass(Reduce.class);
conf.setInputFormat(TextInputFormat.class);
conf.setOutputFormat(TextOutputFormat.class);
FileInputFormat.setInputPaths(conf, new Path(args[0]));
FileOutputFormat.setOutputPath(conf, new Path(args[1]));
JobClient.runJob(conf);
}
}
Образец данных:
abc,10
abc,10
abc,10
def,9
def,9
Ниже трассировки стека. Это имеет какое-либо отношение к моей ключевой ценности?
14/02/11 23:57:35 INFO mapred.JobClient: Task Id : attempt_201402110240_0013_m_000001_2, Status : FAILED
java.lang.ClassCastException: class java.lang.String
at java.lang.Class.asSubclass(Class.java:3018)
at org.apache.hadoop.mapred.JobConf.getOutputKeyComparator(JobConf.java:795)
at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask.java:816)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:382)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:324)
at org.apache.hadoop.mapred.Child$4.run(Child.java:268)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1115)
at org.apache.hadoop.mapred.Child.main(Child.java:262)
Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1246)
at Test.main(Test.java:69)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:186)
Я бы предположил, что вы используете пакет org.apache.hadoop.mapreduce вместо mapred, который является устаревшим (см. Http: // stackoverflow.com/questions/7598422/is-it-better-to-use-the-mapred-or-the-mapreduce-package-to-create-a-hadoop-job), но я не думаю, что это решит проблему , его, скорее всего, будет лучшая практика –
Может ли уменить классы Integer и String с помощью IntWritable, Text? –
@TomSebastian Я заменил классы, как было предложено, и теперь это работает. Не могли бы вы, пожалуйста, пролить свет на то, почему он не работает с String и Integer. Следует ли мне избегать использования классов String и Integer в качестве ключа/значения для написания программ MapReduce? Существуют ли какие-то правила для выбора классов ключа/значения? – addicted20015