Мне нужно написать приложение в C#, которое читает миллиард записей из файлов, а затем через IMPALA ODBC записывает записи на таблицу Impala. Я уже пытался выполнить вставку запроса, используя один оператор с параметромodbc impala bad writing performance
INSERT INTO table VALUES (?,?,.....,?)
или с использованием нескольких вставок:
INSERT INTO table VALUES (?,?,.....,?),(?,?,.....,?),...,(?,?,.....,?)
Но пихты очень медленно и создать один файл на HDFS для каждой записи; во-вторых, более быстрый, но запрос очень долго и миллиарды записей я получаю следующее сообщение об ошибке:
[Cloudera][SQLEngine] (31580) The length of the statement exceeds the maximum: 16384.
Кто-то имеет какое-то решение для моей проблемы, учитывая, что я должен использовать C# как язык для моего приложения.
Thanks
Какой тип файлов вы чтения записей из? –
Csv или текстовый файл. – marley1990