2013-05-28 2 views
0

Я чувствую себя глупым, спрашивая об этом, но мне нужен инструмент графического интерфейса для очистки данных.Очистка данных пользователей

Исполнительный предложил взять на себя некоторые из моих работ по очистке данных, если я могу упростить задачи. Я использовал R для очистки данных и Awk, чтобы разбить его, что выходит за рамки его технических возможностей или интересов. Я предложил написать сценарий Python, который делает все за один выстрел, он скорее бы имеет графический интерфейс.

Все наши данные хранятся в файлах CSV, большинство из которых имеют ~ 10 столбцов и < 2 000 строк. Очистка включает удаление некоторых строк, добавление нескольких других и разделение их на CSV-файлы по значениям столбцов (дата в этом случае). Выходом обычно является десяток файлов CSV «чистых» данных.

Есть ли какие-нибудь удобные инструменты для редактирования CSV &? Excel уничтожает наши данные, так что это невозможно. Я смотрю на Google Refine, я думаю, что это может быть хорошим вариантом, но я не уверен, что он разделит данные.

Кто-нибудь еще сталкивался с проблемой необходимости использования удобных для пользователя инструментов для очистки данных? Я сделал несколько поисков инструментов очистки данных, но ничего не понял.

ответ

2

Пробег: csved. Он может обрабатывать все виды данных CSV и должен быть способен делать то, что вам нужно.

+0

Спасибо за это! Похоже, он справится со всем, что мне нужно. – Lenwood

Смежные вопросы