2015-06-09 3 views
0

Заранее спасибо за помощь.Расширение файла ARFF для бинарного исполняемого файла csv

Я ищу двоичный исполняемый файл для преобразования .arff в .csv в сценарии bash. В идеале что-то, что я мог бы работать по линии

#! /bin/sh 
... some stuff.... 
converstionFunc input.arff output.csv 
... some more stuff ... 

прогностического в письменной форме это сам, я обнаружил, что WEKA предоставляет библиотеку, что я мог бы использовать этот позволит мне сделать это. Однако, сколько бы я ни искал, я не мог найти его. У меня есть weka, установленный на моем mac и после осмотра библиотеки я все еще не смог ее найти.

Кто-нибудь знает, где я могу найти такой исполняемый файл, или могу указать мне, где я мог бы уловить библиотеку weka java, которая позволила бы мне написать ее самостоятельно?

+0

Может ли сценарий python быть приемлемым? Предполагая, что ваш arff не слишком сложный, это должно быть очень простым преобразованием. – reynoldsnlp

+0

все будет приемлемо. У меня есть несколько тысяч файлов arff, которые я бы хотел преобразовать в csv. В идеале я хотел бы, чтобы преобразование было как можно быстрее, но я готов согласиться на все, что работает – HXSP1947

ответ

2

Клонировать это хранилище github. Он содержит инструмент arff2csv в подкаталоге «tools».

arff2csv предназначен для работы в трубах инструментов командной строки unix.

https://github.com/jeroenjanssens/data-science-at-the-command-line

arff2csv является одной строки оболочки сценарий, который вызывает другой скрипт, который вызывает weka.jar,

поэтому она нуждается в Java, установленных на вашем компьютере; и обратите внимание, что arff2csv нуждается в версии Weka 3.6. (По моим экспериментам новее v3.7 не работает.)

Сценарий хочет этот переменные окружения набора:

export WEKAPATH=/path/to/wekajar-dirname 

, а затем вы можете сделать

cat /opt/smallapps/weka-stable/data/breast-cancer.arff | arff2csv > breast-cancer.arff.csv 

Большой arffs нужны некоторые время для обработки.

Вы можете прочитать книгу Дж. Янссена (см. Репо-README) для получения дополнительной информации.

+0

. В итоге я нашел обходное решение, которое позволило мне избежать создания файлов arff. Решение, которое вы указали, похоже, что оно будет работать. – HXSP1947

0

Пробуйте поиск по веб-сайту arff2csv. Похоже, там много утилит.

Смежные вопросы