2012-06-14 2 views
0

Я не совсем уверен, как это назвать, но я искал несколько фраз и не нашел того, что мне нужно.Маркировка или маркировка неструктурированных данных

У меня есть много неструктурированных данных, которые мне нужно получить в базе данных. Раньше я делал тяжелую работу с Needlebase и просто очищал данные оттуда. Но теперь, когда этого больше нет, я хочу, чтобы вы могли быстро захватить фрагменты текста за пределами выбора, скопировать, вставить, намыть, полоскать, повторить.

В идеале что-то, где я мог бы выбрать какой-либо текст, и всплывающее окно спрашивает, что это такое (из пользовательского списка, названия, времени начала, пути к изображению и т. Д.), А затем отмечает его как таковой. Естественно, мне нужно было бы отметить начало и конец записи (все данные строки последовательны, просто не в легко анализируемом формате).

Возможно, я мог бы написать что-то через несколько часов, чтобы это сделать, но я не хочу изобретать велосипед, если что-то существует. Я нахожусь на OS X, но меня интересует программное обеспечение для любой платформы.

+0

У них есть несколько альтернативных программ, предложенных на их веб-сайте: http://needlebase.com/ – Radix

+0

@AminoAcid Да, но все из тех (если я чего-то не хватает) предназначены для работы с уже структурированные, если грязные, данные. –

ответ

0

Ваши данные в формате HTML? если да, вы можете использовать Jsoup

Смежные вопросы