2012-01-18 2 views
0

Мне нужно прочитать 20 нечетных массивных файлов (в основном, txt или pdf в некоторых случаях), а затем выполнить некоторую обработку текста на них.Доступ ко многим текстовым файлам в java

Я использую BufferedReader и цикл для чтения этих файлов, есть ли эффективный способ сделать это?

Моя проблема: прочитайте содержимое этих файлов и разделите их на токены, а затем сохраните их в структуре данных. Я использую массив сейчас, но я бы хотел использовать эффективную структуру.

Может кто-нибудь предложить средства для решения обеих проблем

+0

Вместо использования списка или карты массива ... –

+0

Вы находитесь на правильном пути (чтение файлов с использованием BufferedReader), но вам нужно определить класс, который содержит маркеры. Не используйте массивы, вместо этого используйте Список или карту. – adatapost

+0

Я думал с Картами, пары ключевых значений принесли бы большую сложность .. исправьте меня, если я ошибаюсь – CTsiddharth

ответ

0

Поскольку вы подсчитывая частоту каждого слова вы должны использовать список затем перебирать список и использовать карту с ключом является слово, чтобы следить числа вхождений

+0

Проблема с этим методом в моем случае заключается в том, что я создаю словарь из набора слов, а затем tfs основываются на каждом документе. поэтому каждое слово будет иметь более одного номера, связанных с ним! Так что я не могу использовать карту – CTsiddharth

+0

Вы можете реализовать пользовательский тип для стороны значения карты или использовать карту карт –

+0

Спасибо, я попробую реализовать ее! – CTsiddharth

Смежные вопросы