Доступ ко многим текстовым файлам в java

Мне нужно прочитать 20 нечетных массивных файлов (в основном, txt или pdf в некоторых случаях), а затем выполнить некоторую обработку текста на них.Доступ ко многим текстовым файлам в java

Я использую BufferedReader и цикл для чтения этих файлов, есть ли эффективный способ сделать это?

Моя проблема: прочитайте содержимое этих файлов и разделите их на токены, а затем сохраните их в структуре данных. Я использую массив сейчас, но я бы хотел использовать эффективную структуру.

Может кто-нибудь предложить средства для решения обеих проблем

источник

2012-01-18 CTsiddharth

Вместо использования списка или карты массива ... –

Вы находитесь на правильном пути (чтение файлов с использованием BufferedReader), но вам нужно определить класс, который содержит маркеры. Не используйте массивы, вместо этого используйте Список или карту. – adatapost

Я думал с Картами, пары ключевых значений принесли бы большую сложность .. исправьте меня, если я ошибаюсь – CTsiddharth

Поскольку вы подсчитывая частоту каждого слова вы должны использовать список затем перебирать список и использовать карту с ключом является слово, чтобы следить числа вхождений

источник

2012-01-18 04:54:56

Проблема с этим методом в моем случае заключается в том, что я создаю словарь из набора слов, а затем tfs основываются на каждом документе. поэтому каждое слово будет иметь более одного номера, связанных с ним! Так что я не могу использовать карту – CTsiddharth

Вы можете реализовать пользовательский тип для стороны значения карты или использовать карту карт –

Спасибо, я попробую реализовать ее! – CTsiddharth

Доступ ко многим текстовым файлам в java

ответ

Смежные вопросы