2016-05-26 1 views
0

Я использую Apache Тик парсер для чтения содержимого файла в локальной файловой системе, используя приведенный ниже кодApache Тик разбор из потока файлов FTP

  ContentHandler textHandler = new BodyContentHandler(); 
      Metadata metadata = new Metadata(); 
      ParseContext context = new ParseContext(); 
      InputStream input = new FileInputStream(file); 

      try { 
      _autoParser.parse(input, textHandler, metadata, context); 
      } catch (Exception e) { 

      log(String.format("File %s failed", file.getCanonicalPath())); 
      e.printStackTrace(); 
      continue; 
      } 

      list.add(textHandler.toString); 

Теперь я хотел, чтобы получить файлы с FTP location, можно ли каким-либо образом обработать файлы в FTP во время выполнения, не загружая их в любое место.

+2

Используйте клиент Java FTP, и разобрать 'InputStream' от клиента прямо к Apache Тика? – Gagravarr

ответ

1

Попробуйте библиотеку Apache Commons Net, чтобы получить InputStream файла FTP.

Пример:

String server = "www.myserver.com"; 
    int port = 21; 
    String user = "user"; 
    String pass = "pass"; 

    FTPClient ftpClient = new FTPClient(); 

    ftpClient.connect(server, port); 
    ftpClient.login(user, pass); 
    InputStream inputStream = ftpClient.retrieveFileStream("/test/test1.txt"); 
Смежные вопросы