У меня есть большая строка (более подробная статья в RSS), и я хочу получить слово в определенном startIndex и endIndex. String предоставляет метод подстроки, но только с использованием ints в качестве параметров. Мои начальные и конечные индексы имеют тип long.Java: String.substring() с длинными параметрами типа
Каков наилучший способ получить слово из строки, используя начальные и конечные индексы типа long?
Моим первым решением было начать обрезку String и получить его, чтобы я мог использовать ints. Не понравилось, куда оно идет. Затем я посмотрел на Apache Commons Lang, но ничего не нашел. Любые хорошие решения?
спасибо.
Update:
Просто, чтобы обеспечить немного больше информации.
Я использую инструмент под названием General Architecture for Text Engineering (GATE), который сканирует строку и возвращает список аннотаций. Аннотации содержат тип слова (Person, Location и т. Д.) И начальные и конечные индексы этого слова.
Для RSS я использую ROME, который читает RSS-канал и содержит тело статьи в String.
Почему вы не читали ваши данные, установленные на куски и использовать регулярные подстроку (Int, Int)? –
Из любопытства, насколько велики эти строки? – Pointy
Вы действительно получаете статью RSS из 8 ГБ ?? – Roman