2014-10-19 2 views
1

Есть ли простой способ удалить хэштеги, имена пользователей и URL-адреса, упомянутые в твиттере, используя twitter4j? Я знаю, что используя getHashtagEntities(), getUserMentionEntities() и getURLEntities() Я могу получить эти сущности и их позицию в строке, но как бы использовать их для «очистки» твитов?Удаление хэштегов, имен пользователей и URL-адресов из твита с помощью Twitter4j

Я думал об использовании метода replaceAll (entity, "") для замены всех этих объектов в твите с помощью "", но это не всегда давало бы правильные результаты (.eg он удалял #ht из "_ #ht "чирикать, хотя это не должно).

ответ

1

В конце концов я использовал метод поиска "(?<!\w)" с методом replaceAll() для каждого объекта, и я предполагаю, что это решило мою проблему. Однако мне сказали, что регулярное выражение и метод replaceAll() могут быть довольно медленными, поэтому, если у кого-то есть другие предложения, я был бы рад их прочесть.

+0

Какой класс реализует этот removeAll? – perrohunter

+0

Прошу прощения, я хотел написать replaceAll(). Я работал с объектами String. – GeorgeG