Вот пример/декодирования реализации кодирования длин серий в Java:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RunLengthEncoding {
public static String encode(String source) {
StringBuffer dest = new StringBuffer();
for (int i = 0; i < source.length(); i++) {
int runLength = 1;
while (i+1 < source.length() && source.charAt(i) == source.charAt(i+1)) {
runLength++;
i++;
}
dest.append(runLength);
dest.append(source.charAt(i));
}
return dest.toString();
}
public static String decode(String source) {
StringBuffer dest = new StringBuffer();
Pattern pattern = Pattern.compile("[0-9]+|[a-zA-Z]");
Matcher matcher = pattern.matcher(source);
while (matcher.find()) {
int number = Integer.parseInt(matcher.group());
matcher.find();
while (number-- != 0) {
dest.append(matcher.group());
}
}
return dest.toString();
}
public static void main(String[] args) {
String example = "WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW";
System.out.println(encode(example));
System.out.println(decode("1W1B1W1B1W1B1W1B1W1B1W1B1W1B"));
}
}
Взято отсюда:
http://rosettacode.org/wiki/Run-length_encoding
(эта страница содержит эквивалентные примеры в 72 разных языка программирования для достижения одной и той же цели)
Чтобы достичь того, о чем вы просите, вы должны использовать «enco» de ".
Испытано здесь: http://www.browxy.com/SubmittedCode/21369
Regex сама по себе не является подходящим инструментом для пытаться достигнуть этого.
Escape '.' как этот' \\. '. Обратите внимание, что 'replaceAll' принимает ** regex **, а не строку. ('.' имеет особое значение в regex) – Maroun
String file = new Scanner (новый файл (« Jutt.txt »)). useDelimiter (« \\ A »). next(); \t \t Строка seq = "123456789"; \t \t String regex = seq.replaceAll ("\\.", "(? = [$ 0-9] ([a-z]))?") + "[0-9] [a-z]"; \t \t String repl = seq.replaceAll ("\\.", "\\ $$ 0"); \t \t \t \t file = file.replaceAll (repl, regex); Немного длиннее часть кода. Мне нужно скопировать текст из одного файла в другой, используя несколько модификаций, как сказано ранее: «Мне нужно превратить aaaa в 4a, bbb в 3b и так далее». На данный момент это делается наоборот :( – user2408677
Он использует строку '1..9' для генерации регулярного выражения:' (? = [1-9] ([az]))? (? = [2-9] ([AZ]))? (? = [3-9] ([AZ]))? (? = [4-9] ([AZ]))? (? = [5-9] ([AZ])) (? = [6-9] ([AZ]))? (? = [7-9] ([AZ]))? (? = [8-9] ([AZ]))? (? = [ 9-9] ([az]))? [0-9] [az] 'и использует это с заменой' $ 1 $ 2 $ 3 $ 4 $ 5 $ 6 $ 7 $ 8 $ 9', чтобы превратить '4a' в' aaaa'. Работает для ' [0-9] [az] '. Мне кажется, что вы, возможно, не хотите делать с регулярным выражением, хотя ... – rvalvik