2016-06-24 5 views
0

У меня проблема с простым регулярным выражением в C, мой последний матч не распознается.Regex C - отсутствует матч?

Вот мой код:

#include <regex.h> 
int dummy(const char *s) { 
    size_t nmatch = 0, i; 
    regex_t preg; 
    regmatch_t *pmatch = NULL; 
    char str_regex[255 + 1]; 

    /* Format : ID <ID> L {<Label>} R <Res> C {Info} T {More info} */ 
    /* "C" and "T" aren't required */ 
    snprintf(str_regex, 255, 
        "ID ([[:alnum:]]{1,%d}) L \\{([^}]{1,%d})\\} R ([01])(C \\{[^}]+\\})?(T \\{[^}]+\\})?$", 
        25, // Max 25 chars for id 
        100); // Max 100 chars for label 


    if (regcomp(&preg, str_regex, REG_EXTENDED) != 0) { 
      fprintf(stderr, "Error initialization\n"); 
      return 2; 
    } 
    // We got the number of matches 
    nmatch = preg.re_nsub; 
    pmatch = malloc (sizeof (*pmatch) * nmatch); 
    // EDIT : problem solved with pmatch = malloc(size of(*pmatch) * (nmatch + 1)); 
    if (pmatch == NULL) { 
      fprintf(stderr, "Memory error\n"); 
      return 4; 
    } 

    // String can't be found 
    // EDIT : problem solved with : if (regexec(&preg, s, nmatch + 1, pmatch, 0) != 0) { 
    if (regexec(&preg, s, nmatch, pmatch, 0) != 0) { 
      regfree(&preg); 
      free(pmatch); pmatch = NULL; 
      fprintf(stderr, "String not valid\n"); 
      return 5; 
    } 
    regfree (&preg); 

    // EDIT : problem solved with : for (i = 0; i < nmatch + 1; ++i) { 
    for (i = 0; i < nmatch; ++i) { 
      char tmp[1000]; // Just for test, 1000 char not necessary 
      int start = pmatch[i].rm_so; 
      int finish = pmatch[i].rm_eo; 
      memset(tmp, 0, sizeof(tmp)); 
      strncpy(tmp, s + start, finish - start); 
      printf("Match %d : <%s>\n", i, tmp); 
    } 
} 

со строкой ввода, как: ID ID1 L {Label} R 1 C {Info1} T {Info2}
я ожидаю иметь 5 матч

  • Полная цепь, это нормально
  • <ID1>, это нормально
  • <Label>, все в порядке
  • <1>, это нормально
  • <C {Info1}>, это нормально
  • <T {Info2}>, он не работает

Любая идея, почему последний матч не работает? Если я использую цепочку без или с последней частью (T {Info2}), она работает так же. Часть «T» никогда не признается ...

EDIT: Проблема решена с «nmatch + 1» вместо nmatch см в коде выше «EDIT» части

ответ

2

Согласно man 3 regex, re_nsub содержит количество подвыражений в RE. Так как вы также записываете полную строку, вам не нужно malloc(sizeof(*pmatch) * (nmatch + 1))?

+0

Я думаю, что re_nsub действительно подсчитывает всю строку. Всегда видел размер nmatch, и я просто попытался с nmatch + 1: segfault. – RobinG

0

Ответ найден с помощью nemetroid с man 3 regex: вы должны выделить память для nmatch + 1 match, а затем передать nmatch + 1 вместо nmatch к regexec(), и она работает. Manpage на моем сервере не сказал мне, что ... Grr. Спасибо за помощь !