2011-11-27 2 views
9

Как подсчитать количество совпадений с помощью C++ 11's std::regex?Подсчитать количество совпадений

std::regex re("[^\\s]+"); 
std::cout << re.matches("Harry Botter - The robot who lived.").count() << std::endl; 

Ожидаемый результат:

7

+2

И ваш выход .... –

+0

@EdHeal я получаю ошибку компиляции [] (http://ideone.com/uxyrV): 'error: 'regex_count' не был объявлен в этой области. ;) –

ответ

15

Вы можете использовать regex_iterator генерировать все матчи, а затем использовать distance сосчитать:

std::regex const expression("[^\\s]+"); 
std::string const text("Harry Botter - The robot who lived."); 

std::ptrdiff_t const match_count(std::distance(
    std::sregex_iterator(text.begin(), text.end(), expression), 
    std::sregex_iterator())); 

std::cout << match_count << std::endl; 
+0

Не могли бы вы объяснить, что возвращает 'std :: sregex_iterator' и что такое« расстояние »между этими двумя средствами? –

+1

@muntoo: 'sregex_iterator' является typedef над' regex_iterator', который выполняет итерацию по всем совпадениям в тексте. 'distance' - это функция стандартной библиотеки, которая вычисляет количество элементов в диапазоне итераторов (так что в этом случае он считывает все совпадения и возвращает количество их). –

+0

Привет. Даже если это старый поток: я думаю, вы можете отменить операцию match_count (которая в C++ 11 не существует), поскольку (w) sregex :: iterator уже итерации, как вы сами указываете, по матчам. Таким образом, std :: distance должно возвращать счетчик совпадений. Я пробовал его с помощью gcc 4.6.1 и VS 2013 без match_count, и он работает отлично. – gilgamash

3

Вы можете использовать это:

int countMatchInRegex(std::string s, std::string re) 
{ 
    std::regex words_regex(re); 
    auto words_begin = std::sregex_iterator(
     s.begin(), s.end(), words_regex); 
    auto words_end = std::sregex_iterator(); 

    return std::distance(words_begin, words_end); 
} 
использование 0

Пример:

std::cout << countMatchInRegex("Harry Botter - The robot who lived.", "[^\\s]+"); 

Выход:

7 
Смежные вопросы