Я пытаюсь удалить все не буквенно-цифровые символы из строки, а затем перейти к подсчету количества слов для каждой строки, извлеченной из pdf.Запятые не удалены Javascript regex
var m = item["str"].replace(/[^a-zA-Z0-9 ]/g," ").trim().split(" ");
console.log("count: " + m.length + " words: " + m);
Это код. Пример полученного выхода:
счета: слова 10:, Быстрый, коричневый, Fox ,,, прыжками, Over, The, Ленивый
В то время как пункт [ "ул"] выглядит это:
Быстрый Браун Фокс - прыгает через ленивую
Некоторые выхода также выглядит следующим образом:
Количество: 1 слов:
Может кто-нибудь помочь мне понять, что происходит здесь? Заранее спасибо!
'/ [^ A-Za-Z0-9] +/g' не работает и 'split (" \ s + ")' недопустимый синтаксис. – Cerbrus