У меня есть файл, содержащий некоторые слова с заглавной буквы и некоторые слова смешанного слова, и я хочу извлечь полностью заглавные пробеги слов (содержащихся в одной строке), то есть вещи, разделенные \b
и содержащий не менее двух заглавных букв и не строчных букв. Все 7 бит.Найти пробежки заглавных букв
Так, например, если линия
The QUICK Brown fox JUMPs OV3R T4E LAZY DoG.
, то я хочу, чтобы извлечь QUICK
и OV3R T4E LAZY
.
Это то, что я до сих пор:
while (<$fh>) { # file handle
my @array = $_ =~ /\b[^a-z]*[A-Z][^a-z]*[A-Z][^a-z]*\b/;
push @bigarray, @array;
}
Есть ли более элегантный способ сделать это, чем [^a-z]*[A-Z][^a-z]*[A-Z][^a-z]*
?
последовательных столиц, или 2+ столиц где-нибудь в слове. например 'CApital' или' cApiTal'? последовательный - это легко. 2+ в любом месте, не так много. –
@MarcB последовательный. Но также включая другие символы '\ w', но не строчные буквы. – JQKP
«другие символы' \ w', но без строчных букв »- номера и символы подчеркивания? –