Будучи мой первый ответ на SO, я не могу downvote ответа Даниэля на яваскрипт регулярных выражений.
Я знаю, что это очень поздно, но ответ Даниила неверен. Это исключает древние символы ниже! Это важно, если вы работаете над библейским приложением, которое исследует слова на древнегреческом языке!
Это правильное регулярное выражение для нахождения греческого & коптских в ЯШАХ:
/[\u0370-\u03FF]+/gm
http://unicode.org/charts/PDF/U0370.pdf
Выдержка из диаграммы:
0370 Ͱ ГРЕЦИИ CAPITAL ПИСЬМО HETA → 2C75 Ⱶ латинскома прописная буква полчаса
0371 ͱ ГРЕЦИИ МАЛЕНЬКАЯ БУКВА HETA → 2C76 ⱶ латинская строчная половина ч
0372 Ͳ ГРЕЦИИ CAPITAL ПИСЬМО архаических SAMPI
0373 ͳ ГРЕЦИИ МАЛЫЙ ПИСЬМО архаических SAMPI
EDIT: Craig указывает, что Регулярное выражение Дэниела подходит для OP. Хотя я не могу найти, где ОП указывает, какой греческий текст он оценивает, я уступлю, что мой ответ действителен только для древних текстов.
Пока я редактирую это, я хочу также указать, что никакое регулярное выражение здесь не соответствует греческим символам с таким акцентом, что Персей добавляет к своим текстам. Поэтому, если вам нужно установить http://www.perseus.tufts.edu/hopper/ или использовать любые ресурсы своего общего доступа в приложении, будьте осторожны с моим регулярным выражением.
Какой язык программирования? – kennytm
Почему язык имеет значение? У RegEx есть свои собственные стандарты, не так ли? – Romain
Язык программирования * и * строковый формат (локаль) являются важными. – Gabe