Я использую ANTLRWorks для проверки грамматики, с которой я столкнулся, и одно из правил предусматривает использование символа BULLET •, но когда дерево синтаксического разбора создается, он каждый раз убегает. Я также пробовал другие символы из расширенной таблицы ASCII, и они также опущены. Является ли это ошибкой, или я должен каким-то образом включить расширенные символы ASCII?ANTLR3 не соответствует расширенным символам ASCII
0
A
ответ
1
ANTLR 3.x через 4.0 может соответствовать любому коду UTF-16, за исключением U + FFFF. ANTLR 4.1 также сможет соответствовать U + FFFF. Чтобы соответствовать символам в диапазоне от U + 10000 до U + 10FFFF, вам необходимо явно закодировать их как суррогатные пары UTF-16 в вашей грамматике.
Смежные вопросы
- 1. (grep) Regex соответствует символам, отличным от ASCII? ИЗ WINDOWS
- 2. Sphinx не соответствует правильным символам
- 3. NSPredicate соответствует любым символам
- 4. соответствует необязательным специальным символам
- 5. Python regex соответствует не всем желаемым символам
- 6. выражения preg_match PHP не соответствует правильным символам
- 7. Регулярное выражение - не соответствует последовательным символам - C#
- 8. Регулярное выражение не соответствует символам точки
- 9. соответствует определенным символам в javascript
- 10. Помощь с расширенным ASCII/кодированием в PHP!
- 11. Декодирование символов HTML с расширенным ASCII
- 12. php regex соответствует возможным акцентированным символам
- 13. Сценарий для назначения различных чисел символам ascii
- 14. Regexp соответствует всем символам unicode, кроме буквенных символов
- 15. Почему Text.Regex.Posix = ~ соответствует символам с \ d?
- 16. Regex соответствует всем символам, кроме «.js»
- 17. PHP Regex соответствует только некоторым символам
- 18. Atom Regex-Z соответствует всем текстовым символам
- 19. Perl соответствует двум символам с номером повторения
- 20. Vim соответствует всем символам, кроме начала строки
- 21. Регулярное выражение - соответствует только 7 символам?
- 22. PHP preg_match соответствует последовательным символам новой строки
- 23. Solr MoreLikeЭтот запрос соответствует символам новой строки
- 24. Python regex соответствует всем символам, кроме табуляции
- 25. Как метасимвол точки соответствует символам новой строки?
- 26. Regex соответствует всем символам и новым строкам?
- 27. Regex, который соответствует всем символам подчеркивания
- 28. Excel VBA - Проверьте, соответствует ли символ символам
- 29. Java regex соответствует всем символам, кроме
- 30. Регулярное выражение соответствует только символу ASCII и символам, обозначающим новую строку или абзац?
Эй, пуля, он падает в диапазоне U + 10000 до U + 10FFFF? Это unicode - «\ u2022». Если да, то как он может быть преобразован в суррогатную пару UTF-16? Где я могу найти его? –
@IhorM. Нет, этот символ попадает в диапазон символов, которые ANTLR может обрабатывать без каких-либо особых соображений. Просто используйте '' \ u2022'' в лексической части вашей грамматики. –
Это именно то, что я сделал изначально. Я тестировал его в ANTLRWorks. В поле ввода я помещаю «x • y», а в дереве анализа я вижу NoViableAltException. –