Здесь Definiton:Как стирать апострофы?
апостроф лексемы фильтр удаляет все символы после апострофа, включая сам апостроф.
Попытка снять апострофы и персонажи после них. Когда есть только один апостроф, фильтр вообще ничего не снимает. Кроме того, когда имеется несколько последовательных апострофов, он разбивает соответствующие слова , но не снимает ничего после апострофов. Очевидно, я должен что-то упустить.
ввода с одного апострофа:
POST localhost:9200/_analyze?
{
"filter": ["apostrophe"],
"text": "apple banana'orange kiwi"
}
Выход
{
"tokens": [
{
"token": "apple",
"start_offset": 0,
"end_offset": 5,
"type": "<ALPHANUM>",
"position": 0
},
{
"token": "banana'orange",
"start_offset": 6,
"end_offset": 19,
"type": "<ALPHANUM>",
"position": 1
},
{
"token": "kiwi",
"start_offset": 20,
"end_offset": 24,
"type": "<ALPHANUM>",
"position": 2
}
]
}
ввода с несколькими последовательными апострофы.
{
"filter": ["apostrophe"],
"text": "apple banana''orange kiwi"
}
Выход
{
"tokens": [
{
"token": "apple",
"start_offset": 0,
"end_offset": 5,
"type": "<ALPHANUM>",
"position": 0
},
{
"token": "banana",
"start_offset": 6,
"end_offset": 12,
"type": "<ALPHANUM>",
"position": 1
},
{
"token": "orange",
"start_offset": 14,
"end_offset": 20,
"type": "<ALPHANUM>",
"position": 2
},
{
"token": "kiwi",
"start_offset": 21,
"end_offset": 25,
"type": "<ALPHANUM>",
"position": 3
}
]
}
Извините, я вас не понял, вы хотите просто стереть апострофы? или расколоться ими и удалить их? – Mysterion
Я хочу снять апостроф и персонажи после него. Обновлен вопрос. – gunererd
как насчет попытки https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-replace-charfilter.html? – Mysterion