Я слежу за сообщением Creating an index Nest и пытается обновить настройки моего индекса. Все работает отлично, но фильтр html_strip
не зачищает HTML. Мой кодНастройки индекса обновления гнезда
var node = new Uri(_url + ":" + _port);
var settings = new ConnectionSettings(node);
settings.SetDefaultIndex(index);
_client = new ElasticClient(settings);
//to apply filters during indexing use folding to remove diacritics and html strip to remove html
_client.UpdateSettings(
f = > f.Analysis(descriptor = > descriptor
.Analyzers(
bases = > bases
.Add("folded_word", new CustomAnalyzer
{
Filter = new List <string> { "icu_folding", "trim" },
Tokenizer = "standard"
}
)
)
.CharFilters(
cf = > cf.Add("html_strip", new HtmlStripCharFilter())
)
)
);
Роб, большое спасибо, ваше предложение работает. Я вижу фильтр, однако при индексировании html не удаляется. – Ismail
@ Вы можете поделиться им с индексом? – Rob
'{ umbracotest: { настройки: { индекс: { UUID: "eb3hMpFrS8qyb3DxHZ4_eg", анализ: { char_filter: { html_strip: { тип: "html_strip" } } }, number_of_replicas: "1", number_of_shards: "5", версия: { создано: "1020099" }} }} } ' – Ismail