Я хочу использовать нейронную сеть для классификации строк. «проблема» заключается в том, что нейронные сети принимают числовой ввод, поэтому мне нужен метод кодирования строки в числовой вектор. существует ли стандартный способ решения этой проблемы?как кодировать последовательность символов в числовую форму без потери информации?
Я думал о подсчете n-граммов, но этот подход привел бы к огромным векторам объектов, если я не хочу потерять какую-либо информацию, поскольку мне нужно было бы вычислить все от 1 грамма до длины, струнно-граммы. правильно?
Итак, существует ли более компактный метод кодирования строк для числовых данных? который поддерживает информацию о частоте символов и их порядке?
Как вы можете классифицировать их по знаку? –
@YuraZaletskyy критерии классификации не являются атрибутом строки. каждая строка представляет собой процесс, классификация должна выполняться в соответствии с тем, был ли процесс успешным или нет – yurib