Я пытаюсь сопоставить имя видео YouTube с фильмом, если видео соответствует трейлеру или тому подобное.Извлечь название фильма из видео-имени
Вот некоторые примеры
Голодные игры: Mockingjay Часть 2 Официальный трейлер - «Мы март вместе»
Iron Man - Trailer [HD] Замороженный Официальный трейлер
Диснея
Звёздные войны: Принуждение к силам Аваков (официальный)
Th Марсианский | Тизерный трейлер [HD] | 20th Century FOX
Как вы видите, есть много хлама, как слова «официальный», «трейлер», «HD», «задира», издательство компании, как «Дисней» или «20-го века Фокс "и другие слова, которые не являются частью названия фильма. Иногда он содержит цитаты или имя трейлера, как в случае Голодных игр.
Помимо наивного решения об устранении всех распространенных слов и компаний, какой другой подход я могу принять?
Я хочу, чтобы он соответствовал любому фильму (который существует в IMDB). Поиск «Голодные игры: Mockingjay Part 2 Официальный трейлер -« Мы вместе вместе »в IMDB не соответствует The Hunger Games: Mockingjay Part 2 – gberger
Mhh, это сложно, я не думаю, что у меня есть решение для этого Возможно, вы можете загрузить все названия фильмов IMDB и проверить свою строку заголовка видео для всех этих названий. Я предполагаю, что это очень медленно, хотя. –