Определите, содержит ли строка, содержащуюся в другой строке, в python

Я ищу, чтобы определить, содержится ли строка в начале списка другой строки. Например, если я имел строку cde, и список строк:Определите, содержит ли строка, содержащуюся в другой строке, в python

['ab', 'bce', 'cdef']

тогда будет определять, что cde содержится в начале cdef

Я также ищу пойти в другую сторону вокруг - то есть, если бы у меня был термин abc, чтобы определить, что ab из вышеуказанного списка содержится в нем.

Теперь очевидно, что это тривиально, чтобы настроить цикл for, проверяя каждый экземпляр с помощью функции startswith, однако это не масштабируется с очень большим списком возможностей для проверки.

При проверке каждого экземпляра O (n) [и, следовательно, очень медленного, если у вас есть 100 000 возможностей], я ищу способ проверки O (1) ... похоже, что если «список» был предварительно отсортированный, тогда можно просто извлечь ближайшее совпадение, но не уверен, как это сделать.

Разъяснение:

Я только ищу, где есть идеальный матч в начале строки (то есть весь срок поиска включен).
Я буду искать несколько поисковых терминов (таким образом, при первоначальной сортировке данные могут быть не быстрыми, стоимость потолка будет экономить на последующих смотровых прогибах).
Идеально возвратит все возможные соответствия (т. Е. Если cdef и cdefg, где в списке, и глядя вверх cde, тогда оба будут возвращены).
Я использую термин «список» свободно, как в наборе терминов.

источник

2015-10-14 kyrenia

Просьба пояснить проблему. Все ли необходимые строки включены в список? Вам нужен только один матч или все матчи? Являются ли совпадения только в начале строки? – Prune

Обратите внимание, что сортировка списка не лучше, чем O (n log n), поэтому ваша идея O (n) не произойдет. Кроме того, обратите внимание, что проверка строки не менее O (m), по длине более короткой строки. Пожалуйста, убедитесь, что вы поняли, когда говорите о сложности: будь то шаг или весь проход. – Prune

Вы можете добраться до O (n) в течение многих проверок строк. Я работаю над чем-то –

Это не представляется возможным в O (1), так как, по определению, вы должны пройти через весь массив. Если массив отсортирован, вы можете выполнить двоичный поиск для своей строки, а затем проверить, начинается ли элемент в этой позиции с вашей строки. Эта операция O (log n).

import bisect 

# return the index of the string starting with the prefix 
# or None if no such string is in the list 
def search(a, prefix): 
    i = bisect.bisect_left(a, prefix) 
    isAtStart = (i < len(a) and a[i].startswith(prefix)) 
    return i if isAtStart else None 

search(['ab', 'bce', 'cdef'], 'bc')

источник

2015-10-14 06:04:17 roeland

Определите, содержит ли строка, содержащуюся в другой строке, в python

ответ

Смежные вопросы