Я очищаю reddit usernames с помощью Python, и я пытаюсь извлечь имя пользователя из URL. URL выглядит следующим образом:Python извлечения username из URL
https://www.reddit.com/user/ExampleUser
Это мой код:
def extract_username(url):
start = url.find('https://www.reddit.com/user/') + 28
end = url.find('?', start)
end2 = url.find("/", start)
return url[start:end] and url[start:end2] and url[start:]
Первая часть работы, но удаление знак вопроса и прямой слэш doesen't. Может быть, я использую ключевое слово «и» неправильно? Что означает, что иногда получить что-то вроде этого:
ExampleUser/
ExampleUser/comments/
ExampleUser/submitted/
ExampleUser/gilded/
ExampleUser?sort=hot
ExampleUser?sort=new
ExampleUser?sort=top
ExampleUser?sort=controversial
Я знаю, что я могу использовать API, но я хотел бы узнать, как это сделать без него. Я также слышал о регулярных выражениях, но не слишком ли они медленны?