У меня есть функция, которая загружает тысячи изображений за раз от стороннего источника. Количество изображений может варьироваться от 2500 до 250 000 за каждый ход. Как вы можете себе представить, этот процесс занимает некоторое время, и я хочу оптимизировать все, что могу.Производительность при загрузке тысяч изображений
Как это работает, я беру список путей изображения, прокладываю через них петлю и запрашиваю изображение у третьего лица. В настоящее время, прежде чем я сделаю запрос, я делаю чек, чтобы увидеть, существует ли изображение на сервере ... если это так, оно пропускает этот образ ... если он этого не делает, он загружает его.
Мой вопрос: если кто-нибудь знает, замедляет ли проверка перед загрузкой процесс (или, возможно, ускоряет его)? Было бы более эффективно загружать файл и позволять ему переопределять уже существующие изображения, тем самым вырезая шаг проверки на существование?
Если у кого-либо еще есть советы по загрузке этого объема изображений, они приветствуются!
Если вы выполняете эти операции последовательно, то да, проверка замедлит работу. Но, вероятно, не очень. –
Это похоже на то, что вы могли бы проверить, выполнив один раз один раз с помощью проверки и один раз без него. Однако я бы спросил, что доступ к локальной файловой системе быстрее, чем доступ к сети. Таким образом, пропуская файлы будут компенсировать любую потерю при проверке файлов. – David
Определенно реализовать эту функцию асинхронно. Вы также можете отказаться от выполнения параллельных задач. –