7

У меня есть около 300 миллионов текстовых файлов от 50 кб до 100 КБ, которые мне нужно читать, и служат на веб-странице.Производительность Azure Blob vs Azure Table

Примечания:

На Azure Table, я должен был бы разделить некоторые из текстовых файлов, чтобы убедиться, что она не превышает максимум 64кб на колонке.

На Azure Blob у меня не было бы проблемы с расщеплением, но вам нужно было бы сохранить ссылку на них в таблице Azure SQL/Azure.

Хорошо, вступите! Теперь, на моем приложении Azure Web:

  1. Быстрее будет читать текстовый файл от Azure Blob или от Azure Table?
  2. Может ли Лазурный стол обрабатывать больше запросов?
+0

Я провел некоторое тестирование, и, к моему удивлению, чтение файла из Blob происходит быстрее, чем из таблицы. Кроме того, я согласен, для поиска я планирую использовать Azure Search. –

ответ

4

Я согласен с Андреем М. Лучшее решение - это хранилище памяти с сервисом таблицы или даже база данных sql для хранения ссылки.

Просто еще одна вещь, если вы планируете искать контент в этих файлах, ни обслуживание таблицы/blob не будет хорошо для этого. Если это так, я рекомендую вам настроить виртуальную машину с помощью упругого поиска/solr и проиндексировать их.

PS: есть также Azure Search, для этого вы также можете попробовать.

+1

Теперь можно искать в блобе. https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage Индексирование документов в хранилище Azure Blob с использованием Azure Поиск Инвертор blob может извлекать текст из следующие форматы документов: PDF форматы Microsoft Office: DOCX/DOC, XLSX/XLS, PPTX/PPT, MSG (электронная почта Outlook) HTML XML ZIP EML текстовые файлы JSON (см функцию индексирования JSON сгустки просмотра) CSV (см. Функцию предварительного просмотра индексации CSV) –

5

Хранилище памяти лучше хранить таблицу, если вы хотите работать с файлами. Я определенно не хотел бы иметь дело с файловыми кусками в таблице. Если вам нужно сохранить ссылки на свои капли, как насчет объединения двух опций и использовать хранилище таблиц для ссылок? Я думаю, что это было бы лучшим с точки зрения производительности :).

+0

Точечные запросы (с ключом раздела и ключом строки) очень быстрые с хранилищем таблиц. Вам нужно было бы провести тестирование на себя, но этот факт делает ответ Андрея более верным. –

+0

Даже работая со строками, blob работает быстрее. Я тестировал. Извлечь 2kb из файла в блобе или из хранилища таблиц? Blob выигрывает 9 у.е. из 10 –