1

Я управляю системой управления документами Университета. Эта система является третьей стороной, которая интегрируется с другой сторонней базой данных, которая действует как наша система ERP. DMS довольно неуклюжий и имеет широкий набор ужасных ошибок/недостатков функций. Поддержка &. Я играю с Google App Engine/Drive SDK в свободное время из любопытства. Поскольку мы являемся клиентом Google Apps для учебных заведений, у нас есть неограниченное пространство на диске, и все пользователи - пользователи приложений Google.Google Drive/App Engine для системы управления документами

Будет ли возможно внутреннее создание веб-приложения (возможно, с помощью Google App Engine), которое использует SDK для управления всеми файлами университета (~ 6 ТБ). Из моих экспериментов он, кажется, обладает всеми необходимыми возможностями.

+0

Размер данных не будет важен, он должен иметь возможность обрабатывать все (не зная больше того, что вы планируете делать). – Ryan

+0

Степень системы в первую очередь> импорт документа в DMS> индексный документ на основе предопределенных полей индекса для этого конкретного типа документа> база данных запросов с индексами для извлечения списка документов. –

+0

Между инструментами, которые вы уже упоминали, хранилищем данных и полнотекстовым поиском вы должны быть в состоянии делать то, что вам нужно. https://cloud.google.com/appengine/training/fts_intro/lesson2 – Ryan

ответ

0

Поскольку вы будете создавать собственное программное обеспечение, ответ на вопрос «будет ли он делать то, что я хочу» всегда «да, в конце концов».

Вам необходимо будет принять решение о форматах документов, что, в свою очередь, повлияет на ваш механизм индексирования. В частности, у вас есть два основных варианта: -

  1. конвертировать файлы в форматы Google документов (DOC, таблицы и т.д.). Затем вы сможете использовать собственную индексацию и поиск Google, например. как вы бы с drive.gogle.com. Недостатком является то, что форматирование может быть потеряно во время поездки туда и обратно.

  2. хранить документы в их родном формате (например, MS .docx) и выполнять собственное индексирование. Это потребует разбора каждого типа документа, что является нетривиальным, но я уверен, что для поддержки нужны сторонние библиотеки. Положительным моментом является то, что документы, которые вы извлекаете, являются идентичными документами, которые вы импортировали.

Я думаю, что я бы посмотрел на выполнение обоих вышеизложенных. Таким образом, при импорте файла в ваш DMS вы храните его дважды на Google Диск, конвертируете и не конвертируете. Используйте хранилище данных App Engine, чтобы отслеживать пары. Таким образом, вы можете использовать поиск на Диске, чтобы найти преобразованный документ, но файл, который вы обслуживаете для пользователя, является его неотвержденным двойником.

+0

Спасибо pinoyyid! Я был уверен, что у него есть все возможности, которые мне нужны, а затем некоторые - просто хотели отскакивать от людей, которые имели некоторый опыт. Кроме того, это отличная идея сохранить оба документа. Я уже был обеспокоен сохранением форматирования. Благодаря! –

+0

Часть этого ответа неверна. Google Диск * делает * индексирует файлы MS Office, нет необходимости конвертировать. Теперь, когда OCM интегрирован в Docs Suite, вы даже можете редактировать файлы MS без необходимости конвертировать в наш собственный формат (хотя, возможно, вы захотите использовать некоторые из причудливых функций Docs). @KyleMcIntire –

+0

@DanMcGrath большое спасибо за добавление этого. Не могли бы вы предоставить ссылку, где эти функции подробно описаны, например. какие форматы файлов Office индексируются? – pinoyyid

Смежные вопросы