У меня есть экземпляр экземпляра Solr 4, который содержит около двух миллионов записей, которые публикуются на фондовой бирже. Чтобы дать вам представление о схеме, основные компоненты являются:Анализ индекса Solr
<field name="UID" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="company" type="text_general" indexed="true" stored="true" />
<field name="datetime" type="date" indexed="true" stored="true" />
<field name="title" type="text_general" indexed="true" stored="true" />
<field name="url" type="text_general" indexed="true" stored="true" />
<field name="notice" type="text_general" indexed="true" stored="true" />
<field name="cachefile" type="text_general" indexed="true" stored="true" />
Есть ли способ для подготовки запросов, которые дадут мне некоторые интересные факты и цифры о индексе?
Например:
- Лучшие десять компаний, которые имеют записи (и количество уведомлений для каждого)
- Количество уведомлений, опубликованных каждый год
- Наиболее и наименее популярный день/месяц для опубликования сообщений
- Самый популярный час дня для опубликования сообщений
- Серия уведомление (по количеству символов)
На данный момент я не уверен, если это может быть сделано с некоторым умным синтаксисом запроса, или, если мне нужно использовать использование модуля (статистический/Analytics?)