У меня есть вопрос анализа данных, который я мог бы легко решить с помощью некоторых T-SQL или некоторых сценариев, но мне было интересно, было ли разумное решение SQL. Проблема в том, что он немного разбирается в предположении независимости от SQL-строк.Подсчет последовательных дубликатов записей с SQL
У меня есть таблица, которая состоит из пар имени-значения, связанные с пользователем и заказанных представлениями, например:
ID USERID VARIABLE VALUE SUBMITTED 3115 2287 votech05 2 2009-02-02 15:34:00 3116 2287 comcol05 1 2009-02-02 15:34:00 3117 2287 fouryr05 1 2009-02-02 15:35:00 3118 2287 none05 2 2009-02-02 15:35:00 3119 2287 ocol1_05 2 2009-02-02 15:44:00 3120 2287 disnone 2 2009-02-02 15:45:00 3121 2287 dissense 2 2009-02-02 15:49:00 3122 2287 dismobil 3 2009-02-02 15:51:00 3123 2287 dislearn 3 2009-02-02 15:51:00 3124 2287 disment 3 2009-02-02 15:52:00 3125 2287 disother 2 2009-02-02 15:55:00 3126 2287 disrefus 7 2009-02-02 15:58:00
Я хотел бы быть в состоянии определить стоимость и количество из крупнейших группа идентичных значений (при заказе данных первичный ключ ID). Таким образом, для приведенного выше примера, потому что у меня есть четыре значение = 2 появляется в последовательности, и только три значения = 3, я хотел бы сообщить:
USERID VALUE COUNT 2287 2 4
для данного пользователя.
Опять же, это можно было бы сделать довольно быстро с помощью других инструментов, но поскольку набор данных довольно велик (около 75 миллионов записей) и часто менялся, было бы неплохо решить эту проблему с помощью запроса , Я работаю с SQL Server 2005.
Хорошее название edit, Brian. Благодарю.Я работаю исследователем-исследователем, и его жаргон смещал то, как я думал о проблеме. –