2010-02-02 5 views
52

Я пытаюсь группировать по нескольким столбцам здесь - по одному на каждую таблицу.
Это сценарий, когда я хочу найти значение верхнего портфеля для каждого клиента, добавив их текущий портфель и деньги вместе, но у клиента может быть несколько портфелей, поэтому мне нужен лучший портфель для каждого клиента.MySQL GROUP BY two columns

На данный момент, с приведенным ниже кодом, я получаю одни и те же клиенты несколько раз для каждого из своих верхних портфелей (он не группируется по идентификатору клиента).

SELECT clients.id, clients.name, portfolios.id, SUM (portfolios.portfolio + portfolios.cash) AS total 
FROM clients, portfolios 
WHERE clients.id = portfolios.client_id 
GROUP BY portfolios.id, clients.id 
ORDER BY total DESC 
LIMIT 30 

ответ

140

Во-первых, давайте сделаем некоторые тестовые данные:

create table client (client_id integer not null primary key auto_increment, 
        name varchar(64)); 
create table portfolio (portfolio_id integer not null primary key auto_increment, 
         client_id integer references client.id, 
         cash decimal(10,2), 
         stocks decimal(10,2)); 
insert into client (name) values ('John Doe'), ('Jane Doe'); 
insert into portfolio (client_id, cash, stocks) values (1, 11.11, 22.22), 
                 (1, 10.11, 23.22), 
                 (2, 30.30, 40.40), 
                 (2, 40.40, 50.50); 

Если вы не нуждаетесь в портфолио ID, это было бы легко:

select client_id, name, max(cash + stocks) 
from client join portfolio using (client_id) 
group by client_id 

+-----------+----------+--------------------+ 
| client_id | name  | max(cash + stocks) | 
+-----------+----------+--------------------+ 
|   1 | John Doe |    33.33 | 
|   2 | Jane Doe |    90.90 | 
+-----------+----------+--------------------+ 

Так как вам нужно портфолио ID , все усложняется. Давайте сделаем это пошагово. Во-первых, мы напишем подзапрос, который возвращает максимальное значение портфеля для каждого клиента:

select client_id, max(cash + stocks) as maxtotal 
from portfolio 
group by client_id 

+-----------+----------+ 
| client_id | maxtotal | 
+-----------+----------+ 
|   1 | 33.33 | 
|   2 | 90.90 | 
+-----------+----------+ 

Тогда мы будем запрашивать таблицу портфеля, но использовать присоединиться к предыдущему подзапроса, чтобы сохранить только те портфели общая стоимость которых является максимальной для клиента:

select portfolio_id, cash + stocks from portfolio 
join (select client_id, max(cash + stocks) as maxtotal 
     from portfolio 
     group by client_id) as maxima 
using (client_id) 
where cash + stocks = maxtotal 

+--------------+---------------+ 
| portfolio_id | cash + stocks | 
+--------------+---------------+ 
|   5 |   33.33 | 
|   6 |   33.33 | 
|   8 |   90.90 | 
+--------------+---------------+ 

Наконец, мы можем присоединиться к столу клиента (как вы это делали), чтобы включить имя каждого клиента:

select client_id, name, portfolio_id, cash + stocks 
from client 
join portfolio using (client_id) 
join (select client_id, max(cash + stocks) as maxtotal 
     from portfolio 
     group by client_id) as maxima 
using (client_id) 
where cash + stocks = maxtotal 

+-----------+----------+--------------+---------------+ 
| client_id | name  | portfolio_id | cash + stocks | 
+-----------+----------+--------------+---------------+ 
|   1 | John Doe |   5 |   33.33 | 
|   1 | John Doe |   6 |   33.33 | 
|   2 | Jane Doe |   8 |   90.90 | 
+-----------+----------+--------------+---------------+ 

примечаниячто это возвращает две строки для Джона Доу, потому что он имеет два портфеля с одинаковым общим значением. Чтобы избежать этого и выбрать произвольный верхний портфель, бирку на предложения GROUP BY:

select client_id, name, portfolio_id, cash + stocks 
from client 
join portfolio using (client_id) 
join (select client_id, max(cash + stocks) as maxtotal 
     from portfolio 
     group by client_id) as maxima 
using (client_id) 
where cash + stocks = maxtotal 
group by client_id, cash + stocks 

+-----------+----------+--------------+---------------+ 
| client_id | name  | portfolio_id | cash + stocks | 
+-----------+----------+--------------+---------------+ 
|   1 | John Doe |   5 |   33.33 | 
|   2 | Jane Doe |   8 |   90.90 | 
+-----------+----------+--------------+---------------+ 
+1

Это удивительный ответ, и как только я бы поставил ORDER BY maxtotal DESC на конце это прекрасно! ;) Спасибо – ChrisS

79

Использование Concat на группе будет работать

SELECT clients.id, clients.name, portfolios.id, SUM (portfolios.portfolio + portfolios.cash) AS total 
FROM clients, portfolios 
WHERE clients.id = portfolios.client_id 
GROUP BY CONCAT(portfolios.id, "-", clients.id) 
ORDER BY total DESC 
LIMIT 30 
+1

Умный, я бы сказал. Работает также для меня –

+11

Хорошее решение! Я бы добавил там делиметр: CONCAT (portfolios.id, "-", clients.id). Без делиметра может быть такое же сцепленное значение с разными парами значений. –

+1

На самом деле производительность может быть медленной? – onebraveman