Я пытаюсь запустить собственный SQL-запрос, чтобы выбрать только дубликаты строк в наборе данных, за исключением уникальных результатов.Как удалить уникальные строки и дубликаты KEEP? SQL
Я пытаюсь отобразить только дублированные строки для каждого проекта, т. Е. Если для проекта (автомобиль) пользователь дважды добавил продукт (окно). Хотя окно может содержаться во многих других проектах (дом, здание и т. Д.), Условие - это дублирование внутри проекта, а не весь набор данных.
можно ли написать запрос для этого?
UPDATE:
Как вы можете видеть на изображении ниже, проекты (ID) 500 и 505 содержат повторяющиеся части в них (окна и капот), так что я хотел бы показать это только результаты проектов (ids), содержащих дубликаты. Таким образом, окончательный вид не будет иметь проектов 501, 502, 503, 504, 506. И дублирующиеся будут отображать только строки, содержащие дублируемое поле, т.е. проект 500 (id) будет отображать только строки 100 (область) и 108 и удалять 101, 102 и 114, которые являются уникальными. Как показано ниже, часть OC01 (выделена красным цветом) также может отображаться на других проектах (id), но проект 503 не должен отображаться, поскольку OC01 не дублируется внутри этого идентификатора.
Данные содержатся в файле excel, который затем обрабатывается программным обеспечением BI, называемым Tableau, которое позволяет мне писать пользовательский sql для извлечения данных из xls разными способами.
Какая СУБД вы используете? Postgres? Oracle? –
Отправьте свою точную схему таблиц. Стол, о котором вы говорите, является таблицей многих ко многим ('project_product')? Если это так, то у меня есть уникальный столбец идентификатора (Project) *, который не имеет большого смысла. – peterm
это файл excel, который я пытаюсь манипулировать с помощью программного обеспечения, называемого tableau. я опубликую картину, чтобы дать вам лучшее представление о том, чего я пытаюсь выполнить. – rafacardosoc