2016-10-14 5 views
0

В целях исследования я хочу выбрать проекты github, у которых в корне нет файла LICENSE. С помощью этого кода можно выбрать файлы ЛИЦЕНЗИИ,Выбор проектов, у которых нет файла LICENSE

SELECT repo_name FROM [bigquery-public-data:github_repos.files] WHERE path = "license"

Но как я могу выразить «не имеет» предложение?

+0

ГДЕ путь! = "Лицензия"? –

ответ

0

По предложению Фелипе Хоффа, я закончил с этим запросом:

SELECT url FROM [ghtorrent-bq:ght.projects] WHERE url not in (SELECT CONCAT("https://api.github.com/repos/", repo_name) FROM [bigquery-public-data:github_repos.licenses]) limit 100000

Я должен ограничить иначе BigQuery говорит, что он не может разобрать все эти данные.

0

Каждый репо в наборе данных [bigquery-public-data: github_repos] имеет файл LICENSE, поскольку зеркалируются только репозитории, имеющие известную и обнаружимую лицензию.

В зависимости от вашей цели, вы можете найти данные, которые вы хотите на:

и посмотреть на проекты, а не в https://bigquery.cloud.google.com/table/bigquery-public-data:github_repos.licenses.

Смежные вопросы