У меня есть набор данных в свинки, который выглядит следующим образом:Pig - Расчет
6009544 "NY" 6009545 "NY"
6009544 "NY" 6009545 "NY"
6009548 "NY" 6009546 "OR"
6009546 "OR" 6009546 "OR"
6009545 "NY" 6009546 "OR"
6009548 "NY" 6009547 "AZ"
6009547 "AZ" 6009547 "AZ"
6009547 "AZ" 6009548 "NY"
6009544 "NY" 6009548 "NY"
Первая строка читается так: «патент 6009544 возникла в Нью-Йорке, и цитирует патент 6009545, которая возникла в Нью-Йорке. " Я пытаюсь найти для каждого государства% упомянутых патентов, исходящих из одного и того же состояния. Так что мой ожидаемый результат должен быть
NY: .5
OR: 1
AZ: .5
из-за 6 патентов, которые произошли в Нью-Йорке, 3 ссылаются на патенты, которые также зародилось в Нью-Йорке. 1 патент, который появился в Орегоне, ссылается на патент, который также появился в Нью-Йорке. И из 2 патентов, которые возникли в Аризоне, 1 цитирует патент, который также возник в Аризоне.
Может ли кто-нибудь предложить хороший способ для выполнения этого в Pig?
Этот метод отлично работает - спасибо! – Luke