У меня есть два массива одинакового размера тегов и категорий тегов. Я хочу группировать теги по категориям и подсчитывать теги.Подсчет событий в массивах numpy
Как вы можете видеть, теги могут делиться одними и теми же категориями («мир», «привет»).
Я знаю, что это можно легко сделать с помощью циклов, но я уверен, что у numpy есть несколько отличных способов сделать это более эффективно. Любая помощь будет принята с благодарностью.
# Tag category
A = [10, 10, 20, 10, 10, 10, 20, 10, 20, 20]
# Tags
B = ['hello', 'world', 'how', 'are', 'you', 'world', 'you', 'how', 'hello', 'hello']
Ожидаемый результат:
[(10, (('hello', 1), ('are', 1), ('you', 1), ('world', 2))), (20, (('how', 1), ('you', 1), ('hello', 2)))]
[Pandas] (http://pandas.pydata.org/) может быть более подходящим для этого. –