Численные массивы для числовых данных, безусловно, отлично работают, но медленнее их использовать для нечисловых данных?numpy vs list для нечисловых данных
Например, у меня есть несколько вложенных списков текстовых данных:
mammals = ['dog', 'cat', 'rat']
birds = ['stork', 'robin', 'penguin']
animals1 = [mammals, birds]
При доступе и манипуляций этих данных в этом списке вложенных списков будет быстрее, чем Numpy эквивалент массива?
import numpy as np
animals2 = np.array(animals1)
Поскольку Numpy массивы реализованы в виде «strided» массив, где каждый элемент имеет фиксированную длину, а «редкий» список строк с несколькими длинными строками будет использовать непропорционально большое количество памяти, если преобразуется в NumPy массив. Но как насчет скорости?
Вы всегда можете использовать пакет 'timeit' для сравнения такого рода вещей. – JoshAdel
Основные преимущества numpy в производительности при численных вычислениях. Вы вряд ли увидите значительные преимущества с другими типами данных, и в некоторых случаях производительность может быть значительно хуже. – BrenBarn