2016-08-07 2 views
1

Используя PowerPivot и имея таблицу затрат, с 300 000 различных видов затрат и таблицу расчета, с около 700 000 записей/типов, я изменяю строки продуктов (которые могут быть довольно длинными) целыми числами, чтобы сделать их короче и получить СВЯЗАННАЯ формула работает быстрее.Каков наилучший диапазон чисел для использования отношений идентификационных номеров в PowerPivot: от 1 до 500 000 или от 1 000 000 до 1 500 000?

С этим большим количеством записей и видов затрат, было бы лучше, чтобы все идентификационные номера были одинаковой длины?

Так, например, следует начинать с номера 1000000 до 1500000 или от 1 до 500000?

+0

Если вы использовали 1 - 500 000, не были бы ли файлы данных меньше и, следовательно, более эффективными и быстрыми? Более короткие номера означают, что для хранения номера требуется меньше места и поэтому проще разбираться. –

+0

Не имело бы значения, если цифры составляют менее 2 миллиардов. – sixtytrees

ответ

0

1 до 500 000 - лучший вариант, потому что это меньше байтов для хранения. Наличие такой же длины не имеет никакого преимущества.

0

Вы будете не разница уведомления в выделенной памяти. Если сохранить 1; 2;... или 1000001; 1000002;... или 1 abcdefgh; 2 abcdefgh;... вы узнаете, что:

2.14 Mb для обоих 1-64000 и 1000001-1064000 в формате XLS * 3,02 Mb 1 ABCDEFGH; 2 abcdefgh; ... 584 Kb на диске (намного меньше) для 1-100000 и 1000001-1100000 в формате .ods (вы не можете сохранить больше). Существует небольшая разница (596069Kb против 597486Kb, но она сбрасывается размером кластера 4 Kb).

От удобства использования - от 1 000 000 до 1 500 000. У вас будет одинаковое количество цифр. В противном случае легко повредить 1234 против 11234. Строго рассмотрите SQLite или аналогичную базу данных, потому что 0,5 миллиона строк подталкивают пределы формата Excel.


  • формат XLS может храниться до 65536 строк и 256 столбцов
+0

Полмиллиона нет, где близко к пределу. У меня есть datamodels с более чем 10 миллионами записей. С 64-разрядным Excel 2013 вы больше ограничены аппаратными средствами, чем PowerPivot. https://support.office.com/en-us/article/Data-Model-specification-and-limits-19AA79F8-E6E8-45A8-9BE2-B58778FD68EF – eshwar

+0

Да, он может обрабатывать миллионы строк данных. Но это происходит очень медленно. Например, требуется несколько минут для загрузки. Кроме того, если человек рассматривает 0.5M записи, вначале его система может расти. – sixtytrees

1

Попробуйте сохранить файлы с 1-500000 и 1000001-1500000 и увидеть разницу в свойствах. Разница не стоит.

+0

Правильно. Добавлено в мой пост. – sixtytrees

0

1 и 1000000 занимают одинаковое пространство, потому что данные не сжимаются и пространство достаточное для int (количество до 4 миллиардов).

Смежные вопросы