2009-05-31 2 views
2

Учитывая номера последовательности П.Ф. N, N, N... из некоторого источника, а не ПСЧ, но говорят, датчик или каротажных данных некоторого вида, безопасно предположить, что обработка его как этоткакая часть чисел имеет больше энтропии?

Nn/ B = Q п   Rem Mn

приведет к последовательности Q имеющий меньше энтропии, чем последовательность M?

Примечание: предположим, что B таков, что и Q, и M имеет такой же размер.


Это связано с the observation that most real world data sets, regardless or there source, have a logarithmic distribution; числа, начинающиеся в 1, намного чаще встречаются, чем числа, начинающиеся с 9. Но это мало говорит о деталях низкого порядка.

интересный способ, чтобы проверить это (и отвали вас системным администратором путем срывания его компьютер) запустите в Баш:

ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c 

и получить гистограмму первой цифры размеров файлов.

ответ

1

Это зависит от последовательности. Например, возьмите [1 * 7 = 7, 3 * 7 = 21, 6 * 7 = 42 ... (2 * N - 1) * 7] и B = 7. Qn будет [1, 3, 6, ... 2 * N - 1] и Mn всегда будет 0. Обычно энтропия для Q будет меньше, так как это смещение некоторых бит, но это не всегда так.

И, конечно, это не будет работать специально для данных, поступающих из (Р) RNG, так как диапазон для Qn будет таким же, как диапазон для Mn, и для обоих чисел (равномерно распределены).

+0

IIRC для некоторых PRNG Q будет иметь меньше. – BCS

+0

Только для плохих PRNG, а разница в энтропии будет минимальной, за исключением случаев, когда вы принимаете некоторые действительно плохие, такие как MSVC, где младшие разряды «менее случайны», чем верхние биты. – schnaader

+0

Не поймите меня неправильно, обычные данные датчика (например, температура), конечно, будут меняться только в младших битах, так что Qn будет иметь более низкую энтропию. Но я хочу сказать, что это не относится ко всем типам данных. – schnaader

Смежные вопросы