Учитывая номера последовательности П.Ф. N
, N
, N
...
из некоторого источника, а не ПСЧ, но говорят, датчик или каротажных данных некоторого вида, безопасно предположить, что обработка его как этоткакая часть чисел имеет больше энтропии?
N
n
/ B = Q
пRem M
n
приведет к последовательности Q
имеющий меньше энтропии, чем последовательность M
?
Примечание: предположим, что B
таков, что и Q
, и M
имеет такой же размер.
Это связано с the observation that most real world data sets, regardless or there source, have a logarithmic distribution; числа, начинающиеся в 1, намного чаще встречаются, чем числа, начинающиеся с 9. Но это мало говорит о деталях низкого порядка.
интересный способ, чтобы проверить это (и отвали вас системным администратором путем срывания его компьютер) запустите в Баш:
ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c
и получить гистограмму первой цифры размеров файлов.
IIRC для некоторых PRNG Q будет иметь меньше. – BCS
Только для плохих PRNG, а разница в энтропии будет минимальной, за исключением случаев, когда вы принимаете некоторые действительно плохие, такие как MSVC, где младшие разряды «менее случайны», чем верхние биты. – schnaader
Не поймите меня неправильно, обычные данные датчика (например, температура), конечно, будут меняться только в младших битах, так что Qn будет иметь более низкую энтропию. Но я хочу сказать, что это не относится ко всем типам данных. – schnaader