В реальных числовых данных вероятность того, что первая цифра любого числа будет равна 1, составляет около 30%, а не 11,11%, как может интуитивно показаться.
Распределение первых цифр в соответствии с законом Бенфорда. Каждая полоска представляет собой цифру, а высота полоски – процент чисел, начинающихся с этой цифры:
Закон Бенфорда – это наблюдение, согласно которому во многих реальных наборах числовых данных ведущая цифра, скорее всего, будет маленькой. В наборах, подчиняющихся этому закону, число 1 оказывается ведущей цифрой примерно в 30% случаев, а 9 – менее чем в 5% случаев. Если бы цифры были распределены равномерно, то каждая из них встречалась бы примерно в 11,1% случаев.
Даже последовательность Фибоначчи подчиняется закону Бенфорда.
Возьмем первые 15 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377.
Ведущая цифра 1 встречается в 4 случаях из 15, с вероятностью 26,67%
Возьмем первые 30 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229. Ведущая цифра 1 встречается в 9 случаях из 30. Следовательно, вероятность теперь равна 30%.
Возьмем первые 50 чисел.
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229, 832040, 1346269, 2178309, 3524578, 5702887, 9227465, 14930352, 24157817, 39088169, 63245986, 102334155, 165580141, 267914296, 433494437, 701408733, 1134903170, 1836311903, 2971215073, 4807526976, 7778742049. Ведущая цифра 1 встречается в 15 случаях из 50. И опять вероятность составляет 30%!
Макроэкономические данные, которые правительство Греции сообщало Европейскому союзу перед вступлением в еврозону, были признаны фальсифицированными после сверки с законом Бенфорда.
Еще в 1972 году экономист Хэл Вэриан предложил использовать этот закон для выявления возможного мошенничества в списках социально-экономических данных, представляемых в поддержку государственных плановых решений. Исходя из правдоподобного предположения, что люди, фабрикующие цифры, склонны распределять их достаточно равномерно, простое сравнение распределения частот первых цифр в данных с ожидаемым распределением по закону Бенфорда должно выявить любые аномальные результаты.
Прежде чем вы начнете пытаться найти данные, в которые этот закон не вписывается, учтите, что закон Бенфорда делает наиболее точные предсказания только в реальных данных. То есть только в тех случаях, когда величины различаются на порядки. Так, он не будет работать с возрастом людей, который ограничен всего лишь примерно 100 числовыми значениями. Однако он будет, к примеру, работать с годовыми доходами людей, которые могут варьироваться от 0 до 1 00 000 и даже больше.
По мере того как легальные ставки на спорт распространяются по всей Америке, новое исследование показывает,… Читать далее
Бактерия из кишечника древесных лягушек продемонстрировала «необычайно мощные» способности уничтожать опухоли при внутривенном введении, превосходя… Читать далее
Согласно новому метаанализу, опубликованному в Journal of Sport and Health Science, каждое повышение температуры мышц… Читать далее
От утверждений о том, что вакцины не работают, до манипулированных изображений и намеренного искажения слов… Читать далее
Исследование, опубликованное в журнале Age and Ageing пару недель назад, показало, что пожилые люди, употреблявшие… Читать далее
Многим знакома ситуация, когда после бессонной ночи вы не чувствуете себя бодрым, как обычно. Мозг… Читать далее