В реальных числовых данных вероятность того, что первая цифра любого числа будет равна 1, составляет около 30%, а не 11,11%, как может интуитивно показаться.
Распределение первых цифр в соответствии с законом Бенфорда. Каждая полоска представляет собой цифру, а высота полоски – процент чисел, начинающихся с этой цифры:
Закон Бенфорда – это наблюдение, согласно которому во многих реальных наборах числовых данных ведущая цифра, скорее всего, будет маленькой. В наборах, подчиняющихся этому закону, число 1 оказывается ведущей цифрой примерно в 30% случаев, а 9 – менее чем в 5% случаев. Если бы цифры были распределены равномерно, то каждая из них встречалась бы примерно в 11,1% случаев.
Даже последовательность Фибоначчи подчиняется закону Бенфорда.
Возьмем первые 15 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377.
Ведущая цифра 1 встречается в 4 случаях из 15, с вероятностью 26,67%
Возьмем первые 30 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229. Ведущая цифра 1 встречается в 9 случаях из 30. Следовательно, вероятность теперь равна 30%.
Возьмем первые 50 чисел.
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229, 832040, 1346269, 2178309, 3524578, 5702887, 9227465, 14930352, 24157817, 39088169, 63245986, 102334155, 165580141, 267914296, 433494437, 701408733, 1134903170, 1836311903, 2971215073, 4807526976, 7778742049. Ведущая цифра 1 встречается в 15 случаях из 50. И опять вероятность составляет 30%!
Макроэкономические данные, которые правительство Греции сообщало Европейскому союзу перед вступлением в еврозону, были признаны фальсифицированными после сверки с законом Бенфорда.
Еще в 1972 году экономист Хэл Вэриан предложил использовать этот закон для выявления возможного мошенничества в списках социально-экономических данных, представляемых в поддержку государственных плановых решений. Исходя из правдоподобного предположения, что люди, фабрикующие цифры, склонны распределять их достаточно равномерно, простое сравнение распределения частот первых цифр в данных с ожидаемым распределением по закону Бенфорда должно выявить любые аномальные результаты.
Прежде чем вы начнете пытаться найти данные, в которые этот закон не вписывается, учтите, что закон Бенфорда делает наиболее точные предсказания только в реальных данных. То есть только в тех случаях, когда величины различаются на порядки. Так, он не будет работать с возрастом людей, который ограничен всего лишь примерно 100 числовыми значениями. Однако он будет, к примеру, работать с годовыми доходами людей, которые могут варьироваться от 0 до 1 00 000 и даже больше.
Недавнее исследование, опубликованное в журнале Biosensors and Bioelectronics, говорит о том, что пчелы могут стать важным инструментом для раннего… Читать далее
Исследование, проведенное в клинике Mass Eye and Ear, выявило связь между широко назначаемыми препаратами для… Читать далее
Закон штата Техас, запрещающий аборты на ранних сроках беременности, ассоциируется с резким увеличением числа смертей… Читать далее
Капсульные камеры позволяют почти незаметно и без боли исследовать все уголки кишечника, пока пациент занимается… Читать далее
Недавнее исследование, проведенное учеными из Университетского колледжа Лондона (UCL), проливает свет на то, как мозг… Читать далее
Исследование японских ученых, опубликованное в журнале Scientific Reports 31 мая, свидетельствует о том, что взгляд… Читать далее