В реальных числовых данных вероятность того, что первая цифра любого числа будет равна 1, составляет около 30%, а не 11,11%, как может интуитивно показаться.
Распределение первых цифр в соответствии с законом Бенфорда. Каждая полоска представляет собой цифру, а высота полоски – процент чисел, начинающихся с этой цифры:
Закон Бенфорда – это наблюдение, согласно которому во многих реальных наборах числовых данных ведущая цифра, скорее всего, будет маленькой. В наборах, подчиняющихся этому закону, число 1 оказывается ведущей цифрой примерно в 30% случаев, а 9 – менее чем в 5% случаев. Если бы цифры были распределены равномерно, то каждая из них встречалась бы примерно в 11,1% случаев.
Даже последовательность Фибоначчи подчиняется закону Бенфорда.
Возьмем первые 15 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377.
Ведущая цифра 1 встречается в 4 случаях из 15, с вероятностью 26,67%
Возьмем первые 30 чисел: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229. Ведущая цифра 1 встречается в 9 случаях из 30. Следовательно, вероятность теперь равна 30%.
Возьмем первые 50 чисел.
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229, 832040, 1346269, 2178309, 3524578, 5702887, 9227465, 14930352, 24157817, 39088169, 63245986, 102334155, 165580141, 267914296, 433494437, 701408733, 1134903170, 1836311903, 2971215073, 4807526976, 7778742049. Ведущая цифра 1 встречается в 15 случаях из 50. И опять вероятность составляет 30%!
Макроэкономические данные, которые правительство Греции сообщало Европейскому союзу перед вступлением в еврозону, были признаны фальсифицированными после сверки с законом Бенфорда.
Еще в 1972 году экономист Хэл Вэриан предложил использовать этот закон для выявления возможного мошенничества в списках социально-экономических данных, представляемых в поддержку государственных плановых решений. Исходя из правдоподобного предположения, что люди, фабрикующие цифры, склонны распределять их достаточно равномерно, простое сравнение распределения частот первых цифр в данных с ожидаемым распределением по закону Бенфорда должно выявить любые аномальные результаты.
Прежде чем вы начнете пытаться найти данные, в которые этот закон не вписывается, учтите, что закон Бенфорда делает наиболее точные предсказания только в реальных данных. То есть только в тех случаях, когда величины различаются на порядки. Так, он не будет работать с возрастом людей, который ограничен всего лишь примерно 100 числовыми значениями. Однако он будет, к примеру, работать с годовыми доходами людей, которые могут варьироваться от 0 до 1 00 000 и даже больше.
Рост сосудов в костном мозге черепа на протяжении всей жизни приводит к увеличению выработки клеток… Читать далее
Исследование Тель-Авивского университета может изменить наше понимание того, как люди учатся и формируют память, особенно… Читать далее
Эти сайты расширят ту область, которую вы можете охватить своим взглядом в пространстве-временном континууме. Линейка… Читать далее
Новое исследование ставит под сомнение вековое представление о терпении как о моральной добродетели, показывая, что… Читать далее
3D-модели Australopithecus afarensis указывают на мышечные адаптации, которые сделали современных людей лучшими бегунами. Древние родственники… Читать далее
Ученые из Южной Кореи разработали рой крошечных магнитных роботов, которые работают вместе, как муравьи, и… Читать далее