시사교육배움/지혜는

벤포드의 법칙

천사요정 2022. 5. 10. 09:36

숫자를 조작한 흔적, 이것으로 잡아낸다.

다양한 수치 자료에서 첫 자리에 가장 빈번하게 나타나는 수는 1이다.

우리 주변에 널린 다양한 수치 자료에서 첫 자리에 가장 빈번하게 나타나는 수는 무엇일까. 얼핏 생각해보면 수치 자료에는 1부터 9가 11.1%씩 동등하게 분포하므로 첫 자리 수도 1부터 9가 같은 비율로 나타날 것 같다. 하지만 예상과 달리 1이 가장 빈번하게 나타나고, 2에서 9로 갈수록 그 빈도는 현저히 낮아진다.

벤포드의 법칙

미국의 천문학자 사이먼 뉴컴(1835~1909)은 1881년에 로그표가 담긴 책을 보면서 앞쪽 페이지가 뒤쪽 페이지보다 더 닳아 있다는 것을 발견했다. 이는 사람들이 로그표에서 1로 시작하는 값들을 더 자주 찾아봤음을 의미했다. 물리학자 프랭크 벤포드(1883~1948)는 뉴컴의 이런 발견을 1938년에 공식화했다. 벤포드는 강 335개의 넓이, 물리학 상수 104가지, 분자 중량 1800가지 등 20개 분야 자료들의 첫 자리 수 분포를 분석해 ‘벤포드의 법칙’을 내놓았다.

벤포드의 법칙에 따르면 어떤 분야의 수치들에서 1부터 9까지의 수 n이 첫 자리 수가 될 확률은 다음과 같다.

첫 자리 수가 1일 확률은 P(1)=log10(1+1/1)=log102≒0.301, 즉 30.1%이고, 첫 자리 수가 2일 확률은 P(2)=log10(1+1/2)=log101.5≒0.1761, 약 17.6%가 된다. 이런 방식으로 1부터 9까지의 수가 첫 자리 수가 될 확률을 계산하면 다음과 같다.

그렇다면 벤포드의 법칙은 왜 성립하는 것일까. 우리 주변의 자료 중에는 일정한 배율로 증가하는 것이 많다. 예를 들어, 일정한 배율로 자라는 나무의 현재 높이를 1이라고 해보자. 높이가 2로 2배가 될 때까지 걸리는 시간을 A라고 한다면, 높이가 2에서 3으로 1.5배가 될 때까지 걸리는 시간은 A보다 짧다. 마찬가지로 3에서 4로 1.33배 늘어나는 데 걸리는 시간은 더 짧다. 결과적으로 나무의 높이는 1에서 머무르는 시간이 길고, 2에서 9로 갈수록 머무는 시간이 짧아진다. 이를 표현한 것이 바로 벤포드의 법칙에 나타나는 상용로그 식이다.

벤포드의 법칙은 자연과학 법칙처럼 항상 성립하는 절대적 진리가 아니라, 상당한 자료에서 성립하는 경향성이다. 다음 그래프에서 확인할 수 있듯이 전 세계에 있는 마을을 높이 순서로 12만개를 선정해 고도를 조사하면 벤포드의 법칙에서 크게 벗어나지 않는다.

피보나치 수열도 벤포드의 법칙과 관련이 있다. 피보나치 수열은 첫째 항과 둘째 항을 1로 놓고 세 번째 항부터는 앞의 두 항을 더해서 만드는 것이다. 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, … 로 계속된다. 100항까지 구한 뒤 각 항의 첫 자리 수 분포를 조사하면 다음 표와 같다. 대략적으로 벤포드의 법칙을 따른다.

벤포드의 법칙은 기업의 회계 부정이나 가격 담합 등을 적발하는 데도 이용된다. 만약 어떤 기업에서 부정한 방식으로 수치를 조작하면 1부터 9까지의 수를 무작위로 균등하게 분포시킬 가능성이 높다. 그렇게 되면 첫 자리 수의 빈도가 1에서 9로 갈수록 낮아지는 벤포드의 법칙에 위배된다. 이를 이용해 미국의 국세청(IRS)이나 금융감독 기관은 기업이 조작한 단서를 잡는다.

부자연스러운 수 e를 밑으로 하는 ‘자연로그’

벤포드의 법칙을 설명하는 로그는 10을 밑으로 하는 ‘상용로그’다. 사실 우리는 십진법을 쓰기 때문에 밑을 10으로 하는 상용로그를 자연스럽게 느끼는데, 막상 ‘자연로그’는 밑을 e로 하는 로그다. e는 순환하지 않는 무한소수인 무리수로, 그 값이 2.718281828…이다. 이처럼 부자연스러운 수를 밑으로 하는 로그를 자연로그라고 부르는 것이 아이러니해 보이지만 e는 생각보다 정교하다.

비현실적인 설정이지만 연이율 100%인 금융 상품이 있다고 가정해 보자. 1원을 맡기면 1년 후 2원을 찾게 된다. 그런데 일부 은행에서는 이자를 1년에 한 번이 아니라 여러 번에 나누어 복리로 지급하기도 한다. 1년에 2번 복리로 이자를 지급하면 (1+1/2)2=2.25원을 찾게 되고, 3번 복리로 이자를 지급하면 (1+1/3)3=2.37원을 찾게 된다. 이를 일반화 하면, 1년에 n번 복리로 이자를 지급한다고 할 때 원리금 합계는 (1+1/n)n이 된다. n이 커짐에 따라 원리금 합계는 무한정 늘어날 것 같지만, 사실은 특정한 값에 수렴한다. 그 값이 바로 e=2.71828…이다. 즉 이자를 지급하는 횟수를 아무리 늘려도 원리합계는 2.71828…원을 넘지 않는다.

e는 구글(Google)과 관련해서도 관심을 받은 수다. ‘검색한다’는 일반적인 의미로 사전에 등재될 정도로 대표적인 검색엔진인 구글은 검색의 무한성을 나타나기 위해 10100을 의미하는 googol을 어원으로 했다. 2004년 기업 공개 당시 구글의 규모는 27억1천828만1천828달러였는데, 이는 바로 e billion(2.718281828×10억)이다. 이름에서부터 수학적 배경을 가지고 있는 회사답게, 기업 공개 규모를 e를 토대로 산정한 것이다.

수학에서 가장 아름다운 식

logex=ln x를 미분하면 1/x이고 ex를 미분하면 그대로 ex이 된다. e를 이용하면 미분과 적분 계산이 편리해 지는 것이다. 이런 의미에서 보면 자연로그라는 이름이 어울릴 수도 있다.

자연로그를 e로 표기한 최초의 수학자는 오일러다. e를 ‘오일러의 수’라고도 부르는 이유다. 오일러는 표기법의 중요성을 인식해 e 이외에도 함수 f(x), 삼각함수의 sin, cos, tan, 수열의 합 Σ, 허수의 단위 등 현재 사용하고 있는 많은 수학 기호를 고안해 냈다. 이전부터 사용해온 원주율 도 오일러에 이르러 확고한 표기로 자리 잡았다.

오일러는 수학의 여러 분야에서 수많은 공식을 만들어냈는데, 대표적인 것은 지수함수와 삼각함수를 연결하는 ‘오일러의 공식’ eix=cosx+i sinx다. 이 공식에서 x=π로 놓으면, 수학에서 가장 아름다운 식으로 알려진 eiπ+1=0이 된다. 이 식에는 e, i, π와 기본적인 수 0, 1이 절묘하게 결합돼 있다. 오일러는 이 식을 만들기도 했지만 이 식에 포함된 표기를 처음으로 만들어내기도 했다.

[네이버 지식백과] 벤포드의 법칙 - 숫자를 조작한 흔적, 이것으로 잡아낸다. (수학산책, 박경미, 과학동아)

우주 만물 모든 것은 정확한 수학 법칙에 따라 움직인다! 벤포드의 법칙!

https://www.youtube.com/watch?v=K3m--1mGnvA&ab_channel=%EB%A6%AC%EB%B7%B0%EC%97%89%EC%9D%B4%3AOwl%27sReview