Cosa hanno in comune le superfici di 300 fiumi con le distanze dalla Terra delle 300 stelle più luminose o con il numero civico di residenza di 1000 persone scelte a caso? Questi insiemi di numeri provengono da contesti molto diversi, ma tutti e tre contengono dati che possono essere considerati casuali. Ora scegliete una di queste serie e considerate la prima cifra significativa di ogni suo elemento (ad esempio la prima cifra di 8673 è 8, la prima cifra di 0.045 è 4); otterremo così una sequenza di numeri compresi tra 1 e 9. Poiché questa serie di prime cifre proviene da un insieme di dati casuali, è ragionevole aspettarsi che esse siano distribuite uniformemente, ovvero che ogni cifra compaia circa l'11% delle volte... ma la realtà dei fatti è che per ognuno di questi insiemi di dati
la probabilità che la prima cifra sia 1 è circa 6 volte maggiore della probabilità che essa sia 9. La distribuzione delle prime cifre per molti insiemi di dati osservabili in natura non è infatti uniforme ma è più simile alla distribuzione detta di Benford, che ha formula
P(d) = log(d + 1) - log(d)
la quale ci da la probabilità che la prima cifra sia
d (si noti che qui
log indica il logaritmo decimale). Nella seguente tabella vediamo le conseguenze numeriche di questa formula:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
30.1% | 17.6% | 12.5% | 9.7% | 7.9% | 6.7% | 5.85 | 5.1% | 4.6% |
Nella riga inferiore è riportata la probabilità che ogni cifra ha di comparire al primo posto.
L'ubiquità di questa distribuzione, scoperta nel 1881 a partire da osservazioni empiriche sull'usura delle tavole logaritmiche e studiata approfonditamente da Benford a partire dal 1938, è stata spiegata in modo soddisfacente solo nel 1995. È stato dimostrato matematicamente che essa emerge ogni volta che si prendono in considerazione serie di dati i cui logaritmi sono distribuiti uniformemente, quando si mischiano dati provenienti da distribuzioni molto diverse tra loro e quando si fanno misurazioni in processi di crescita esponenziale.
Una proprietà molto interessante della legge di Benford è l'invarianza di scala: le superfici dei fiumi, ad esempio, seguono questa legge siano esse misurate in metri quadrati o in piedi quadrati.
Detto ciò, esistono molte situazioni in cui la legge di Benford non è applicabile: ciò avviene per numeri selezionati casualmente in modo artificiale (ad esempio con un generatore computerizzato o una roulette) o per serie di dati che hanno sempre lo stesso ordine di grandezza (ad esempio un campione di quozienti intellettivi).
Tuttavia la legge di Benford è applicabi...
Read the whole post...
Last comments