Knowit

  1. La legge di Benford
    L'ordine emergente nelle serie di dati reali

    Avatar
    Tags
    matematica
    statistica
    By Antonio Poianella il 22 June 2012
    3 Comments   121 Views
    .
    Cosa hanno in comune le superfici di 300 fiumi con le distanze dalla Terra delle 300 stelle più luminose o con il numero civico di residenza di 1000 persone scelte a caso? Questi insiemi di numeri provengono da contesti molto diversi, ma tutti e tre contengono dati che possono essere considerati casuali. Ora scegliete una di queste serie e considerate la prima cifra significativa di ogni suo elemento (ad esempio la prima cifra di 8673 è 8, la prima cifra di 0.045 è 4); otterremo così una sequenza di numeri compresi tra 1 e 9. Poiché questa serie di prime cifre proviene da un insieme di dati casuali, è ragionevole aspettarsi che esse siano distribuite uniformemente, ovvero che ogni cifra compaia circa l'11% delle volte... ma la realtà dei fatti è che per ognuno di questi insiemi di dati la probabilità che la prima cifra sia 1 è circa 6 volte maggiore della probabilità che essa sia 9. La distribuzione delle prime cifre per molti insiemi di dati osservabili in natura non è infatti uniforme ma è più simile alla distribuzione detta di Benford, che ha formula

    P(d) = log(d + 1) - log(d)

    la quale ci da la probabilità che la prima cifra sia d (si noti che qui log indica il logaritmo decimale). Nella seguente tabella vediamo le conseguenze numeriche di questa formula:


     1 2 3 4 5 6 7 8
     30.1% 17.6%12.5% 9.7%7.9% 6.7% 5.85 5.1% 4.6%


    Nella riga inferiore è riportata la probabilità che ogni cifra ha di comparire al primo posto.
    L'ubiquità di questa distribuzione, scoperta nel 1881 a partire da osservazioni empiriche sull'usura delle tavole logaritmiche e studiata approfonditamente da Benford a partire dal 1938, è stata spiegata in modo soddisfacente solo nel 1995. È stato dimostrato matematicamente che essa emerge ogni volta che si prendono in considerazione serie di dati i cui logaritmi sono distribuiti uniformemente, quando si mischiano dati provenienti da distribuzioni molto diverse tra loro e quando si fanno misurazioni in processi di crescita esponenziale.

    Una proprietà molto interessante della legge di Benford è l'invarianza di scala: le superfici dei fiumi, ad esempio, seguono questa legge siano esse misurate in metri quadrati o in piedi quadrati.

    Detto ciò, esistono molte situazioni in cui la legge di Benford non è applicabile: ciò avviene per numeri selezionati casualmente in modo artificiale (ad esempio con un generatore computerizzato o una roulette) o per serie di dati che hanno sempre lo stesso ordine di grandezza (ad esempio un campione di quozienti intellettivi).

    Tuttavia la legge di Benford è applicabi...

    Read the whole post...

    Last Post by Federico Saltarin il 22 June 2012
    .