Knowit

  1. La legge di Benford
    L'ordine emergente nelle serie di dati reali

    Avatar
    Tags
    matematica
    statistica
    By Antonio Poianella il 22 June 2012
     
    3 Comments   121 Views
    .
    Cosa hanno in comune le superfici di 300 fiumi con le distanze dalla Terra delle 300 stelle più luminose o con il numero civico di residenza di 1000 persone scelte a caso? Questi insiemi di numeri provengono da contesti molto diversi, ma tutti e tre contengono dati che possono essere considerati casuali. Ora scegliete una di queste serie e considerate la prima cifra significativa di ogni suo elemento (ad esempio la prima cifra di 8673 è 8, la prima cifra di 0.045 è 4); otterremo così una sequenza di numeri compresi tra 1 e 9. Poiché questa serie di prime cifre proviene da un insieme di dati casuali, è ragionevole aspettarsi che esse siano distribuite uniformemente, ovvero che ogni cifra compaia circa l'11% delle volte... ma la realtà dei fatti è che per ognuno di questi insiemi di dati la probabilità che la prima cifra sia 1 è circa 6 volte maggiore della probabilità che essa sia 9. La distribuzione delle prime cifre per molti insiemi di dati osservabili in natura non è infatti uniforme ma è più simile alla distribuzione detta di Benford, che ha formula

    P(d) = log(d + 1) - log(d)

    la quale ci da la probabilità che la prima cifra sia d (si noti che qui log indica il logaritmo decimale). Nella seguente tabella vediamo le conseguenze numeriche di questa formula:


     1 2 3 4 5 6 7 8
     30.1% 17.6%12.5% 9.7%7.9% 6.7% 5.85 5.1% 4.6%


    Nella riga inferiore è riportata la probabilità che ogni cifra ha di comparire al primo posto.
    L'ubiquità di questa distribuzione, scoperta nel 1881 a partire da osservazioni empiriche sull'usura delle tavole logaritmiche e studiata approfonditamente da Benford a partire dal 1938, è stata spiegata in modo soddisfacente solo nel 1995. È stato dimostrato matematicamente che essa emerge ogni volta che si prendono in considerazione serie di dati i cui logaritmi sono distribuiti uniformemente, quando si mischiano dati provenienti da distribuzioni molto diverse tra loro e quando si fanno misurazioni in processi di crescita esponenziale.

    Una proprietà molto interessante della legge di Benford è l'invarianza di scala: le superfici dei fiumi, ad esempio, seguono questa legge siano esse misurate in metri quadrati o in piedi quadrati.

    Detto ciò, esistono molte situazioni in cui la legge di Benford non è applicabile: ciò avviene per numeri selezionati casualmente in modo artificiale (ad esempio con un generatore computerizzato o una roulette) o per serie di dati che hanno sempre lo stesso ordine di grandezza (ad esempio un campione di quozienti intellettivi).

    Tuttavia la legge di Benford è applicabile alle dichiarazioni dei redditi e ai risultati delle elezioni; essa è stata più volte utilizzata per smascherare delle frodi e ha valore legale in molti tribunali, anche se il suo utilizzo come prova di colpevolezza rimane controverso.

    Tra i tipi di dati che seguono la legge di Benford sono le popolazioni delle città, le costanti fisiche, numeri scelti a caso da un giornale, i prezzi delle azioni e i numeri di Fibonacci.

    Su questo sito potete verificare come la legge di Benford si adatti ad alcune serie di dati provenienti dal mondo reale.
      Share  
     
    .

Comments
  1. Federico Saltarin
    view post
     
    .

    User deleted

    User deleted


    Ah era quella di cui parlavi l'altro giorno? :D Spiegata così riesco a capirci un pochettino di più....non tanto, data la mia ignoranza matematica, ma un po'. La trovo molto affascinante anche perché spesso avevo notato il fatto che ricorressero di più le cifre più basse però mi ero sempre detto che probabilmente era appunto casuale,e invece questo mi spiega l'esatto contrario :).
    CITAZIONE
    Tuttavia la legge di Benford è applicabile alle dichiarazioni dei redditi e ai risultati delle elezioni

    In che senso? Non capisco bene in quale modo.
     
    Top
    .
  2. Antonio Poianella
    view post
     
    .

    User deleted

    User deleted


    Molti evasori fiscali non sono a conoscenza di questa legge; dunque quando falsificano i dati sui propri introiti tendono a scegliere cifre distribuite uniformemente. In realtà i dati finanziari spesso non variano su molti ordini di grandezza e quindi non si può fare il test di Benford sulla prima cifra ed aspettarsi un risultato molto affidabile. Però esistono delle formule per determinare la distribuzione della seconda, terza cifra e così via; di fatto quando si sospetta che una serie di dati sia stata falsificata si controlla anche che le frequenze relative delle seconde cifre di tutti i numeri differiscano significativamente da quelle teoriche. Per metterci dei numeri, la seconda cifra più probabile è lo 0 con una frequenza del 12% mentre il 9 capita solo nell'8.5% dei casi. Attraverso un procedimento chiamato test del chi-quadro è possibile convertire una lista delle frequenze relative in una stima percentuale della probabilità di una frode; i campi di applicazione potenziali spaziano dalla verifica di frodi fiscali fino alla prova dell'affidabilità di misurazioni scientifiche, a misure di sicurezza utilizzate per prevenire il Millennium bug.
     
    Top
    .
  3. Federico Saltarin
    view post
     
    .

    User deleted

    User deleted


    Ah ok ora ho capito. Bello, mi piace. ;) Davvero inerressante
     
    Top
    .