La legge dei grandi numeri, detta anche teorema di Bernoulli (in quanto la sua prima formulazione è dovuta a Jakob Bernoulli), descrive il comportamento della media di una sequenza di prove di una variabile casuale, indipendenti e caratterizzate dalla stessa distribuzione di probabilità ( misure della stessa grandezza, lanci della stessa moneta, ecc.), al tendere a infinito della numerosità della sequenza stessa.
Secondo la legge dei grandi numeri è ragionevolmente sicuro che la media, che determiniamo a partire da un numero sufficiente di campioni, sia sufficientemente vicina alla media vera, ovvero quella calcolabile teoricamente. Che cosa significhi "ragionevolmente sicuri" dipende da quanto vogliamo essere precisi nel nostro test: con dieci prove, avremmo una stima grossolana, con cento, ne otterremmo una molto più precisa, con mille, ancora di più, e così via: il valore di che siamo disposti ad accettare come sufficiente dipende dal grado di casualità che riteniamo necessario per il dato in questione.
In termini generici, per la legge dei grandi numeri si può dire:
che la media della sequenza è un'approssimazione, che migliora al crescere di della media della distribuzione, e
che, viceversa, si può prevedere che sequenze siffatte mostreranno una media tanto più spesso e tanto più precisamente prossima alla media della distribuzione quanto più grande sarà .
Un caso particolare di applicazione della legge dei grandi numeri è la previsione probabilistica della proporzione di successi in una successione di realizzazioni indipendenti di un evento ossia la frequenza di nelle misurazioni: per che tende a infinito, la proporzione di successi converge alla probabilità di .
Unita a questa si ha un'altra nozione interessante, ossia la legge dei piccoli numeri, che va al di là del concetto di equiprobabilità e considera la dimensione del campione rispetto ai possibili eventi e conseguenti esiti. In particolare, a seguito di esperimenti ripetuti considerando un campione più piccolo, è molto più semplice allontanarsi dal valore atteso, banalmente perché avendo meno valori da considerare vi è più probabilità che essa si approssimi a un certo valore, sottostimando il numero di campioni per stime accurate. Essa fu teorizzata da Kahneman.[1]
Legge forte dei grandi numeri
Se, data una successione di variabili casuali indipendenti e identicamente distribuite con media (finita) , si considera la media campionaria
Sia una successione di spazi di probabilità. Si consideri lo spazio prodotto e in esso una successione bernoulliana di eventi (stocasticamente indipendenti e con probabilità costante ) . Assegnato un elemento si definisce la frequenza di successo in prove , dove e indica il numero di successi ottenuti in prove.
Dimostrazione della legge debole dei grandi numeri
Nelle condizioni sopra enunciate, si vuole dimostrare che:
La legge debole dei grandi numeri non assicura che, comunque scelto , quasi certamente a partire da un certo il valore si mantenga minore o uguale a , ossia che l'insieme
sia -trascurabile. Infatti, esplicitando la definizione di limite, si trova:
ma niente sembra assicurare che non diverga per .
Dimostrazione della legge forte dei grandi numeri
Ciò è invece assicurato, nelle medesime condizioni, dalla proposizione:
che, in effetti, implica sia
sia la legge debole dei grandi numeri.
Dimostrazione delle due implicazioni
La legge forte può essere formulata, esplicitando la definizione di limite e passando al complementare, come:
che a sua volta è equivalente, trasformando il quantificatore esistenziale in un'unione, a:
e per monotonia di
da cui, per confronto, la prima implicazione. Trasformando anche gli altri due quantificatori in operazioni insiemistiche, si ha:
ma, si è in presenza dell'intersezione di una successione non crescente di insiemi, dunque per monotonia di , si ha:
e ancora:
da cui anche la seconda implicazione, ricordando che questo è valido per ogni .
Dimostrazione della legge forte
Si è già visto che l'asserto è equivalente a:
Discretizzando, come consueto nel caso dei limiti, si ha:
Dunque, se quest'ultima espressione sarà nulla, si sarà dimostrata la legge forte. Essendo non negativa, si dovrà avere:
si vuole mostrare che questo è vero considerando la sottosuccessione . Si vuole applicare il lemma di Borel-Cantelli, pertanto si verifica che converga l'espressione