Aiuto:Una voce a caso

Il link "Una voce a caso", situato nella barra a sinistra dell'interfaccia di Wikipedia.

La pagina speciale Speciale:PaginaCasuale (o Speciale:Random), quando viene visitata, rinvia automaticamente a una voce a caso dell'enciclopedia. Questa funzione è facilmente accessibile tramite il link Una voce a caso nella barra di sinistra dell'interfaccia di Wikipedia.

Sono esclusi dalle pagine casuali i redirect e le pagine di disambiguazione[1].

Gli altri namespace modifica

Come abbiamo visto, Speciale:PaginaCasuale visualizza una pagina a caso appartenente al namespace principale, quello che contiene le voci dell'enciclopedia. Per utilizzare la stessa funzione per gli altri namespace occorre specificarli: ad esempio per visualizzare "una discussione a caso" il wikilink da utilizzare è Speciale:PaginaCasuale/Discussione, per ottenere "un template a caso" il wikilink è Speciale:PaginaCasuale/Template, e così via.

Notare che in molti namespace secondari sono abilitate le sottopagine, e questo sistema può estrarre una pagina a caso anche tra tutte le sottopagine. Per visualizzare una pagina di base a caso, escludendo le sottopagine, usare ad esempio il percorso Speciale:RandomRootpage/Template.

Redirect modifica

Per visualizzare un redirect a caso, è possibile utilizzare la pagina speciale Speciale:RedirectCasuale (Special:RandomRedirect). I redirect sono altrimenti esclusi dalle pagine possibili.

Voci di una categoria modifica

Per visualizzare una pagina a caso tra quelle contenute in una categoria, è possibile utilizzare la pagina speciale Speciale:CasualeInCategoria. Basta inserire nella casella il nome della categoria (senza il prefisso "Categoria:"). Tuttavia questo sistema non può estrarre pagine dalle sottocategorie, ma solo quelle inserite direttamente nella categoria stessa. Impostando ad esempio la categoria "Storia", non si otterrà una qualunque voce di storia, ma solo una delle poche voci o sottocategorie di primo livello visibili direttamente nella pagina Categoria:Storia.

Frequenza delle voci modifica

D: Ho cliccato più volte su Una voce a caso e mi sembra che vengano restituite quasi sempre voci relative a "comuni francesi", "città o paesi", "film", "asteroidi", ecc. Siamo sicuri che funzioni in maniera corretta e che tutto ciò che esce sia effettivamente "preso a caso"?

R: La risposta, per farla breve, è che le voci restituite da tale funzione sono scelte davvero in maniera casuale. Selezionando la funzione Una voce a caso si chiede, in effetti, al motore di ricerca di wikipedia di scegliere - in maniera casuale - una pagina tra le 1 859 994 presenti sul database di it.wiki.

Considerando, però, che i comuni francesi, le città ed i paesi in Italia e del mondo ed i vari film (per citare gli esempi precedenti) costituiscono una percentuale piuttosto alta delle voci presenti sull'enciclopedia, è facile capire come sia effettivamente più probabile che la funzione restituisca una voce di uno di questi tre tipi piuttosto che un'altra. Tale considerazione trae fondamento dai principi del campionamento statistico e, più in generale, da quelli base della statistica.

Proviamo a spiegare cosa effettivamente accade quando si sceglie Una voce a caso: in it.wiki vi sono, al momento, 1 859 994 voci, che possiamo considerare come delle palline colorate in un'urna (un'urna decisamente molto grande...). Supponiamo di pescare una pallina: di che colore sarà? Potrebbe essere, ovviamente, di ognuno dei colori presenti nell'urna. Prendiamo, ad esempio, il blu e facciamo finta che il totale di palline blu presenti nell'urna sia di 10.000; ciò vuol dire che la probabilità di pescare una pallina blu tra tutte le palline presenti nell'urna è pari a 10.000/1 859 994, ovvero a 0.0054; in sostanza, pescando una pallina a caso dall'urna, si ha circa il 1% di probabilità che questa sia blu.

Analogamente, con i comuni francesi: le voci che li riguardano sono infatti oltre 36.600 e, quindi, c'è circa il 2% [2][3] di probabilità[4] che, cliccando su Una voce a caso, venga visualizzata una voce relativa ad un comune francese. Col crescere del numero totale delle voci su it.wiki tale probabilità tenderà, progressivamente, a diminuire: contribuisci anche tu a diminuirla!

«Detto in parole povere: se escono spesso dei comuni francesi è perché ci sono tanti comuni francesi.»

«Si guarda al futuro, quando le voci saranno talmente tante che per forza di cosa i comuni francesi saranno una goccia nel mare

Appendice modifica

Lista di categorie di voci numerose e frequenza di uscita teorica prevista (se non diversamente specificato i dati sono aggiornati in automatico)[5]:

Categoria Numero di voci Probabilità di uscita
Un comune (fr, it, es, de, br, ro) 69 487 3.63%
  - Comuni francesi
36 608
1.97%
  - Comuni italiani
8 162
0.44%
  - Comuni spagnoli
8 109
0.44%
  - Comuni tedeschi
5 853
0.31%
  - Comuni brasiliani
5 564
0.3%
  - Comuni rumeni
3 175
0.17%
Album ~ 25 000[6] 1.34%
Città (esclusi i comuni) ~ 23 500[6] 1.26%
Tornei di tennis ~ 18 300[7] 0.98%
Film statunitensi ~ 30 300[8] 1.63%
Film italiani ~ 9 800[8] 0.53%
Asteroidi ~ 14 800[7] 0.8%
Personalità della letteratura 11 790[6] 0.63%
Attori (us, it) 28 0%
  - Attori statunitensi
13
0%
  - Attori italiani
15
0%
Calciatori italiani 6 0%
Chiese d'Italia ~ 6 400[6] 0.34%
Libri ~ 5 400[6] 0.29%
Cestisti statunitensi 10 0%
Politici italiani del XX secolo 10 629 0.57%
Liste di nati/morti nell'anno 3 821[6] 0.21%
Minerali 3 665[6] 0.2%
Contee degli Stati Uniti d'America 3 143[6] 0.17%
Anni 3 088[7] 0.17%
Vini DOC 3 035[7] 0.16%
Diocesi cattoliche ~ 3.000[6] 0.16%

Note tecniche modifica

Il generatore di pagine casuali utilizza un algoritmo per la generazione di numeri pseudocasuali di tipo Mersenne Twister. L'algoritmo genera un numero in virgola mobile casuale compreso tra 0 e 1. Ad ogni pagina di Wikipedia è associato, al momento della sua creazione, un indice casuale fisso di questo tipo. Quando clicchiamo Una voce a caso, viene estratto un nuovo numero casuale, e viene selezionata la pagina che ha l'indice più vicino al numero estratto, avvicinandosi dall'alto.

Notare che in questo modo non tutte le pagine hanno la stessa probabilità di essere estratte. Più una pagina ha l'indice lontano dal precedente indice più basso, più è facile che venga estratta. Comunque si tratta sempre di probabilità molto piccole, ed è difficile rendersi conto delle differenze. E non c'è comunque alcuna correlazione tra la probabilità effettiva di una certa pagina e il suo contenuto; il motivo per cui certe categorie di voci sono più frequenti è spiegato al capitolo precedente.

  1. ^ fino al 2015 erano comprese anche le pagine di disambiguazione
  2. ^ 36.608/1 859 994 = 0.0197 = 1.97%
  3. ^ Va comunque considerato che vi può essere una differenza, anche notevole, tra la probabilità misurata su un campione non rilevante e la probabilità come limite tendenziale secondo la legge dei grandi numeri: solo nel caso di un campione rilevante la probabilità misurata tenderà ad essere prossima a quella teorica.
  4. ^ Da sottolineare, infine, che le persone tendono a fare molta più attenzione a un pattern, e quindi a stimare una probabilità soggettiva maggiore di quella che l'evento effettivamente ha. In un certo senso, se si prova a cercare dieci "voci a caso" e tre di esse riguardano un comune francese, la probabilità percepita è molto maggiore dell'8%, quasi come se tutte le altre voci venissero raggruppate tra loro. Questo è lo stesso motivo per cui nessuno giocherebbe al Superenalotto la sestina "1, 2, 3, 4, 5, 6" che pure ha la stessa possibilità di uscita di una qualunque altra.
  5. ^ Si considerano solo gruppi omogenei di almeno 3.000 elementi.
  6. ^ a b c d e f g h i Dati aggiornati a novembre 2009
  7. ^ a b c d Dati aggiornati a dicembre 2011
  8. ^ a b Dati aggiornati ad agosto 2015