Wikipedia:Bar/Discussioni/Dimensioni impossibili di wikipedia!!

Dimensioni impossibili di wikipedia!! NAVIGAZIONE


Ho provato a esaminare la possibilità di installare wikipedia sul cellulare, cosi' mi sono messo a cercare versioni scaricabili del database. Ed ho scoperto cose incredibili, cifre incredibili! Anzi, per meglio dire, impossibili!


Raccolta completa articoli wiki italiana, senza immagini, senza storico, senza commenti utenti: http://download.wikimedia.org/itwiki/20071215/ 418 MB compressi

Raccolta completa articoli wikipedia inglese, senza immagini e senza commenti: http://download.wikimedia.org/enwiki/20071218/ ( file enwiki-20071218-pages-articles.xml.bz2 ) 760 MB compressi

Ora, considerando che si tratta di solo testo, probabilmente c'e' una compressione di almeno 10:1 . Quindi, la wiki italiana occuperebbe almeno 4 GB, e quella inglese almeno 7 GB.

Ok, questo è matematicamente impossibile.

Motivo: un'enciclopedia di 20 volumi, con 500 pagine per volume, 2 colonne per pagina, 300 righe per colonna e 40 caratteri per pagina, occuperebbe 228 MB (MEGAbytes)!! Invece, 4 GIGAbyte equivalgono a circa 333 dei suddetti volumi: 10 metri di enciclopedia!!!

E l'enciclopedia britannica pare che invece occupi circa UN gigabyte!!!

Cioe', la wikipedia italiana sarebbe grande QUATTRO VOLTE l'enciclopedia britannica.

per piacere....

C'e' qualcosa che non va in questi dump.

Probabilmente ci sono piu' metadati che dati!!! Questo commento senza la firma utente è stato inserito da Cassioli (discussioni · contributi).

La spiegazione è semplice: il software mediawiki registra tutto sotto cvs in maniera non incrementale. Ogni volta che modifichi una virgola in una voce, viene registrata nuovamente l'intera voce. Quindi è matematicamente possibile :-) Gac 10:36, 7 gen 2008 (CET)[rispondi]

La wikipedia inglese contiene 2.163.522 voci. Direi che sono piu' di quelle contenute nella britannica, e' normale che occupino piu' spazio. Jalo 10:47, 7 gen 2008 (CET)[rispondi]
@Gac: la versione che dice Cassioli comprende solo le versioni correnti delle voci. Secondo me il punto è che 4Gb sono circa 4 milioni di kb, che divisi per le circa 400000 voci di it.wiki danno una media di 10 kb per voce. Considerando che il dump è fatto in XML, che è un formato estremamente ridondante, e la sintassi wiki stessa occupa un po' di spazio, direi che le dimensioni sono ragionevoli. --Francesco (All your base are belong to us) 10:59, 7 gen 2008 (CET)[rispondi]
mi era sfuggito che parlava di versione corrente. Sorry Gac 11:10, 7 gen 2008 (CET) [rispondi]
en.wikipedia ad agosto 2007
Mi stupisce che en.wiki sia grande meno del doppio di it.wiki. Possibile?--Bultro 11:28, 7 gen 2008 (CET)[rispondi]

(OT: un'immagine come quella qui a destra sarebbe interessante anche per noi; si può fare facilmente? --gLibero sapere in libero web 11:11, 7 gen 2008 (CET)[rispondi]

Bellissimo il libro sui pokemon in basso a destra XD Jalo 19:12, 7 gen 2008 (CET)[rispondi]

Sono sbagliati i dati di riferimento iniziali. Il dump in italiano è di 551,6M e si riferisce a pages-meta-current (al 15-12-2007). L'analogo in inglese è di 5,7 G sempre riferito a pages-meta-current (al 23-12-2007). Quindi circa 10 volte e non il doppio. Gac 11:48, 7 gen 2008 (CET)[rispondi]

Ma che wikipedia sia 4 volte la Britannica è possibilissimo, visto che la Britannica non ha certamente voci su tutti i comuni, film, attori, cartoni, manga, specie animali e vegetali, libri, corpi astronomici, classifiche sportive, edifici, opere d'arte, cantanti, canzoni, migliaia di liste più disparate ecc. ecc. ecc. Marko86 13:36, 7 gen 2008 (CET)[rispondi]

È anche possibile che parecchie voci della Britannica siano assenti dalla Wikipedia italiana, ma senza "volare" così alto in questa pagina del Ministero dell'Università c'è un elenco di brevi biografie che si possono agevolmente ritenere enciclopediche. Ebbene, non molto tempo fa feci un controllo parziale sulla loro presenza in it:wiki e ne risultarono mancanti circa un centinaio. --Lucio Di Madaura (disputationes) 17:26, 7 gen 2008 (CET)[rispondi]

Per Gianfranco e per tutti coloro a cui interessa sull'immagine ci sto lavorando. Usando gli stessi criteri esposti qua ed ammesso ma non concesso che abbia fatto i calcoloni per ben benino ora la wiki in lingua italiana è composta da 124 volumi ossia poco piu' di metà di uno scaffale mostrato nell immagine. Per chi volesse maggiari dettagli puo' andare nella pagina che ho appena creato Wikipedia:Dimensione in volumi--Contezero 18:24, 7 gen 2008 (CET)P.S. se qualcuno mi controlla i calcoli e mi aggiusta la pagina mi fa un favore--Contezero 18:26, 7 gen 2008 (CET)[rispondi]

(fuori cron) Conte, hai dimenticato il volume dei pokémon. XD XD XD -- Sannita - L'admin (a piede) libero 00:09, 8 gen 2008 (CET)[rispondi]
Un volume di pokemon? o_O ----{G83}---- 22:18, 7 gen 2008 (CET)[rispondi]
@Sannita no su uno scaffale a parte. A parte i pokemon vorrei sapere dove a preso i dati per dire ci sono tot film tot articoli su persone morte eccetera--Contezero 01:08, 8 gen 2008 (CET)[rispondi]
A quanto dice lui sulla descrizione dell'immagine, ha fatto una scansione del database facendo ricerche con espressioni regolari. Immagino ad esempio che per tutte le persone abbia ricercato se era presente una data di morte. Nel nostro caso potresti utilizzare il template bio e ricercare per il campo dataMorte. --Francesco (All your base are belong to us) 08:03, 8 gen 2008 (CET)[rispondi]

Ho rifatto i calcoli con un metodo secondo me molto più preciso, e la wiki in italiano equivale a 98 volumi della Britannica (in termini di spazio; tabelle demografiche dei comuni escluse). Rimangono da rifare tutti i calcoli per la versione in inglese di wikipedia secondo il mio metodo (se qualcuno ha 5 ore da perdere...) --Priority 07:13, 9 gen 2008 (CET)[rispondi]

PS: all'interno dei 98 volumi troverebbero spazio anche 73.500 fotografie (basta fare la proporzione con la Britannica, che ha 24.000 foto in 32 volumi). --Priority 15:07, 9 gen 2008 (CET)[rispondi]
altra statistica ricavabile: la Britannica stampata nel Regno Unito occupa uno scaffale di 1 metro e 32 centimetri, con un peso di 62 Kg [1]; si deduce quindi che la Wikipedia in italiano occupa uno scaffale di 4 metri e pesa 190 Kg. Ditelo al falegname quando ordinate i mobili!!! :D --Priority 17:07, 9 gen 2008 (CET)[rispondi]