Wikipedia:Bar/Discussioni/Nuova pagina speciale: come si fa?

Nuova pagina speciale: come si fa? NAVIGAZIONE


Ciao a tutti,
dopo aver collaborato per un po' alla selezione delle voci da segnalare qui e soprattutto ora che mi è stata affibbiata affidata l'incombenza esclusiva (affidamento solo temporaneo, mi raccomando!) mi rendo conto che questo lavoro non s'ha da fare (almeno così). Mi spiego. Visto che le segnalazioni di altri utenti non sono molte per recuperare quella trentina di pagine da segnalare l'unica alternativa è la scansione a tappeto di tutte le Pagine più recenti dell'ultima settimana. E qui iniziano i problemi, perchè le pagine nuove sono circa 2000-3000 a settimana, bisognerebbe passarle tutte, entrarci, vedere che c'è già qualche template (stub, wikificare, aiutare, da cancellare, ...), allora non vanno bene, passare alla prossima e così via.
E' vero che con l'esperienza alcune voci da evitare si vedono anche dal titolo (es. inserimenti in massa di comuni/contee/asteroidi), ma restano comunque tante. Venerdì scorso in circa un'ora (il tempo che avevo a disposizione) non ho nemmeno esaminato un giorno di nuovi inserimenti.

Da buon (?) pigro programmatore ho pensato che bisogna assolutamente automatizzare l'automatizzabile (che non è certo il buon senso, ma alcuni altri punti si). Ad esempio avere un filtro che segnali le pagine che già contengono dei template evita di perdere tempo con queste (secondo mie statistiche, molto parziali, siamo a già oltre il 50% delle voci). Certo resta ancora molto lavoro, ma sempre meno di prima. Avrebbe anche un doppio uso, nel patrolling delle nuove voci ci si potrebbe concentrare su quelle che, non avendo template, probabilmente non sono state controllate da nessuno.

Dopo varie elucubrazioni mi sembra che la strada migliore possa essere una nuova pagina speciale apposita (modifica/Extension di MediaWiki, qui un elenco di estensioni esistenti), simile alla "Pagine più recenti", che filtri però le voci in base ai template contenuti nelle stesse, presentando un risultato simile a questo:

[    ] 01:51, 26 gen 2007 Trauma psicologico (cron) [1.839 byte] Aki 01 (Discussione | contributi) (Nuova pagina; testo: 'Il trauma psicologico è un tipo di danno subito dalla psiche o dalla personalità a seguito di una esperienza (un evento singolo oppure ripetuto o prolungat...')
[    ] 01:47, 26 gen 2007 Wmii (cron) [1.118 byte] BlackSheep81 (Discussione | contributi) (Nuova pagina; testo: '((S|informatica)) ((Infobox_Software | nome = WMII | #screenshot = 200px | #didascalia = Screenshot di wmii | sviluppatore = Anselm R. Garbe | ve...')
[disa] 01:47, 26 gen 2007 Adamov (cron) [353 byte] Nick1915 (Discussione | contributi) (Nuova pagina; testo: '((disambigua)) *Adamov, comune del distretto di C(eské Bude(jovice in Repubblica Ceca *[[Adamov (distretto di Kutná Ho...')
[stub] 01:40, 26 gen 2007 Mestru Jona (cron) [2.019 byte] Saxings (Discussione | contributi) (Nuova pagina; testo: '((S|musica)) ((Gruppo |Nome Gruppo= Mestru Jona |Nazione gruppo = Italia |Immagine bandiera nazione = Immagine:Flag of Italy.svg |Generi musicali = ragga muffin [[Ra...')
[    ] 01:18, 26 gen 2007 Il Portogallo e le grandi scoperte (cron) [12.548 byte] Burgundo (Discussione | contributi) (Traduzione parziale)
[stub] 01:02, 26 gen 2007 Sound system (cron) [441 byte] Saxings (Discussione | contributi) (Nuova pagina; testo: '((S|musica)) Per Sound System si intende quel complesso di strumenti elettronici (casse, piatti, mixer, ecc) necessari a un dj per compiere il proprio l...')
[    ] 00:44, 26 gen 2007 Strada Statale 482 Alto Polesine (cron) [1.888 byte] Cano (Discussione | contributi) (Nuova pagina; testo: 'La ex Strada Statale 482 è stata istituita in seguito alla realizzazione delle varianti alla vecchia provinciale Mantova-Ostiglia. Inizia il suo percorso proprio a Mantova, ...')
[wiki] 00:32, 26 gen 2007 Musica Nuda (cron) [683 byte] 213.140.18.129 (Discussione) (Nuova pagina; testo: 'Questo album, uscito nel 2004 è un esperimento ben riuscito di Petra Magoni in collaborazione con il contrabassista degli Avion Travel Ferruccio Spinetti. Inf...')
[stub] 00:27, 26 gen 2007 Boom da bash sound system (cron) [1.063 byte] Saxings (Discussione | contributi) (Nuova pagina; testo: '((S|musica)) ((Gruppo |Nome Gruppo = Boom da bash sound system |Nazione gruppo = Italia |Immagine bandiera nazione = Immagine:Flag of Italy.svg |Generi musicali = [[Ragga]...')
[aiut] 00:26, 26 gen 2007 Silvano Fedi (cron) [495 byte] 85.18.136.72 (Discussione) (Nuova pagina; testo: 'Eroe della partigianeria pistoiese. Comandante delle "squadre franche" in cui operavano anche altri conosciuti partigiani pistoiesi come Enzo Capecchi ed Artese Benesperi. Mor...')
[wiki] 00:25, 26 gen 2007 Dignity (cron) [1.674 byte] Giuse89 (Discussione | contributi) (Nuova pagina; testo: '((Album |Titolo = Dignity |Nome Artista = Hilary Duff |Tipo album = |Data = aprile 2007 |Etichetta = Hollywood records |Produttore = |Durata = - [[minuto|min...')

dove è evidenziato tra parentesi il template (il primo trovato in caso di più template) presente all'interno della pagina.

Ora, che cosa mi serve? Nell'ordine di gradimento, qualcuno che dica:

  1. nessun problema, ho già pronto tutto io / si può già fare e non te ne sei accorto. :-)))
  2. ok ho capito cosa vuoi, ora lo faccio
  3. ok ho capito cosa vuoi, te lo spiego poi lo fai tu
  4. sembra fattibile ma è una gran complicazione, parliamone
  5. non si può fare, bisogna continuare a farlo come ora, ma ti dò una mano io
  6. non si può fare, bisogna continuare a farlo come ora, continua pure da solo
  7. non si può fare, bisogna continuare a farlo come ora, continua pure da solo e per punizione di averci disturbato già che sei li patrolla, wikifica e metti in ordine tutte le voci :-(

Tenendo conto che ora siamo al punto 6 (e non vorrei scendere oltre), che mi dite?

N.B. Ricordo a tutti che è sempre possibile (anzi auspicabile, per non lasciare ad una persona sola l'onere, a suo insindacabile giudizio, della selezione delle voci), inserire le novità meritevoli di segnalazione nell'apposita pagina.

--Pier Siate brevi... 12:53, 1 feb 2007 (CET)[rispondi]

Magari c'é un punto 5-bis "Non ho la più pallida idea se si può fare, me lo auguro, ma una mano (piccola e forse) te la posso dare". Dimmi di più, magari nella mia pagina. O forse si può andare a ravanare nei Progetti dove, in genere, si viene invitati a segnalare le novità (e io lo dimentico sempre). Se un "autore" segnala la voce la si trova in 10 20 minuti. O forse mi sbaglio... Mah! Vale!--Horatius -- E-pistulae 21:51, 1 feb 2007 (CET)[rispondi]
Si tratta di un 4 e mezzo: è teoricamente possibile, ma bisognerebbe scrivere una nuova estensione e poi farla installare sui server mediawiki da Brion e compagni, cioè quasi impossibile :-) Vedo più probabile un bot che si scarichi le ultime pagine create e ci lavori sopra offline. Alfio (msg) 12:53, 3 feb 2007 (CET)[rispondi]
(Conflittato) anche io salirei al massimo fino al punto 4,5... Mi spiego: derivare una nuova pagina speciale dal codice già disponibile non è molto complesso, per chi si trovi a suo agio con PHP. Quello che è un pochino più complesso (ma non impossibile) è dimostrare agli sviluppatori che la nuova pagina, così come è scritta:
  1. è non dannosa, ovvero il nuovo codice non introduce vulnerabilità o regressioni in MediaWiki;
  2. è efficiente nel senso che è ben scritta e in grado di scalare fino all'uso ripetuto su en.wiki con tempi di elaborazione tali da non rischiare effetti di Denial of Service;
  3. è non inutile, ovvero ha senso su più progetti Wikimedia, ha uno "use case" chiaro e non velleitario.
Senza questi requisiti, è difficile che la patch finisca online sui nostri server, anche se magari l'estensione viene accettata nel repository di MediaWiki. Se invece i requisiti ci sono, perché la pagina non è più "pesante" della stessa Newpages, ci sono buone probabilità che arrivi in fondo.
Un'altra strada possibile è quella di sfruttare qualche strumento già esistente come ad es. CatScan di Duesentrieb. In quel caso, se il flag !!only_new!! fosse indipendente dalle altre opzioni ciò consentirebbe di filtrare a monte le condizioni poste (presenza/assenza di template, ecc.). Anche se non si tratta dello scopo principale dei quel tool, ho parlato con l'autore e non esclude - ma senza impegno - di modificarlo lui stesso in questo senso. Puoi avviare il discorso su m:Talk:Toolserver o direttamente in m:User_Talk:Duesentrieb/Tools.
Infine, come punto di sintesi, si può pensare di sviluppare un tool specifico per questa esigenza, anche derivato da quelli esistenti, e farlo girare sul Toolserver. Ottenere un account lì è abbastanza semplice, ed è un buon modo per sperimentare senza dover affrontare subito i requisiti di robustezza, ecc. imposti dal sito principale. --Lp 13:25, 3 feb 2007 (CET)[rispondi]
Ringrazio Alfio e Lp per le risposte. Accidenti, ho fatto i conti senza l'oste l'admin! Pensavo che avessimo un maggior grado di libertà come it.wiki (magari anche solo per provarla), invece siamo sugli stessi server americani. Peccato, perché la soluzione newpages sembrava la migliore (e forse tecnicamente lo è). Difficile dimostrargli quello dice Lp, senza averla mai provata! Provo un po' a vedere con i tools. Mi sembra che CatScan, se non fosse legato alla categoria, già una mano la potrebbe dare.
P.S. c'è anche l'ostacolo che PHP non lo conosco affatto (anche se qualcosa posso capirci)!
--Pier Siate brevi... 13:07, 5 feb 2007 (CET)[rispondi]

Per trovare voci per compilare le liste settimanali sulle novità introdotte nell'enciclopedia, la via più semplice mi sembra scrivere un programmino che legga l'elenco delle pagine nuove, escluda quelle troppo corte, controlli come si vuole il contenuto. Se conosci il Python, puoi scriverlo in poco tempo usando il Pywikipediabot. Sarebbe meglio però poter disporre di segnalazioni umane, magari da i vari progetti... --F. Cosoleto 16:32, 13 feb 2007 (CET)[rispondi]

Andiamo con ordine, iniziamo dal fondo :-). Come avrai visto la pagina per le segnalazioni umane c'è, solo che è poco frequentata, da qui la necessità di un filtro, che dalle 3000 voci settimanali le riduca a 1000, 500, 100 da esaminare una per una. Si, dovrei scrivere un messaggio per avvisare i progetti, appena ho tempo lo faccio (sempre rinviare, ma perché non lo fai subito?). Non conosco il Python ne il Pywikipediabot, vedrò (prima o poi) cosa riesco a capirci, per ora li metto in coda alle cose da fare (ma magari riescono a saltare la coda)... Comunque grazie dei suggerimenti.
--Pier Siate brevi... 10:05, 14 feb 2007 (CET)[rispondi]
Per quel che puo' essere utile, lo metto anche tra le mie cosa da fare. Puo' darsi che riesca a trovare qualcosa anche senza l'uso di un bot (magari con un paio di script). Se vengo folgorato sulla via di Damasco ti faccio un fischio. --Jalo 15:58, 14 mar 2007 (CET)[rispondi]
Grazie Jalo, veramente qualcosina l'ho già fatta, è da perfezionare. Ho uno script in Python , derivato dal Pywikipediabot che legge le pagine dalle NewPages, le filtra in base ai template contenuti e salva il risultato in un file in locale (sul mio PC). E' ancora un po' rozzo, quando ho tempo provo a raffinarlo e magari a trasformalo in bot che scriva una pagina di report. Ogni suggerimento è bene accetto. --Pier Siate brevi... 16:52, 14 mar 2007 (CET)[rispondi]