Discussioni Wikipedia:Festival della qualità/Aprile 2019

Ultimo commento: 5 anni fa, lasciato da Laurentius in merito all'argomento Botolare errori 11, 25, 65, 81

Nota: al termine del festival sarebbe opportuno che le discussioni di questa pagina vengano cambusate o segnalate in Discussioni Wikipedia:Elenchi generati offline/Check Wikipedia.

Chiarimenti su ISBN e ISSN modifica

Le categorie 69, 70, 71, 72 e 73 riguardano problemi nei codici ISBN, mentre le categorie 106, 107 e 108 riguardano errori nei codici ISSN.

Dato che gli errori generati sono più di 1300 e non sono molto afferrato in materia volevo chiedere qui consigli a riguardo.

Riferimenti Aiuto:ISBN --Torque (scrivimi!) 12:59, 2 apr 2019 (CEST)Rispondi

Ciao, la casistica è piuttosto varia, se, come dici, non sei proprio af-ferrato, magari chiedi qualcosa di più specifico, visto che sono errori che non è detto che si riesca a correggere facilmente (almeno non sempre). --Er Cicero 10:20, 4 apr 2019 (CEST)Rispondi
Grazie [@ Er Cicero] sia per la risposta che per la correzione ortografica. In pratica volevo prima di tutto capire se ci sono degli strumenti o modi per "velocizzare" il controllo di una parte di questi errori oppure se devo cercarli ex novo uno ad uno. Un utente mi ha suggerito di usare worldcat.org e opac.sbn.it per la verifica/ricerca dei codici. Quelli con sintassi errata credo siano i più facili, mentre mi preoccupano quelli con cifra di controllo errata. --Torque (scrivimi!) 11:11, 4 apr 2019 (CEST)Rispondi
Mi limito per ora agli ISBN, alcuni suggerimenti:
  1. Capita che lo stesso errore sia presente in più voci, per velocizzare ordina la lista per codice ISBN (la terza colonna titolata "Notice"); corretto l'errore in una voce l'hai risolto in tutte le altre;
  2. Più spesso di quello che si potrebbe credere, il codice ISBN-10 viene confuso con l'ISBN-13 (e viceversa). Per l'ID errore 72 o 73 prima di cercare il corretto check-digit un tentativo "veloce" è quello di aggiungere (o togliere) il valore 978 in testa al codice e verificare che il nuovo codice sia quello corretto. Ti faccio un esempio: la voce Domenico Macaggi presente nell'ID 72 contiene il codice errato ISBN 88-87588-35-4, facilmente verificabile cliccandoci sopra e accedendo alla pagina delle "Fonti librarie" ove, in colore rosso, appare in rosso la scritta: "L'ISBN inserito sembra non essere valido....". Su questa stessa pagina anteponi il 978 al codice ISBN e rilancia il "Cerca": noterai che la scritta rossa scompare in quanto il nuovo codice è corretto. Per scrupolo, l'ultima verifica sarà cliccare su "Catalogo SBN italiano" e verificare che il testo dell'OPAC corrisponda proprio a quello cercato;
  3. Un altro caso di errore è lo scambio di codici ISBN con ISSN. Qui serve un po' d'occhio. Voce Paroxetina presente nell'elenco dell'ID 70. Il codice 14651858 è un codice ISSN (invece che ISBN come riportato in voce), si deve correggere in modo da ottenere ISSN 1465-1858 (WC · ACNP), quindi questo è un caso abbastanza semplice;
  4. capita anche di trovare l'indicazione ISBN 977.... Qui la correzione è duplice. Bisogna trasformare il codice 977 nel codice ISSN a 8 caratteri e ovviamente indicare che è un ISSN. Es.: voce Football Club Internazionale Milano 1993-1994, dell'ID 73, nella nota 30 viene riportato ISBN 9771129338008. Tolto 977, prendere le 7 cifre seguenti, cioè 1129338 e calcolare il check-digit (per farlo, uso un sito del quale non ho sottomano il link, te lo aggiungo stasera). Trovato che il Check Digit è "1", si sostituisce ISBN 9771129338008 con ISSN 1129-3381 (WC · ACNP) e l'errore è risolto.
Poi se ho tempo vedo di integrare con qualche altra indicazione, ciao. --Er Cicero 14:42, 4 apr 2019 (CEST)Rispondi
P.S.: conosco abbastanza sia Worldcat che l'OPAC, ma non mi è chiaro come ti è stato suggerito di usarli per trovare i codici corretti.
Dimenticavo: attenzione ai codici con cifra di controllo errata. In realtà il software dà per scontato che i primi 9 caratteri siano corretti e che quello errato sia l'ultimo (e ovviamente non è detto che sia così), per cui se si ricalcola il check-digit si rischia di avere un codice formalmente corretto ma che non è quello giusto. Anche in questo caso uso un sito per il ricalcolo del check-digit, ma pure questo lo aggiungo stasera. :-)
Buona norma è sempre verificare su qualche sito librario che il codice che abbiamo ricostruito sia quello corretto. In caso di dubbi chiedi pure. --Er Cicero 14:50, 4 apr 2019 (CEST)Rispondi
Grazie intanto per queste dritte! Mi fa capire che la situazione è più articolata di quello che potrebbe sembrare! Pe ora mi sono limitato a correggere gli errori 69 (li ho sistemati quasi tutti) dove l'errore era solo nella sintassi. Correggendo la sintassi in pochi casi si è anche corretto l'errore relativo alla lunghezza. Per gli altri la ricerca manuale e singola mi obbliga a metterli ad una priorità più bassa rispetto ad altri errori che so affrontare più chiaramente. Per i due siti che ho nominato sopra la procedura non era chiara neppure a me, mi erano solo stati indicati come database. --Torque (scrivimi!) 15:08, 4 apr 2019 (CEST)Rispondi
Allora, a questo indirizzo si può fare il calcolo automatico del check-digit di un codice ISSN (notare che nell'ultima riga viene anche prospettato il relativo codice 977), mentre a quest'altro indirizzo trovi un convertitore ISBN-10 ---> ISBN-13 e viceversa. Inoltre se scrivi un codice col check-digit sbagliato ti informa dell'errore indicandoti la cifra corretta. Sicuramente utile. --Er Cicero 21:01, 4 apr 2019 (CEST)Rispondi

Filtro per interwiki modifica

Visto che uno dei check riguarda la rimozione degli interwiki (ID: 68), non sarebbe il caso di impedirne la creazione di nuovi con un filtro? Ne discutiamo alla Sala operativa.--Equoreo (msg) 15:11, 2 apr 2019 (CEST)Rispondi

Categoria con uno spazio modifica

Ciao, una domanda questa lista non può essere risolta tramite bot, pingo [@ Pil56] esperto botolatore per sapere la sua opinione --NewDataB (msg) 16:51, 2 apr 2019 (CEST)Rispondi

Sono errori comuni che vengono già corretti automaticamente da AWB quando qualcuno lo usa sulla voce; ho fatto girare il bot su alcune di quelle voci e qualcosa ho corretto, però la lista non appare aggiornata (parrebbe dal 23 marzo). Personalmente suggerirei che gli utenti "normali" (senza bot) non stiano nemmeno a perdere troppo tempo su questa categoria, non vale la pena di disperdere energie :-) --Pil56 (msg) 17:00, 2 apr 2019 (CEST)Rispondi
A proposito di interventi tramite bot: in questo momento sto svuotando questa categoria, visto che compiere tale impresa manualmente sarebbe da folli. Per il momento ho individuato solo il carattere di controllo Unicode più presente lì dentro (ossia U+200E), ma un po' alla volta passerò in rassegna anche tutti i restanti. -- Mess what a happiness! 00:44, 3 apr 2019 (CEST)Rispondi
[@ Mess] mi pare che spesso quel carattere sia presente nel nome delle immagini, dove non va sostituito pena la "sparizione" delle immagini stesse dalle voci :-) Ciaoo --Pil56 (msg) 10:17, 3 apr 2019 (CEST)Rispondi
[@ Pil56] Io invece l'ho riscontato quasi sempre nelle trascrizioni in alfabeti non latini (in particolare l'arabo) e rimuovendolo non ho riscontrato effetti collaterali; comunque, foss'anche come dici tu, basta segnalarmi l'anomalia e si risolve (al limite farò io stesso un rapido controllo per essere sicuro che le modifiche del mio bot siano state corrette). -- Mess what a happiness! 14:01, 3 apr 2019 (CEST)Rispondi
[@ Mess], non era una critica ma solo una constatazione, se guardi i miei primi contributi di oggi vedrai 3 rb al tuo bot per quel motivo (non credo ce ne siano altri) :-) --Pil56 (msg) 14:25, 3 apr 2019 (CEST)Rispondi

Filtro anti abuso bot modifica

Posso proporre di disattivare una regola del filtro anti abusi? Con WP cleaner, modificando gli errori facili e usando qualche shortcut si fanno molto facilmente modifiche sotto i 20 secondi. Già tempo fa il filtro mi ha impedito le modifiche (e giustamente, ero arrivato a 16 modifiche al minuto mi pare), ma proporrei di togliere la regola "anti abuso bot" per la durata di questo festival. Io da parte mia prometto mi impegno a non fare velocemente come una volta. --Vespiacic (msg) 07:51, 3 apr 2019 (CEST)Rispondi

Capita anche a me di tanto in tanto di fare modifiche veloci, ma ho sempre cercato di non correre troppo. Credo di non essere mai arrivato sotto le 4-5 modifiche al minuto. A parer mio, se si potesse senza che comporti problemi burocratici o di permessi non la vedo una cosa negativa! Naturalmente il blocco del filtro serve per evitare di intasare l'elenco delle ultime modifiche, quindi non è li per niente... dovrebbero darti lo status di bot o qualcosa di analogo. --Torque (scrivimi!) 09:04, 3 apr 2019 (CEST)Rispondi
Faccio richiesta agli admin nella pagina apposita. --Vespiacic (msg) 12:25, 3 apr 2019 (CEST)Rispondi
La richiesta è stata respinta, continuiamo così. --Vespiacic (msg) 15:01, 4 apr 2019 (CEST)Rispondi

Poco attivo modifica

Scusate se sono poco attivo nel festival, sono incappato in un altro utente che in buona fede, esegue violazioni di copyright da anni e per questo motivo dobbiamo controllare tutti i suoi contributi e come al solito siamo i soliti tre a farlo. Tornerò attivo nel festival appena avremo finito --NewDataB (msg) 12:18, 5 apr 2019 (CEST)Rispondi

Segnalazione automatica di articoli corretti tramite bot? modifica

Ma esiste un modo per segnalare automaticare come risolti gli articoli che sono stati corretti tramite AWB e/o altri tool usati dai bot? In questo momento sto svuotando questa categoria, in cui la stragrande maggioranza degli articoli sono delle voci di mineralogia con sezioni vuote identiche tra loro, a cui sto aggiungendo il template {{Sezione vuota}}. Visto che sarebbe improponibile segnarle tutte a mano una per una (e ovviamente non sarebbe corretto segnare tutte le voci come risolte), mi chiedevo se qualcuno di voi ne sapesse qualcosa di più in merito. Grazie. -- Mess what a happiness! 13:55, 6 apr 2019 (CEST)Rispondi

Se completi l'intera lista, puoi schiacciare Set all articles as done!, altri modi non credo ci siano --NewDataB (msg) 14:11, 6 apr 2019 (CEST)Rispondi
[@ NewDataB] Il problema è proprio quello: essendoci tutte le altre (circa 900) che non rientrano in quella casistica, non mi sembra giusto segnarle come risolte quando in realtà non lo sono affatto. Cercherò senz'altro un modo per correggere anche quelle, però mi sembra strano che non esista un modo automatico per depennare le voci già risolte (con o senza WPCleaner). -- Mess what a happiness! 14:57, 6 apr 2019 (CEST)Rispondi
OK, per risolvere la questione ho salvato qui le voci che ancora hanno una sezione vuota da segnalare con {{Sezione vuota}} (o da rimuovere, se non serve), così che si possano sistemare in un secondo momento. A questo punto posso cliccare senza remore su Set all articles as done! in quella categoria. -- Mess what a happiness! 21:04, 6 apr 2019 (CEST)Rispondi
Comunque quando ripasserà il bot che gestisce gli elenchi di Check wikipedia reinserirà nell'elenco tutte le voci che presentano almeno una sezione vuota. --Er Cicero 09:43, 7 apr 2019 (CEST)Rispondi

C'è lo stesso problema con l'errore ID 64 (wikilink uguali alla propria descrizione), sono circa 1000 errori riportati ma dopo 30 che ne ho aperti non ne ho trovato nemmeno 1. Ogni quanto l'elenco viene aggiornato? --Vespiacic (msg) 15:36, 8 apr 2019 (CEST)Rispondi

circa ogni tre settimane--NewDataB (msg) 16:07, 8 apr 2019 (CEST)Rispondi

Errori nelle voci di calciatori modifica

Ho notato che nelle voci di calciatori si trovano molti errori come questo, ovvero le doppie parentesi quadre chiuse prima delle doppie parentesi graffe del template cita web. Mi viene da pensare che questo errore sia così ripetuto a causa di un copia incolla da qualche parte dove si trova o si trovava questo errore. Ho controllato Wikipedia:Modello di voce/Biografia calcistica e lì il cita web è scritto correttamente. Se gli errori persistono in futuro, forse è il caso di indagare più a fondo. --Daniele Pugliesi (msg) 14:34, 10 apr 2019 (CEST)Rispondi

Aiuto per voci particolari modifica

Ciao, inserisco qui un primo caso di una voce che non saprei come affrontare. Magari se qualcun'altro si imbatte in altri casi analoghi può aggiungere qui sotto.

  • Lingua cinese media - Analizzandola con WPC riporta vari errori di elementi HTML per liste e tabelle (012 e 031) e doppie quadre non aperte (046). Data la strana posizione di quest'ultimo in particolare chiedo aiuto.


--Torque (scrivimi!) 14:44, 10 apr 2019 (CEST)Rispondi

Botolare errori 11, 25, 65, 81 modifica

Ciao, ho già chiesto se l'errore 85 (Tag vuoti) può essere botolato per velocizzare almeno i casi più semplici e ripetitivi. Oltre a questo vorrei il vostro parere anche per altre categorie che almeno io reputo piuttosto ripetitive e semplici (correggete pure se mi sbaglio):

  • 11 - Entità con codice nominale. Circa 700 voci.
    La prima ha veramente poco da fare, si tratta principalmente di un cerca e sostituisci.
  • 25 - Sezioni con gerarchia errata. Circa 7000 voci.
    Le sezioni forse è l'elemento più articolato da gestire, perché spesso le sezioni sono da spostare a blocchi. Però vale la pena perché son veramente tante... nel frattempo le sto macinando a mano pian piano.
  • 65 - Wikilink uguali alla propria descrizione. Circa 900 voci.
    Dei wikilink ci sono già bot ciclici che se ne occupano. Quindi non dovrebbe essere un problema.
  • 81 - Nota ripetuta. Circa 7700 voci.
    Anche qui forse il codice diventa più articolato, ma come sopra potrebbe valerne la pena. Il nome del ref ad ogni modo non deve essere articolato in quanto serve solo da richiamo, io certe volte ho semplicemente richiamato le note in ordine alfabetico (vedi QUI).

Ho pensato prima di tutto a queste. C'è qualche altro gruppo, ma si tratta di poche voci affrontabili a mano, oppure che nascondono ogni tanto qualche insidia (come i vari <u>, <small>, etc.). --Torque (scrivimi!) 17:02, 16 apr 2019 (CEST)Rispondi

[@ Torque] Ultimamente stavo cercando di risolvere proprio questi errori ripetitivi col mio bot (soprattutto per quelli che superano il migliaio di voci), e almeno un paio di categorie le ho risolte brillantemente. Ieri sera avevo iniziato ad analizzare e sistemare sia le liste indentate sia i tag vuoti, ma in entrambi i casi ho proceduto a rilento perché beccavo molto spesso dei casi particolari che andavano sistemati con soluzioni ad hoc. Inoltre avevo provato a formulare un regex per le note ripetute, ma mi sono bloccato perché non trovo un modo per far sì che la prima nota venga mantenuta così com'è (ma con l'aggiunta del ref name), mentre tutte le ripetizioni successive vengano rimpiazzate dal solo ref name. Se vi può essere d'aiuto, potrei pubblicare questo regex abbozzato, così magari arriviamo insieme alla soluzione finale. -- Mess what a happiness! 19:38, 16 apr 2019 (CEST)Rispondi
Magari per un aiuto sul codice apriamo una discussione in zona bot, così abbiamo l'attenzione diretta degli interessati. WPC li identifica e a parte qualche click automatizza quasi (si potrebbe provare a sbirciare il suo codice, se è possibile e se è compatibile). --Torque (scrivimi!) 09:09, 17 apr 2019 (CEST)Rispondi
La 25 come è possibile agire via bot senza controllo umano? Nel senso... forse non colgo perfettamente ciò che si vuole fare, ci sarebbe un esempio da visionare? --.avgas 19:32, 18 apr 2019 (CEST)Rispondi

[ Rientro]Questo e questo possono essere due esempi di modifica. Tramite WPC non viene fatta propriamente in semiautomatica ma ci siamo vicini.

Posso qui di seguito dire qualche ovvietà, ma è giusto a scanso di equivoci. Le sezioni standard seguono di norma:

== Sezione 1 ==
=== Sottosezione 1 ===
==== Sotto-sottosezione 1 ====
== Sezione 2 ==
== etc. ==

Capita spesso però di trovare casi come questo:

=== Sezione 1 ===
=== Sezione 2 ===
=== Sezione 3 ===
== Sezione 4 ==
== etc. ==

Oppure questo:

== Sezione 1 ==
==== Sotto-sottosezione 1 ====
==== Sotto-sottosezione 2 ====
=== Sotto-sottosezione 3 === (questa è giusta)
== Sezione 2 ==
== etc. ==

Che sono reciprocamente i casi che ho linkato all'inizio. [@ .avgas] dici siano casi troppo complessi per un bot o qualcosa possiamo recuperare? --Torque (scrivimi!) 09:01, 19 apr 2019 (CEST)Rispondi

[@ Torque] Scusa il ritardo, ma solo ora ho riveduto il regex che avevo creato nei giorni scorsi per sistemare le note ripetute (per il momento solo quelle che contengono un indirizzo URL). Qui ho pubblicato il codice del regex applicato ad un esempio che ho preso a caso tra le pagine ancora pendenti. Come si può notare, il regex va bene se e solo se la nota è stata ripetuta una sola volta (ovvero è presente 2 volte); già con 2 ripetizioni non riesco a catturare le ripetizioni successive alla prima, se non a coppie (ma solo se la stessa nota è presente con un numero di volte pari, mentre se sono dispari l'i-1esima occorrenza non viene catturata). Come già detto più sopra, io vorrei che anche le ripetizioni di numero pari (la 2ª, la 4ª, la 6ª, l'8ª, ecc.) vengano sostituite da <ref name="''nomenota''/> anzichè con la nota originaria (come avviene invece col mio regex attuale). -- Mess what a happiness! 13:17, 20 apr 2019 (CEST)Rispondi
Per quanto riguarda il 25 (le sezioni), posso far girare un bot. La logica mi sembra chiara, ma giusto per essere espliciti, il comportamento deve essere trasformare:
===A===
=====B=====
=====C=====
===D===
==E==
in:
==A==
===B===
===C===
==D==
==E==
Mi sembra una modifica non ambigua, e corrisponde al modo in cui viene visualizzato il sommario delle voci in questi casi. Non mi vengono in mente casi in cui saltare dei livelli sia legittimo (può darsi che qualcuno lo faccia per considerazioni estetiche, ma è sbagliato). - Laurentius(rispondimi) 18:36, 20 apr 2019 (CEST)Rispondi
Il risultato può essere non ideale in casi come Ango Sakaguchi, dove c'è una sezione di secondo livello, seguita da due di quarto livello, una di terzo livello e alcune altre di quarto (2 4 4 3 4). Secondo il ragionamento di sopra si otterrebbe un 2 3 3 3 4; in realtà guardando i contenuti la cosa migliore probabilmente sarebbe cancellare proprio la 3, ma questa è una considerazione di contenuti e non di forma. - Laurentius(rispondimi) 18:55, 20 apr 2019 (CEST)Rispondi
Ah, farei girare lo stesso script anche per l'errore 83 (Prima sezione di livello 3, poi di livello 2). - Laurentius(rispondimi) 20:33, 20 apr 2019 (CEST)Rispondi

Io avevo fermo da tempo in cantiere uno script per sistemare note ripetute o con errori di sintassi. L'ho appena finito di testare e posso provare a farlo partire. Così vediamo quali casi restano fuori. -- Basilicofresco (msg) 21:08, 20 apr 2019 (CEST)Rispondi

[@ Torque] Sto avviando il bot. - Laurentius(rispondimi) 11:22, 22 apr 2019 (CEST)Rispondi
[@ Basilicofresco] Occhio che in questa modifica il bot si è perso un paio di <ref name=Klin/> per strada, lasciando il testo senza nota. Lì ho corretto ma non so se la stessa cosa possa essere successa anche altrove. --goth nespresso 06:01, 21 apr 2019 (CEST)Rispondi
Nel caso sopra (2 4 4 3 4) il risultato ideale per rispettare l'indentatura dovrebbe essere 2 3 3 2 3 (non ho aperto la voce, dico a livello teorico). Si tratta già di casi minori... nella maggiore si tratta di un singolo paragrafo fuori dal coro. Lo stesso principio si può eseguire tranquillamente anche nell'errore 83. Lo stavo processando io perché non sono moltissime, ma data la semplicità "il bot lo può fare mentre sbadiglia". Se per caso il bot dovesse lasciare qualche errore indietro, rimarrebbe segnato e potremmo sempre passare noi.
Per il discorso di richiamare le note non so dare ulteriori consigli, non essendo un gran conoscitore di codici (se non i più basilari), stavo tuttavia pensando di andare a fare un giro in en:wiki a vedere se magari dispongono di qualcosa di simile che può aiutarci. --Torque (scrivimi!) 12:03, 22 apr 2019 (CEST)Rispondi
Sì, di solito si tratta di un solo paragrafo sbagliato: con qualche caso che va un po' oltre, come questo che saltava ben tre livelli (intestazioni di livello 6 figlie di intestazioni di livello 2... e anche tante). La trasformazione che sto seguendo comunque è quella che mantiene la stessa struttura del sommario come elaborata da MediaWiki. - Laurentius(rispondimi) 14:34, 22 apr 2019 (CEST)Rispondi
Ho visto ora il passaggio del Bot. Suggerisco ordunque di sostituire qui: Aiuto:Sezioni dove si dice È consigliabile usare i livelli con È obbligatorio usare.., visto che l'oggetto del Bot dice : correzione delle sezioni con gerarchia errata. No ? Nessuno ha pensato che il passaggio da 2 a 4 (3..5, 4..6) saltando una sezione intermedia può essere voluto in caso di ampliamento futuro ?--78.14.246.237 (msg) 16:24, 22 apr 2019 (CEST)Rispondi
Se non ti sembra chiaro riformulalo! Non userei il termine "obbligatorio" comunque, ma direi semplicemente che si fa così.
Ho fatto passare il bot su tutte le pagine degli elenchi 25 e 83 (circa 8.000 voci). È un lavoro che potrebbe essere fatto periodicamente: nel caso pingatemi e faccio ripassare il bot! - Laurentius(rispondimi) 17:22, 22 apr 2019 (CEST)Rispondi
Avevo scritto male, l'errore 16 che avevo citato inizialmente è in realtà l'errore 11. Questo. --Torque (scrivimi!) 09:41, 23 apr 2019 (CEST)Rispondi

[@ Laurentius] con l'aggiornamento della lista sono saltate fuori altre voci (circa 5000). Probabilmente molte sono falsi positivi dato che l'operazione è stata effettuata l'altro giorno. Chiedo se è possibile dare un'altro giro agli errori 25 e 83. Grazie --Torque (scrivimi!) 10:55, 24 apr 2019 (CEST)Rispondi

Fatto. Le modifiche effettive sono state circa 200, quindi in larga maggioranza erano effettivamente falsi positivi. - Laurentius(rispondimi) 20:06, 24 apr 2019 (CEST)Rispondi
Ritorna alla pagina di progetto "Festival della qualità/Aprile 2019".