Utente:Pracchia-78/AWB/Registro


ALMENO il 10% delle voci di Wikipedia è affetta da errori ortografici e refusi. Significa circa centomila voci da correggere e con una certa costanza...

A partire da circa il 22 o 23 agosto 2012 i server sembrano non disconnettere più AWB a seguito di una pausa operativa di durata di alcuni secondi. Nel corpo del testo, redatto prima della data indicata, accenno a quell'inconveniente e alle sue ripercussioni quando si eseguono modifiche manuali nell'edit box del software. Ho altresì rilevato che le modifiche aggiuntive a mano (nell'esempio: l'aggiunta di maiuscola a inizio del periodo) non intaccano il campo oggetto, diversamente da quanto esposto nel testo. Questo avviso è inteso come temporaneo ed è inserito in attesa di una conferma e dell'esito complessivo di una serie di prove.



Lavori in corso!

Dal 2008 mi occupo di correzioni di errori sulle voci di Wikipedia tramite il browser del sistema operativo del mio PC; dalla metà del 2010 suddivido i miei contributi con un editor semiautomatico, AWB nella versione 5.2.0.0 (e successive), che mi permette di eseguire operazioni altrimenti impossibili con il solo browser e con concreti risultati [1] anche sotto il mero aspetto quantitativo fissato per regolamento a 60 modifiche orarie [2].

In questa pagina si trova un test del 3 aprile 2012 (seguito da altri) condotto con AWB nella versione 5.3.1.0 [3]: lo scopo è un tentativo di quantificare la probabile percentuale di errori ortografici, di refusi e di formattazione presenti nelle pagine principali, cioè nelle voci dell'enciclopedia utilizzando specifiche condizioni di ricerca degli stessi. Ho inserito anche una serie di descrizioni di situazioni nelle quali mi sono imbattuto: esse sono dei semplici ma utili(zzabili) promemoria tratti dalla quotidianità, possibili fonti di spunto per altre idee e migliorie inerenti al settore di cui mi occupo in modo prevalente.

Se altri Utenti hanno esperienze simili sono grato se me le comunicheranno in quest'altra pagina.

Generazione della lista modifica

Tramite AWB ho selezionato l'opzione che permette di cercare con criterio casuale dieci voci nell'enciclopedia. Cliccando ripetutamente su make list ho ottenuto una lista[4] di 2 000 voci accessibile tramite questo collegamento. La lista è stata subito salvata sul mio pc con la formattazione tipica di Wikipedia, in un file nominato Random.txt.
Dal campo Souce dal menu a discesa ho scelto Text file: (UTF-8) e per sincerarmi che non vi fossero errori ho caricato di nuovo in memoria il contenuto del Random.txt previa cancellazione della lista poco prima generata da AWB.

Elaborazione della lista modifica

Per l'elaborazione ho seguito la consueta procedura standard caricando prima di tutto i Typos presenti sul server di Wikimedia tramite caricamento del file settings.xml (contenente le regex e la lista dei Find and replace) per infine interrogare il server con le mie credenziali (nome utente e password) sul progetto it.wikipedia). Una volta accettato, AWB ha iniziato a caricare in memoria il contenuto del primo elemento della lista.

Particolarità emerse durante il lavoro modifica

La lista di lavoro mi offriva pagine in NS-0 nelle quali non era possibile né stabilire né intuire a priori quali tipi di errori ortografici, refusi o di formattazione avrei trovato per il semplice motivo che la lista era stata generata con criterio casuale da AWB tramite una serie di interrogazioni al database di it.wikipedia.[5]. Tuttavia visto l'elevato numero di voci contenute nella lista e la generosa dimensione del mio settings.xml, vi era fin da principio l'assoluta garanzia di trovare un generico lavoro per AWB e per di più quantitativamente interessante.[6].

La fase di sostituzione delle parole errate, di correzione di template e delle entity si è svolta nel rispetto dell'attuale policy d'uso prevista per le utenze prive di flag e, per quanto attiene l'aspetto tecnico, senza che il software si "congelasse" nel caricare in memoria o salvare una specifica voce[7]. Le sostituzioni sono andate tutte a buon fine e l'occasione mi ha offerto la possibilità di affinare il file settings.xml perché si erano manifestate un paio di eccezioni (difficilissime da prevedere senza una reale manovra "sul campo", cioè in NS-0, di AWB). L'incidenza dei falsi positivi è stata lievemente minore di quella che mi sarei atteso e ciò ha influito positivamente sul regolare svolgimento del lavoro. Preciso che non sono mai uscito da AWB per eseguire correzioni "extra" a mano al di fuori del counter di AWB per cui il numero di effettivi interventi è realmente quello verso il fondo della lista archiviata.

Gli errori modifica

«Prima di scrivere, pensa; prima di pensare, leggi»

Dove si trovano modifica

Una certo quantitativo di errori è presente nelle pagine di Wikipedia in funzione di alcuni fattori:

  1. è in numero alto dove il numero di parole contenute è elevato e contemporaneamente è basso il numero di modifiche che le pagine hanno subito nel corso del tempo a partire dalla loro creazione
  2. è in numero alto dove è basso il numero delle utenze singole che vi hanno lavorato e con lunghi intervalli di tempo fra le singole modifiche
  3. è in numero alto dove scarseggia il controllo (patrolling) contro i vandalismi o le modifiche errate
  4. è in numero più alto dove è minore l'aggiornamento delle pagine e in quelle trascurate per qualsivoglia motivazione[8].

Può formarsi una interdipendenza fra il primo punto e quelli successivi perché una pagina con molte parole e pochi aggiornamenti eseguiti da pochi singoli utenti e a lunghi intervalli di tempo presenta maggiori probabilità di vari errori (e non solo di tipo ortografico) di un'altra attentamente seguita, costantemente aggiornata, modificata e tenuta sotto un buon controllo da vari utenti.

Ne consegue che, in prima approssimazione, sono le pagine delle voci (nonché le relative pagine di discussione) quelle in cui avrò maggior occasione di riscontrare un interessante numero di errori: senza contare che attualmente (aprile 2012) l'enciclopedia conta circa 910 000 voci.

Ricordo che una parte consistente di errori deve obbligatoriamente essere registrata anche nel file settings.xml di AWB perché possano essere "scoperti"[9].

Lo status di errore modifica

Perché taluni presunti errori acquisiscano lo status di "autentici errori" occorre una discussione seguita da un consenso della comunità wikipediana. Fin qui nihil sub sole novum. Il problema è che i dizionari e le grammatiche e la stessa Accademia della Crusca ai quali volgiamo l'attenzione, non sono entità normative il cui dettato abbia valore legale e nemmeno, più semplicemente, fonti normative sempre pacificamente accettate dagli studiosi. Sto pensando a una analogia con le norme tecnico scientifiche fissate dal SI e che sono quotidianamente disattese talora anche in contesti educativi (libri di testo e dispense) o informativi (quotidiani, stampa periodica "generalista" o specializzata) o economici (fatture commerciali di enti erogatori di servizi) nonostante i vari Stati contraenti ne abbiano sancito in modo inequivocabile il suo uso (anche al di fuori dall'ambito tecnico-scientifico) e il suo abuso con tanto di sanzioni.
Quindi, sotto questo aspetto, la soluzione che da i suddetti testimoni "cartacei o elettronici" potrebbe provenirci si limita ad essere, più modestamente, un suggerimento da analizzare e discutere fra noi utenti. È un fatto certo che i grammatici e i compilatori di dizionari sovente non spiegano quale variante grafica sia da preferirsi e la Crusca si limita ad analizzare, giustificare e spiegare quale sia la ragion d'essere di una variante nel corso del tempo ma senza prendere una netta posizione al riguardo[10]. Le regole grammaticali non sono ferree: dovrebbe essere un fatto di indubitabilità storica, che, per citarne uno fra i tanti, non vi sia un accordo unanime fra gli studiosi a riguardo della D eufonica[11] e con variegati pareri anche su Wikipedia[12]. Così il filosofo, scrittore e traduttore Ugo Dèttore in tutti i suoi scritti usava a esempio al posto del più comune ad esempio o del più classico "per esempio". È verosimile che il suo gusto personale o un suo particolare modo d'intendere l'eufonia (ipotizzo che volesse scansare un accostamento fonico ad e... a Ade perché per alcuni di noi si palesa di potenziale malaugurio), prevalessero su regole cristallizzate.
Se a ciò aggiungiamo che non è chiaro se una determinata parola (o una sua variante grafica) che è entrata in uno più dizionari di lingua sia di uso comune e comprensibile per tutti o per la stragrande parte degli italoparlanti ce n'è a sufficienza per aprire una discussione su come ci si debba regolare ortograficamente nella stesura delle voci.

Il consenso modifica

 

Può capitare che, durante lo svolgersi delle discussioni, le parti contendenti adducano razionali motivazioni che potrebbero equamente essere candidate come regola (policy) da seguire. Dal momento che la regola è, o dovrebbe essere, per quanto possibile una sola, breve e chiara, in tali situazioni di equità nei giudizi espressi è accaduto con una certa frequenza che le risoluzioni finali si fondassero su questi punti:

  1. Non vietare in assoluto una certa grafia in quanto essa può essere una legittima e libera scelta stilistica del singolo autore
  2. Consigliare in generale di preferire la forma più comune della parola (o della locuzione), ovvero quella più usata perché maggiormente comprensibile ai lettori / alle lettrici dell'enciclopedia
  3. Fare un uso omogeneo delle varianti ortografiche all'interno della singola voce
  4. Dare la preferenza a quella forma ortografica che al momento è la più utilizzata all'interno di una o più categorie.

Il fatto che si giunga a concludere di non vietare una certa forma grafica (o un certo modo di dire o una certa locuzione) non dà adito a nessuno di obiettare che non si debba "correggere" se la "correzione" mira a un miglioramento della leggibilità, della spigliatezza, della velocità di apprendimento del contenuto. Per esempio: se in una voce è ripetuta più volte una stessa parola, una stessa frase, perché non cercare, se vi sono, parole sinonime o modi di dire alternativi e altrettanto validi?[13]

Quegli utenti che abbiano dimostrato concretamente una notevole familiarità nell'uso di AWB (nella fattispecie usato come normale browser) non dovrebbero essere scoraggiati a farne uso per sistemare i sinonimi sempre che ciò non comporti una maggiorazione nei tempi di esecuzione del lavoro rispetto al normale browser. Tutto ciò andrebbe spiegato agli altri utenti ignari del funzionamento di AWB. Comunque è più che normale trovare una certa riluttanza della Comunità a permettere un uso ancorché sorvegliato di un automatismo qual è AWB per questo genere di interventi.

Per ciò che può valere la mia pratica personale con AWB posso dire che non lo faccio partire per eseguire solo questo semplice lavoro (motivi: non si devono sovraccaricare i server per una serie di piccole modifiche ma anche non sciupare il proprio tempo) bensì con altri interventi più impegnativi e urgenti. Per esempio l'ho istruito a cercare i vari "rilascia/ano/ato/i/o..." predisponendo una generica sostituzione con "pubblica/ano/ato/i/o... più il normale lavoro di routine. Chiaramente la sostituzione proposta non è sempre valida: l'importante è che AWB intercetti l'abuso linguistico lasciandomi libertà e discrezionalità per cercare un sinonimo più adeguato (se esiste) e inserendolo a mano nell'edit box. Questa possibilità aggiuntiva sarebbe già sufficiente a spiegare il suo sotto-nome: The semi-automated wiki editor...

Alcuni paradossi. La "Regolaccia" delle tre generazioni modifica

La fretta di correggere modifica

Nel correggere gli errori di ortografia e i refusi dattilografici non ci vuole fretta!
Il tempo di attesa fra un salvataggio e il successivo può essere impiegato per un'occhiata aggiuntiva al periodo precedente o a quello seguente per rendersi conto che, a fianco degli errori attesi, ce ne potrebbero essere altri. Alcuni elementi da verificare possono essere così riepilogati: la sintassi, la scorrevolezza dei periodi, se le frasi posseggano un senso logico con relativa attenzione agli eventuali vandalismi dissimulati (occorre una certa esperienza e attenzione per scovarli) e così via. Se si pone una totale ed esclusiva attenzione all'errore "scoperto" da AWB potrebbe capitare (è accaduto e ancora accadrà) di correggere invano un errore ortografico all'interno di un periodo che in primis richiedeva un controllo più approfondito. Potrebbero però esservi utenti che valutano il minuto di attesa ai fini di un apprendimento "sicuro e senza danni" all'uso del software.

Per conseguire i risultati di cui al paragrafo precedente AWB può funzionare anche come browser con il quale è possibile ispezionare l'intero testo portandosi con l'occhio sulle e al di là delle fasce di testo colorate. Detto in termini ancor più esemplificativi: AWB è un software che incorpora un browser per modificare i testi di Wikipedia (esempio).

La velocità e il rendimento modifica

Riporto, modificando un po' le parole ma non il senso, due distinti commenti di altrettante utenze a proposito degli attuali limiti di AWB (aprile 2012) ai quali devono soggiacere le utenze che non operano come bot ufficiali.

«(...) con AWB a 1 edit al minuto, ne faccio di più a mano (...)»

«(...) attendere che passi un minuto è un po' frustrante (...)»

Per la frustrazione che si potrebbe provare, ho già specificato le ragioni per le quali la fretta non paga. Non entro poi nel merito se sia più frustrante attendere un minuto fra una modifica e l'altra, oppure sentirsi dire alla fine del lavoro che si son fatte una serie di modifiche da annullare per questo o per quel motivo...
Più interessante è l'obiezione dell'Anonimo 1 in quanto reitera un luogo comune, un tranello. La velocità slegata da un parametro non dice nulla. La velocità di intervento la si misura sia come quantità di correzioni all'interno di una singola voce eseguite tramite un automatismo rapportate a quella che un utente di media esperienza potrebbe eseguire tramite il suo browser nel medesimo tempo impiegato dall'automatismo (A) e sia come quantità intercorrente fra le correzioni massime presumibili di un utente di media esperienza nell'unità di tempo (di solito si assume come riferimento il minuto oppure l'ora) e quelle di un bot (2). Nelle due illustrazioni che ho preso a mo' di esempio si palesa che AWB, a differenza di un utente umano, può svolgere correzioni di ragguardevole imponenza. Soprattutto la figura (A) mostra e dimostra che in una manciata di minuti (3-4 al massimo) si possono eseguire all'interno di 2-3 voci ben oltre 1 000 correzioni, senza infrangere la policy!

Occorre inoltre prudenza perché un massiccio numero di piccole modifiche a brevi intervalli di tempo, anche se eseguite a mano, non è generalmente ben visto dalla comunità di Wikipedia in particolar modo di chi si occupa di patrolling (e dal buon senso). Faccio un esempio pratico. Se devo cercare tutte le occorrenze di perchè e poi di poichè, poi di benchè, poi di (...) è inutile e dispendioso in termini di tempo (mio e altrui) e risorse di rete che le faccia e le rifaccia per ogni parola; meglio una regex ad hoc da implementare in AWB. E se proprio non posso o non voglio usare AWB, mi vengono in aiuto i correttori ortografici di cui i maggiori browser sono forniti o installabili come plugin e poi inserire nel campo della ricerca , oltre che osservare le sottolineature rosse.

Accuratezza, aritmomania, errori, fretta modifica

Si tratta di inquadrare al più presto che cosa abbia a che spartire l'aritmomania nel presente contesto. Mi viene in aiuto un saggio redatto dai colleghi di lingua inglese leggibile qui.
In linea generale potrebbe essere utile controllare il numero dei propri contributi a scadenze temporali ben definite (per es. a inizio e fine sessione) specie se si è versati nella statistica. Per esempio si può conoscere tramite una semplice differenza aritmetica quanti edit ho compiuto correggendo una parola errata e vedere come tale errore si ripresenta in termini quantitativi nel corso del tempo senza bisogno di fare un esagerato numero di note al margine in questa pagina. Un po' di inventiva personale non guasta, anzi.

La situazione cambia e non di poco quando il conteggio degli edit è fine a sé stesso; ovvero quando è un'azione circoscritta in un esclusivo ammirare un contatore che gira, gira e gira... senza che chi l'osserva si renda conto che, a monte, ci sta un progetto a cui contribuisce e che per sua intrinseca natura richiederà un costante aggiornamento del quale non si vede un termine!

Questa situazione non solo può minare la salute del singolo utente ma potrebbe anche arrecare danni al funzionamento dell'enciclopedia. Cosa capita quando un notevole quantitativo di utenti fanno un gran numero di modifiche di piccola entità a brevi intervalli di tempo? Sovraccaricano inutilmente i server con uno sperpero di risorse! Non è cosa da sottovalutare tant'è che esiste un apposito template che i patroller notificano nelle pagine di discussioni degli utenti: {{anteprima}} vale a dire un avviso di presunto abuso di salvataggi. Tuttavia queste sequenze di "salvataggi impulsivi" non vanno confuse con il vandalismo; è però bene che questi utenti si adeguino a usare l'anteprima.


(proseguirà...)
La torre di Babele e le tre generazioni modifica

«Non voglio più saperne; il famoso cogito mi fa andare in bestia. (...). Si spiega ciò che si capisce pochissimo per mezzo di parole che non si capiscono affatto!»

Le Odi barbare di Carducci e il Duca d'Atene di Tommaseo furono alcuni fra i tentativi che i letterati dell'Ottocento tentarono per ridare lustro alla poesia e alla prosa rifacendosi a modelli stilistici del passato. Il contenuto di queste opere è tutt'oggi (2012) comprensibile senza bisogno di particolari spiegazioni a un lettore di media preparazione scolastica. Furono tentativi che, però, fallirono perché la metrica e il lessico del tempo erano diretti ad altri modelli e innovazioni. Inoltre nel passaggio dal Settecento all'Ottocento si assistette in Europa alla nascita di nuove professioni e studi e, sopra di tutto, al progressivo allontanamento (specializzazione) fra le discipline umanistiche e quelle scientifiche (si pensi all'affermarsi del Positivismo) con la impellente necessità di "inventare" o "adattare" un lessico preesistente in altre lingue per le sopravvenute necessità.

Verso la fine del XX secolo una pubblicazione periodica italiana ad amplissima diffusione, propagandava la commercializzazione a dispense della Divina commedia precisando che era stata tradotta (sic) in italiano; alcuni anni dopo alcuni insegnanti delle scuole medie osservavano che il Verga non poteva essere proposto in lettura agli studenti di lingua italiana dell'Alto Adige perché essi non capivano il senso delle frasi, il quale doveva essere costantemente tradotto (sic) in classe dai docenti.

Preferisco esentarmi dai commenti perché io e tu che leggi questa righe possiamo trarne alcuni liberi spunti di riflessione riferiti al contesto wikipediano. Un contesto quanto mai variegato e mutevole per i liberi apporti di conoscenza che utenti volontari sparsi per il mondo apportano costantemente.

Più che risposte preferisco propormi alcune situazioni tratte dalla quotidianità.
È il contenuto di Wikipedia comprensibile a tutti? Se qualcuno desidera espandere il proprio orizzonte cognitivo su determinati argomenti nei quali è versato ma non si è tenuto aggiornato nel corso di alcuni anni, vi riuscirà leggendo i "nostri" articoli? Se il quidam assumesse l'essenza di Tre distinte generazioni quale sarà il grado di fruibilità dei contenuti di Wikipedia? Il contenuto di Wikipedia risponde alla domanda culturale delle Tre generazioni? Il contenuto di Wikipedia è curato, è oggetto di attenzione alla pari del contenitore nell'equo rispetto delle Tre generazioni?[14]. La lingua impiegata nelle voci nella sua complessiva morfologia è senza dubbio adeguata per essere compresa senza o minime difficoltà dalle Tre generazioni?

Alle scuole elementari avevo un maestro che in previsione di sorbirci i nostri temi scalcagnati d'italiano aveva l'abitudine di ripeterci: «Quando scrivete fate finta che io non conosca affatto l'argomento e non entrate d'un subito in medias res» Ripeteva che suo padre (anch'egli maestro) gli aveva insegnato il latinorum «a forza di calci nel sedere (sic).» e pure noi ci dovevamo avvezzare. Alle locuzioni latine. Senza bisogno ogni volta di "reinventare la ruota" è auspicabile (anzi necessario) che le composizioni, ivi compresa una enciclopedia, siano presentate con un vestito che le renda degne per lo meno sotto l'aspetto della comprensibilità delle parole-concetti esposte.

Ancora. Mi interrogo se sia una scelta oculata quella di dare per scontato che sia sempre un bene che a ogni battito di ciglia il lettore / la lettrice debba distrarre la lettura dell'articolo di proprio interesse da un link che tenta di spiegare un termine, una locuzione, un modo di dire? Come si comporterà, cosa penserà se egli/ella non trovando un link esplicativo di un termine non italiano consulterà un dizionario che -massima sfortuna- non elenca proprio quell'eccezione o pur elencandola non riesce a dare un senso compiuto alla frase che leggeva[15]? Vero è che ogni lettore/lettrice può, è liberissimo di approfondire o di ignorare ciò che nel testo reputa più utile o inutile ai propri interessi; ma in tante voci si possono riscontrare link al limite del ridicolo e non solo per la loro ripetitività all'interno del medesimo testo[16]

Mi domando se le scelte tecniche operate a monte del Progetto tengano conto che vi sono persone, vi sono nazioni povere, molto povere che utilizzano sistemi operativi e browser vetusti e che non gliene importa un fico secco se "Zilla" o "Plorer" sia o no il migliore o peggiore browser in circolazione.

Mi domando se il software di Wikipedia sia da noi usato dando la massima priorità all'igiene dell'occhio. Perché, a quanto pare, i testi li si leggono con gli occhi i quali, a differenza di un PC, non possono essere regalati, acquistati o sostituiti una volta deteriorati.

Mi domando se stiamo fornendo (o siamo sulla buona strada per farlo) la possibilità anche ai ciechi e ai sordi di fruire dell'enciclopedia: qual è, a tal proposito, lo stato di interesse e l'avanzamento dei lavori della Wikipedia parlata?

Errare humanum est modifica

Premesso che gli errori ortografici non sono vandalismi (esclusi quei casi dove l'errore è intenzionale in quanto utilizzato con la palese intenzione di danneggiare l'enciclopedia); è un obbligo che chi corregge mantenga un rapporto di cordialità e indulgenza nei confronti di chi ha sbagliato l'ortografia e la grammatica. Mai far pesare l'errore per mezzo di parole esplicite ma nemmeno presentandoli con più o meno velati sarcasmi alludenti all'autore e alle sue capacità.
Resta il fatto che alcuni di noi potrebbero avere sviluppata una personale reazione repulsiva alla presenza di un testo con errori d'ortografia o grammaticali: in ogni caso non si deve mai toccare la buona fede di chi li ha commessi. Sarà invece più saggio che l'utente che vuol correggere indirizzi i propri sforzi su come l'errore potrebbe essere concretamente contrastato con il minor impiego di tempo e fatica.
Grazie al controllo discreto che eseguo sugli errori ho per esempio notato delle peculiarità fra le quali una certa ciclicità nel loro ripresentarsi dovuta a varie cause -non tutte chiarite- che qui è fuori luogo enunciare. Grazie però a tali periodiche ricorrenze mi è possibile programmare un certo ordine di intervento prioritario in rapporto alla loro maggiore o minore diffusione nelle pagine di Wikipedia. Non nego che in tutto ciò possa entravi una personale (e forse innata) predisposizione a studiare le cause piuttosto che a deriderle (fatti salvi gli sporadicissimi casi in cui -del tutto involontariamente- si verifichino involontari e ameni giochi di parole che muovono l'ilarità generale compreso chi ha errato).

Il testo sotto riportato è parte del codice di condotta di chi lavora con un bot. L'originale è qui;
L'essenza resta intatta anche per quanti correggono gli errori "a mano".
Il colore e il grassetto sono miei.

«Il lavoro del manovratore è difficile e spesso ingrato. Il fatto di poter arrecare grandi danni in breve tempo porta la maggior parte degli utenti ad avere un atteggiamento piuttosto severo nei confronti dei manovratori. Per questo motivo è fondamentale che chi gestisce un bot abbia una particolare cura nel gestire le comunicazioni correlate a questa attività.

 

Essere in grado di rispondere cordialmente, rapidamente e in maniera pertinente è una condizione importante per poter gestire un bot.

Sempre al fine di migliorare l'aspetto comunicativo è importante utilizzare oggetti delle modifiche chiari ed esplicativi.»

Da questi elementi è sufficientemente chiaro che la correzione degli errori ortografici non può essere improvvisata ma attentamente valutata in primis dalla singola utenza per vedere quando è possibile attuare una correzione totalmente automatizzata "cieca" e quando invece occorre un controllo visivo voce per voce anzi, periodo per periodo. Per ottenere ciò occorre avere una motivazione personale e molto tempo, sia per scovare gli errori più noti e sia quelli meno evidenti o oggetto di contestazioni.



(proseguirà...)

Gli errori secondo AWB modifica

Se opportunamente istruito AWB gestisce e ripara (ovvero: sostituisce) quasi tutti i tipi di errori di ortografia, di refusi e dattilografici tipici della scrittura con tastiera, ma anche i regionalismi o parole dialettali in contesti che non li prevedono affatto. Nel contempo AWB esamina anche gli errori di formattazione per esempio da <i> </i> a '' '' comprese le eccedenze o la scarsità di spaziatura interlinea ("ritorni di carrello"). Su quest'ultimo caso specificherò in una sezione a parte se e come convenga operare in presenza di correzioni di minore entità (minor edits).
Il software AWB è anche in grado di svolgere altri compiti qui non trattati ma comunque descritti nel manuale di istruzioni.

 
L'importante disclaimer di AutoWikiBrowser
Coloro che intendono correggere gli errori ortografici tramite AWB devono controllare visivamente se la sostituzione eseguita è sempre quella esatta in ogni voce perché eventuali eccezioni non possono mai escludersi del tutto. È fondamentale ricordarsi del disclaimer presente in AWB:

«AutoWikiBrowser (AWB) comes with ABSOLUTELY NO WARRANTY. AWB is constantly in development, and there may be bugs in the software. YOU are responsible for what you do with this tool. Use it at your own risk.»

Come AWB corregge gli errori modifica

La conduzione più veloce eseguita in modalità automatica (proibita dal regolamento a chi non ha il flag di bot)[17] oppure eseguita lentamente in modalità semiautomatica, senza ispezionare l'edit box, sono quelle che producono il maggior numero di false correzioni e quindi le più rischiose sia per il Progetto e sia per la reputazione del manovratore.

L'operatore che ispeziona l'edit box prima di salvare il contenuto, riduce di molto la probabilità di incorrere in un errore[18]

Partendo dal dato di fatto che AWB permette sempre di ispezionare il contenuto e di aprire il browser nella voce prima del salvataggio, può essere più razionale sfruttare questa possibilità, piuttosto che svolgere una serie di correzioni come utente-Bot e poi controllarle come utente-non-Bot.
Vi è però da precisare che lanciando il proprio browser tramite AWB[19] si potrebbe entrare nella pagina di Wikipedia come utente anonimo (se il browser è configurato perché all'uscita cancelli i dati di accesso al proprio account) ovvero con l'account di utente "normale" ovvero di utente "bot". L'attuale policy in vigore su it.wikipedia.org non permette che l'utente-Bot esegua correzioni manualmente e di queste situazioni occorrerà che chi lavora con AWB ne tenga debito conto e altrettanto dicasi per gli amministratori, i burocrati (ai quali è demandata la possibilità di applicare e rimuovere la funzione di Bot) e infine a quei botolatori che non sono edotti sulle funzionalità di AWB.

Il file settings.xml di AWB modifica

Il file settings.xml contiene quelle impostazioni che servono al funzionamento del software su un progetto Wiki. A fianco di una struttura predefinita che permette un funzionamento di base, l'utente può inserire delle espressioni regolari che costituiscono il "dizionario interno" di AWB. Mi limito a un sunto delle possibilità che riguardano in modo specifico la ricerca degli errori nei testi.

La regex che segue, attinente alla formattazione in uso su Wikipedia, permette di trovare all'interno di una pagina tutte le occorrenze di </br> <br\> <br/> e di sostituirle in blocco con: <br />

<IRule xsi:type="Rule">
       <enabled_>false</enabled_>
       <Children />
       <Name>Give <br /> tags proper XHTML format.</Name>
       <ruletype_>OnWholePage</ruletype_>
       <replace_></?br\s*/?></replace_>
       <with_><br /></with_>
       <ifContains_ />
       <ifNotContains_ />
       <regex_>true</regex_>
       <ifIsRegex_>false</ifIsRegex_>
       <numoftimes_>1</numoftimes_>
       <ifRegexOptions_>None</ifRegexOptions_>
       <regexOptions_>IgnoreCase</regexOptions_>
     </IRule>
     <IRule xsi:type="Rule">
       <enabled_>false</enabled_>
       <Children />

Esiste la possibilità di creare regex più complesse facenti uso di strutture annidate. Ma, al tempo stesso, è possibile scrivere regole strutturalmente più semplici e veloci (per lo meno dal punto di vista dell'operatore) ma che comunque richiedono attenzione per non provocare falsi positivi. Quella che segue cerca tutte le occorrenze di milano sostituendole con Milano

<Replacement>
       <Find>\ milano</Find>
       <Replace> Milano</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>false</BeforeOrAfter>
       <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions>
     </Replacement>

I falsi positivi si possono sperimentare se, per esempio nella parte

<Find>\ milano</Find>
       <Replace> Milano</Replace>

si elimina lo spazio vuoto

<Find>\milano</Find>
       <Replace>Milano</Replace>

la regola cercherà non solo il singolo milano ma anche tutte le parole contenenti ...milano.... Per cui milano e assimilano, Assimilano verranno sostituite da Milano e da assiMilano, AssiMilano.

Quando il file settings.xml corregge le correzioni modifica

Potrebbero presentarsi situazioni nelle quali AWB porge una errata correzione nonostante l'operatore ritenga di aver posto la massima diligenza nel compilare i Find and replace.

  • Mi capitò in più occasioni una serie di situazioni nelle quali il wikilink di s.l.m. (sul livello del mare) e varianti grafiche, anziché [[s.l.m]] veniva scritto in alcuni casi: [[[[s.l.m.]]]], cioè con ben quattro parentesi quadre al posto delle canoniche due. Il fatto mi apparì curioso in quanto non mi ritenevo in grado di replicare l'errore tramite un test a parte. Si esamini l'attuale struttura (alla data del 11 aprile 2012):
       ......
<Replacement>
       <Find>slm</Find>
       <Replace>s.l.m.</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>false</BeforeOrAfter>
       <RegularExpressionOptions>None</RegularExpressionOptions>
     </Replacement>
     <Replacement>
       <Find>s\.l\.m\.</Find>
       <Replace>s.l.m.</Replace>
       <Comment>After fixes!!</Comment>
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>true</BeforeOrAfter>
       <RegularExpressionOptions>None</RegularExpressionOptions>
     </Replacement>
     <Replacement>
       <Find>s\.\ l\.\ m\.</Find>
       <Replace>s.l.m</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>false</BeforeOrAfter>
       <RegularExpressionOptions>None</RegularExpressionOptions>
     </Replacement>
       ......


Dovetti controllare il contenuto della voce; riscontrato che s.l.m prendeva effettivamente più varianti grafiche all'interno della voce a causa dell'arbitrio dei collaboratori, dovetti stabilire un ordine di intervento, cioè una condizione supplementare alla regola, questa:

       ......
<Replacement>
       <Find>s\.l\.m\.</Find>
       <Replace>s.l.m.</Replace>
       <Comment>After fixes!!</Comment> *mio commento*
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>true</BeforeOrAfter> *condizione necessaria (true)*
       ......

in pratica la regola sopra riportata dev'essere applicata da AWB dopo le altre se si vuole che, in tutti i casi, si abbia la seguente resa grafica finale: s.l.m e non [[s.l.m.]].

  • Ecco un'altra sostituzione la quale ha richiesto che tutti i casi di sostituzione "del Sc --> dello Sc" abbiano attivata (true) la condizione <BeforeOrAfter>true</BeforeOrAfter> onde evitare questa falsa correzione "--> dello Scoialismo".
  • In questo altro caso è stato necessario applicare la correzione .d -> . D dopo la seguente correzione: della c.d. -> della cosiddetta altrimenti si sarebbe erroneamente corretto: della c. D.. Si consulti il Manuale di stile nel punto dove invita a ridurre al meno possibile le abbreviazioni al fine di una migliore leggibilità dei testi.
  • Può essere interessante osservare questa regex estratta dalla pagina dei Typos:
<Typo word="Di sé" find="\b(D|d)i se\b" replace="$1i sé" />

Quando trova: se' produce: sé' presumibilmente perché alcuni utenti utilizzano una tastiera non italiana.

Per rimediare ho inserito la correzione sé' -> sé da applicare subito dopo quella presente nella pagina dei typos cioè vale a dire in un'unica passata (<BeforeOrAfter>true</BeforeOrAfter>):

       ......
<Replacement>
       <Find>\ sé'</Find>
       <Replace> sé</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>true</BeforeOrAfter>
       <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions>
     </Replacement>
       ......

Questo è il risultato. (Vi è un apostrofo fuori luogo e che non c'entra: era necessario lasciarlo così-momentaneamente- per mostrare l'intero contenuto del campo oggetto)

Di tanto in tanto qualche utente inserisce qualcosa come:
una altro
un accostamento errato oltre che brutto a leggersi e da pronunziare. Per contro AWB l'ho istruito in modo che inserisca un apostrofo quando l'articolo indeterminato "una" precede una parola iniziante per "a". Nel caso specifico si sarebbe prodotta la falsa correzione seguente:
una altro —> un'altro
Anche in questo caso occorre scrivere nel file settings.xml una correzione suplettiva per evitare di far passare due volte AWB sulla voce:

<Replacement>
       <Find>un'altro</Find>
       <Replace>un altro</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>true</BeforeOrAfter>
       <RegularExpressionOptions>None</RegularExpressionOptions>
     </Replacement>


Come di consueto si deve stabilire l'ordine di intervento che in questo caso è After, cioè Dopo avere messo l'apostrofo una a —> un'a.

Ciò che è importante ricordare da queste situazioni è che una prova condotta nelle sotto pagine dell'utente non potrà mai sostituire un'esperienza reale "sul campo" cioè in NS:0. Attenzione! Non è detto che gli inconvenienti si manifestino "alla prima uscita", a volte occorrono giorni, a volte settimane per rendersi conto che qualcosa non va nel dizionario. Sotto questo aspetto la conduzione semiautomatica di AWB (cioè con ispezione umana prima del salvataggio) è raccomandabile anche ai botolatori con flag.

Le correzioni di minore entità con AWB modifica

AWB è un software che "dialoga" con un server dedicato con un carico di esercizio, a volte intenso, il quale è bene che sia finalizzato a modifiche di indubbia utilità e urgenza. Viene pertanto logico domandarmi se le piccole modifiche (aggiustamenti di spaziatura fra le singole lettere o le righe, uniformazione di tag per compatibilità XHTML, rimozione di tag deprecati perché obsoleti o in contrasto con le norme di accessibilità e così via) abbiano le carte in regola per essere elaborate senza tema di essere additato come utente "sprecone di risorse"[20]. Dico che una risposta la potrei dare solo tramite un ragionamento ad inversum. Provo idealmente (voglio dire che non lo faccio materialmente ma solo ipoteticamente) a scartare sempre le predette correzioni di "minor conto" e come me tutti coloro che fanno uso di automatismi. Trascorso un congruo periodo di tempo -difficile da indicare ma senza dubbio reale- i testi in NS:0 mostreranno un incremento di più o meno piccoli "difetti di varia formattazione" al punto che ci potrebbero essere le condizioni per parlare di un intervento tramite bot. Dunque come potrei comportarmi? La soluzione che mi pare più ragionevole è quella di evitare i due precedenti "scenari" tramite una "diluizione", ovvero un inframmezzamento di consistenti correzioni con altre di minore entità specie se queste ultime sono di una certa rilevanza numerica nella pagina che sto per salvare.

AWB e il debugging modifica

Questa nota interessa per lo più gli operatori. Quando si commette un errore nello scrivere una regex nella pagina dei Typos, AWB lo segnala tempestivamente. L'esempio si riferisce a un caso reale: leggi i particolari.

Il campo oggetto scritto da AWB modifica

L'operatore / l'operatrice può modificare, entro certi limiti, il contenuto del campo oggetto per adeguarlo alla lingua del Progetto oppure per indicare esattamente il compito che sta svolgendo.

Da tale contenuto si possono evincere alcune informazioni. Non mi risulta che la delucidazione che segue sia riscontrabile nel manuale tecnico di AWB. L'ho ricavata da mie osservazioni.

  • Il campo oggetto è totalmente vuoto
    • chi manovra ha il flag di bot, ha volontariamente abilitato l'opzione Suppress "using AWB" in edit summary e ha apportato modifiche a mano nell'edit box.



  • Nel campo oggetto si legge solo la frase: using AWB (usando AWB)
    • chi manovra ha disabilitato l'opzione Add replacements to the edit summary oppure ha scritto a mano nell'edit box ovvero tutt'e due i casi.
    • AWB ha letto e applicato unicamente le regex accessibili dalla scheda Options, Advanced settings
    • AWB ha applicato una o più regole di sola formattazione mentre il manovratore non ha compilato il campo oggetto


  • Nel campo oggetto si legge replaced: abbile → abile, (sostituzione)
    • AWB ha applicato la regola inserita nel file settings.xml


  • Nel campo oggetto si legge typos fixed: inghilterra → Inghilterra, (correzioni tipografiche)
    • AWB ha applicato la regola inserita nella pagina dei Typos


  • Nel campo oggetto si legge removed: stocazz, removed: magnifico using AWB (rimozione)
    • AWB ha applicato la regola che prescrive la rimozione di una o più parole inadeguate, indicate dall'operatore nel file settings.xml.


A seconda di come è configurato, AWB può scrivere più combinazioni nel campo oggetto fino al numero massimo di caratteri permesso.

I numeri racchiusi fra parentesi tonde, nell'esempio l' → l' (17) e un' → un' (2), indicano quante volte è stata applicata la sostituzione.

Eccezioni da sapere modifica

Attenzione: a volte e in modo impredicibile, AWB applica alcune eccezioni all'elenco dei campi oggetto più sopra elencati. Per esempio in questa modifica esso attingeva al mio dizionario interno solo per quanto riguarda [madonna->Madonna] e perciò si sarebbe dovuto leggere: replaced: madonna → Madonna,....
Altre volte aggiunge una parte del testo della voce. Si tratta di trovare un accordo fra chi fa patrolling intensivo (e potrebbe essere disturbato visivamente da simili "corposi" campi oggetto) e chi deve o vuole indicare puntualmente ad altri cosa sta facendo AWB.
A seconda di come è configurato il file settings.xml si potrebbero avere dei campi oggetto che non corrispondono —in tutto o in parte— alla reale operazione svolta: (Typo fixing, replaced: , → ,, typos fixed: t → t using AWB). Si potrebbe pensare che AWB abbia sostituito , con ,, il che non è vero (oltre che errato). Nel mio file settings.xml è presente una regola "obbligata", perché se è vero che precedenti regole a monte aggiustano lo spazio fra la virgola e una lettera, per esempio:
chitarre ,mandolini ,arpe... sostituendo con:
chitarre, mandolini, arpe...
alcuni utenti inseriscono una complicazione così esprimibile:
chitarre, ,mandolini ,arpe...
la quale viene corretta parzialmente così:
chitarre,, mandolini, arpe...
e quindi occorre una correzione suplettiva all'occorrenza:

<Replacement>
       <Find>,,</Find>
       <Replace>,</Replace>
       <Comment />
       <IsRegex>false</IsRegex>
       <Enabled>true</Enabled>
       <Minor>false</Minor>
       <BeforeOrAfter>true</BeforeOrAfter>
       <RegularExpressionOptions>IgnoreCase</RegularExpressionOptions>
     </Replacement>

E comunque non si tratta ancora di ciò! Verosimilmente AWB scrive nel campo oggetto alcune operazioni eseguite al suo interno ma che non sempre corrispondono alla reale ed effettiva sostituzione applicata e quindi il predetto campo oggetto non è sempre affidabile (per chi deve controllare "al volo", cioè senza avvalersi della differenza di versioni).


Impostazioni predefinite del campo oggetto modifica

Quelle che seguono sono le impostazioni già presenti in AWB per il campo oggetto. Alcuni link sono rossi perché puntano a pagine di servizio e template presenti solo nella versione inglese di Wikipedia.

   <SelectedSummary> </SelectedSummary>
   <Summaries>
     <string>clean up</string>
     <string>re-categorisation per CFD</string>
     <string>clean up and re-categorisation per CFD</string>
     <string>removing category per CFD</string>
     <string>subst:'ing</string>
     <string>stub sorting</string>
     <string>Typo fixing</string>
     <string>bad link repair</string>
     <string>Fixing links to disambiguation pages</string>
     <string>Unicodifying</string>

Si noti che la parte di codice:

   <SelectedSummary> </SelectedSummary>

serve a ricordare ad AWB che, all'avvio, deve predisporre uno (1) spazio vuoto nel campo oggetto. È necessario inserire nel campo oggetto almeno uno spazio, altrimenti AWB si rifiuta di lavorare.

L'impostazione di uno spazio vuoto nel campo oggetto è a discrezione dell'utente.
Personalmente l'ho trovato utile per risparmiare spazio in caso di lunghi elenchi di sostituzioni ma è ovvio che, per esigenze di servizio, potrebbe essere preferibile caricare all'avvio un'altra scelta. Durante il lavoro è sempre possibile cambiare i campi oggetto (o aggiungerne di nuovi e salvarli) selezionandoli dal menù a tendina Summary:... nella scheda Start.

Difetti noti o presunti di AWB modifica

Se non diversamente specificato mi riferisco alla versione 5.3.1.0

  • Non riconosce il template bio e aggiunge un ulteriore grassetto[21].
  • In taluni casi non riesce a "vedere" in modo unitario (nella lista generata la pagina di servizio era ripetuta 4 volte).
  • AWB trascorso un certo numero di secondi di inattività viene disconnesso dal server: vengono mantenute memorizzate le credenziali di accesso (nome utente più password). Subito dopo il messaggio di avviso, inizia un conteggio alla rovescia per una nuova connessione. Quest'ultima può essere anticipata premendo su Start. Pare essere un'esigenza imposta dal servizio.
  • AWB tenta ripetutamente e a intervalli incrementali di tempo di connettersi senza successo al suo server. Chiaramente non è un difetto vero e proprio bensì non è stata curata a sufficienza la leggibilità del messaggio di errore (504=Gateway Timeout) il che è chiaramente visibile e descritto all'interno dello screenshot.
  • Su alcuni PC e/o in loro particolari configurazioni, quando in AWB è opportuno cambiare il Default Summary (alias: il "campo oggetto") nel bel mezzo del lavoro, potrebbe presentarsi una schermata opaca persistente per alcuni secondi simile a questa la quale "ingombra" tutta l'area del monitor. Allontanando il puntatore del mouse la schermata scompare ma quando si ritorna col puntatore del mouse in prossimità del box il fenomeno si ripresenta. Per rimediare si tenga premuto il tasto sinistro del mouse e attendere che la schermata a sfondo giallo scompaia. Dopo di ciò (mantenendo sempre premuto il tasto del mouse) si usino le freccette alto—basso della tastiera per spostarsi sopra o sotto il Default Summary selezionando quello più opportuno. Sembrerebbe una caratteristica correlata all'uso di versioni delle librerie .NET Framework >2.0 necessarie per il funzionamento di versioni di AWB >5.3.1.0.

Alcune particolarità di AWB modifica

L'operatore alle prime esperienze è più ricettivo ai messaggi di AWB di uno già addestrato: inserisco in ordine sparso alcuni di essi in attesa di una migliore riorganizzazione...

  • Come bloccare AWB (ogni abuso verrà perseguito a norme di policy...)

I bot fuori controllo, quelli non autorizzati, sono bloccati all'istante tramite una funzione in possesso degli amministratori e categorie superiori. Tuttavia per comunicare celermente qualcosa al manovratore di AWB ma senza che vi siano gli estremi di un blocco drastico imposto per motivi di sicurezza e salvaguardia del Progetto gli si può scrivere in talk, con questo risultato "lato operatore".

  • Come sbloccare AWB (blocchi imputabili in prima approssimazione alla complessa formattazione di alcune pagine)

In alcuni casi AWB non risponde più all'operatore: si blocca per un tempo che potrebbe variare fra alcuni secondi e alcuni minuti. Ci sono due o tre possibilità e sta a chi conduce l'automatismo verificarne l'applicabilità caso per caso.
Soluzione bruta: se si usa Windows XP premere in sequenza i tasti CTRL ALT CANC selezionando Processi e dalla colonna Nome immagine, clic destro su AutoWikiBrowser.exe e poi Termina processo; rispondere Sì. Si perderanno tutti i dati di lavoro non precedentemente salvati.
Soluzione estrema: se è il computer a non rispondere più, premete il pulsante reset posizionato sul pannello del PC. Per la verità in oltre due anni di uso intensivo di AWB non mi è mai capitato di farlo, comunque è bene sapere che se si hanno altri programmi aperti si perderanno i relativi dati di lavoro.
Soluzione soffice: attendere con pazienza... e una volta che si è sbloccato, salvate subito le impostazioni di lavoro nell'eventualità di un (malaugurato) ripetersi dell'evento!

  • Come salvare o recuperare il contenuto di Advanced settings

Prima di chiudere AWB occorre sincerarsi se le modifiche effettuate nel suo dizionario debbano essere salvate oppure scartate. Il comando Delete in Replace Special si applica istantaneamente e non è possibile recuperare il contenuto di ciò che si è modificato mantenendo AWB operativo. È possibile ripristinare il contenuto del file settings.xml come si trovava all'ultima apertura di AWB, ovvero al momento dell'ultimo salvataggio semplicemente chiudendo il programma senza salvare nulla.

In modo limpido con relativo avviso per l'operatore.
A onor del vero non è semplice ottenere uno screenshot esplicativo di tale situazione (in oltre due anni di uso molto intenso l'ho esperito non più di 3 o 4 volte in tutto). Affinché si manifesti un conflitto di edizione occorre che un altro utente esegua e salvi una modifica della pagina proprio un po' prima di AWB. Ecco un'immagine del 29-ago-2012. Premendo il tasto OK viene ricaricata la versione aggiornata dall'utente "contrastante" AWB: se l'operatore in precedenza aveva compiuto modifiche personalizzate al testo, esse dovranno essere reinserite (a mano).
Nota. Alla data attuale (ago 2012) AWB ignora (cioè "maschera") la presenza di {{WIP}} per cui l'operatore si ricordi di ciò se gli saranno mosse rimostranze. Se l'intervento di AWB è anche nell'incipit è bene che l'operatore si abitui a guardare in cima alla pagina (anche per evitare di inserire due volte lo stesso template, per esempio {{correggere}}.

  • Come passare dal funzionamento bot a quello semiautomatico senza apparente instabilità del software (dalla versione 3.0 alla 3.4)

La soluzione migliore è fermare il bot, andare nella scheda Bots e togliere il segno di spunta ad Autosave. Se si desidera fare ripartire il bot dopo che esso ha raggiunto il valore numerico della casella Max edits potrebbe essere consigliato chiudere AWB e rilanciarlo. Se non si è ancora raggiunto il lavoro si può fermare il timer/contatore dalla linguetta Start e quindi Stop. Disabilitare l'Autosave e iniziare a lavorare in semiautomatico. Vedi l'immagine esplicativa (fusione di due screenshot). Rispettare la policy del Progetto.

  • Come scavalcare il blocco alle modifiche causato dalla presenza del template in use (ma anche dalla presenza di un link "lungo" iniziante per esempio con https://it.wikipedia.org/una pagina) al posto di un wiki link nella v. 5.8.6.0 e v. 5.8.7.0

Il risultato non è garantito e men che mai documentato.
Non si prema subito il tasto OK proposto da AWB, bensì si apra la pagina che contiene il {{WIP|}} con il normale browser. Si attenda alcuni secondi e poi si torni ad AWB e finalmente si prema il tasto OK. Le modifiche, con AWB, dovrebbero essere ora possibili (risultato non garantito). Da usare con prudenza e consapevolezza di ciò che ci si appresta a modificare.

  • Dopo avere rimosso manualmente il template di Work in progress che mi bloccava l'accesso alla pagina desiderata, AWB ripristinava automaticamente il template (V.5.9.0.0).

AWB e Windows XP/IE8 modifica

Aggiornamento del mese di ottobre 2017. Your Browser's Connection Security is Outdated, HTTPS Browser Recommendations, HTTPS/3DES Deprecation. AWB per lavorare si basa sulla presenza di IE, pertanto non funzionerà anche se sul computer è installata la versione recente consigliata da Wikimedia in sostituzione di IE8: Mozilla Firefox 52 ESR

AWB o browser del PC? modifica

Il titolo esprime questo interrogativo: Per correggere gli errori (ortografici) è meglio usare AWB o il browser per la navigazione in internet? Si tratta di una situazione già anticipata nella sezione Errare umanum est ma tipica di chi non ha ancora acquisito una soddisfacente familiarità con le correzioni "sistematiche" (per correzioni "sistematiche" intendo tutte quelle azioni tese a eliminare con appropriato criterio dal database di Wikipedia tutte le occorrenze di un errore in NS-0, non solo da alcune pagine). Ecco allora che l'efficacia di un'azione non può prescindere da una valutazione preliminare del lavoro che si fonda e che si misura in ampia parte sull'esperienza dell'operatore/trice. Più di tante parole valga un esempio pratico. Se devo correggere una parola errata che il database mi indica essere presente in 30—40 pagine su di 1 000 000 e AWB invece mi costruisce una lista di 850 pagine nelle quali ritiene vi sia l'errore, forse è il caso di correggere tramite il browser per alleggerire il carico di lavoro (mio e dei server di Wikimedia). Se però quello specifico errore si ripresenta con una certa regolarità non è male inserirlo fra gli interventi da svolgersi periodicamente. Riguardo poi a quantificare questa "periodicità" non è semplice da stimare in quanto l'esperienza del singolo non è sufficiente e dev'essere raffrontata all'effettiva, reale (quindi non teorica) presenza di automatismi condotti da altri operatori/trici che incorporano "quella" specifica correzione. Quindi è bene tenersi tutti quanti in contatto riguardo anche alle sostituzioni di routine, quelle insomma che ripresentandosi a intervalli più o meno regolari richiedono una speciale attenzione.

Nei casi di errori che, presi singolarmente, superano un centinaio di pagine, è razionale avvalersi di un automatismo. Correggere a mano con la partecipazione di più utenze (ovvero singolarmente e a distanza di tempo fra una sessione e l'altra) può essere frustrante e affaticante e poco "redditizio" perché il database viene solitamente aggiornato dopo alcune ore e nel frattempo tale errore comparirà ancora fra i risultati delle ricerche anche se è stato eliminato.
AWB invece lavora caricando e scaricando automaticamente le pagine e l'operatore/trice non ha che da attendere e osservarne il funzionamento senza preoccuparsi se altri sono già passati fra quelle pagine in lista.

Domande frequenti: FAQ (Fully Anticipated Questions) modifica

«Oggigiorno il silenzio è d'oro massiccio.
La parola latta arrugginita.»

Questa è una sezione che serve in modo precipuo a quanti mi scriveranno facendomi notare che io avrei corretto un termine o una parte del discorso o applicata una formattazione in modo errato o per lo meno discutibile.

Premesso che nessuno è perfetto e appurata una certa ripetitività di contenuto nelle note lasciatemi da leggere (e da rispondere) in questi anni, per evitar(mi) uno spreco di tempo per fornire le (più o meno solite) spiegazioni, le riassumo qui sotto in termini generici.




Domande generiche sul software AWB modifica

  • ...tramite AWB si può correggere la grammatica e la sintassi?

In teoria sì; in pratica è molto, molto difficile ottenere risultati soddisfacenti e applicabili su ampia scala.


  • ...è vero che AWB è in grado di scoprire anche i vandalismi?

Sì ma a condizione che sia istruito per farlo. Come è facile comprendere il dizionario delle bestemmie, insulti, parolacce, improperi, ecc. deve essere mantenuto riservato e in mani di utenti di assoluta lealtà nei confronti del Progetto perché, rivelarne il contenuto, può vanificarne l'efficacia se cadesse in mani ostili al Progetto.


  • ...ho creato alcune pagine: posso usare AWB per correggerle oppure ci potresti pensare tu?

Se sei un utente registrato lo puoi fare benissimo tu. Se proprio non ci riesci e hai paura di pasticciare... parliamone!


  • ...si può cambiare la lingua usata per l'interfacciamento dall'inglese all'italiano?

No.


  • ...ho un PC con Windows XP con Service Pack 3 e AWB non funziona!

Consulta questa sezione. Probabilmente avrai la necessità di aggiornare alla versione 2 questo componente di Windows. Poi controlla le impostazioni del firewall: se per ipotesi hai impedito l'esecuzione di AWB dovrai cercare la soluzione perché sia riclassificato fra i file sicuri. Tieni infine presente che AWB si appoggia sul browser Internet Explorer: se l'hai sradicato dal sistema operativo utilizzando uno speciale tool reperibile in Internet, allora AWB non potrà mai funzionare.


  • ...AWB purtroppo mi avvisa che non sono autorizzato al suo utilizzo!

Devi attenerti scrupolosamente alla procedura di base: prima devi caricare il file settings.xml e in Options—>Preferences—>Site nel campo Project: scrivi "wikipedia" (senza le virgolette) e in Language: scrivi "it" (senza le virgolette) e solo dopo fai il login con il tuo nome utente (o del bot) più la password. Attenzione! è sempre quello indicato l'ordine da seguire, altrimenti ottieni questo risultato. Se premi su |Ok| sei indirizzato alla pagina di servizio inglese di AWB. Infatti la lingua predefinita è proprio l'inglese ed evidentemente non hai ancora il permesso per condurre AWB su en.wikipedia.


  • ...durante un blackout del database di Wikipedia ho visto bene che AWB continuava a lavorare?!

Bisognerebbe comprendere dove e come si è manifestata la temporanea interruzione del flusso. Per esempio durante il volontario oscuramento della versione italiana nell'autunno 2011 per protesta contro il cosiddetto "Decreto ammazzablog", AWB ha avuto l'accesso aperto (lettura & scrittura) per 20 minuti oltre quello imposto ai normali browser e, in sola lettura, per tutto la durata dell'oscuramento (alcuni giorni). Questo avviene perché l'automatismo accede al database tramite un server dedicato. Per quel po' che può valere una semplice immagine ecco la situazione nelle ore pomeridiane (fuso orario CEST) del 5 luglio 2012. Vero è che a volte il malfunzionamento è a livello del server dedicato per cui è impossibile lavorare con AWB.


  • ...se mentre lavori con AWB qualcuno (per esempio io) modifica la pagina dei typos mi aspetto che essa sia subito disponibile nel "motore" di AWB

Teoricamente sì. In pratica la procedura che garantisce il corretto caricamento dell' ultima versione della pagina da te indicata, prevede la totale chiusura di tutte le copie di AWB attive su it.wikipedia.org seguito da un nuovo lancio di tutte le copie. Occorrerà un po' di tempo e pazienza perché tutti i software siano allineati all'ultima versione dei Typos... e comunque non è detto che tutti i manovratori carichino quella pagina. Alcuni dovranno svolgere specifici interventi durante i quali si sentirebbero intralciati se si dovessero occupare anche degli errori ortografici.

Espressioni logore modifica

  • ...mi pare che qui non avresti dovuto correggere "rilasciare" con "concedere". Mi sembra eccessivo e da non fare con un bot...
  • * Risposta breve:

In effetti un bot deve eseguire delle sostituzioni standard, cioè senza eccezioni di sorta. In teoria l'operatore potrebbe addirittura assentarsi dal PC dal quale opera il bot, anche se ciò non è mai consigliato. Nel caso specifico dovrebbe essere proprio come tu scrivi ma... la modifica è stata fatta dalla mia utenza ordinaria la quale non agisce come un bot. Non agendo come un bot può prendersi un po' di tempo per esaminare quale debba essere un sinonimo per evitare che in una voce ricorra in modo eccessivo lo stesso termine.

  • * Risposta lunga:

Ai miei tempi, nel Medioevo, esisteva ancora l'uso dei sinonimi. Oggigiorno lo snobismo anglomane, spacciato per innovazione e ricchezza stilistica, si espande a campi nei quali non v'è la benché minima necessità o convenienza di intendersi tramite l'impiego di un glossario tecnico anglosassone. Se qualcuno mi ha poi fatto notare che nel maggio 2012 avrei raggiunto centomila edit (ecchissenefr***) e se ciò corrispondesse a verità potrei dire qualcosa in merito ai mila e mila abusi di molti termini oramai omologati, appiattiti, cristallizzati, fossilizzati nel lessico italiese contemporaneo. La stragrande maggioranza dei termini da me osservati si possono ricondurre, in ossequio alla pigrizia mentale o a lacune scolastiche, a una pedestre traduzione o alla prima eccezione che si trova scritta nei dizionari bi-lingue.
Release è rilascio.
Ai miei remoti tempi un gas, una reazione termonucleare, uno pneumatico scoppiato, una bottiglia di spumante stappata, un profumo... emettevano, liberavano, sprigionavano, esalavano dei gas, rumori o altri accidenti. Oggi, sempre e unicamente, li rilasciano: (release). Gli Avvisi ai naviganti e il Meteomar non li si emettono, li si rilasciano (release). Un tempo la colonna di un film, un brano di un album, una versione di un software, un libro, venivano pubblicati.
Ora vengono rilasciati. Le release, appunto.
Il buffo è che per qualcuno l'adattamento al lessico italiano o addirittura la sua traduzione non esistono. La truaduzione (sic) di cover in italiano e'... cover! :P. Se non esiste la traduzione non si sa di ciò che stiamo parlando.

Avrai le mie scuse solo quando una persona fermata dalla Questura anzicché essere rilasciata, troverai da me "corretto": l'amica della portinaia, innocente, fu quasi subito pubblicata.


False correzioni modifica

  • ...mi è capitato di trovare corretto pero (sostantivo) con però (congiunzione coordinativa avversativa) vedi qui. Non potresti fare in modo che in futuro AWB non compia questa correzione?

In teoria si potrebbe fare come tu dici ma:

  1. vi sono utenze che scambiano la congiunzione col noto albero e bisogna tenerne conto;
  2. nella stessa linea vi erano altri errori (veri, come puoi verificare dal campo oggetto) e AWB in tali condizioni è restrittivo: o corregge tutto (comprese le false correzioni) o non corregge nulla su quella linea (tramite un doppio clic sulla fascia che contiene l'errore o gli errori —veri o falsi che siano).

Tuttavia si può tentare di intervenire "chirurgicamente" sul "falso positivo" con il browser integrato in AWB. La difficoltà è insita nel fatto che il server a cui AWB è connesso lascia aperta la connessione per pochi secondi dopo di che occorre ri-domandare al server il contenuto della pagina. Se si è veloci tutto dovrebbe essere salvato secondo le intenzioni, in caso contrario si perdono tutte le modifiche manuali fatte col browser integrato.
Nel caso che hai indicato non era possibile fare altrimenti e cioè ho preferito correggere *tutto* e poi in una seconda sessione di lavoro correggere manualmente. Per chi ha il flag di bot potrebbero esservi delle difficoltà operative perché l'attuale policy non prevede che la medesima utenza che si usa per le correzioni automatiche esegua delle correzioni extra a mano.


Date modifica

  • ...perché AWB sta inserendo le minuscola in anni Novanta, anni Sessanta, e toglie anni '40, anni '50 mettendo al loro posto anni quaranta, anni cinquanta...?

Perché è la regola attualmente presente (23-7-2012) nel Manuale di stile di Wikipedia nella sezione decenni.


Numeri in formato ibrido modifica

  • ...stai correggendo 18enne, 29enne, 41enne, ecc. in diciottenne, ventinovenne, ecc. Non si possono lasciarli così? Sono oltretutto anche più brevi!

No, il suffisso enne è errato perché è errato il modo usato per indicare una quantità numerica. Fra l'altro Wikipedia non è una tipografia editoriale o un magazine o la redazione di un Tiggì dove lo spazio e il tempo sono tiranni e la brevità un obbligo. Quelle che hai indicate ti informo che sono forme di scrittura errate stando alle norme legali internazionali. Trascendendo in errori: sono errate anche le forme 25nali, 25nnali, 25ennali e simili.
Quindi si deve scrivere: trentunenne e non 31enne, trentennali e non 30ennali, ecc. sempre che non siano citazioni testuali reperite al di fuori di Wikipedia e facilmente documentabili.


Se stesso modifica

  • "...se seguito da "stesso" e "medesimo" NON va accentato!

Si tratta di una regola priva di fondamento e quel che è peggio è che a molti di noi è stata presentata sui banchi scolastici come norma inderogabile. Ti invito a leggere questa sezione sull'accento distintivo sui monosillabi e anche i collegamenti esterni.

Con l'occasione ti invito a controllare meglio il contenuto del campo oggetto delle mie modifiche (eseguite con l'aiuto di AWB) perché non viene corretto il pronome "se stessa/e/o/i" ma il pronome personale riflessivo di terza persona maschile e femminile singolare e plurale preceduto da una preposizione semplice. Esempio: di, a, da, in, con, su, per, fra, tra se (al posto del corretto ) e AWB corregge solo in tale senso. Esempio: replaced: su se → su sé,; ecco comunque un esempio più esplicito dove è chiaramente visibile che né io né AWB analizziamo la presenza o l'assenza dell'accento. Nel giugno 2012 ho avuto modo di chiarire a due o tre utenti alcuni punti che qui riporto sinteticamente:

  1. Non è una banalità far comprendere ad AWB che quando incontra la sequenza di-a-da-in-con-su-per-fra-tra se stessa-e-i-o deve tralasciare una qualunque forma di aggiunta o rimozione di accento su se;
  2. Quand'anche si riuscisse a istruirlo nel modo predetto, resta il fatto che all'interno di varie voci si ha un'oscillazione fra entrambe le forme grafiche. La soluzione che di solitio si adotta è quella di uniformare la grafia. L'attuale orientamento di discreta parte dei grammatici propende per la non necessità di non accentare (vedasi link alcune righe più sopra);
  3. Vi è infine la presenza di accenti errati per cui: vi è da sostituire l'accento errato sè stess* con quello esatto: sé stess*.

In definitiva vi sarebbero da affrontare tre complicazioni per un accento... Se qualcuno ha un'idea (anche solo un abbozzo) può sempre comunicarla dal momento che personalmente trovo interessante cimentarmi in soluzioni (meglio se semplici) di nuovi problemi (meglio se non troppo complessi). Grazie.


Un buon suono intervocalico modifica

  • ...perché togli/aggiungi la "d" dopo la "A/a" e la "E/e"?

Per motivi d'eufonia. Consulta questa sezione. Se tuttavia la correzione tramite AWB avesse malauguratamente prodotto un accostamento cacofonico, ti prego di segnalarmi l'inconveniente tramite una differenza di versione scrivendo in quest'altra pagina. Grazie.


Parole di origine non italiana modifica

  • ...credo che ormai [la parola] si può considerare entrata nell'uso comune italiano. Forse non si trova ancora in tutti i dizionari, ma [omissis] per ciò non ritengo la si debba scrivere in corsivo o tra virgolette...

La regola sulla grafia dei termini di origine non italiana è leggibile in questa sezione. Un approfondimento del corsivo è invece in questa pagina.

Per l'uso del corsivo estraggo questa parte:

«Le parole appartenenti a lingue diverse dall'italiano (incluso il latino e ogni altra lingua morta che usi l'alfabeto latino) vanno sempre indicate in corsivo, escluse quelle entrate nell'uso comune italiano (ad esempio: marketing, computer, mouse) e quelle scritte in alfabeti non latini (ad esempio: Кириллица, Ελληνικό, عَرَبيْ, עִבְרִית).

Per capire in generale se una parola possa essere ritenuta italiana oppure no, basatevi sulle marche linguistiche presenti su un (buon) dizionario d'italiano, all'occorrenza anche più d'uno (ovviamente tenendo presenti le eccezioni su indicate).»

La questione consiste nello stabilire se:

  1. il termine è entrato nel lessico non specialistico quotidiano e
  2. se è comprensibile per tutti.

Considera che non è obbligatorio per un (buon) vocabolarista fare precedere studi statistici sulla penetrazione di un termine non italiano prima della compilazione di un (buon) dizionario e, d'altra parte, non possiamo farli noi o basarci su mere supposizioni su "sentito dire" o su un "mi pare". Sempre dalla policy estraggo:

«Bisogna inoltre tener presente che molte parole straniere, seppure di uso corrente, dispongono di sinonimi italiani (ad esempio "week-end" si può facilmente sostituire con "fine settimana"): usare la forma italiana evita qualunque imbarazzo di questo genere (forma del plurale e del singolare, corsivo o no ecc.), per cui è spesso la soluzione migliore anche quando la traduzione o adattamento non è molto comune (anche perché in genere a un primo incontro è comunque più comprensibile dell'originale, ed essere comprensibili anche per i "non addetti ai lavori" è particolarmente importante per un'enciclopedia come Wikipedia).»

Per dirimere concretamente la questione è opportuno stabilire prima di tutto se:

  • non ho tenuto conto che su Wikipedia esisteva la corrispondente voce "esplicativa" (a prescindere che si trovi allo stato di abbozzo o già matura)
    • in tale caso posso istruire AWB affinché aggiunga un wikilink "esplicativo" alle voci che ne sono prive.
  • Ho tenuto conto che su Wikipedia non esiste un simile termine
    • in tale caso sentiti-sentitevi libero-i di creare la voce; se essa continuerà a mancare e-o se sussistono dubbi sulla sua comprensione della popolazione italo-parlante, in tal caso è giustificato l'uso del corsivo.


  • ...ti faccio notare che Look è una voce già presente in Wikipedia e trendy è oramai entrato nella lingua italiana. Perché li inserisci in corsivo?

Il motivo è semplice. Io leggo molto (anche) Wikipedia e il termine look l'ho scoperto utilizzato in una "marea" di accezioni, di significati che vanno molto ma molto al di là del contenuto leggibile nella voce: look. Lo vedo riferito a cose, animali e persone sia nella loro interezza che nelle loro rispettive particolarità, ivi compresi gli stati d'animo e i sentimenti e nei contesti più disparati e disperati: (all’inizio i consumatori adottano un certo look (acquistano un bene). Evidentemente c'è qualcosa di indefinito e un'enciclopedia deve essere chiara quando espone i concetti. Quanti poi non conoscono l'inglese ne sapranno quanto prima leggendo look o look. Quindi ci sono due aspetti: chi ha scritto look doveva esplicitare (ma non l'ha fatto) e io non ho tempo per cercare i migliori significati di look. Altro non rimane che scriverlo in corsivo in attesa di una eliminazione dell'evasività del termine look. Idem per trendy.


Il segno # modifica

  • ...AWB sostituisce # con "numero" e "vs" con "contro": ti sei accorto che è scritto così anche sulla Wiki inglese?

I Paesi anglofoni usano quel sistema di notazione che però non è applicabile in italiano. Se spedisci una raccomandata in via Vattelapesca #154 o in: 154, via Vattelapesca, l'impiegato postale, magnanimo perché non la rifiuta, però te la correggerà con: via Vattelapesca, 154 oppure: n.154.
La policy applicata scrivendo su Wikipedia è in questa sezione dalla quale estraggo:

«Evitare l'abbreviazione di uso statunitense # (cancelletto o diesis) al posto di n. (meglio ancora sarebbe numero per esteso...»

Le uniche eccezioni sono rappresentate dalle citazioni verbatim e-o da trascrizioni di titoli di opere, di gare, di competizioni, di tornei.

Vi sono tuttavia casi nei quali colui che scrive ignora il significato del segno #.

  • ...bene. Allora ti informo che # e "vs" fanno parte del titolo!

Oltre a non essere onniscente io non sono tenuto a conoscere se ciò a cui ti riferisci è un titolo originale o una libertà linguistica. AWB, nel rispetto generale della policy qui sopra indicata, deve correggere come ha fatto. Se è come tu dici, se ne sei più che sicuro, allora devi inserire nel titolo e solo nel titolo l'apposto template predisposto per impedirne la correzione da parte di bot.


Scritture a norme SI e nomi propri modifica

  • ...ti faccio notare che qui [[link]] hai sbagliato perché hai sostituito cc con cm³ e 100Km con 100 km ma è proprio il nome del veicolo (auto, moto, ecc.), della categoria e della gara!

Sono addolorato della svista... ma non sono addentro agli eventi sportivi e non sono tenuto a conoscerli mentre siamo co-obbligati a rispettare queste norme legali.
Perciò, se sei assolutamente certo della grafia, ti prego di inserire l'apposito template per impedire che i bot correggano e che, se non lo conosci, ti comunicherò personalmente onde evitare abusi (nel presente contesto è fuori luogo).


  • ...perché invece di usare AWB per questi non lo usi per correggere i veri errori?

AWB è un software che corregge in funzione del contenuto di questa pagina, mentre il file settings.xml una volta che è stato compilato, per esempio sul contenuto di quest'altra, applica ai testi dell'enciclopedia anche le sostituzioni indicate dall'operatore. Non entro nel merito di quali siano i veri errori di cui parli dal momento che la sola presenza/assenza nei dizionari (moderni) non sempre fornisce una risposta soddisfacente, vale a dire precisa. A proposito delle delle correzioni di minore entità potresti leggere le correzioni di minore entità e se hai suggerimenti, sentiti libero di scrivermi


&nbsp; modifica

  • ...non capisco proprio la necessità che tu inserisca &nbsp; dal momento che il risultato grafico è immutato e il testo risultante in fase di editing mi confonde!

Hai le tue sacrosante ragioni (di mero carattere estetico) solo nell'ultima parte della domanda perché alcuni di noi preferiscono inserire al posto di &nbsp; il template {{TA|}}. Tale scelta mi riesce solo a mano, non con AWB. Personalmente la prediligo, a mano, solo in indicazioni abbastanza complesse come, per esempio: {{TA|15 218 218,37 m²}} invece di 15&nbsp;218&nbsp;218,37&nbsp;m². Nota: entrambe le scritture porgono lo stesso risultato e sono accettate scrivendo su Wikipedia. Hai invece semplicemente torto quando affermi che ...il risultato grafico è immutato.

Ti suggerisco di leggere Spazio unificatore, Hard space, Entità (markup), Sostituzioni periodiche (non vanno sostituiti: &nbsp;, &gt;, &lt;) e se non ti rincresce puoi fare tu stesso delle prove pratiche per toccare con mano la differenza.

Se ti può interessare, ci sarebbero sono da correggere un sacco di scritture errate. Per indicare una distanza o un tempo o quello che si vuole, ci sono utenze che, sia pure in buona fede, fanno un uso errato delle convenzioni internazionali del SI. Cinque kilometri, cinque tonnellate, cinque minuti, cinque litri, ecc. sono, a volte, così scritti: 5k/Km, 5t, 5min, 5l invece di: 5 km, 5 t, 5 min, 5 l, ecc. Sotto tali premesse l'entità &nbsp; serve anche per scindere una parte numerica erroneamente attaccata senza soluzione di continuità al suo simbolo metrologico. Poniamo ora il caso (mica tanto ipotetico) che in 5km vi sia un errore nella quantità numerica la quale debba essere sostituita con 5,17. Cerchiamo di predire il comportamento di un contribuente ignaro delle norme SI. Si presume che da 5m si passi a leggere cosi: 5,17m. L'errore permane! Pertanto ho istruito AWB in modo che trovandosi in presenza di tali errori agisca come un "deterrente" (ecco un primo esempio di errore xMHz e un secondo esempio però eseguito a mano) per evitare futuri inserimenti di scritture non a norme SI e cioè separando la parte numerica dal simbolo letterale con uno spazio vuoto (non spezzabile!) tramite &nbsp;.
Per esempio si può trovare questo genere di scritture: se, per un qualunque motivo, si dovesse aggiornare la parte numerica, il simbolo potrebbe essere mantenuto così come è: fuori dagli standard. La correzione fatta con AWB ha eliminato l'errore per sempre...

C'è infine da osservare che &nbsp; serve anche a mostrare visivamente l'effetto di più spazi vuoti consecutivi. Se per qualunque motivo fosse necessario separare due caratteri di stampa con due o più spazi vuoti con o senza l'uso di &nbsp; il risultato potrebbe essere questo:
|Squadra 1| |Squadra 2| (senza &nbsp;) (vedi il sorgente della pagina)
|Squadra 1|     |Squadra 2| (con &nbsp;).


  • ...sempre a proposito di &nbsp; spiegami questo: perché metti quell'entità in un elenco composto di righe di pochissimi caratteri?

Quando trovo le situazioni alle quali ti riferisci (e null'altro) salto a piè pari quella voce. Se dai un'occhiata alla differenza di versioni è quasi certo che il mio assistente (AWB) abbia trovato altre cose da sbrigare all'interno del testo oppure errori entrocontenuti proprio nelle righe brevi Ghz->GHz. Se il numero delle brevissime righe da spuntare che contengono &nbsp; eccede un certo quantitativo a me occorre un po' di tempo per deselezionarle a mano e così scade anche il tempo entro il quale il server attende una risposta da AWB. Quando il server comunica che AWB è fuori tempo, il risultato è che perdo tutto il lavoro fatto fino a quel punto su quella voce! Quindi, delle due l'una: o correggo tutto compreso gli errori ortografici, i refusi, la formattazione, ecc. oppure ignoro tutto. Cosa mi suggerite?


  • ...ho visto che hai annullato la mia modifica: mi spieghi perché i punti fra le migliaia non vanno bene?

L'ho annullata perché tu reinserendo il punto hai peggiorato la situazione nel rispetto delle più volte ricordate norme internazionali SI. Leggi: Separatore decimale e Aiuto:Manuale_di_stile#Numeri. Se invece al posto di &nbsp; ti va di inserire il template {{TA|5 000 000}}, ben venga e... grazie!

<br /> et <small> </small> modifica

  • ...perché togli <br /> e <small> </small>?

AWB, pur nei suoi limiti, si attiene all'usabilità del web. Quando incontra quel tag all'interno delle note e nelle didascalie li rimuove perché il carattere diventa troppo piccolo per essere di facile lettura. A volte è necessario che qualcuno (io) lo forzi a rimuovere anche all'interno del testo in quanto il suo impiego non è giustificato. Invece <small> non lo si rimuove dai template perché il suo uso è stato oggetto di un consenso comunitario.<br />

Per la rimozione di <br /> dai un'occhiata al termine del paragrafo qui sopra. Qualcuno ha richiesto di andare a capo e, a seguire, una interruzione di linea. È decisamente superfluo.



(proseguirà...)

Dedicato a... modifica

  • tutti coloro che dicono che AWB confonde chi va a modificare la voce;
  • tutti coloro che dicono che AWB non è/sarebbe in grado di correggere soddisfacentemente nel rispetto delle norme internazionali SI. Per inciso: è un caso di media difficoltà: si noti, fra gli altri errori, un errato inserimento di punti "." dopo i simboli e relativa eliminazione previa scrittura di regoletta in Normal settings. Infatti (e purtroppo) non è un errore isolato...

modifica

  1. Attenzione! Quando si parla di "voci" si intende sempre "lista di titoli di voci" non lista di contenuti! Se per esempio oggi compilo una lista e fra X giorni la ricarico in memoria, il contenuto che andrò a correggere è quello in essere alla data dell'operazione di correzione degli errori.
  2. Se non diversamente indicato la funzione utilizzata per la generazione delle liste in tabella è: Source:Random pages.
    Dall'8 aprile 2012 ho iniziato a inserire nel mio file settings.xml alcuni errori di spaziatura fra le parole terminanti e inizianti con le vocali e separate da una virgola senza spazio a seguire (errore comune). Esempio: a,a —> a, a —— i,e —> i, e[22].
  3. Se non diversamente indicato, AWB corregge gli errori caricando in memoria la pagina dei Typos più il contenuto del file settings.xml.
  4. Alle liste generate con la funzione Wiki search: AWB applica nelle pagine visitate alcune correzioni aggiuntive al termine errato cercato. Infatti AWB l'ho configurato per scoprire il numero più elevato di errori e non un unico termine errato.
  5. Dal 15 aprile 2012  00:00:00 CEST al 19 aprile 2012  23:59:60 CEST era attiva la sostituzione: Ad un(a), ad un(a) --> A un(a), a un(a).
  6. Dal 16 giugno 2012  15:00 CEST è attiva la sostituzione sperimentale di 2—3—4 spazi vuoti fra le parole a favore di un solo spazio.
  7. Per le liste generate con la funzione Source:New pages sarebbe auspicabile che gli utenti interessati coordinassero (magari in una pagina all'uopo destinata) le rispettive operazioni al fine di evitare inutili sovrapposizioni. Nel presente contesto che mira a quantificare percentualmente gli errori, può rivelarsi utile specificare, oltre la data, l'orario di formazione della lista come da tabella sottostante.
  8. AWB dovrebbe essere in grado di elaborare una lista composta da un massimo di 25 000 voci[senza fonte]. [23][24][25]


Il colore delle celle indica alcune specifiche funzioni di ricerca usate da AWB.


Nuove pagine —> (numero massimo di voci: 500)

Ricerca Wiki (per testo oppure per titolo) —> filtrabile per namespace(s)

Ricerca casuale (random pages) —> numero minimo di voci: 10

Ricerca per Categoria —> fissabile il limite del livello di profondità

Contributi di un utente —> filtrabili per namespace(s)


Progr.vo Data di calendario Liste Voci in lista (A) Voci con errori (B) % (B ÷ A) × 100 Annotazioni
1 3 aprile 2012 1 2 000 235 11,75
2 4 aprile 2012 1 200 20 10
3 4 aprile 2012 1 200 20 10
4 4 aprile 2012 1 500 54 10,8
5 5 aprile 2012 1 800 93 11,625
6 6 aprile 2012 1 1 200 152 12,667
7 7 aprile 2012 14:50 CEST 1 500 59 11,8 Source:New pages
8 7 aprile 2012 1 500 59 11,8
9 8 aprile 2012 1 933 183 19,614 Category:Correggere (RecursionDepth:5)
10 8 aprile 2012 1 700 81 11,571
11 9 aprile 2012 1 1 600 195 12,188
12 10 aprile 2012 1 119 68 57,143 Category:Passi e valichi della Svizzera (RecursionDepth:5)
13 11 aprile 2012 14:30 CEST 1 500 101 20,2 Source:New pages
14 11 aprile 2012 1 500 60 12 ora file: 19:33 CEST
15 12 aprile 2012 1 1 500 175 11,667
15 15 aprile 2012 1 1 200 196 16,25 ADD:flashback->flashback; ENABLED:ad un Ad un REPLACED:d cacofonica dove occorre
17 16 aprile 2012 1 1 200 230 19,167
18 17 aprile 2012 14:26 CEST 1 500 114 22,8 Source:New pages
19 18 aprile 2012 1 582 206 35,395 Wiki search:albums (truncated list)
20 19 aprile 2012 1 1 050 175 16,667
21 20 aprile 2012 1 1 050 196 18,667 DISABLED:ad un Ad un
22 21 aprile 2012 11:38 CEST 1 500 78 15,6 Source:New pages
23 21 aprile 2012 1 466 92 19,742 Category:Videogiochi_sportivi (RecursionDepth:6)
24 22 aprile 2012 1 1 500 176 11,733
25 23 aprile 2012 1 2 510 334 13,307
26 24 aprile 2012 1 900 110 12,222
27 26 aprile 2012 1 20 18 90 Wiki search:connubbi[26].
28 26 aprile 2012 1 265 118 44,528 Wiki search:perchè
29 27 aprile 2012 13:37 CEST 1 500 92 18,4 Source:New pages
30 30 aprile 2012 1 4 952 1 283 25,909 Category:Categorie_per_personalità (RecursionDepth:6)
31 1 maggio 2012 1 1 300 240 18,462
32 2 maggio 2012 1 7 552 188 2,489 Category:Aiuto
33 2 maggio 2012 1 800 132 16,5
34 4 maggio 2012 1 1 000 177 17,7
35 4 maggio 2012 16:25 CEST 1 500 61 12,2 Source:New pages
36 6 maggio 2012 1 2 386 599 25,105 Category:Etica (RecursionDepth:5), (2386 of 3454 articles)
37 7 maggio 2012 1 1 600 251 15,688
38 8 maggio 2012 >10 1 257 183 14,558
39 10 maggio 2012 1 1 000 150 15
40 11 maggio 2012 17:09 CEST 1 500 71 14,2 Source:New pages
41 14 maggio 2012 1 170 89 46,471 Wiki search:22enne
42 17 maggio 2012 1 1 300 213 16,385
43 22 maggio 2012 13:33 CEST 1 500 82 16,4 Source:New pages
44 25 maggio 2012 1 1 200 139 11,583
45 2 giugno 2012 1 1 300 183 14,077
46 6 giugno 2012 1 267 144 53,933 Category:Cellulari Nokia (RecursionDepth:4)
In massima prevalenza scritture non a norme legali. Non ho corretto i punti usati in modo errato come separatori decimali.
47 7 giugno 2012 1 1 500 177 11,8
48 9 giugno 2012 >10 870 100 11,494
49 11 giugno 2012 11:33 CEST 1 500 78 15,6 Source:New pages
50 16 giugno 2012 1 1 200 234 19,5 Compresa parziale sostituzione spazi vuoti ripetuti con 1 spazio singolo
51 18 giugno 2012 >10 371 100 26,954 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
52 20 giugno 2012 >10 600 150 25 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
53 25 giugno 2012 >10 681 184 27,019 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
54 29 giugno 2012 >10 556 144 25,899 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
55 2 luglio 2012 11:09 CEST 1 500 105 21 Source:New pages
56 7 luglio 2012 >10 590 130 22,034 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
57 10 luglio 2012 1 837 207 24,731 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
58 11 luglio 2012 >10 504 180 35,714 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
59 19 luglio 2012 1 1 186 580 48,904 Category:Montagne delle Alpi (RecursionDepth:6) (Truncated list)
60 13 agosto 2012 1 700 127 18,143 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
61 1 settembre 2012 6 600 99 16,5 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
62 4 settembre 2012 2 600 122 20,333 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
63 8 settembre 2012 15:00 CEST 1 500 86 17,2 Source:New pages
64 22 settembre 2012 11:28 CEST 1 500 106 21,2 Source:New pages
65 25 settembre 2012 2 550 97 17,636 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
66 26 settembre 2012 1 500 101 20,2 Compresa sostituzione spazi vuoti ripetuti con 1 spazio singolo
67 3 ottobre 2012 9:16 CEST 1 500 78 15,6 Source:New pages
68 14 ottobre 2012 14:47 CEST 1 500 63 12,6 Source:New pages. Circa 243 voci create da Gacbot prive di errori
69 26 ottobre 2012 1 340 150 44,118 User contribs:Eumolpo.
Utente molto attivo nelle correzioni ortografiche.
70 25 marzo 2013 1 1 050 250 23,810
71 26 marzo 2013 1 100 31 31
72 12 aprile 2013 14:34 CEST 1 500 100 25 Source:New pages
73 16 apr 2013 1 401 171 42,643 Wiki search:Istituto geografico militare (truncated list: 401 of 1000)
74 4 set 2013 4 600 130 21,667
75 17 set 2013 1 272 130 47,794 Wiki search:T.A.T.u (truncated list)
76 13 nov 2013 4 600 108 18 [1 50] [1 100] [1 150] [1 300]
77 19 nov 2013 3 700 137 19,571 [1 100] [1 100] [1 500]
78 21 nov 2013 1 699 520 74,392 Category:Contee degli Stati Uniti d'America. (RecursionDepth:6) (Truncated list)
Da: stato/i a: Stato/i
79 8 dic 2013 1 300 92 30,667 Wiki search:22enne
80 29 gen 2015 4 400 61 15,25 [1 100] [1 100] [1 100] [1 100]
81 7 feb 2015 1 500 62 12,4
82 12 feb 2015 3 450 63 14 [1 150] [1 150] [1 150]
83 14 mar 2015 1 500 91 18,2
84 26 ago 2015 1 500 69 13,8
riga85 ?
riga86 ?


(proseguirà...)

Note modifica

  1. ^ Ultime 1 400 modifiche nella pagina di servizio per l'elaborazione degli errori e il contributo delle utenze partecipanti.
  2. ^ Contributi eseguiti con AWB dal luglio 2010 alla data indicata dagli indici nello screenshot
  3. ^ Caratteristiche delle varie versioni in ordine di uscita. Il 4 settembre 2012 è uscita la versione 5.4.0.0 sensibilmente migliorata rispetto alle precedenti
  4. ^ Una lista contiene, nel presente test, unicamente i soli titoli delle voci formattati, prive dei contenuti i quali vengono caricati in memoria ed elaborati quando in AWB si preme Start.
  5. ^ Sebbene l'attuale file setting.xml contenga tutte le mie regex e i miei Find and replace ricordo che i Typos della pagina di servizio caricati in automatico non sono selezionabili singolarmente (all'aprile 2012 ammontavano a 119 sulla pagina apposita di Wikipedia italiana e a circa 280 nell'agosto 2012). AWB è perciò un automatismo ad ampio spettro di correzione (a meno di non disabilitare i Typos "esterni" e operare con il solo Find and replace "interno" di minime dimensioni)
  6. ^ Le correzioni effettivamente salvate sono state 235
  7. ^ Nella attuale configurazione e in un paio d'anni di uso non ho mai esperito il crash di AWB
  8. ^ Come "caso limite" mi riferisco alle pagine in NS:0 (giacché il test è circoscritto a questo namespace) che non sono inserite fra gli osservati speciali di nessun utente
  9. ^ Le altre raccolte di errori sono contenute di default nei file di AWB (in specialissimo modo quelli attinenti alla wiki-formattazione ma non modificabili dall'operatore) e nella pagina dei Typos. Quando AWB attinge a quella pagina scrive nel campo oggetto delle modifiche: , typos fixed:...
  10. ^ esempi fra i tanti: locuzione "fin da subito" e il punto di vista del prof. Giovanni Nencioni a proposito se si dica terapeuta o terapista?. Non è sufficientemente chiaro cosa abbia da spartire la nascita di una professione con l'etimologia preesistente della parola sulla quale la professione si innesta.
  11. ^ Accademia della Crusca: D eufonica
  12. ^ Sulla D eufonica su Wikipedia
  13. ^ Ma attenzione a non esagerare: se si parla di triangoli sarebbe inutile e ridicolo sostituire qua e là con: figura a tre lati/angoli...
  14. ^ mi riferisco alla versione specializzata messa in opera per essere utilizzata dai dispositivi mobili
  15. ^ I link esplicativi che, all'interno di una voce, non puntano ad altre voci già presenti su Wikipedia sono in numero talmente elevato da far propendere che coloro che hanno redatto le voci davano per scontato che il termine, nell'eccezione usata, fosse non solo presente in tutti i dizionari inglesi (mica parlo degli italiani nei quali il termine è presente per necessità editoriali), ma fosse entrato nell'uso comune di tutti gli italoparlanti e perciò perfettamente comprensibile. È impossibile elencare tutti i tecnicismi di cui sono infiorettate le voci di sport, musica, spettacolo, tanto per citare quelle fra le più bombardate. In un mio dizionario di inglese (in edizione maggiore di una notissima casa editrice) cheerleader è solo ed esclusivamente quella persona che nei palcoscenici televisivi è incaricata di dare la stura agli applausi. Le cheerleader(s) credevo fossero le "ragazze pon pon" ma qualcuno mi ha fatto notare che non è così... Reunion si traduce con "riunione" (meno male) ma cover oltre che significare "reinterpretazione" assume anche il significato di "custodia, copertina, astuccio" e finalmente mi si dice nella mia pagina utente di non tradurre con reinterpretazione perché cover è voce entrata nell'uso comune. Alla faccia di chi ha scritto la voce cover dove per tre volte si trova il termine "reinterpretazione". Coverizzare sa di studi trascendentali. Vocalist non si traduce con "cantante" perché esegue particolari melodie che lo differenziano (e quali, di grazia, se il redattore ha omesso nel wikitesto italiano la corrispondente aggettivazione inglese?); headliner non si sa cosa sia per cui AWB sa che deve virgolettarlo; la chart è la "classifica", la hit è il "successo", un sold out è un "tutto esaurito", il guitarist è il "chitarrista" l'orgia di diesis (#) non sono delle alterazioni musicali ma significa "numero" (di tipo cardinale) e così via ad libitum oltre ogni dire.
  16. ^ Mi sono accorto che vi sono utenze che passano il loro tempo a infarcire i testi con "wikilink" verso voci dell'enciclopedia prive di un chiaro nesso logico con l'argomento trattato. Non è detto, non mi pare proprio che il melius abundare quam deficere sia sempre una regola razionale. Una pagina con testo bi-colore (nero e blu) non è il massimo per l'occhio.
  17. ^ La "modalità automatica" consiste nel predisporre AWB in modo che esegua un predeterminato compito (es.: elaborazione di una lista di voci) senza che l'operatore compia "in tempo reale" alcun controllo o azione, affidando l'intero lavoro alla capacità del robot.
  18. ^ Fatti salvi i casi di disattenzione dell'operatore, di imperfetta regex, non ho mai esperito alcun bug del software.
  19. ^ AWB si appoggia sul motore di Internet explorer
  20. ^ Edit throttle and peak hours. L'articolo parla di limiti per i bot in funzione dell'orario di impiego.
  21. ^ Immagine esplicativa
  22. ^ Sezione "spazi nel Manuale di stile
  23. ^ Attualmente (11 aprile 2012) non posso dimostrare che il valore massimo sia quello indicato in quanto non è riportato nel manuale tecnico. AWB si rifiuta di formare liste contenti oltre 25 000 voci: si veda l'immagine in quanto ho all'attivo un numero di pagine editate una sola volta di molto superiore alle 25 000 voci.
  24. ^ Un altro esempio che avvalorererebbe il limite massimo di 25 000 voci è la richiesta di una lista sorgente da Special Pages si veda l'immagine dello screenshot.
  25. ^ Avviando la ricerca per la Categoria:Letteratura_per_lingua la lista che si ottiene è composta da 30 507 elementi: una volta richiesto di elencare solo le voci in NS:0 presenti all'interno della lista, queste assommavano a poco più di 19 000
  26. ^ La ricerca manuale di connubbi dava venti voci. Due sono state ignorate da AWB perché il termine era all'interno del template "Quote" e nell'altro caso l'errore era racchiuso fra le virgolette "connubbio". Se avessi impostato AWB in modalità da scandagliare all'interno delle citazioni, delle note in references ecc. avrei sì trovato tutte le occorrenze di "connubbi*" ma anche ottenuto dei falsi positivi per rimediare ai quali avrei dovuto deselezionarli a mano con conseguente lavoro aggiuntivo (e spreco di tempo). Punteggio di AWB: 18/20.

Voci correlate modifica

Archivo della lista di lavoro

Assolutamente sì

Bot-like editing

Controllo ortografico

Categoria:Correggere

Categoria:Template di ausilio ai bot

Correggi solo i collegamenti a redirect inutili

Filmo (Plugin dell'utente B3t per AWB)

Funzioni parser

Leggi e provvedimenti legislativi   (Si noti la mancanza di uno spazio dopo il punto.)

Manuale di stile di Wikipedia in lingua italiana

Overlinking giorni e mesi dell'anno (Come è facile comprendere è una raccomandazione contro l'esubero dei collegamenti interni)

Speciale:FiltroAntiAbusi

Team OTRS-Bot (Bot per soli compiti speciali)

Terminologia del wrestling

Ultime modifiche ai filtri

Una voce a caso

Utente:CommonsDelinker

Collegamenti esterni modifica

Documentazione attinente al primo test eseguito modifica

Lingua e informatica modifica

Lingua parlata e lingua scritta modifica

Linguistica modifica

Luciano Canepari modifica

Canepari MFo modifica

  • Luciano Canepari, Italia (PDF), in MFo. Manuale di fonetica, Muenchen, Lincom, 2003. URL consultato il 13 agosto 2012.

Canepari Avviamento alla fonetica modifica

  • Luciano Canepari, Avviamento alla fonetica italiana, Torino, Einaudi, 2006, pp 119-128.

Canepari MaPI modifica

  • Luciano Canepari, MaPI. Manuale di pronuncia italiana, 2ª ed., Bologna, Zanichelli, 1999.

Canepari Web modifica

Altri modifica