Utente:AushulzBot/Python/6

Correzioni maiuscole modifica

  • PROBLEMA DA RISOLVERE: le iniziali non vanno corrette se si trovano all'interno di [[Immagine:...]], [[Image:...]] o [[File:...]] oppure se è presente |Immagine= e negli altri casi in cui c'è un .png o .svg o .jpg o simili
  • Forse "cesare" va anche minuscolo (nel senso di nomina politica)
  • C'è stato un blocco. Forse bisogna inserire -sleep:0.002

Questo script inserisce la maiuscola iniziale nelle parole che ne hanno bisogno.

Prima di aggiungere un nome alla lista, controllare che questo non sia presente nella lista di termini da non includere a fine di questa pagina.

Il codice sottostante (in python) va aggiunto al codice del file fixes.py Quindi si digita:

replace.py -log -start:! -namespace:0 -fix:minuscole

Le correzioni effettuate riguardano la correzione dei termini che in italiano vanno in minuscolo.

fixes = {
'minuscole': {
        'regex': True,
        'msg': {
               'it':u'[[Wikipedia:Bot/Sostituzioni|Sostituzioni standard]]: correzione minuscole'
              },
        'replacements': [

                (u'(\s)abramo(\s)', ur'\1Abramo '),
                (u'(\s)achille(\s)', ur'\1Achille '),
                (u'(\s)adamo(\s)', ur'\1Adamo '),
                (u'(\s)adelaide(\s)', ur'\1Adelaide '),
                (u'(\s)adele(\s)', ur'\1Adele '),
                (u'(\s)adrian(a|o)(\s)', ur'\1Adrian\2 '),
                (u'(\s)agnese(\s)', ur'\1Agnese '),
                (u'(\s)agostin(a|o)(\s)', ur'\1Agostin(a|o) '),
                (u'(\s)aiace(\s)', ur'\1Aiace '),
                (u'(\s)albano(\s)', ur'\1Albano '),
                (u'(\s)ald(a|o)(\s)', ur'\1Ald(a|o) '),
                (u'(\s)aleandro(\s)', ur'\1Aleandro '),
                (u'(\s)alessandr(a|o)(\s)', ur'\1Alessandr\2 '),
                (u'(\s)alessi(a|o)(\s)', ur'\1Alessi\2 '),
                (u'(\s)alfio(\s)', ur'\1Alfio '),
                (u'(\s)alfonso(\s)', ur'\1Alfonso '),
                (u'(\s)alfredo(\s)', ur'\1Alfredo '),
                (u'(\s)alida(\s)', ur'\1Alida '),
                (u'(\s)altiero(\s)', ur'\1Altiero '),
                (u'(\s)amalia(\s)', ur'\1Amalia '),
                (u'(\s)ambrogio(\s)', ur'\1Ambrogio '),
                (u'(\s)amedeo(\s)', ur'\1Amedeo '),
                (u'(\s)amerigo(\s)', ur'\1Amerigo '),
                (u'(\s)amilcare(\s)', ur'\1Amilcare '),
                (u'(\s)anacleto(\s)', ur'\1Anacleto '),
                (u'(\s)anastasia(\s)', ur'\1Anastasia '),
                (u'(\s)andrea(\s)', ur'\1Andrea '),
                (u'(\s)aniceto(\s)', ur'\1Aniceto '),
                (u'(\s)annabella(\s)', ur'\1Annabella '),
                (u'(\s)annibale(\s)', ur'\1Annibale '),
                (u'(\s)anselmo(\s)', ur'\1Anselmo '),
                (u'(\s)antonell(a|o)(\s)', ur'\1Antonell\2 '),
                (u'(\s)antoni(a|o)(\s)', ur'\1Antoni\2 '),
                (u'(\s)antonin(a|o)(\s)', ur'\1Antonin\2 '),
                (u'(\s)apollo(\s)', ur'\1Apollo '),
                (u'(\s)apolloni(a|o)(\s)', ur'\1Apolloni\2 '),
                (u'(\s)archimede(\s)', ur'\1Archimede '),
                (u'(\s)arianna(\s)', ur'\1Arianna '),
                (u'(\s)arcibaldo(\s)', ur'\1Arcibaldo '),
                (u'(\s)aristotele(\s)', ur'\1Aristotele '),
                (u'(\s)arcibaldo(\s)', ur'\1Arcibaldo '),
                (u'(\s)arnoldo(\s)', ur'\1Arnoldo '),
                (u'(\s)aronne(\s)', ur'\1Aronne '),
                (u'(\s)arsenio(\s)', ur'\1Arsenio '),
                (u'(\s)arturo(\s)', ur'\1Arturo '),
                (u'(\s)ascanio(\s)', ur'\1Ascanio '),
                (u'(\s)asdrubale(\s)', ur'\1Asdrubale '),
                (u'(\s)asia(\s)', ur'\1Asia '),
                (u'(\s)attilio(\s)', ur'\1Attilio '),
                (u'(\s)augusto(\s)', ur'\1Augusto '),
                (u'(\s)aureliano(\s)', ur'\1Aureliano '),
                (u'(\s)aureli(a|o)(\s)', ur'\1Aureli\2 '),
                (u'(\s)austria(\s)', ur'\1Austria '),
                (u'(\s)australia(\s)', ur'\2Australia '),
                (u'(\s)azeglio(\s)', ur'\1Azeglio '),
                (u'(\s)baldassarre(\s)', ur'\1Baldassarre '),
                (u'(\s)barnaba(\s)', ur'\1Barnaba '),
                (u'(\s)bartolo(\s)', ur'\1Bartolo '),
                (u'(\s)bartolome(a|o)(\s)', ur'\1Bartolome\2 '),
                (u'(\s)beatrice(\s)', ur'\1Beatrice '),
                (u'(\s)belgio(\s)', ur'\1Belgio '),
                (u'(\s)benito(\s)', ur'\1Benito '),
                (u'(\s)berardo(\s)', ur'\1Berardo '),
                (u'(\s)berenice(\s)', ur'\1Berenice '),
                (u'(\s)bernardo(\s)', ur'\1Bernardo '),
                (u'(\s)biagio(\s)', ur'\1Biagio '),
                (u'(\s)bonifacio(\s)', ur'\1Bonifacio '),
                (u'(\s)boris(\s)', ur'\1Boris '),
                (u'(\s)brasile(\s)', ur'\1Brasile '),
                (u'(\s)brigitta(\s)', ur'\1Brigitta '),
                (u'(\s)celsius(\s)', ur'\1Celsius '),
                (u'(\s)cesare(\s)', ur'\1Cesare '),
                (u'(\s)cinzia(\s)', ur'\1Cinzia '),
                (u'(\s)costantino(\s)', ur'\1Costantino '),
                (u'(\s)daniel(a|e)(\s)', ur'\1Daniel\2 '),
                (u'(\s)davide(\s)', ur'\1Davide '),
                (u'(\s)eleonora(\s)', ur'\1Eleonora '),
                (u'(\s)elisa(\s)', ur'\1Elisa '),
                (u'(\s)elisabetta(\s)', ur'\1Elisabetta '),
                (u'(\s)emanuele(\s)', ur'\1Emanuele '),
                (u'(\s)emili(a|o)(\s)', ur'\1Emili\2 '),
                (u'(\s)enric(a|o)(\s)', ur'\1Enric\2 '),
                (u'(\s)fahrenheit(\s)', ur'\1Fahrenheit '),
                (u'(\s)ferdinando(\s)', ur'\1Ferdinando '),
                (u'(\s)francesc(a|o)(\s)', ur'\1Francesc\2 '),
                (u'(\s)francia(\s)', ur'\1Francia '),
                (u'(\s)gennaro(\s)', ur'\1Gennaro '),
                (u'(\s)germania(\s)', ur'\1Germania '),
                (u'(\s)girolamo(\s)', ur'\1Girolamo '),
                (u'(\s)giusepp(a|e)(\s)', ur'\1Giusepp\2 '),
                (u'(\s)grecia(\s)', ur'\1Grecia '),
                (u'(\s)india(\s)', ur'\1India '),
                (u'(\s)inghilterra(\s)', ur'\1Inghilterra '),
                (u'(\s)italia(\s)', ur'\1Italia '),
                (u'(\s)jessica(\s)', ur'\1Jessica '),
                (u'(\s)lussemburgo(\s)', ur'\1Lussemburgo '),
                (u'(\s)marcell(a|o)(\s)', ur'\1Marcell\2 '),
                (u'(\s)marianna(\s)', ur'\1Marianna '),
                (u'(\s)maurizio(\s)', ur'\1Maurizio '),
                (u'(\s)mirella(\s)', ur'\1Mirella '),
                (u'(\s)mongolia(\s)', ur'\1Mongolia '),
                (u'(\s)napoleone(\s)', ur'\1Napoleone '),
                (u'(\s)pier(a|o)(\s)', ur'\1Pier\2 '),
                (u'(\s)pietro(\s)', ur'\1Pietro '),
                (u'(\s)rodrigo(\s)', ur'\1Rodrigo '),
                (u'(\s)romolo(\s)', ur'\1Romolo '),
                (u'(\s)romualdo(\s)', ur'\1Romualdo '),
                (u'(\s)susanna(\s)', ur'\1Susanna '),
                (u'(\s)vanessa(\s)', ur'\1Vanessa '),

        ]
    },

Termini da non includere modifica

Qui di seguito sono scritti i nomi da non includere nello script, perché possono andare sia in maiuscolo sia in minuscolo, a seconda del loro significato:

  • Addolorata: nome proprio di persona ma anche aggettivo
  • Agata: nome di persona ma anche nome di un minerale
  • Alba: nome di persona e di cosa
  • Albino/a : nome di persona e aggettivo
  • Alice: nome di persona e di animale
  • Amanda: nome di persona e di animale (Amanda armata), ma anche parola latina, che può essere presente in qualche citazione
  • Ambra: nome di persona e di minerale
  • Amelia: nome di persona e malformazione dell'anca
  • Angelo/a: nome di persona e di essere soprannaturale
  • Anna: nome di persona e antica unità monetaria indiana
  • Annunziata: nome di persona e aggettivo
  • Armando: nome di persona e verbo (gerundio presente di "armare")
  • Assunta: nome di persona e aggettivo
  • Aurora: nome di persona e di cosa
  • Ausiliatrice: nome di persona e aggettivo
  • Barbara: nome di persona e aggettivo
  • Battista: nome di persona e seguace del battismo
  • Benedetta/o: nome di persona e aggettivo
  • Beniamino: nome di persona e nome comune
  • Bianca: nome di persona e aggettivo
  • Bruno: nome di persona e aggettivo

Termini ancora da inserire nello script modifica

  • Nomi propri di persona: C-Z
  • Nomi di nazioni: A-Z
  • Nomi di città: A-Z
  • Nomi di regioni (anche non italiane): A-Z
  • Nomi di isole e penisole: A-Z
  • Nomi di mari: A-Z
  • Nomi di laghi: A-Z
  • Nomi di fiumi: A-Z
  • Nomi di monti: A-Z
  • Cognomi famosi: A-Z
  • Nomi di divinità: A-Z