Utente:Marco27Bot/refLinks.py

Da chi è usato questo scriptModifica

Qui su it.wiki, lo script è utilizzato da Marco27Bot, quindi per ogni genere di informazioni puoi contattare il suo manovratore. Il codice sorgente dello script è reperibile nel repository di pywikibot.

Cosa fa questo script?Modifica

Lo script dà un titolo ai collegamenti esterni senza titolo nelle note.

Alcuni esempi del suo funzionamento: [2], [3], [4] e [5].

FunzionamentoModifica

Note come queste:

  • <ref>[http://www.google.it]</ref>[1]
  • <ref>http://www.google.it</ref>[2]

sono convertite in:

  • <ref>[http://www.google.it Google<!-- Titolo generato automaticamente -->]</ref>[3]

e il risultato è:

  • Il titolo utilizzato come titolo del link è il titolo HTML della pagina linkata (preso dal tag <title>).
  • Gli a capo vengono convertiti in singoli spazi per evitare lunghi titoli. Gli spazi in eccesso vengono eliminati.
  • Quando i contenuti non sono di tipo text/html (quindi immagini, audio, .doc, ...), lo script non riesce a dare un titolo al documento, così lo sostituisce semplicemente con l'indirizzo del link.
  • I titoli lunghi sono troncati automaticamente a 250 caratteri. Quando questo avviene, nella parte finale del titolo compare "...".

Come posso fermare il bot mentre esegue questo script?Modifica

Se c'è la necessità di fermare il bot durante l'esecuzione di questo script, basta modificare semplicemente questa pagina. Il bot, che controlla quella pagina ogni circa 10 modifiche, si fermerà entro breve.

CaratteristicheModifica

  • Legge i titoli dai file PDF
  • Se trova un link non attivo, lo marca con il template {{Collegamento interrotto}}; lo si potrà cercare nell'Internet Archive, vedi mw:Archived Pages.
  • Se nella pagina non è presente <references/> o {{References}}, aggiunge <references/>.
  • Quando sono presenti note con lo stesso contenuto, viene mantenuta solo la prima e alle altre viene aggiunto un refname.

Tuttavia, alcuni link non possono essere modificati dallo script. Questo può avvenire quando:

  • La pagina linkata non ha titolo nel suo codice HTML
  • Il sito si trova in blacklist
    • Blacklist dei titoli : Lo script esclude automaticamente alcune parole, come "Accedi", "Registrati", "Login", "Pagina non trovata", ecc....