Wikipedia:Bar/Discussioni/Archivio del giornale La Stampa e problemi con i link agli articoli


Archivio del giornale La Stampa e problemi con i link agli articoli		NAVIGAZIONE

Indice

Settimana

Giorno

Immagino che lo sappiate, ma il quotidiano La Stampa mette a disposizione un archivio storico a partire dal 1867, che può essere un'ottima fonte per le voci dell'enciclopedia. Il problema è che purtroppo i link agli articoli, apparentemente funzionanti all'atto dell'immissione su Wikipedia, in seguito cessano di funzionare e rimandano ad una pagina bianca. Ad esempio cliccate qui aprendo in un'altra scheda del browser: mentre io ora vedo correttamente l'articolo, voi non dovreste vedere nulla. L'arcano è presto spiegato: c'è un bug nel programma di visualizzazione e per accedere ad un articolo bisogna passare prima dalla pagina di ricerca (questa) almeno una volta, poi magicamente tutti i link cominciano a funzionare. Ritengo che la cosa abbia a che vedere con le "sessioni" del protocollo, ma non ho approfondito.

Fate ora la prova: cliccate sulla pagina di ricerca (sempre usando un'altra scheda del browser) poi ricliccate sul link che prima non vedevate e vedrete che adesso funziona e continuerà a funzionare insieme a tutti gli altri link agli articoli del giornale fino a che non chiuderete il browser.

Ovviamente una volta conosciuto il trucco è semplice per chiunque leggere gli articoli de La Stampa eventualmente linkati ad una voce, ma capirete che è piuttosto scomodo. Ed ecco perché ho aperto la discussione al bar (è la prima volta, portate pazienza). Ci ho pensato un po' su ed ho escogitato questo "hack":

<html>
<head>
<script language="javascript" type="text/javascript">
function redirect() {
	setTimeout("window.location.href='" + location.search.substr(1) + "'", 1000);
}
</script>
</head>
<body>
<object style="border:0px" 
data="http://www.archiviolastampa.it/component/option,com_lastampa/task,ricerche" 
type="text/html" width="1" height="1" onload="redirect()">
</object>
<div style="text-align:center"><h1>Attendere...</h1></div>
</body>
</html>

Credo che chi conosce un po' di HTML e di Javascript avrà già capito: in parole povere il trucco sta in una pagnna HTML che apre di nascosto la pagina della ricerca della Stampa e dopo un istante reindirizza al link desiderato. Per vederla in funzione cliccate qui, dovreste vedere comparire dopo qualche istante l'articolo del giornale, e la cosa dovrebbe funzionare sempre, anche se chiuderete e riaprirete il browser. A questo punto però mi chiedo se sia possibile trasformare tutto questo in un template contenuto interamente su Wikipedia perché è impossibile pensare di appoggiarsi ad un sito esterno (il mio) come ho fatto nell'esempio. Spero di essermi spiegato bene (le cose da dire erano parecchie) e spero anche che si possa fare qualcosa, perché altrimenti i link all'archivio del giornale La Stampa sono quasi inutilizzabili. -- Lepido (msg) 23:18, 23 giu 2011 (CEST)[rispondi]

personalmente eviterei questi "trucchetti". non basta citare in maniera completa le informazioni sull'articolo de La Stampa (data, titolo, autore, ...) e aggiungere "disponibile nell'archivio online" o qualcosa di simile? da lì il lettore potrà usufruirne senza dover impazzire dietro javascript (che nelle versioni stampate non funzionano :) ) o nel caso un domani il giornale decida di cambiare metodo di accesso al proprio archivio... --vale pert 23:26, 23 giu 2011 (CEST)[rispondi]

io uso entrambe le soluzioni, link e la testata da cui ho preso la notizia, data e numero di pagina.. 93.56.25.106 (msg) 23:30, 23 giu 2011 (CEST) Ps: comunque bisognerebbe "affrettarsi" a prendere le notizie, sull'emeroteca del Coni le pagine del Corriere dello Sport o del littoriale sono in molti casi sparite..[rispondi]

Be' il rischio che un domani cambi il metodo di accesso ad una pagina è sempre in agguato e se avessimo paura di questo non potremmo linkare più nessuna pagina di siti esterni. È ovvio che utilizzando il {{Cita web}} correttamente compilato, ci sarebbero meno problemi, perché gli estremi per reperire la fonte (giorno, mese, anno, pagina ecc.) ci sarebbero tutti, ma l'effetto "dead link" dell'eventuale collegamento alla pagina sarebbe proprio brutto. E per la questione che il javascript non funziona una volta stampata la pagina :)))) ricordo che non funzionano neppure i link :) -- Lepido (msg) 23:39, 23 giu 2011 (CEST)[rispondi]

Aggiungo che esistono già template che "pasticciano" un po' con le url dei siti (ad esempio {{Imdb}}) quindi non si tratterebbe di un vero precedente... solo che sarebbe un po' più "truccoso" del solito -- Lepido (msg) 23:42, 23 giu 2011 (CEST)[rispondi]

Se si potesse fare sarebbe molto interessante (e soprattutto utile). --Una giornata uggiosa '94 · E poi, di che parliamo? 03:23, 24 giu 2011 (CEST)[rispondi]

Visto che si sta già pensando a pasticciare si potrebbe pensare anche continuare con i pasticci modificando il template {{cita news}} in modo che gestisca l'url in questo modo:

{{#ifeq:http://www.archiviolastampa.it|{{padleft:|30|{{{url|}}}}}|''gestione Lepido dell'url''|''solita gestione dell'url''}}

In questo modo il template cita news farebbe automaticamete il "pasticcio di Lepido" senza che chi compila il template se ne accorga (senza quindi influenzararlo sul mettere o non mettere la pagina dell'articolo). A parte questo a me l'idea di Lepido sembra buona, visto che immagino che in parecchi cliccando i nostri link all'archivio della Stampa si sentano persi e pensino a un normale link rotto.--Sandro_bt (scrivimi) 04:55, 24 giu 2011 (CEST)[rispondi]

@Lepido: IMHO Wikipedia dovrebbe contenere il meno possibile link della forma "www.example.org/foo/bar.php?p=42&t=[codice_che_sembra_il_titolo_di_un_film_della_Wertmüller]&tec&ra...", perché aumenta decisamente la probabilità che il link si rompa. non a caso per citare i libri tramite ISBN chiediamo all'utente di non inserire un link diretto ad una fonte librarie, ma solo la parolina magica ISBN

@Sandro_bt: a proposito di link rotti, il cita web dovrebbe IMHO avere un parametro per identificare un collegamento interrotto (e, come suggerito qui, ed il {{collegamento interrotto}} dovrebbe linkare ad una linea guida e non ad un elenco generato offline). se si prospettano modifiche al template tanto vale aggiungere questo :). --vale pert 07:27, 24 giu 2011 (CEST)[rispondi]

@Vale: Come ogni tecnico sa, un problema diventa più grosso se (inconsapevolmente o meno) si chiama "problema" quello che in realtà è una somma di problemi. Ora, la discussione verte su una tecnica che, a partire da link esistenti già nelle voci permetta a loro di funzionare. Il fatto che sia sconsigliato mettere tali link è un'altro problema che in questo momento è "off topic", a meno che tu non proponga di fare passare un bot che elimini tutti i "www.example.org/foo/bar.php?p=42&t=[codice_che_sembra_il_titolo_di_un_film_della_Wertmüller]&tec&ra..." (anche quelli funzionanti) estirpando il "male" alla radice. Quello che intendo è che un conto sono le linee guida, un conto è il problema che ho sollevato. A margine ricordo che ormai è finita l'epoca delle pagine "www.example.org/foo/titolo_film.html" e i link ai moderni CMS sono in gran parte del tipo "proibito". In particolare, http://www.repubblica.it/politica/2011/06/23/news/p4_intercettazioni-cicchitto-18114307/?ref=HREA-1 è un normale collegamento ad un articolo di Repubblica, del tipo di cui Wikipedia è piena, "strano" quanto quelli della Stampa, con l'unica differenza che funziona sempre.

In definitiva, discutere sul fatto dell'opportunità di limitare o inibire i link "strani", pur se legittimo, non c'entra però con questa discussione che ricordo riguarda un problema squisitamente tecnico e il sistema su come pensare di risolverlo. Possiamo non fare nulla, ignorare questo problema e lasciare le cose come stanno, ma appunto essendo una cosa distinta dall'utilizzo dei link "strani", questi continueranno ad essere utilizzati così come lo sono tuttora, a prescindere dal funzionamento ai link alla Stampa.

Per rispondere invece a Sandro, l'idea di intervenire sul template {{Cita news}} invece che creare un template ad hoc mi sembra buona, ma il punto è sul "come". Ritengo infatti che per fare un lavoro "pulito" occorrano competenze e "privilegi" su Wikipedia che io non possiedo. Questa discussione voleva quindi segnalare un problema (che esiste solo con "La Stampa", gli altri giornali funzionano correttamente) e mostrare una possibile soluzione, per aprire un tavolo tecnico su come implementarla. Mi aspetto e posso comprendere anche critiche del tipo "non si fanno casini del genere su Wikipedia", un po' meno quelle del tipo "questi link sono brutti" :-) Tutto qui -- Lepido (msg) 09:20, 24 giu 2011 (CEST)[rispondi]

Direi che lo script si dovrebbe portare su toolserver e che si debba creare un template {{Archivio La Stampa}} per eventuali aggiornamenti/cambi/qualcosa. --Vito (msg) 11:13, 24 giu 2011 (CEST)[rispondi]

Si può utilizzare anche WebCite per link a pagine web che sono temporanee.--Romero (msg) 13:53, 24 giu 2011 (CEST)[rispondi]

Quoto Vito.--francolucio (msg) 19:32, 24 giu 2011 (CEST)[rispondi]

Anch'io quoto Vito ovviamente, anzi in realtà la mia idea recondita ed inconfessabile era proprio questa, però vedevo due problemi:

non so se ci siano precedenti di template "misti" che risiedono in parte su Wikipedia ed anche su toolserver , anche perché...
mi pare che toolserver abbia la "mania" (ma potrei sbagliarmi o ricordare male) di disabilitare gli account e di conseguenza i tool abbinati in caso di mancato utilizzo dell'account per un certo periodo, la qual cosa è ovviamente inaccettabile per un template che debba funzionare "sempre", a prescindere dall'utente che l'ha creato.

Per quanto riguarda invece la proposta di Romero, adesso non posso testarla a fondo (qui in città è il periodo degli aperitivi, e non sono nella condizione mentale giusta per lavorare seriamente...) :-) ma se funzionasse potrebbe essere un'interessante alternativa. Ma mi chiedo, dal punto di vista "legale" e di copyright, è una soluzione corretta? -- Lepido (msg) 20:34, 24 giu 2011 (CEST)[rispondi]

WebCite non funziona per 'ste cose ed è molto inaffidabile.

Per quello che vedo, quei collegamenti all'archivio de La Stampa sono permanenti: si tratta solo di avere un cookie (problema piuttosto comune), il che peraltro significa che si li si è disattivati non funziona comunque. In effetti però il trucchetto è una comodità e nel sito non si vieta il deep linking.

Non vedo nessuna difficoltà nel piazzare la cosa sul Toolserver, basta che qualche buon samaritano ce lo metta. Sí, sarebbe meglio avere un tswiki:Multi-maintainer projects ma ci vuole tempo per averlo e comunque non è necessario. Nemo 13:01, 26 giu 2011 (CEST)[rispondi]