Discussioni Wikipedia:Elenchi generati offline/Disambigue non collegate

Non riuscendo a trovare una soluzione al problema, ho provato a sottoporre la questione su #wikimedia-toolserver per avere il parere di chi lavora tutti i giorni con la struttura del database di MediaWiki. La cosa ha suscitato una certa curiosità ma le specifiche non sono sembrate molto chiare (non si capisce, ad esempio, la necessità di eliminare i redirect). Questo è un tentativo di migliorare la leggibilità della query attraverso l'uso di tutte le tabelle ausiliarie, ma va verificato con le tue intenzioni:

SELECT CONCAT("# [[", P.page_title, "]]")
FROM page as P
LEFT JOIN templatelinks as PT ON PT.tl_from = P.page_id AND PT.tl_namespace = 10 AND PT.tl_title IN ( "Disambigua", "Sigla", "Sigla2", "Sigla3", "Sigla4", "Cogni" )
LEFT JOIN pagelinks ON pl_namespace = 0 AND pl_title = P.page_title
LEFT JOIN page as G ON G.page_id = pl_from
LEFT JOIN templatelinks as GT ON GT.tl_from = G.page_id AND GT.tl_namespace = 10 AND GT.tl_title IN ( "Disambigua", "Sigla", "Sigla2", "Sigla3", "Sigla4", "Cogni" )
WHERE P.page_namespace = 0
AND P.page_is_redirect = 0
AND P.page_title LIKE "%_(%)"
AND PT.tl_from IS NULL
AND pl_from IS NULL
ORDER BY P.page_title;

Possiamo partire da questo per una migliore definizione delle specifiche? --Lp 00:59, 11 feb 2008 (CET)Rispondi

Complementi a tutti quelli di #wikimedia-toolserver: ho eseguito la query e i risultati sono stati esattamente quelli che volevo ottenere.

Avevo pensato di eliminare i redirect perché, ma magari si tratta solamente di un errore nel mio database, alcuni redirect non vengono segnati come tali. Ad esempio fra i risultati di questa query ho trovato Zin (rapper) che è un redirect. Ho quindi eseguito la query:

SELECT  * FROM 'page' WHERE page_title =  "Zin_(rapper)";

E il risultato è stato (lo riporto in xml):

<itwiki>
    <page>
        <page_id>705771</page_id>
        <page_namespace>0</page_namespace>
        <page_title>Zin_(rapper)</page_title>
        <page_restrictions></page_restrictions>
        <page_counter>0</page_counter>
        <page_is_redirect>0</page_is_redirect>
        <page_is_new>0</page_is_new>
        <page_random>0.349996166629713</page_random>
        <page_touched>20080118203740</page_touched>
        <page_latest>5669400</page_latest>
        <page_len>24</page_len>
    </page>
</itwiki>

Stranamente page_is_redirect è settato su 0 nonostante la pagina sia un redirect. Forse un problema nel dump? Comunque ancora grazie. --Incola (posta) 15:12, 11 feb 2008 (CET)Rispondi

Bene, se la query funziona intanto ringrazio Duesentrieb e soci per l'aiuto. Quanto alla sparizione dei redirect, come importi il dump? Solo inserendo il file XML o anche le tabelle ausiliarie? Per queste ultime sono sicuro che redirect non è del tutto aggiornata essendo stata creata solo a partire da un certo momento, ma le informazioni in page dovrebbero essere sempre corrette. --Lp 20:46, 11 feb 2008 (CET)Rispondi
Per importare il dump carico il file xml con mwdumper, quindi importo le tabelle pagelinks, categorylinks e templatelinks, quindi il contenuto di page dipende unicamente dal file xml. --Incola (posta) 22:00, 11 feb 2008 (CET)Rispondi
Ritorna alla pagina di progetto "Elenchi generati offline/Disambigue non collegate".