Wikipedia:Bar/Discussioni/Bot come gli olandesi e milione di voci

Bot come gli olandesi e milione di voci NAVIGAZIONE


Gli olandesi hanno un bot che li ha portati a creare circa 130.000 voci in poche settimane, passando dal nono al quarto posto della graduatoria di numero di voci presenti tra tutte le edizioni mondiali. La mia proposta è: perchè non adottare il pattern di voci create dalgi olandesi, che oltre a riportarci quarti (meritatamente) nella classifica in questione, ci consentirebbero, entro al massimo un mese, di raggiungere il milione di pagine dell'ns0? Io sono, ovviamente, più che favorevole. E per un semplice motivo, lo sono:al di là dei numeri e del prestigio dell'apparire, chi mai creerà le voci sugli insetti e sugli artropodi che tanto velocemente sono inserite dal bot, peraltro in buono stato ed arricchite da immagini? Ma quelle voci, anche se a poche persone, serviranno pure a qualcuno. E allora, perchè non scriverle con rapidità e completezza, riempiendo in questo modo, celermente, ogni specie conosciuta a riguardo in campo zoologico? Queste voci possono essere, inoltre, ampliate anche nella loro base, aggiungendo diverse altre informazioni utili, che verranno poi divulgate in ogni relativo articolo ed adattate alle caratteristiche ed alle esigenze di ogni gruppo di voci. Il punto è che non desidero comunicare la mia fretta a voi, anzi, penso che la calma sia sempre una buona consigliera, ed immagino che molti di voi, vedendo proposto un metodo così rapido e netto per la crescita dell'enciclopedia, si cauteleranno preferendo non supportarlo, però, obiettivamente:bisogna pensare che l'aumento numerico è anche una fonte di incremento di informazioni, di una maggiore esaustività del sapere, di spazi sempre più grandi esplorati ed analizzati dal grandioso, celeberrimo e consultatissimo sito di informazione gratuita, imparziale e largamente condivisa quale è Wikipedia? Attendo pareri costruttivi, non distruttivi; sia chiaro. Voglio dire: è vostro diritto smontare il mio modo di pensare, ma per cortesia, non siate violenti nel farlo: siate, piuttosto, non "prevenuti" e disposti a spiegare i legittimi perchè del vostro mancato supporto. Spero che questa pagina si riempia di vostre considerazioni, di vostre idee, di vostri spunti di riflessione e, soprattutto, di decisione sul da farsi. Vi ringrazio tutti! Un saluto da --87.8.128.19 (msg) 18:53, 20 nov 2011 (CET) P.S.:Conosco WP:WNF, infatti il mio intento non è certo quello di rendere una pagina di servizio di Wikipedia un forum di discussione libera e di qualunque tipo;al contrario, vorrei che, più che le parole, si esaminino i fatti possibili, certi o impossibili, e prevedere o analizzare le relative cause e le relative conseguenze. Perdonatemi, inoltre, per il titolo da "spaccone" della pagina:sarebbe stato meglio un incipit del tipo "automatismo per crescita wikipediana (numerica e qualitativa)".[rispondi]

Io sarei sicuramente favorevole, ma nè io nè altre persone (perfino gli amministratori) decidono, infatti la decisione è comunitaria, percui... mi faccio da parte, dopo avere dato il mio assenso :). --Farberking Guarda!!! 19:03, 20 nov 2011 (CET)[rispondi]
Sinceramente non ritengo importante gareggiare in quanto a numero di voci con le altre Wikipedie (piuttosto, meglio gareggiare in quanto a qualità delle voci); forse è possibile fare girare un bot per creare le pagine delle specie "sconosciute" di insetti et similia (un po' come per gli asteroidi, per intenderci), ma a questo punto non sarebbe meglio parlarne direttamente al Progetto:Forme di vita? Detto questo, Wikipedia in lingua italiana può, in certa misura, vantarsi di avere "poche voci ma buone" (rispetto ad esempio a quella inglese), e avrei qualche riserbo a far creare decine di migliaia di voci a una "macchina". --Kamina✍ 19:39, 20 nov 2011 (CET)[rispondi]
Io tutto sommato sarei favorevole all'idea dell'IP ma comunque andrebbe creato il BOT, trovare uno che lo sappia usare ecc ecc dubito che qua qualcuno lo farà mai --Erik91scrivimi 19:49, 20 nov 2011 (CET)[rispondi]

Non è con il metro che si misura la cultura... spero la proposta/provocazione cada nel vuoto. --79.55.174.182 (msg) 20:39, 20 nov 2011 (CET)[rispondi]

Sarei curioso di vedere le voci olandesi create dal bot. Potresti linkarne un paio qui? -- Yiyi ___ (Scrivimi...) 20:50, 20 nov 2011 (CET)[rispondi]
A te la scelta ;). --Narayan89 20:54, 20 nov 2011 (CET)[rispondi]
Tendenzialmente contrario, e lo dice uno che si occupa sia di asteroidi che di insetti. Il motivo è che la tassonomia, specialmente in campo entomologico, è una materia estremamente complicata, in continua evoluzione e tutt'altro che certa. Non esistono liste ufficiali, come per gli asteroidi, di tutte le specie conosciute, e anche quelle che al Forme di vita consideriamo "ufficiali" per le fonti spesso, e a volte anche pesantemente, sono in contrasto tra di loro e tutte sono in ogni caso incomplete. Persino tra gli esperti del settore c'è spesso discordanza di idee. Senza contare che di molte specie si sa poco oltre alla classificazione (e spesso nemmeno quella), insomma non vorrei trovarmi con centinaia di voci costituite dal tassobox e un incipit che non dice nulla se non quello che c'è scritto nel tassobox. A conferma dei miei timori ho preso una delle voci a caso linkate da Narayan89 e ho provato a cercarla su ITIS, spesso da noi usato come riferimento, e guarda caso non l'ho trovata. Nel frattempo apro anche una segnalazione al progetto per avere il parere di qualcuno più esperto di me.--αStar msg 21:05, 20 nov 2011 (CET)[rispondi]
Non so quanto possa essere utile avere una serie di voci formate da un template e due righe di testo... È vero che sarebbe qualcosa in più per la nostra Wikipdia, ma rimarrebbe un di più di scarsa qualità. Se poi è vero quello che dice Alphastar (io non lo so, non mi intendo nè di asteroidi nè di insetti), verrebbe a crearsi anche una certa confusione... Per questo io non appoggerei questa idea, almeno per quanto riguarda le voci relative a forme di vita, per i motivi sopra citati. Per il resto non saprei. Quali altre categorie di voci si potrebbero creare con questo metodo? -- Yiyi ___ (Scrivimi...) 21:55, 20 nov 2011 (CET)[rispondi]

Scusate, ma che ci frega di fare gare con concorrenti furbastri? Facciamo piuttosto le voci migliori possibili, debitamente referenziate ed esaustive. Lasciamo il vuoto giochino delle classifiche ai gonzi. E cerchiamo di non rifare il verso - come troppo spesso ci capita di fare - a enciclopedie scritte, inevitabilmente conservatrici e implacabilmente superate dagli eventi. --Cloj 22:02, 20 nov 2011 (CET)[rispondi]

Il fatto è che per questo tipo di voci, riguardanti oggetti chiaramente enciclopedici e che difficilmente in futuro potranno essere ampliate oltre un template sinottico, una foto e una frase, ha senso utilizzare un bot perchè è un lavoro meccanico che nessuno affronterà mai a mano (è un po il discorso dei comuni francesi). E queste voci su nl.wiki non differiscono molto, in quanto a qualità di abbozzo, da centinaia (migliaia?) di voci su insetti già presenti su it.wiki. Ora, se il problema è la fonte che hanno utilizzato, allora è un discorso che va affrontato da utenti con un minimo di cognizione in materia (nel progetto relativo). Se il problema è la presa di orgoglio secondo cui la regola sarebbe "no, dobbiamo creare tutto a mano, è più bello così!" oppure "ma poi Wikipedia sarebbe così brutta con tante voci così corte!", allora bisogna prendere in seria considerazione l'utilizzo del bot e lasciare da parte queste motivazioni dettate dalle emozioni e dal sentimento ed essere pragmatici.--Romero (msg) 22:22, 20 nov 2011 (CET)[rispondi]
Contrario Ammesso e non concesso che si trovino effettivamente dati strutturati ed attendibili tali da consentire ad un bot di fare quel lavoro in una maniera seria, si tratterebbe comunque di voci che richiederebbero comunque un intervento "umano", non fosse che per verificare che i dati inseriti siano corretti. Inoltre trovo che la "corsa a chi ce l'ha più grosso a chi ha più voci" sia la cosa più assurda che esista e lontana dallo spirito del progetto.--Frazzone (scrivimi) 23:44, 20 nov 2011 (CET)[rispondi]
Sono tendenzialmente favorevole alla proposta, non perchè voglia fare le corse con le altre wiki, non controllo il mio di editcounter, figuriamoci quello di tutta WP! Io mi occupo quasi esclusivamente di forme di vita e questo progetto pullula letteralmente di ministub il cui contenuto informativo non è superiore a quelli creati dal bot dei Paesi Bassi e nessuno se ne scandalizza. Perchè mai dovrebbe? Un bel giorno qualcuno cercherà su Google un assurdo animale e magari vedendo che la voce è così povera farà il passo fatale e cliccherà su quell'invitante linguetta con su scritto "modifica". Creare una voce di bel nuovo è tutta un'altra storia, richiede diversi passaggi non sempre agevoli per il niubbo assoluto che non sa nulla di tassobox, incipit, wikilink, interwiki, eccetera (e non vale solo per i niubbi: compilare il tassobox, specie se non se ne trova uno di un taxon strettamente correlato da copiare, è una vera rottura di scatole). Dare al novizio almeno un abbozzo su cui basarsi per scrivere la nuova voce inoltre facilita il lavoro di chi dovrà poi wikificarla e consente di avere stub più omogenei e rispondenti almeno ai minimi requisiti. Non posso che essere d'accordo con chi invita alla cautela riguardo alla tassonomia: certe situazioni sono fluide in maniera sconfortante, spesso, ahimé, a causa del protagonismo di certi ricercatori. Questo però non deve essere un freno alla creazione di nuove voci: in tutti i casi di controversia tassonomica il nome dato alla voce di un taxon non può che essere il riflesso delle convinzioni tassonomiche del creatore. La tassonomia non è una scienza naturale ma solo il tentativo dell'uomo di ridurre un'inconcepibile (ma non irriducibile) complessità ad un certo numero di categorie gerarchicamente disposte e quindi comprensibili. Tutto questo per dire che credo che sia meglio avere una voce (o uno stub) ad un sinonimo che non averla affatto. E comunque non siamo un database tassonomico e lo scopo nostro e del progetto non è quello di fornire in tempo reale la tassonomia aggiornata di un taxon. La mia proposta è di usare ITIS come tassonomia di riferimento per tutti i gruppi che non abbiano un database più corretto/affidabile (come Fishbase per i pesci). Scusate la lunghezza.--etrusko5² (msg) 00:27, 21 nov 2011 (CET)[rispondi]
Ecco, il mio dubbio sull'uso del bot derivava da quanto detto da Alphastar sulle forme di vita eccetera eccetra, ma se per le voci sugli stradi animali il problema è risolvibile, io sono favorevle all'utilizzo del bot anche per i motivi esposti da Etrusko5²... -- Yiyi ___ (Scrivimi...) 00:59, 21 nov 2011 (CET)[rispondi]

(a capo) Decisamente Contrario e per una serie di motivi:

  • 1) L'incipit delle voci olandesi è del tutto identico: "la specie X è un insetto della famiglia Y. È stata scoperta dall'entomologo Z nell'anno B ". Queste informazioni sono pari pari reperibili immediatamente dal template minimale a fianco.
  • 2) Il template è minimale perché riporta una classificazione scientifica ridotta all'osso e poco indicativa del reale albero tassonomico che porta alla specie.
  • 3) Nella pagina di contributi olandese linkata, 2 voci su 490 hanno un'immagine, le altre no.
  • 4) Le specie in oggetto sono state prelevate dal bot dagli elenchi presenti in questa pagina, sono tutti coleotteri. Cliccando i link alle varie famiglie sono comunque dati che lo zoologo Hallan ha aggiornato al 2008 (Bruchidae), 2007 (Ptinidae), non prima di tre anni fa e non proprio recenti!
  • 5) Per quanto autorevole, si tratta comunque di dati pescati da una e una sola fonte e per giunta secondaria. Queste voci andrebbero costruite con ricerche sui testi originali dei descrittori delle specie, come cerchiamo di fare e insegnare a fare noi che ci occupiamo del Progetto:Forme di vita.
  • 6) Avremmo una valanga di pagine cui sarebbe doveroso porre lo stub e il da aiutare, con il risultato che, se ne inserissimo anche solo 300.000, l'utente nuovo, che cerca con Una voce a caso, ne pescherebbe in media una ogni tre, non proprio un bel biglietto da visita per l'Enciclopedia.
  • 7) Ogni specie è diversa, oltre quei dati, dalle altre. Per gli asteroidi, l'uscita di nuovi parametri o di nuovi dati è facilmente integrabile nelle voci in modo automatico, almeno nel template. Ampliare e destubbare queste voci di forme di vita richiederebbe solo l'intervento manuale, quindi rimarrebbero stub per chissà quanto.
  • 8) Se si attua questo intervento, pensiamo che si tratta di intervenire su vasta scala. Potenzialmente la forme di vita sono 1.800.000 (piante incluse), quindi non paragonabili agli asteroidi (circa 11.000), ai comuni italiani (8.000) o ai comuni francesi (25.000), nemmeno lontanamente. Fra l'altro, di questi elenchi appena citati, quelli relativi ai comuni presentano ancora una valanga di stub a distanza di 4-5 anni dall'inserimento, figuriamoci per quanti decenni rimarranno stub tutte quelle forme di vita.
  • 9) Non penso abbia molto senso rincorrere le altre wiki a costo di essere pieni di stub fino ai capelli.
  • 10) Dimenticavo il meglio...IMHO se bastassero template e incipit così come nelle voci olandesi a rendere una voce degna di un'enciclopedia....penso proprio che potrei inserirne una settantina-ottantina al giorno a manina e avrei già iniziato a farlo se lo avessi ritenuto opportuno!--Eumolpo (πῶς λέγεις;) 04:46, 21 nov 2011 (CET)[rispondi]

Favorevole al bot anche se speravo operasse sui comuni un po' come il bot polacco di qualche mese fa. Ci sono utenti (tra cui il sottoscritto) che impiegano diversi mesi per completare i comuni di una nazione mentre un bot, ottenendo tra l'altro un risultato simile, impiegherebbe molto di meno liberando forze lavoro per un eventuale ampliamento. --RaMatteo 09:17, 21 nov 2011 (CET)[rispondi]

Piuttosto contrario, la qualità non si misura con la bilancia. In ogni caso poiché abbiamo WP:be bold impossibile opporre un muro a chi e' intenzionato ad operare il tal senso. E' anche vero che quello che noi chiamiamo stub per piccole voci e' anche quello che troviamo tranquillamente nella Treccani sulle stesse voci: se c'è un paesino di 200 anime forse oltre che prendere nota che il paese esiste non si puo' far altro.--Bramfab Discorriamo 11:37, 21 nov 2011 (CET)[rispondi]

Bot al lavoro modifica

Noi botolatori ci stavamo già lavorando. Ho contattato il botolatore olandese qui. Prossimi obiettivi:

  1. Raggiungere 1.000.000 di voci (botolabilmente facile, basta sapere che voci scrivere e qualche dato per scriverle...)
  2. Avere una maggior qualità delle voci (fattibile solo dagli utenti)

Quindi, al lavoro! :)--Nickanc ♪♫@ 23:11, 20 nov 2011 (CET)[rispondi]

favorevole in linea di principio a usare un bot per togliere lavoro agli utenti. Creare stub si può fare, facciamoglielo fare. Meglio tanto con qualche informazione, di cui poco di qualità, o solo quel poco di qualità che han fatto gli utenti? (intendiamoci: "poco" e "tanto" in termini botolabili e di numero di voci, non certo a livello di importanza o di impegno, anzi) --Superchilum(scrivimi) 23:14, 20 nov 2011 (CET)[rispondi]
Ma si dovrebbe bloccare il bot poco prima di raggiungere il milione, però, perchè è auspicabile che la milionesima voce possa essere una voce fatta a mano e che, possibilmente, si possa ampliare quanto più possibile e portarla ad un livello decoroso, dato che farà un po' il giro del mondo.--Romero (msg) 23:48, 20 nov 2011 (CET)[rispondi]
@Nickanc: spero sia chiaro che prima di partire sia necessario trovare un ampio consenso, che attualmente non c'è. --Jaqen [...] 01:06, 21 nov 2011 (CET)[rispondi]
Favorevole per i motivi espressi e a mio avviso poca informazione e meglio di nessuna informazione (meglio uno stub che niente). Della gara al numero di voci non mi importa niente, anzi forse è meglio arrivare subito al milione così ce lo leviamo per sempre dalle scatole (o almeno per una decina di anni). Concordo con superchilum di dare la possibilità di compilare la milionesima voce, non sarei contento se questa fosse fatta da un bot. --Limonadis (msg) 01:24, 21 nov 2011 (CET)[rispondi]

Favorevole a un bot che cancelli tutti i nano-articoli creati con il pensiero di fare numero in testa. --188.11.123.189 (msg) 02:07, 21 nov 2011 (CET)[rispondi]

Chapeau :) --Vipera 09:16, 21 nov 2011 (CET)[rispondi]
Favorevolissimo al bot. Quello che mi interessa è che wiki contenga più informazioni possibili. Non mi importa se ne abbiamo più o meno delle altre wiki, l'importante è che ne abbiamo tante. Chi se ne frega se sono stub, si tratta di cose in più. Forse se cancellassimo adesso tutti gli stub che abbiamo wiki ci guadagnerebbe?
Avere uno stub è meglio che non avere niente, e avere una voce così mi va benissimo, visto che se aspetto l'intervento di un utente non-bot la voce Paraselenis marginipennis non l'avrò mai.
L'unica cosa che potrebbe farmi cambiare idea è l'assoluta inaccuratezza del DB, e al momento non sembra proprio che sia così. Come dice Etrusko, quelle dubbie si controllano Jalo 09:52, 21 nov 2011 (CET)[rispondi]
Parla uno che un BOT non l'ha mai avuto per le mani (a meno che non si tratti di Capodanno...)
Il BOT non è il "diavolo" e se serve a liberare risorse umane, ben venga. Se abbiamo BOT che aggiustano i formati, che cambiano le categorie, ecc... perché non avere anche BOT che creano le voci?
It:wiki è almeno da febbraio 2007 (gli asteroidi citati) che non fa più grossi inserimenti automatici, ma io personalmente non ci vedo nulla di male.
Però a due condizioni importantissime:
  1. le voci devono essere ben fatte. Sembra un'ovvietà, ma non avete idea di quanti problemi si scoprono solo dopo (e alle volte risulta difficilissimo risolverli). L'inserimento deve essere accuratamente dunque preparato, lavori di voci campione devono essere accuratamente vagliate dalla comunità e soprattutto.. senza fretta. Una fonte inesatta, un errore di formattazione, una categorizzazione non adeguata, un capoverso da spostare in basso... dopo diventano migliaia di errori da correggere. se sono facili, con altri giri di BOT, se sono difficili... ciccia.
  2. deve esserci un gruppo di persone che segue le voci. Inutile creare 1000 voci di coccinelle (ad es.) se non c'è nessuno che si interessa di coccinelle. Ci vuole un gruppetto di persone che fa il controllo del vandalismo, aggiorna i dati, destubba... quanto meno che organizza il lavoro per i nuovi BOT che devono fare il lavoro di manutenzione.
Insomma: sì senza nessuna preclusione ideologica, ma con giudizio. --Retaggio (msg) 10:09, 21 nov 2011 (CET)[rispondi]
Aggiungo un PS: - It:wiki negli anni 2005-2007 ha fatto molti inserimenti via bot: all'inizio ci furono molti errori, ma dopo un po' di tempo si era formato un solido "bagaglio di esperienze" grazie ad alcune persone che avevano imparato a seguirli, a capire in anticipo quali potevano essere i problemi, ecc... Ora questo "bagaglio" è un po', diciamo... dimenticato, quindi auspicherei, se si partisse con un'iniziativa del genere, di cominciare con inserimenti piccoli, di gruppetti di qualche centinaio di voci e non direttamente con 130.000 coleotteri... con una BOTta del genere rischiamo di farci male... ;-)

Vorrei far notare che creare più voci non significa automaticamente avere informazioni in più (anzi, alle volte può essere il contrario). Quello che si può disseminare in migliaia di articoli, può essere presentato in una lista... --188.11.123.189 (msg) 11:38, 21 nov 2011 (CET)[rispondi]

Direi che se it.wiki è prima, quarta o ventinovesima per numero di voci non ce ne potrebbe fregare di meno. Quello che conta è che quelle che ci sono (centomila o un miliardo) siano voci realmente enciclopediche, ben strutturate, corrette, chiare, informative. Di qualità solida, insomma. Quindi, il bot per mostrare che il Virile Italico è più "quantitativo" del Perfido Neerlandese mi sembra assolutamente un controsenso. Il che non vuol dire che un uso intelligente dello strumento Bot sia da demonizzare; se in alcuni settori, ed a determinate condizioni di verifica, un bot è realmente utile per semplificare o avviare la base di un tedioso lavoro manuale di mero "inserimento dati" non vedo perchè non usarlo nella fase di avvio. Ma, appunto, il problema è non trovarsi cinquantamila voci di una riga che ripetono un dato presente in un template. --Veneziano- dai, parliamone! 13:38, 21 nov 2011 (CET)[rispondi]

Non precluderei l'idea a prescindere, vorrei però maggiormente capire l'eventuale BOT quanto può fare oltre a quello olandese, che effettivamente crea voci, che per il Progetto Forme di vita, sono a cavallo tra il Template A di aiuto e quello S di stub. Bisogna capire il livello minimo di voce che vogliamo accettare, ricordiamoci che già tutt'ora abbiamo voci che consideriamo STUB prive di foto e a volte di fonti. Sono poi daccordo che un centinaio o migliaio di esse ce le possiamo gestire, se ne entrano più di 100.000 non si può pretendere che gli utenti si accollino un lavoro mostruoso di controllo su di esse. Quindi, pare ragionevolmente ovvio pensare che la maggior parte di tali voci create da BOT resteranno così per molti anni. La domanda è, ci va bene ? -- KrovatarGERO 13:57, 21 nov 2011 (CET)[rispondi]

Non continuiamo ad accusare gli altri di voler aggiungere le voci solo per fare la guerra alle altre wiki, visto che nessuno ha detto una cosa così stupida. Se pensate che un'informazione non sia utile ditelo, ma non accusate gli altri di cose che non hanno detto.
@188.11.123.189: Se il problema fosse davvero che "quello che si può disseminare in migliaia di articoli, può essere presentato in una lista", si potrebbe fare in modo che il bot raccolga quei dati presentandoli sotto forma di lista, raggruppandoli per famiglia, ordine, classe o che altro.
Ripeto, avere più voci degli altri non è importante. A me interessa avere informazioni, e se pensate che sia meglio presentarle come lista allora mi va bene Jalo 14:00, 21 nov 2011 (CET)[rispondi]
(Fuori crono) L'intervento dell'IP diceva: "Gli olandesi hanno un bot che li ha portati(...) dal nono al quarto posto della graduatoria di numero di voci presenti tra tutte le edizioni mondiali. La mia proposta è: perchè non (...) riportarci quarti (meritatamente) nella classifica in questione (...) al massimo un mese, di raggiungere il milione di pagine dell'ns0?". Imho è proprio traducibile con: "Ach ! Maledetti amanti dei papaveri ! Ci hanno superati con il loro diabolico Mulino a Vento Atomico; adesso dobbiamo tornare al posto che ci compete in classifica, per Italico Onore ! Tiriamo fuori la littorina a vapore ! Li ricacceremo in breve sulle loro dighe !" ;-) --Veneziano- dai, parliamone! 14:26, 21 nov 2011 (CET)[rispondi]
(fuori crono) Ven, anche a me non me ne frega una cippa se siamo quarti o ventitreesimi... tuttavia non possiamo tacere il fatto che qui su it:wiki, negli ultimi quattro anni siamo stati sempre ideologicamente contrari alle voci create via bot. Questo io contesto. Per ideologia ci stiamo privando di uno strumento che potrebbe essere utile. Il bot non è il diavolo: basta farle per bene le cose. --Retaggio (msg) 14:44, 21 nov 2011 (CET)[rispondi]
(Fuori crono) E infatti, se vedi, scrivevo appunto che non sono contrario a priori ai Bot, se sono usati con giudizio per inserimenti dati ripetitivi... :-) --Veneziano- dai, parliamone! 22:14, 21 nov 2011 (CET)[rispondi]
restare per molti anni con stub (poche informazioni referenziate e corrette) o restare per molti anni senza informazioni? Scusate, ma la risposta dovrebbe essere la prima senza dubbio. Sicuramente il lavoro da fare sarebbe da pensare bene, mettere a punto e partire solo con dati affidabili e voci non tautologiche. Al di là di questo, se non ci sono persone che ampliano gli stub ugualmente non ci sono persone che compilano voci di qualità. E allora tanto vale avere gli stub. --Superchilum(scrivimi) 14:08, 21 nov 2011 (CET)[rispondi]
@188.11.... (bi-conflittato) Certo che si può fare, e difatti già si fa: Categoria:Elenchi di specie botaniche. Ovviamente una cosa non esclude l'altra... --Retaggio (msg) 14:10, 21 nov 2011 (CET)[rispondi]
[conflittato] quoto Veneziano... noto anche che sia piuttosto antipatico far passare gli olandesi come dei "furbastri" (cosa che mi sembra sia nascosta nelle pieghe del discorso) che hanno trovato una gabola solo per sorpassarci... non è escluso che l'uso del bot da parte loro sia strumentale ad altro... ovvero che ora inseriscano un tot di voci che sono già pronti a rimpolpare... io gli auguro buon lavoro... in quanto a noi... se c'è un motivo sensato per far inserire voci con bot o senza bot, bene... altrimenti continuamo pure così... tra l'altro è nella natura delle cose che lingue come lo spagnolo, il portoghese, il russo e altre prima o poi ci sorpassino... hanno molti più "parlanti" disponibili che non l'italiano... insomma abituamoci all'idea che forse tra un po' saremo nel "gruppone" inseguitori, invece che tra quelli in fuga... non è così drammatica come cosa...--torsolo 14:14, 21 nov 2011 (CET)[rispondi]
Certo. Alla fine, BOT o non BOT, la classifica delle wiki dovrà essere per forza qualcosa di molto più simile alla classifica delle lingue. --Retaggio (msg) 14:18, 21 nov 2011 (CET)[rispondi]

Concordo totalmente con Veneziano. Ed è un controsenso liberare risorse umane, per poi affidare ad un gruppo di umani il lavoro di seguire e controllare migliaia di voci (?) che definire da aiutare è fin troppo generoso.--Eumolpa (msg) 14:21, 21 nov 2011 (CET)[rispondi]

Permettimi, ma non è un controsenso: la differenza tra 10 umani che creano 100 voci e 10 umani che manutengono 100 voci create da un bot è che nel secondo caso le voci esistono già. --Retaggio (msg) 14:31, 21 nov 2011 (CET) PS - E poi chi ha parlato di voci da aiutare? E' ovvio che il BOT le deve creare già buone le voci, sennò che senso ha?[rispondi]
(f.c.)Beh, ho visto le voci portate sopra come esempio. Un rigo di incipit con un template accanto è una voce "buona"? Quindi se scrivo "Il museo Tal dei tali si trova a Roma ed espone dipinti". Punto. Poi accanto ci metto il template museo, in cui scrivo che il museo si chiama Tal dei tali, si trova a Roma ed è una pinacoteca... è una voce buona oppure è (come minimo!) da aiutare? --Eumolpa (msg) 14:47, 21 nov 2011 (CET)[rispondi]
Eh no, mi dispiace ma stai sbagliando. Questa è it:wiki, non nl:wiki. Devi guardare una voce creata da bot su it:wiki, non su nl:wiki. Noi qui non abbiamo mai creato roba del genere... --Retaggio (msg) 14:50, 21 nov 2011 (CET)[rispondi]
Spero di sbagliarmi, allora, ma qui (e ieri in chat) il discorso è partito da un modello olandese, e sono state portate ad esempio quelle voci. Bene, spero che continueremo a non creare roba del genere. --Eumolpa (msg) 15:08, 21 nov 2011 (CET)[rispondi]
Di chat non so nulla. Però di inserimenti via BOT su it:wiki ne ho visti parecchi, negli anni scorsi (quando ancora si facevano). Le cronologie sono disponibili. --Retaggio (msg) 15:16, 21 nov 2011 (CET)[rispondi]
ma infatti, perchè dici già che saranno voci da aiutare? Se si decide di far creare le voci a un bot prendendo informazioni da fonti affidabili, gli si fa creare sicuramente almeno uno stub, non certo un mezzo rigo di voce. Io stesso creo a volte stub piccolini con poche informazioni ma sufficienti, non per questo mi sento in colpa. --Superchilum(scrivimi) 14:40, 21 nov 2011 (CET)[rispondi]

Bho, a me sembra che si stia prendendo il problema al contrario. Prima si deve fare il "database", cioè il contenuto verificato e fontato dei coleotteri o dei funghi o delle muffe o di quello che si vuol mettere su 'pedia, poi, siccome si fa prima, si scrive il codice per dare in pasto ad un umanoide semi o per nulla senziente (il bot) la mera compilazione delle voci. Chi sostiene la necessità di metter su un bot per raggiungere il milione di voci, prima mi deve convincere che non scriverà cavolate nelle millemila voci che intende creare. Non confondiamo il contenuto con lo strumento. Tra l'altro Wikimedia ha un suo progetto sulle forme di vita per cui non capisco la necessità di creare un doppione magari divergente qui su 'pedia. Per meri elenchi di classificazioni tassonomiche basta e avanza quel progetto. Se si deve dire l'importanza culinaria nella cultura del Borneo del coleottero giallo con le antenne blu, allora val la pena fare una voce qui, altimenti... Se qualcuno ha fretta di fare voci via bot, l'ambito milgiore, e oggi ancora un po' sguarnito, è quello geografico (ad es. i comuni statunitensi sono per 3/4 da fare, dopo il censimento del 2010 ce ne sono da creare ex-novo anche negli stati che credevamo di aver finito e che sono comunque da aggiornare e c'è mezzo mondo di nazioni ancora "vergini"). Prima però si devono trovare i dati (n°abitanti, superfici, ecc.), decidere le convenzioni sulle suddivisioni amministrative di ogni singolo stato del mondo ancora mancante, ecc., ecc. Poi si accendono i bot. --Amarvudol (msg) 14:52, 21 nov 2011 (CET)[rispondi]

Io sono d'accordo. Si risparmia un noioso lavoro di prima compilazione, i wikipediani poi sono capaci di ampliare qualsiasi cosa. --Sailko 16:31, 21 nov 2011 (CET)[rispondi]
Io sarei curioso di vedere un esperimento sulla creazione di bot-voci su aeroporti o compagnie aeree. Nel progetto Aviazione abbiamo una linea guida che consiglia un incipit standard dove inserire i dati che si possono estrarre da unha tabella preesistente o, perché no, dai template sinottici delle wiki in lingua estera. Tra l'altro è un lavoro di routine che spesso si fa e che alle volte è fatto da chi vuole semplicemente dare una mano ad it.wiki con una traduzione pur non essendo a conoscenza dell'argomento che sta traducendo. UN bot sono convinto farebbe meno danni di quanto è già capitato su iniziativa utenti stranieri che desiderosi di dare visibilità alle voci scritte nella loro wiki vanno nelle altre wiki a fare stubboni spesso pieni di errori sia nella struttura (che non è quella usata nella loro wiki) che nella sintassi. Che poi roda un po' credo sia umano ed istintivo, tanto quanto può rodere un po' quando nella real life vediamo colleghi di lavoro raggiungere risultati con la furbizia piuttosto che con merito, l'importante è trovare il giusto equilibrio nella curiosità di vedere un risultato piuttosto che farsi accecare dalla mera rincorsa all'editcount. Che mi risulti, la giusta dose di sana competizione non può che essere utile e stimolo e, ribadisco, piuttosto che stub creati per fare numero ma male da utenti eccessivamente malati di edicountite meglio lasciare il compito ad un bot che IMHO se costruito o provato con raziocinio può dare risultati potenzialmente migliori.--threecharlie (msg) 18:06, 23 nov 2011 (CET)[rispondi]

Come si lavora con un bot crea-pagine modifica

Apro questa sezione perché ho letto molta disinformazione metodologica al riguardo, se non vere e proprie stupidaggini che mi astengo dal demonizzare. Un bot non viene MAI utilizzato come concorrente degli umani, perché perde! Allora perché sarebbe utile un bot crea-pagine? Perché liberiamo gli umani dall'occuparsi di cose stupide. Per esempio: è meglio che un umano utilizzi il suo tempo a occuparsi delle opere d'arte e non di quanti abitanti ha un comune. Infatti per creare le voci sui comuni passa un bot che crea le voci e ci mette demografia ecc. Poi arriverà un umano (in alcuni casi non è ancora arrivato) che scriverà tutti i dati "umani". Questo libera gli umani dall'occuparsi di questi dati mnemonici, che sono concettualmente poveri e gli permette di dedicarsi ad altro. Nel caso olandese delle specie viventi, ora gli umani non dovranno più scrivere tutta la classificazione di questi animali perché la trovano già fatta. E magari possono dedicarsi di più al comportamento dell'animale.--Nickanc ♪♫@ 14:29, 21 nov 2011 (CET)[rispondi]

Interessante io sarei a favore di un BOT che crea voci e toglie lavoro --Erik91scrivimi 15:20, 21 nov 2011 (CET)[rispondi]
Nickanc, quello che dici è verissimo e proprio qui sta il problema. Dove troviamo le liste esatte delle specie esistenti? Nel caso olandese viene citata una sola fonte per centinaia di specie di insetti, ma sono quasi certo che esiste un'altra fonte che dice che quella classificazione è errata. Come fa un bot a decidere quale delle due è più affidabile, quando non ce la fanno neanche gli umani? Nel corso degli anni sono sorti problemi di classificazioni persino per gli animali più "ovvi" come l'elefate, figuriamoci sugli insetti, e anche adesso non tutti gli esperti sono concordi nel fornire una classificazione esatta nenanche per i taxa di livello superiore come il regno. La tassonomia è una materia (nenanche una scienza) in continua evoluzione. Fra due o tre anni (ma anche fra una settimana) quelle classificazioni saranno quasi sicuramente in parte da rivedere, sfido io allora a sistemare quasi un milione di voci di insetti. Inoltre, dici che una volta scritta la classificazione via bot gli essere umani potrebbero passare ad inserire gli altri dati per esempio sul comportamento, ma questo non è esatto semplicemente per il fatto che di questi insetti non si sa assolutamente nulla, cosi che queste voci sono destinate a rimanere microstub che ripetono paro paro quanto già scritto nel tassobox. Ciliegina sulla torta: secondo il modello adottato dal progetto per le forme di vita animali, sono obbligatorie almeno minime informazioni sul comportamento, e questo non può essere fatto via bot. Scusate se mi sono dilungato e/o ho scritto sciocchezze, ma ho la febbre a 38 e potrei averne scritte parecchie :( --αStar msg 16:23, 21 nov 2011 (CET)[rispondi]
  Favorevole. In generale è utile sperimentare con questo tipo di bot (qual'è il danno di avere stub ? Wikipedia non è di carta) Ritengo ci siano molte discipline, tra cui quelle che seguo, che potrebbero avvantaggiarsi utilizzando sistemi semiautomatici di creazione degli stub e tutte le esperienze in questo senso, secondo me sono utili. Con il tempo, infatti, suppongo che questi bot diventeranno sempre più sofisticati e gli stub meno minimi e impresentabili. L'unione "tabelle + infobox + testi standardizzati completi di navbox, portali e categorie tutte uguali" e ha delle potenzialità che secondo me vanno esplorate e attuate. --EH101{posta} 16:30, 21 nov 2011 (CET)[rispondi]
Solo un piccolo commento: la tassonomia puo' cambiare nel tempo, ma e' meno ballerina delle squadre in cui giocano i calciatori, altrimenti non avrebbe neppure senso inserire a mano le voci delle singole specie, se queste dovessero essere rifatte ogni anno.--Bramfab Discorriamo 16:44, 21 nov 2011 (CET)[rispondi]
  Contrario Il Progetto:Forme di vita è ricorso in altre occasioni ad un bot per la creazione automatica di gruppi di voci (vedi Uccelli nidificanti in Italia, Progetto:Forme di vita/Festival della qualità: 100 specie, Orchidee selvatiche in Italia) ma si trattava di gruppi di poche centinaia di voci e dietro il bot c'era una squadra di umani che ha lavorato dei mesi per rendere le voci "accettabili" e sopratutto per garantirne il successivo monitoraggio. Creare via bot decine o addirittura centinaia di migliaia di voci (che poi sarebbero degli stub striminziti) significherebbe di fatto abbondonarle al loro destino non potendone ragionevolmente garantire il successivo aggiornamento e monitoraggio. Il vantaggio sarebbe solo quantitativo, ma la qualità dell'enciclopedia (vedi sopracitato esempio di *Una voce a caso*) ne trarrebbe solo svantaggi. --ESCULAPIO @msg 17:09, 21 nov 2011 (CET)[rispondi]
(Confl.) Si ma forse non è chiaro un problema, c'è una differenza tra i comuni e gli insetti, i dati sui comuni sono oggettivi, quegli sugli insetti no anzi ci abbastanza dispute, siccome fonti aggiornate fatte bene e non di parte sugli insetti non c'è ne sono, significherebbe dire addio alla neutralità di Wikipedia. Se fosse un operazione scientifica, credete che in Wikispecies (che qualcosa ne capiranno) non lo avrebbero già fatto?--Pierpao.lo (listening) 17:11, 21 nov 2011 (CET)[rispondi]
Sono stato io a creare la discussione ieri:confermo che un altro bot sui comuni farebbe davvero comodo, anzi, a pensarci bene sarebbe ancora meglio di quello sugli insetti, perchè darebbe tutti i valori possibili ed, inoltre, ogni comune ha le stesse caratteristiche per essere descritto, valutato e riportato nei suoi dati e nelle sue informazioni. Ciò non toglie, comunque, che anche molte forme di vita, per arricchire lo scibile umano riportato su questa enciclopedia, sarebbero molto comode da inserire con un'utenza automaticaautomatizzata (notare la cancellatura:la differenza tra i due termini è enorme);ribadisco che non avrei dovuto intitolare così la pagina, ma è la prima cosa che mi è venuta in mente vedendo la paurosa crescita di tutte le edizioni wikipediane che affidano ad un bot la creazione di decine di migliaia di voci così riempienti le wikilacune, nonchè considerate una volta per tutte, senza essere messe nel dimenticatoio per la frequenza della loro consultazione, che per quanto sia indubbiamente non elevata, può costituire un validissimo supporto per chi è appassionato di zoologia, o comunque ha un lavoro legato agli animali ed alla natura in generale. Per qualunque scompartimento delle conoscenze, almeno entomologhe, avremmo risolto la maggior parte dei problemi riguardo al mancato completamento della scrittura delle voci su famiglie e sottofamiglie di insetti e di altri animali, pressochè utopico senza una mano automatizzata, raggiungibilissimo, gratificante e di grande utilità, nonchè fonte di esaustività e di gamma di informazioni sull'argomento, grazie ad un futuro, eventuale bot, che mi auguro verrà attivato per il bene non solo di noi wikipediani, ma per l'inserimento di una grande parte del sapere scientifico, e un giorno (chi lo sa?) forse demografico, in questa enciclopedia che tanto ha bisogno di crescere e fornire sempre più conoscenze, sempre più sapere, sempre più voci su qualunque argomento che costituisca una classe aperta. E' una pura e semplice conseguenza. Le voci in aumento c'entrano (non dico nulla perchè così per me non è) poco, in confronto agli altri vantaggi di un ipotizzato, e spero considerato con successo e tutto il profitto possibile, utilizzo dei bot non solo dei ritocchi ortografici o wikisintattici alle voci, ma anche nella loro stesura da soli dati esterni. Con l'esperienza di noi (voi :)) tutti, ce la faremo, perchè mi fido di questo progetto e della comunità che lo porta avanti. --87.8.143.211 (msg) 17:54, 21 nov 2011 (CET)[rispondi]

(torno a capo)
Riguardo alla fonti: nel portare a termine i comuni statunitensi, ad esempio, si fa riferimento a precisi ed attendibili siti. Il sito da cui gli olandesi stanno prendendo i dati è uno dei tanti, ha il pregio probabilmente di aver incasellato i dati stessi in modo più facilmente ‘’prendibili’’ da un bot, ma non è granché aggiornato tassonomicamente. Ad esempio, ho preso a caso il genere Parorectis: il sito di Hallan mi riporta due specie in questo genere, il sito dell’ITIS me ne porta anche due, ma una sola è in comune; infine questo sito dedicato proprio alla famiglia Cassidae cui appartiene il genere me ne riporta tre di specie. E ho scelto a caso!! Quale attendibilità diamo a queste fonti se hanno questa diversità di contenuti? L’umano in questi casi riporterebbe tutte e tre le specie indicando tutti e tre i siti attendibili che ne parlano; inoltre cercherebbe anche indicazioni sulle pubblicazioni originali in cui sono state descritte le specie in questione, cosa che mi pare proprio gli olandesi non abbiano fatto.
Riguardo ai contenuti, sempre riguardo alla voce Parorectis scelta a caso, il bot dal sito di Hallan, non è riuscito a prendere importanti dati tassonomici (specie tipo, denominazioni precedenti, sinonimie) che dovrebbero essere inseriti nel template. Forse i nostri bot sono migliori e prenderebbero questi dati?

@ Nickanck: Non sono contrario ‘’a prescindere’’ all’inserimento delle voci tramite bot, il bot può anche tornare utile, ma , minimo, la voce inserita dal bot deve avere più contenuti che il semplice incipit e template in formato ridotto. Come dice Jalo, a queste condizioni è meglio confinare le specie e i generi in liste appropriate. In base a ciò che il bot olandese ha scritto nel template, l’umano che viene dopo non è minimamente aiutato. Per rimanere solo alla classificazione scientifica, l’umano dovrebbe riscrivere tutto daccapo. Ad esempio sempre per rimanere alla voce a caso di cui sopra, a sinistra la classificazione tassonomica come dovrebbe essere, a destra, quella olandese:

….non perde molto più tempo ad aggiungere nel template i taxa mancanti l’operatore di buona volontà che vorrà ampliare la voce?--Eumolpo (πῶς λέγεις;) 17:57, 21 nov 2011 (CET)[rispondi]

Il fatto che le tassonomie possano cambiare non significa nulla. Se non ci avete fatto caso, abbiamo al momento oltre 800.000 voci il cui argomento è in continua evoluzione, quasi tutte in modo più rapido di quanto non cambi una tassonomia (una volta ogni 5 anni?). Il fatto che fonti diverse riportino (per una microscopica percentuale di voci) dati diversi significa che non dobbiamo creare la voce? O forse che dobbiamo crearla inserendo entrambe le alternative? A questo punto dovremmo impedire al progetto forme di vita di scrivere altre voci, visto che le tassonomie "potrebbero" cambiare Jalo 17:59, 21 nov 2011 (CET)[rispondi]
Jalo, il fatto che una microscopica percentuale di voci riporti cose diverse fra loro non mi pare proprio. Io veramente ho scelto una voce a caso e sono andato a controllare trovando tutte queste discrepanze. Penso proprio che oltre il 50% delle voci sia afflitto da questo problema e la soluzione è indicare le varie fonti ciò che indicano e come lo indicano. D'altra parte ritengo che il sito dell'ITIS sia quello con maggiore attendibilità se proprio se ne vuole scegliere uno....però sono sicuro che lì i bot non lavorerebbero per niente bene dovendo prendere i dati delle specie uno alla volta!!--Eumolpo (πῶς λέγεις;) 18:12, 21 nov 2011 (CET)[rispondi]
Per i comuni di molti Stati, se ho capito bene, siamo tutti d'accordo. O mi sbaglio? Bene, se siamo tutti d'accordo, si potrebbe decidere di iniziare con quello, che già agevolerebbe la vita a molti grandi ed umili contributori, come Ramatteo, nella creazione di decine di migliaia di voci sicuramente molto utili per un'enciclopedia online come la nostra, oltre che rendere, come del resto con i bot per ogni argomento, un lavoro completo ed inequivocabile? Dai, si continui pure a proseguire a scambiarsi pareri contrastanti sulle forme di vita, ma sui comuni, sinceramente, uno svantaggio di applicare un ausilio automatizzato non lo intravedo (e non lo intravediamo) nemmeno. Io sarei per procedere con celerità e senza farsi troppi problemi, perlomeno riguardo ai paesi ed alle città di vari Stati stranieri, fino ad oggi decisamente trascurati, a causa delle sole mani degli uomini "veri e propri", ma che sarebbero curati in fretta e con un grande successo grazie ad un intervento automatizzato dal nostro cervello cosciente della bilancia dei pro edei contro, sicuramente, in questo caso, a favore dei vantaggi del progetto, che IMHO, andrebbe assolutamente perseguito con collaboratività e con il desiderio di rendere Wikipedia un sito più ricco, migliore. --87.8.143.211 (msg) 18:19, 21 nov 2011 (CET)[rispondi]
Che per i comuni non ci siano problemi non mi convince del tutto, la si sta facendo troppo facile. Facciamo un paio di esempi. Caso A. Stato dell'Europa orientale che utilizza una lingua scritta con il cosiddetto "latino esteso", per stare sul facile la Romania. In molti casi, per esempio per la Romania, non sono disponibili dati con le denominazioni corrette (vedi, nel caso specifico questo file xls); chi è che insegna al bot a cercare altrove le grafie con tutti i diacritici al loro posto? Chi si impegna a cercarle e a fare tutti gli spostamenti, correzioni di link interni ecc.? Caso B. Stato con lingua ufficiale con caratteri non latini. Chi le fa le traslitterazioni corrette, il bot? Se va davvero bene e si trova un database con una versione in una lingua potabile, solitamente in inglese, chi modifica le traslitterazioni anglofone con quelle che ci siamo dati come standard da utilizzare, sempre il bot? Chi si fa, anche qui, tutti gli spostamenti di voci e le correzioni di link, ancora il bot? Quello delle traslitterazioni è un problema molto serio, che in un ambito come quello dei comuni non va certo sottovalutato.--Frazzone (scrivimi) 19:03, 21 nov 2011 (CET)[rispondi]
P.S. Personalmente mi sono inserito qualche migliaio di comuni di diversi paesi, ma mi sa che ci metterei più tempo a correggere quelli inseriti da un bot che a farli a manina.--Frazzone (scrivimi) 19:05, 21 nov 2011 (CET)[rispondi]
@Frazzone Quello che dici a proposito della grafia è corretto ma di casi fattibili ce ne sono parecchi, basta vedere l'inserimento di qualche migliaio di comuni inglesi fatto da un bot polacco qualche mese fa. Potremmo noi, a mano, fare di meglio? Non lo so. Il rapporto qualità degli edit/tempo speso mi fa supporre che è meglio che sia una macchina a smazzarsi il template e a mettere due dati, l'utente può spendere il tempo guadagnato per ampliare qualcosa. --RaMatteo 19:14, 21 nov 2011 (CET). P.S.:Avessimo fatto a mano i comuni francesi saremmo ancora a metà e non avremmo voci migliori di quelle che abbiamo oggi.[rispondi]
Sì Matteo, secondo me possiamo fare di meglio. Per lo meno possiamo fare una verifica dei dati "a priori" e fare degli stub certamente corretti (a parte i sempre possibili errori umani, ma abbastanza rari). Lasciatelo dire da uno che a mano si è inserito almeno una decina di stati e che probabilmente in qualche giorno ne completerà un altro.--Frazzone (scrivimi) 19:19, 21 nov 2011 (CET)[rispondi]
Molto dubbioso. Da una parte non sono affatto contrario agli inserimenti via bot e sono dell'opinione che "piuttosto che niente meglio piuttosto", d'altra parte su wp scrivo anche di forme di vita, e sinceramente trovo sia un caso piuttosto raro trovare una specie per la quale non ci siano da scrivere più informazioni di quelle che può inserire un bot (ricordo che la tassonomia e la nomenclatura sono solo alcune delle scienze naturali). Inoltre il problema delle fonti è più rilevante di quanto alcuni sembrino credere. Nella mia esperienza è piuttosto raro trovare una specie per la cui tassonomia siano tutti d'accordo (eccezion fatta per quei piccoli gruppi che hanno un organo di classificazione "ufficiale") ed è necessario il discernimento umano per valutare la fonte più attendibile e per rintracciare le pubblicazioni originali. Fatevi un giro negli archivi della talk del progetto forme di vita per rendervi conto del problema: se abbiamo problemi a classificare i cervi, come pensate che siamo messi coi coleotteri (che, per renderci conto, costituiscono un quarto delle specie animali del pianeta)? Suggerisco di accantonare il bot-forme di vita e di proporre un altro argomento con cui far "giocare" i nostri fidi manovratori ;-) --Rupert Sciamenna qual è il problema? 21:41, 21 nov 2011 (CET)[rispondi]

Alcune considerazioni:

  1. domanda provocatoria: volete un'enciclopedia o una raccolta dati fine a sé stessa? se volete un'enciclopedia forse sarebbe il caso di chiedersi a quali bisogni (del lettore) si vuole far fede, se volete una raccolta dati fine a sé stessa allora sarebbe il caso di strutturare l'articolazione dei lemmi in modo più usabile. Gli stub automatizzati finalizzare a riempire spazi che mai saranno riempiti sono comunque inutili per un'enciclopedia: cercare il nome di una specie e leggere che quella specie esiste è una tautologia. Questa informazione si trova, inquadrata in un contesto più usabile, nelle banche dati on line e nei cataloghi. Una buona enciclopedia non deve necessariamente riportare 5000 stub su altrettante specie sconosciute di una famiglia, una buona enciclopedia deve invece riportare informazioni ampie sulla famiglia e rimandare il lettore ad un database (esterno) o a una lista (interna o esterna) se vuole conoscere i nomi delle specie che vi sono comprese.
  2. leggo a proposito di una fonte a cui il bot dovrebbe accedere. Bene. Quale fonte? in ambito zoologico esiste una sola fonte: l'International Commission of Zoological Nomenclature (ICZN), la cui banca dati non raccoglie alcuna lista di specie, bensì i riferimenti bibliografici delle descrizioni che fanno riferimento ad una serie tipo, ovvero le "ufficializzazioni" dei nomi delle specie. L'unica fonte attendibile è l'insieme composito della letteratura scientifica che si attiene agli standard della ICZN e del credito che la comunità scientifica attribuisce ad ogni autore nel momento in cui descrive una nuova specie o applica una revisione tassonomica. Tutte le banche dati, cataloghi, checklist o che dir si voglia sono, per definizione e per natura, incomplete e non affidabili in quanto riproduzioni istantanee e più o meno fedeli di un contesto in continuo dinamismo. Si cita ITIS come fonte affidabile? e quando mai? ITIS è limitato al contesto del Neartico (Nordamerica), peraltro non tanto aggiornato: la tassonomia dei Ditteri è fondamentalmente basata sul Manual of Nearctic Diptera, opera prodotta dal 1981 al 1989, ovvero un quarto di secolo fa. Nel frattempo sono passati oceani sotto i ponti. Quale bot è in grado di estrapolare un'informazione da un insieme bibliografico? al massimo può estrarre un dato da un database, ma chi controlla l'affidabilità del database?
  3. Prendiamo questo esempio. Può un bot riportare questa informazione? no, può solo scrivere una voce sull'esistenza di Beckeriella niger (Williston, 1897) o di Gastrops niger Williston, 1897 o, peggio, di entrambe. Peccato che non sia in grado di contestualizzare un errore sistematico incorporato nell'immenso calderone della letteratura scientifica prodotto dalle citazioni concatenate e mai risolto da una revisione. L'enciclopedia può però illustrare all'attento lettore che cerca spiegazioni la dinamica di un'incongruenza che ha accidentalmente riscontrato.
  4. Si vuole fare numero (article-count) oppure colmare una lacuna? allora non si devono scrivere 100 mila voci su insetti o bestiacce varie, di stub se ne devono creare circa 4-5 milioni. Perché questo è il numero di specie di organismi viventi stimato. Di cui circa il 60% sarebbero insetti o, almeno, un milione e mezzo. Se vi limitate a 100 mila stub non fate né zuppa né pan bagnato. Solo numero e rank, senza peraltro fare niente di utile (perché questi stub, nel complesso, hanno utilità pari a zero).
  5. Ma serve effettivamente una voce su ogni specie di insetto? ho i miei dubbi. Serve magari una voce sulla mantide religiosa perché è un insetto conosciuto e magari molti lettori vogliono saperne qualcosa sulla sua conformazione, sulla sua biologia, sul suo comportamento, ecc. Ma a fronte delle poche specie ben conosciute e interessanti sotto qualche punto di vista, esiste un esercito di decine (se non centinaia) di migliaia di nomi di specie che esistono perché un qualche autore, storicamente, ne ha dato la descrizione, magari sommaria, senza che nessun altro abbia mai visto un solo esemplare, senza che ne esista un esemplare vivente o conservato in una collezione. Da qualche decennio si è deciso di fare ordine: oggi l'istituzione di una nuova specie richiede una descrizione fedele e l'indicazione dell'esemplare (olotipo) che la rappresenta, conservato in una qualsiasi collezione, a disposizione di chiunque lo voglia osservare/studiare. Le vecchie specie esistono con carattere di ufficialità anche in assenza dell'olotipo finché non ci sia qualcuno che ne confermi l'esistenza riclassificando la specie con l'indicazione di un tipo oppure ne invalidi l'esistenza attribuendo una sinonimia o altra revisione.
  6. e qui mi fermo, per il resto fate come ritenete opportuno, ho solo dato qualche spunto di riflessione. Buon proseguimento :-) (giancarlo) --93.70.131.204 (msg) 21:45, 21 nov 2011 (CET)[rispondi]
Mah, sarà che mi occupo di pesci europei, tra i quali è raro che ci siano controversie tassonomiche in ranghi superiori al genere, o forse è semplicemente l'indifferenza dell'ecologo a questioni che gli paiono più forma che sostanza ma se nelle voci di ittiologia si applicasse para para la tassonomia di Fishbase non avrei nulla da ridire. Forse tutto nasce dal fatto che abbiamo proposto da subito i coleotteri, il cui numero è spaventoso, per gruppi più piccoli come i pesci il progresso dell'opera o sperimentazione che sia sarebbe molto più facile da seguire e correggere. Per inciso: la filogenesi è una scienza naturale, la tassonomia lo è solo nella misura in cui la rispecchia.
Questa o questa voce, che mi immagino siano state create da un bot su en wiki, contengono una serie di informazioni (stato di conservazione e cause della minaccia, habitat, areale) -immagino prese dal sito della IUCN- che non sono presenti nel tassobox. Quello che non so è se possiamo chiedere a un bot di fare questo lavoro, se sia possibile identificare le informazioni nel sito e raccoglierle...non ne so nulla di bot.--etrusko5² (msg) 00:12, 22 nov 2011 (CET)[rispondi]
Si, le voci inglesi sono state create da un bot prendendo i dati da qui. Secondo quanto leggo (l'IP) non esiste da nessuna parte una tassonomia ufficiale per nessuna specie vivente. Questo significa che tutte le nostre voci sono ricerche originali? Oppure, se per scriverle ci basiamo su una o più fonti, perché non potrebbe farlo anche un bot? "Una buona enciclopedia non deve necessariamente riportare 5000 stub su altrettante specie sconosciute di una famiglia" (cit.). Ma dai, e io che credevo che un'enciclopedia fosse "un'opera letteraria che raccoglie la sistematizzazione del sapere umano nei vari campi" Jalo 09:18, 22 nov 2011 (CET)[rispondi]

Permettete un OT: ma è possibile mettere gli interwiki a Speciale:PaginePiùRecenti? --Retaggio (msg) 09:54, 22 nov 2011 (CET)[rispondi]

Ehmmm, non ho capito Jalo 11:50, 22 nov 2011 (CET)[rispondi]
Non so nulla di coleotteri, ho appena scoperto da it.wiki che sono 350.000 specie. Un po' di tempo fa mi sono messo a fare le voci dei comuni del Mississippi. Per prima cosa ho scoperto quanti sono. Poi ho creato una banale tabella Excel dove ho inserito tutti i dati relativi ai comuni (nome, contea, wikilink alla contea, stato, n° abitanti, superficie, CAP, coordinata, sito web ufficiale se disponibile, link alla piantina su Commons, ecc, ecc.) prendendoli da varie fonti ufficiali del governo americano (tipicamente USCB). Poi ho controllato le disambigue necessarie e le ho riportate in tabella. Poi mi sono aiutato con un po' di righe in VB per creare dei file txt con ogni voce completa. Poi ho creato le singole voci, ho fatto copincolla dai txt e cliccato su "anteprima". Poi ho controllato i link in uscita, ho inserito una foto se c'era su Commons e solo dopo ho cliccato "salva". Di tutto questo lavoro l'unico realmente importante è stato il completamento della tabella (300 righe circa e una ventina di colonne). Avrei potuto affidarmi ad un bot (anzi spero che si possa trovare il modo di usarne uno per i prossimi comuni americani, venezuelani, congolesi, ecc.) solo per la creazione della voce, l'incollaggio del tutto nella finestra di modifica e il salvataggio della voce. Il controllo dei link in uscita, l'inserimento di una immagine appropriata e una verifica completa del risultato avrei dovuto comunque farli a mano. Se dobbiamo fare 350.000 voci di coleotteri o dei 100.000 funghi classificati, bisogna prima fare la tabella (e dubito che Excel basti :-P). E sentendo quello che viene detto qui sopra dagli esperti in materia, capisco che anche fare una tabella "giusta" non sia semplice (diveramente dai comuni statunitensi per i qual ottimisticamente i dati sono cristallizati per 10 anni, da un censimento all'altro). Riusciamo a fare un tabella che spieghi anche i problemi (mi par di capire notevoli) di classificazione tassonomica? Coerente e che raccolga davvero tutto quello che serve per descrivere i coleotteri o le muffe da un punto di vista tassonomico? Se ci riusciamo facciamo un lavoro per il quale la scienza, il sapere collettivo e l'umanità tutta ci saranno riconoscenti per l'eternità. Minimo ci danno il Nobel o forse la comunità scientifca ci spara per invidia. Fatto questo è evidente che ci serve un bot per riempire Wikipedia di tutti quei dati :-)
N.B. E' evidente che se questa raccolta di informazioni, che sono quelle che come enciclopedia dobbiamo mettere a disposizione dei nostri lettori, poi decidiamo di organizarla in 350.000 voci (oltre alle 100.000 per le muffe e tutte quelle che servono per ogniforma di vita conosciuta) oppure decidiamo di inserirla in tabelle, alberi, grafi all'interno di un numero minore di voci (fermanci alla famiglia, al genere o a quello che si vuole) diventa un problema del tutto secondario. Buttare lì una numero esagerato di voci dedicate a animali dei quali non è nemmeno certa l'esistenza fermandoci alla classificazione tassonomica e senza spiegare perché e percome questa sia incerta, discussa, non aggiornata, facciamo un danno a 'pedia. --Amarvudol (msg) 10:17, 22 nov 2011 (CET)[rispondi]
@ Jalo. Hai ragione sulla questione stub, che si possono ovviamente creare con un bot. Ma proprio perché dobbiamo raccogliere la sistematizzazione del sapere umano nei vari campi, IMHO è meglio se perseguiamo un minimo di cautela. Siamo sicuri che le voci olandesi sui coleotteri saranno aggiornate e manutenute in futuro? Una voce su un coleottero avvistato da un solo scienziato, classificato, la cui esistenza è certa e condivisa può contenere anche solo i meri dati tassonomici, non è uno stub, è una voce striminzita, ma completa e che presumibilmente sarà valida anche tra 10 o vent'anni. --Amarvudol (msg) 10:17, 22 nov 2011 (CET)[rispondi]
@Jalo, la questione delle fonti è più complicata di così. Non è che non esistano fonti sulla tassonomia, semplicamente non esistono fonti a misura di bot. Per un bot servono elenchi schematizzati, che esistono sotto forma di database, ma che non sono attendibili. Non che siano per principio sbagliati, ma nella maggior parte dei casi ogni specie richiede un vaglio da parte dell'utente. La fonte attendibile è infatti l'articolo scientifico nel quale la specie viene descritta. Questo è normalmente il procedimento con cui io verifico la tassonomia di una specie: per prima cosa cerco il nome nei database sopracitati, sperando magari di trovare una risposta univoca. In secondo luogo vedo a quale fonte i database si appoggiano per la classificazione e la nomenclatura, e seguo le fonti "a ritroso" per arrivare agli articoli originali. A questo punto mi devo fare qualche domanda, per esempio: dove è stato pubblicato quest'articolo? E quando? E quanto credito gli viene dato? E cosa è successo dopo? In altre parole: quanto è valida la fonte? Potrei per esempio trovare una classificazione degli anni ottanta basata sulla morfologia e accettata in un primo momento ma smentita negli ultimi anni da studi molecolari, oppure potrei trovare una specie descritta da un solo autore ma che altri due autori non considerano una specie indipendente, ma che per qualche motivo risulta su un database ecc. Discernere tra le fonti in base al panorama e all'opinione prevalente della comunità scientifica non è certo una ricerca originale, altrimenti qualunque voce lo è, ma se qualcuno ha programmato un bot in grado di fare un lavoro del genere ditemelo che smetto di scrivere e lascio fare tutto a lui. --Rupert Sciamenna qual è il problema? 11:29, 22 nov 2011 (CET)[rispondi]
Dimenticavo, la proposta di Etrusko25, di limitarsi all'inserimento di piccoli gruppi "sicuri" mi trova favorevole, a patto che dietro ai bot passi una pattuglia di utenti a destubbare le voci, come è atato fatto in passato. Parliamone di là. --Rupert Sciamenna qual è il problema? 11:32, 22 nov 2011 (CET)[rispondi]
@Amarvudol: Dici "Siamo sicuri che le voci olandesi sui coleotteri saranno aggiornate e manutenute in futuro?". Secondo me il problema è diverso. Abbiamo migliaia di voci su sportivi vari (calciatori in primis) in cui i dati sulle presenze/gol cambiano 2/3 volte la settimana. Siamo sicuri che siano sempre aggiornate? No, al contrario, siamo sicuri che non sono *mai* aggiornate. E poi ci preoccupiamo per una tassonomia che non verrà mai cambiata, o che lo sarà circa una volta ogni 5 anni
@Rupertsciamenna: Di solito, quando fonti diverse riportano cose diverse, chi scrive la voce non ne sceglie una, ma piuttosto le riporta tutte. Allora si potrebbe decidere di riportare nel template in automatico la tassonomia di una fonte (ovviamente liberamente correggibile se è sbagliata) e mettere nella voce tutte le tassonomie proposte dalle varie fonti. Oppure, se vogliamo, il bot è in grado di fornirti la voce senza salvarla, e tu decidi se farlo o meno Jalo 11:50, 22 nov 2011 (CET)[rispondi]
Questo è valido solo e soltanto se le fonti hanno pari attendibilità. Tra un database che segue una vecchia classificazione e uno che ne segue una più recente non si mettono entrambi ma si sceglie il secondo, tra un database che riporta una classificazione che non ha credito presso la comunità scientifica e uno che invece riflette l'opinione corrente della suddetta comunità si ceglie il secondo. Sarebbe come dire che se su un certo numero di siti internet c'è scritto che la terra è piatta allora dobbiamo riportare anche tale opinione, indipendentemente dal fatto che le fonti autorevoli riportino che invece è sferica. Fortunatamente non siamo bot e siamo in grado di discernere, motivo per cui questo lavoro un bot non lo potrebbe fare. Forse nei precedenti interventi non sono stato chiaro: non è che non esista una classificazione da considerare valida, solo che spesso trovarla richiede la capacità di ragionamento propria dell'essere umano. Non è lo stesso per le voci di storia, di arte o di fisica? E se io adesso proponessi di scrivere tutte le voci sugli eventi storici che ci mancano facendole copiare da un bot da uno dei numerosi siti di cronologie che si trovano su internet? Ovviamente vi sembrerebbe assurdo. Cosa vi fa pensare che descrivere una forma di vita (in particolare la tassonomia, che riassume in uno schema milioni di anni di storia evolutiva) sia più semplice che descrivere un evento storico? Ripeto, non sono contrario alla creazione di voci via bot, ma gli olandesi hanno scelto l'argomento sbagliato. --Rupert Sciamenna qual è il problema? 12:09, 22 nov 2011 (CET)[rispondi]
Scusate, noto solo adesso questa pagina che sta diventando già troppo grossa per me. Il suggerimento è questo: qualcuno ha chiesto al progetto Forme di vita se per caso possiamo usare database+BOT per inserire voci riguardo non alle specie, ma a qualche livello tassonomico superiore, ad esempio i generi (o ancora più in alto)? chiedo scusa se ila richiesta è già stata fatta. --Azz... 12:18, 22 nov 2011 (CET)[rispondi]
  •   Favorevole al bot. Abbiamo già avuto bot simili (per i comuni francesi ad esempio) che hanno creato migliaia di stub che nessuno avrebbe mai creato neanche ancor oggi probabilmente, ma che una volta creati sono stati destubbati facilmente e con ottimi risultati. Quindi WP:BE BOLD se i nostri botolatori se la sentono nulla osta. ---- Theirrules yourrules 12:54, 22 nov 2011 (CET)[rispondi]
  •   Favorevole all'uso dei BOT soprattutto per quel che riguarda la creazioni di voci sui comuni --Erik91scrivimi 13:18, 22 nov 2011 (CET)[rispondi]
  • Io sono   Contrario a prendere decisioni così specifiche in questa pagina. Infatti penso che dovrebbero essere solo i partecipanti al progetto Forme di vita a decidere sulla effettiva utilità e qualità di tali voci. Leggendo infatti i commenti di tali utenti mi pare di capire che la tassonomia non è una "scienza esatta", per cui bisogna andarci con i piedi di piombo e affidarsi a chi davvero conosce l'argomento. --Aushulz (msg) 13:27, 22 nov 2011 (CET)[rispondi]
A prescindere dal caso specifico (il progetto forme di vita ha utenti di cui mi fido ciecamente) mi sembra pericoloso dire che solo i partecipanti di un progetto debbano prendere una decisione che coinvolge decine di migliaia di voci Jalo 13:48, 22 nov 2011 (CET)[rispondi]
Beh però usarlo nei comuni da creare credo ci siano meno problemi no ??? --Erik91scrivimi 15:04, 22 nov 2011 (CET)[rispondi]
Sui problemi specifici relativamente ai comuni mi sono espresso poco più sopra, quindi non mi ripeto, ma ribadisco che i problemi ci sono e non vanno sottovalutati. A proposito dei comuni francesi che, a quanto leggo più sopra, sono stati destubbati facilmente e con ottimi risultati, scusa Their ma, a parte le città più importanti, che ci sarebbero state comunque, io di questi comuni ampliati dopo la creazione da parte del bot ne vedo ben pochi (a nasometro un 5%); non guardiamo se hanno il template {{S}}, quello è stato tolto quando si è deciso che non andava messo sotto i 5.000 abitanti.--Frazzone (scrivimi) 18:44, 22 nov 2011 (CET)[rispondi]
Sempre sui comuni francesi: la gran parte di essi non ha i dati aggiornati all'ultimo censimento e anche gli istogrammi con l'evoluzione demografica sarebbero da aggiornare, ulteriore dimostrazione che non basta creare le voci, bisogna anche curarne la manutenzione, e qui la "manodopera" non è che sia poi molta. Non mi esprimo poi, per "carità di patria", sui template di navigazione delle dimensioni di una tovaglia da banchetti nuziale che a template davvero fruibili. E ricordatevi che tra qualche mese, quando usciranno, saranno da aggiornare anche gli 8.000 e rotti istogrammi dei comuni italiani.--Frazzone (scrivimi) 18:50, 22 nov 2011 (CET)[rispondi]
  Favorevole, decisamente, a dare la mia piccola mano verso un grande salto di qualità, verso una grande responsabilità che, finalmente, non scartiamo a priori, ma cerchiamo di assumerci facendo tesoro delle nostre conoscenze, della nostra esperienza. --87.4.145.29 (msg) 21:24, 22 nov 2011 (CET)[rispondi]
Scusa Frazzone ma cosa centra il fatto che dovranno essere aggiornati ??? Allora non dovremmo creare in ogni caso più voci per lo stesso problema anche a mano??? --Erik91scrivimi 22:12, 22 nov 2011 (CET)[rispondi]
C'entra con lo stesso discorso che è stato fatto da altri più su con riferimento alle forme di vita. Piuttosto, facciamo in modo che i bot operino molto di più su queste cose, come l'aggiornamento dei dati quando esce un censimento per esempio, o la sostituzione dei template sinottici obsoleti e sostituiti da strumenti unificati. Per me, quelli sono "lavori da bot", non la creazione di voci, sempre che nonsi vogliano fare le corse che tutti negano di voler fare. A margine, Erik, visto che anche tu dici che con i comuni non ci sarebbero problemi, che mi dici di quelli che ho indicato sopra? I problemi ci sono eccome, certo bisogna volerli vedere e non dire che poi "qualcuno li risolverà". Nella mia modesta esperienza, proprio sulle voci di comuni, ti garantisco che modificare una voce già fatta, anche da un bot, richiede almeno il doppio del tempo di crearne una ex novo.--Frazzone (scrivimi) 22:54, 22 nov 2011 (CET)[rispondi]
NDR io sopra ho scritto che ci sarebbero meno problemi --Erik91scrivimi 09:29, 23 nov 2011 (CET)[rispondi]

  Favorevole Quando la tecnologia può aiutare, perché privarsene? Esiste la possibilità che vengano introdotti errori, ma anche nelle voci scritte a mano esistono. Fino a pochi giorni fa [1] Greenspan era ancora dato come segretario della Fed, cosa che non è più da quasi sei anni. Lo spirito di wiki è proprio il lavoro collaborativo: un pezzo lo faccio io, un pezzo un altro. E se l'altro in questo caso è un bot non ci vedo nulla di male. --Chessstoria (le s sono 3) (Dica Duca) 11:58, 23 nov 2011 (CET)[rispondi]

Ma LOL!!! Ora stanno mettendo i cimiteri! :-DDD --Retaggio (msg) 14:28, 24 nov 2011 (CET)[rispondi]

  Favorevole alle voci automatiche Karol Józef (msg) 16:30, 27 nov 2011 (CET)[rispondi]

  Favorevole alla creazione delle voci in automatico, o per lo meno non vedo perché dovremmo negarci a priori questa possibilità. Quando accadrà occorrerà studiare bene la cosa e non sarà ovviamente possibile per tutte le tipologie di voci, ma perché non farlo se fosse possibile? --Lepido (msg) 22:27, 27 nov 2011 (CET)[rispondi]

Aiuto:Creazione sistematica di pagine modifica

Vista tutta la discussione, segnalo che a Utente:Nickanc/Sandbox/4 sto elaborando una linea guida che spieghi se e come sia possibile la creazione in massa di pagine. Ogni contributo è estremamente gradito!! :)--Nickanc ♪♫@ 15:13, 22 nov 2011 (CET)[rispondi]

Discussione assolutamente "da bar" questa, perché, anche se i più fossero davvero favorevoli, servirebbe comunque un bot con manovratore. Piuttosto, se qualcuno ha un bot può mettersi a disposizione di questo o quel progetto per la creazione di voci, ma non serve a nulla che chi non manovra un bot si dica favorevole al lavoro degli altri. --78.13.59.73 (msg) 18:09, 23 nov 2011 (CET)[rispondi]
E quindi è anche inutile dichiararsi contrari se non si ha un bot. La soluzione qual è? Che chi ha un bot decide senza chiedere niente? Jalo 08:52, 24 nov 2011 (CET)[rispondi]
Presumo più o meno come fare una discussione sul permettere o meno ad un utente di creare una serie di stubboni con AWB, se non che sia un utente esperto nell'uso di quello strumento per evitare faccia più danni che creare benefici. Credo il tutto sia nel campo chiedo una cortesia ---> la cortesia viene accolta, senza ulteriori polemiche su chi ha questa capacità all'interno della comunità :-)--threecharlie (msg) 09:15, 24 nov 2011 (CET)[rispondi]
Questa discussione dove sta andando a finire ? Si vuole usare un BOT per creare voci o no?? Se si almeno si decida un argomento... --Erik91scrivimi 10:19, 24 nov 2011 (CET)[rispondi]
Veramente, come botolatore, io sarei intervenuto... per il resto serve più consenso e soprattutto più conoscenza di questi metodi per fare queste cose quindi:
  1. si cerca di completare quella bozza di linea guida qui su
  2. nei progetti si elaborano, chi le vuole elaborare, le proposta di lavoro col bot, poi se ne discute in generale.
Questo mi sembra il metodo migliore. cosa ne dite?--Nickanc ♪♫@ 14:20, 24 nov 2011 (CET)[rispondi]
Concordo! -- Yiyi ___ (Scrivimi...) 14:49, 24 nov 2011 (CET)[rispondi]
Non per essere pessimista ma mi sa che finirà con un nulla di fatto :/ --Erik91scrivimi 21:52, 25 nov 2011 (CET)[rispondi]
speriamo di riuscirci invece! 93.58.120.244 (msg) 20:32, 28 nov 2011 (CET)[rispondi]

E allora cerchiamo di non fossilizzarci! modifica

Se non ci sbrighiamo a pubblicare gli obiettivi per i quali stiamo lavorando, mi vedrò costretto a quotare Erik1991; anzi, quasi lo quoto adesso, perchè la discussione mi sembra già semifossilizzata. Io proporrei, senza alcun dubbio, un prototipo delle voci che si verrebbero a creare, per inserirle in una pagina di sondaggio per la comunità, in modo da esprimere subito il nostro parere in linea di massima, potendo poi agire di conseguenza, sospendendo i lavori per mancato consenso o iniziando a compierli, in gruppo e collaborativamente, qualora la maggioranza fosse favorevole all'impiego di bot per lo sviluppo da zero di determinate pagine.--Farberking Guarda!!! 13:44, 26 nov 2011 (CET)[rispondi]

Non siamo 24h su 24 qui. La linea guida che intendevo scrivere sopra, quando l'avrò finita, non si ha da intendere come programmatica ma come tecnica: ti spiega come fare. Quel che si vuole fare, non c'entra nulla, è soltanto limitato da ciò che è possibile. Potete discuterne anche adesso, ma penso che prima serve dare alla comunità delle spiegazioni su quel che può effettivamente chiedere a noi botolatori. Datemi il tempo di scrivere... :(--Nickanc ♪♫@ 13:50, 26 nov 2011 (CET)[rispondi]
Ma certo, Nickanc:anzi, ti ringraziamo tutti tanto per il prezioso lavoro che stai conducendo :)! Prosegui pure ed opera bene, mi raccomando... mi fido di te ;)!! Scusami, comunque:non volevo metterti alcuna pressione, io. --Farberking Guarda!!! 17:31, 26 nov 2011 (CET)[rispondi]

(rientro) No problem. Bozza di linea guida pronta a Utente:Nickanc/Sandbox/4. :)--Nickanc ♪♫@ 18:21, 26 nov 2011 (CET)[rispondi]

Buono ma non si può mettere la discussioni tra quelle in evidenza al bar ??? Secondo me è importante --Erik91scrivimi 12:34, 27 nov 2011 (CET)[rispondi]
E' chiaro che sarebbe un'ottima cosa, io ero convinto che, data la quantità molto elevata di visite della pagina e dei loro interventi, fosse automatico che la discussione, per merito del server, passasse tra quelle in evidenza per qualche mese. --Farberking Guarda!!! 13:28, 27 nov 2011 (CET)[rispondi]
Anche io lo pensavo sinceramente --Erik91scrivimi 15:26, 27 nov 2011 (CET)[rispondi]
Fatto, risegnalato al bar e nelle discussioni importanti. Ora si attendono pareri sulla bozza di linea guida tecnica.--Nickanc ♪♫@ 15:36, 27 nov 2011 (CET)[rispondi]
visto che non sono apparsi pareri contrari alla bozza di linea guida, che ne dite se la trasferiamo a Aiuto:Creazione sistematica di voci?--Nickanc ♪♫@ 22:18, 27 nov 2011 (CET)[rispondi]
Per me è ok... -- Yiyi ___ (Scrivimi...) 22:31, 27 nov 2011 (CET)[rispondi]
Non sono tanto convinto dalla linea guida. Mi sembra che dia l'impressione che la creazione di voci tramite bot possa essere una cosa quasi normale e non eccezionale. Anche perché all'interno si dicono cose come che per creare un numero enorme di voci, è consigliato chiedere l'aiuto dei bot. Già il consenso per la creazione di voci tramite bot non è così chiaro, figuriamoci per dire che per creare un numero enorme di voci è consigliato usare un bot.
Io sono favorevole all'uso di bot per creare alcuni tipi di voci se ci sono le condizioni, ma l'uso del bot dev'essere uno strumento, non l'obiettivo. Se ci si imbatte in un database che ci consente di creare via bot degli stub dignitosi (e con informazioni corrette), benissimo, si discute della bontà del database, della fattibilità dell'operazione e se c'è consenso si parte. Ho l'impressione però che qui si stia finendo per partire dall'idea di usare un bot per poi andarsi a cercare un database con cui creare le voci, con le storture che si rischiano di crearsi, prima fra tutte una spinta ad usare il bot tanto per usarlo senza preoccuparsi troppo delle informazioni che si andranno a scrivere (vedi alcuni interventi nella discussione qua sopra, tipo l'IP che ha scritto "un altro bot sui comuni farebbe davvero comodo, anzi, a pensarci bene sarebbe ancora meglio di quello sugli insetti").--Sandro_bt (scrivimi) 05:43, 28 nov 2011 (CET)[rispondi]
Non posso fare altro che concordare con te quando dici che «l'uso del bot dev'essere uno strumento, non l'obiettivo». Effettivamente io essendo nella mia RL in un ambito tecnico, qualche perplessità ce l'ho proprio per questa intera discussione. Voglio dire, il bot è uno strumento per fare delle cose, come lo è un computer o un formo a microonde. Una discussione se sia lecito l'uso dei bot per creare una o diecimila voci, scusate, mi pare un po' strana. Capirei di più una discussione mirata su un progetto, cioè: "abbiamo questo database, può essere utilizzato per creare in automatico stub decenti?". In pratica occorrerebbe discutere sul "fine" (i contenuti) non su come questi contenuti vengono immessi (bot, a mano o con la telepatia). --Lepido (msg) 08:25, 28 nov 2011 (CET)[rispondi]
Come Lepido --Bultro (m) 12:26, 28 nov 2011 (CET)[rispondi]
Sagge parole --ESCULAPIO @msg 13:02, 28 nov 2011 (CET)[rispondi]
Anche io sono d'accordo ma se mi posso permettere una riflessione vorrei condividerla: benché sia da una parte consigliato di contribuire a it.wiki facendo traduzioni dalle wiki in lingua straniera e da un'altra che WP (multilingue) non è fonte primaria (quindi non usatela, ma limitatamente come fonte nel testo), non sarebbe interessante un esperimento di "cannibalizzazione" di voci provenienti da (ad esempio) en.wiki? Non credo sarebbe un problema che un bot leggesse un sinottico in en.wiki e ne estraesse i contenuti inserendoli in quelli it.wiki con tanto di verifica se gli stessi abbiano o meno una fonte (ad esempio nelle voci di aerei questo è presente). Continuo a farvi partecipi che si ha in Progetto:Aviazione/Convenzioni di stile per aeromobili una linea guida per un incipit standard dove credo si potrebbe inserire alcuni dati provenienti dal sinottico stesso. All'inizio probabilmente risulterebbe un po' tautologica ma non meno delle decine di stub peggiori che abbiamo nella Categoria:Stub - aerei. Il concetto vale anche per compagnie aeree ed aeroporti (prego i curiosi di farsi un giro tra le categorie per vedere lo stato medio di questa tipologia di voci. Giusto per non fossilizzarsi sulle forme di vita :-))) naturalmente un esperimento potrebbe pescare in una sola categoria (aerei per costruttore, cose che in it.wiki non abbiamo ancora, o compagnie aeree o aeroporti per nazione, così con nazioni "minori" abbiamo meno problemi di fonti multiple e potenzialmente discordanti). Che ne pensate? Utopia o ragionevolmente fattibile?--threecharlie (msg) 13:07, 28 nov 2011 (CET)[rispondi]

(rientro) il botolatore che è in me vorrebbe capire: nella bozza, proprio nell'introduzione è spiegato che i bot non sono il fine (Questo tipo di elaborazioni non devono MAI essere intese od utilizzate in modo concorrenziale al lavoro umano ma devono servire a liberare l'utente dall'occuparsi di strutture e dati mnemonici, che sono concettualmente poveri, così da permettergli di dedicarsi agli altri aspetti della voce.) e nella sezione "bot o umano?" mi sembra ci sia scritto esattamente quello che sandrobt e lepido hanno qui detto (c'è scritto È importante che, prima di chiedere l'aiuto dei bot, la modifica che si intende fare sia stata discussa e vi sia consenso su di essa: modificare molte voci in poco tempo, in caso di errore, può portare a dover fare molte correzioni.) nonché sul database all'inizio c'è proprio scritto che deve essere affidabile (ho messo una specificazione ora al proposito)... a me sembra quindi che la linea guida specifichi l'aspetto di affidabilità e consenso che sottolineate. Eppure dite di non essere convinti. Pertanto chiedo: non è sufficientemente chiaro? come lo chiarireste? Specifico che ho messo la bozza nella mia sandbox, però ogni vostro contributo è ben accetto. :)--Nickanc ♪♫@ 14:08, 28 nov 2011 (CET) p.s. In questa discussione si è parlato molto della liceità della creazione via bot. La bozza spiega invece come si deve fare e non se si deve fare (come scienza ed etica); per la liceità si rimanda ai principi generali dei pilastri e del consenso... questo è chiaro nella bozza secondo voi?[rispondi]

Assolutamente chiaro ed assolutamente d'accordo. 93.58.120.244 (msg) 20:35, 28 nov 2011 (CET)[rispondi]
Condivido i dubbi di sandro_bt e di Lepido. Mi sembra però che siano tutti "addressati" all'interno della bozza di linea guida. La bozza è sintetica, ma la preferisco così: inutile parlare dei dettagli tecnici del bot o di come si deve formare il consenso, visto che su di esso ci sono documenti appositi. Quello che mi domando è: visto che abbiamo la bozza, quale dovrebbe essere il prossimo passo? --Chessstoria (le s sono 3) (Dica Duca) 12:01, 29 nov 2011 (CET)[rispondi]
Un database. ;-) --Retaggio (msg) 12:02, 29 nov 2011 (CET)[rispondi]
Butto lì un'idea nuova, insetti :-) --Chessstoria (le s sono 3) (Dica Duca) 12:10, 29 nov 2011 (CET)[rispondi]
80 mila specie? Diciamo che è "buttata" nel senso letterale del termine :D. Hai idea delle centinaia di migliaia di specie di coleotteri che sono ancora da determinare o da confermare? --93.70.131.204 (msg) 12:31, 29 nov 2011 (CET)[rispondi]

(rientro)Vista questa discussione, la bozza di pagina di aiuto è stata spostata a Aiuto:Creazione sistematica di voci. Non resta che discutere, prima nei progetti specifici e, se si riterrà opportuno l'uso di bot, poi al bar generale, delle eventuali paginee da fare. Ai bar dei progetti potete copia-incollare questo avviso (il cui contenuto è desunto da questa discussione):

il cui codice è

{{Avviso
| tipo = struttura
| testo = '''È stata creata una pagina di aiuto sulla [[Aiuto:Creazione sistematica di voci|creazione sistematica di voci (o parti di esse)]]- con o senza bot.'''
----
Invitiamo questo bar a prendere in considerazione il contenuto della linea guida e l'eventualità di aiutarsi attraverso questi sistemi, laddove possibile. Si ricorda che:
* l'uso di bot è un '''caso straordinario''' da prendere in considerazione solo per un grandissimo numero di voci (2000+ almeno) e solo previo un '''ampio consenso''';
* Queste operazioni di creazione sistematica di voci sono meglio fattibili e '''in poco tempo anche da parte di un umano''', per esempio attraverso le spiegazioni date nella pagina di aiuto (come nel caso degli asteroidi).
}}--~~~~

--Nickanc ♪♫@ 15:37, 29 nov 2011 (CET)[rispondi]

Per favore, l'avviso a tutti i progetti proprio no... --Sandro_bt (scrivimi) 05:38, 1 dic 2011 (CET)[rispondi]

ho confezionato l'avviso se qualcuno lo volesse mettere laddove ritenga opportuno, però non passerei mai a mettere l'avviso a tappeto: in qualche progetto l'idea può essere utile, ma in molti progetti è inutile se non dannoso.--Nickanc ♪♫@ 16:11, 1 dic 2011 (CET)[rispondi]
Io alla fine non ho capito nulla di tutta questa discussione. Scusate, qual è il problema per fare come hanno fatto gli olandesi? Perchè non possiamo fare come loro? Perchè non usare un bot che possa scrivere in pochi giorni cose che una squadra di utenti normali non riuscirebbe a scrivere, anche solo a livello di stub, in alcuni anni?--93.42.211.16 (msg) 19:47, 11 dic 2011 (CET)[rispondi]

Proposte operative modifica

Sulla spinta di questa discussione, e alla luce delle passate esperienze, il Progetto:Forme di vita ha individuato come possibile terreno operativo la creazione di tutte le voci dell'ordine Cycadales. Ne stiamo discutendo qui. C'è qualcuno tra i botolatori disposto a dare una mano? --ESCULAPIO @msg 10:14, 30 nov 2011 (CET)[rispondi]

Tornare alla questione modifica

Mi sembra che la discussione abbia rapidamente abbandonato la questione principale per affrontare la fattibilità tecnica senza tener conto di un diffuso dissenso. Vorrei dunque riportare la discussione al punto iniziale. Io sono:

  •   Contrario alla realizzazione di migliaia di voci abbozzate con o senza bot. Penso che la sfida per Wikipedia è avere voci attendibili e approfondite, in particolare sugli argomenti portanti per qualsiasi enciclopedia (scienza, tecnica, storia, filosofia, storia dell'arte), in modo tale da confrontarsi non solo con le enciclopedia a stampa generaliste, ma anche con le opere specialistiche. --Salvatore gioitta (msg) 16:03, 26 dic 2011 (CET)[rispondi]
  • E' normale che non ci sia più un'affluenza sufficiente per procedere con nuovi progetti, del resto non è più "roba che scotta", non balza più agli onori della cronaca una discussione, anche se importante, dopo un mese e mezzo dal "boom". Discutere in ogni progetto compatibile con un bot crea-pagine, sarebbe più "attuale", e discusso, soprattutto, da persone più esperte nel settore. Lì, inoltre, si deciderebbe con più conoscenze di base sullo specifico argomento;ciò indirizzerebbe il tiro dei botolatori verso lo sviluppo, in positivo ed anche qualitativo, di Wikipedia. Mi ribadisco più che   Favorevole alla creazione di pagine automaticamente, visto che, se "istruito" a dovere e da persone competennti quali sono i nostri botolatori, può tranquillamente ricoprire mansioni, nemmeno troppo "spoglie", degli utenti in carne ed ossa. --Farberking 14:19, 2 gen 2012 (CET)[rispondi]

  Favorevole all'uso dei bot per la creazione di voci sulle specie animali.

Motivo? Quale umano avrebbe mai il tempo, la voglia, la forza di volontà, la perseveranza di creare migliaia di pagine tutte molto simili col fatto che l'errore umano è più diffuso di quello del bot?

Altrimenti rimarremo indietro come nella Rivoluzione Industriale rispetto agli sviluppatori di questo sistema. A quanto mi è parso poi per le fonti sarebbe giusto mettere un'avviso ad hoc per questo processo che informi i lettori della possibile inesattezza delle informazioni (o qualcosa di simile). L'importante non è essere perfetti ma tenderci. (Al Progetto:Insetti avranno un lungo lavoro umano a seguire il bot.)

Una idea: il lavoro dopo-bot potrebbe essere suddivisibile su vasta scala a tutti gli utenti interessati.

  • Ci sarà innanzitutto un avviso dello stesso carisma di quello del Fundraiser 2011-2012 per una settimana che avvertirà tutti quelli che visualizzano wikipedia se a loro va di far parte di questo Processo (l'avviso, si intende con immagine annessa. Me ne potrei occupare io se qualcuno come già detto non mi smonta l'idea.).
  • (A parte: bisogna dare un nome specifico a questo Processo altrimenti sarà un po' difficile sponsorizzarlo in una settimana.)
  • Poi vi sarà una pagina in cui vi sarà scritto di che si tratta e perché e come etc. in cui si chiederà in grassetto di mettere una firma per accettare di unirsi al Processo di revisione nome processo. Chi si iscriverà riceverà, alla fine della creazione dei bot delle pagine (con tutti i dovuti avvisi annessi), una lista di un certo numero x di voci (create dai bot) di cui si chiede di accettarle come parte della propria eredità (o qualcosa di simile) e semplicemente di verificarle (cioè andare su internet e verificare l'esattezza con altri siti).
  • Dobbiamo essere uniti; solo così si farà qualcosa di tutto ciò. E poi, non siamo solo tutti italiani? E, no, ci sono anche degli svizzeri fra noi e loro si che saranno precisi nel verificare le voci. Quindi potremmo contare virtualmente su più persone disposte ad aiutare questo Processo. più siamo meglio... Raoli ๏̯͡๏ (msg) 04:12, 3 gen 2012 (CET)[rispondi]
Sarebbe da insistere sul fatto che per le voci inserite via bot comunque qualcuno deve impegnarsi a metterle negli osservati speciali e tenerle d'occhio. Dividendole fra piu` persone e` possibile.
--Lou Crazy (msg) 04:33, 3 gen 2012 (CET)[rispondi]
  Contrario Lou, non riusciamo attualmente a tenere sotto controllo 15-16.000 voci create, figurati centinaia di migliaia. Chi ce le terrà sotto controllo, il bot? No, certamente, finito il suo lavoro, avremo 100.000-200.000 stub da far pena (con tutto il rispetto per i botolatori, temo che il livello di complessità che richiedono queste voci attualmente sia fuori portata). Esempio di voci degli olandesi che invidiamo tanto: [2], [3] (corrispondenti voci italiane Diastanillus, Ainerigone). Questi sono esempi dal mondo dei ragni cui contribuisco, ma per le altre forme di vita è lo stesso. Vale la pena di tenere centinaia di migliaia di voci per chissà quanto in quelle condizioni?--Eumolpo (πῶς λέγεις;) 05:54, 3 gen 2012 (CET)[rispondi]

A mio parere la creazione di voci tramite bot ha senso solo se affiancata dal lavoro di squadre sufficientemente numerose da riuscire in breve tempo a farsi carico della verifica/ampliamento degli "scheletri" creati dal bot medesimo. Questa almeno è la filosofia che sta alla base della "operazione Cycadales" in cui è attualmente impegnato il progetto Forme di vita. Se manca questo presupposto si rischia davvero la creazione di migliaia di stub abbandonati al loro destino, di nessuna utilità dal punto di vista del reale contenuto informativo e per di più facile bersaglio di atti di vandalismo. Suggerirei quindi, piuttosto che dividersi in astratto tra favorevoli e contrari all'uso dei bot, di fare delle proposte concrete in ambiti specifici, individuando di volta in volta gli utenti disponibili e facendo le nostre scelte in base a tali disponibilità.--ESCULAPIO @msg 08:48, 3 gen 2012 (CET)[rispondi]

Esculapio, magari gli "scheletri" in alcuni casi possono essere a posto cosi` come escono dal bot (ad esempio con gli asteroidi credo sia andata cosi`...). Dipende dai casi. L'importante, e` evitare che, come dici, diventino "facile bersaglio di atti di vandalismo", il che richiede avere prima un tot di utenti che si impegnino a dividersi le voci nuove nei propri osservati speciali.
Questo vale anche per Eumolpo. Non conosco ne` i ragni ne` la lingua olandese, ma quelle due pagine mi sembrano onesti stub, che intanto anneriscono un po' di link rossi. L'importante e` che qualcuno le tenga d'occhio nel tempo.
Torno ad Esculapio. Pienamente d'accordo con l'idea di discutere casi concreti.
--Lou Crazy (msg) 12:12, 3 gen 2012 (CET)[rispondi]
gli scheletri si possono mettere dentro gli script (ovvero, diciamo così, "dentro al bot"), sul computer del botolatore, su wikipedia... il risultato sarà sempre uguale. È però più sicuro metterli fuori dal bot e su wikipedia. Fuori dal bot perché così si minimizza la parte di codice da creare ex novo (= meno bug + meno lavoro per il botolatore), su wikipedia per questioni di trasparenza (software libero in enciclopedia libera :) ) in modo da rendere più facile il lavoro se capitasse che il botolatore non fosse disponibile e si dovesse fare un lavoro simile. Per questo incoraggiamo questo modo di lavorare e non altri. Ovviamente previo consenso (e non in astratto, in concreto).--Nickanc ♪♫@ 19:09, 3 gen 2012 (CET)[rispondi]

  Contrario Apprezzo il lavoro dei bot e dei botolatori che li creano/gestiscono. Quando funzionano a dovere sono molto utili. E sottolineo molto. Tuttavia, l'idea che migliaia di voci possano nascere in una catena di montaggio automatizzata e seriale perché temiamo di restare indietro la trovo francamente sbagliata. Oserei dire anche insultante. Ma mi trattengo. Wikipedia è un'enciclopedia ed è anche una comunità. Ci siamo dati degli obiettivi, quasi un mandato, ci mettiamo passione, tempo, voglia. E nessuno ci obbliga. Ci piace. Adesso, per "stare al passo", sentiamo il bisogno di far fare a un bot per non doverlo fare noi. Forse sarò radicale ma la mia risposta è: no, grazie. (Aggiungo che l'Operazione Cycadales ha comunque un suo perché e una buona impostazione; non robotizzata sarebbe anche migliore, più lenta ma migliore.) --ARIEL 01:09, 9 gen 2012 (CET)[rispondi]

Domanda tecnica modifica

Esistono strumenti pratici per estrarre informazioni dai template di una wiki in un'altra lingua, e tabularle? Poi si potrebbero dare in pasto ad un bot.

--Lou Crazy (msg) 12:14, 3 gen 2012 (CET)[rispondi]

Utente:Abisys/ScanTemplate.--Nickanc ♪♫@ 18:24, 3 gen 2012 (CET)[rispondi]
Una domanda meno tecnica ma forse più pertinente se ci si ostina ad automatizzare le voci sulle specie: da quando la wiki in un'altra lingua è considerata fonte attendibile?
Anche ammesso che il lavoro di un bot venga poi verificato dall'umano, facciamo qualche calcolo tenendo i piedi per terra. Ipotizziamo che il bot estrapoli i dati dalle "nuove" voci create dal bot olandese sui coleotteri. Quante sono? 100 mila? per controllare l'affidabilità bisogna consultare più fonti compresa anche la letteratura dato che le banche dati non sono assolutamente affidabili. Ma anche ipotizzando una procedura di verifica snellita (=ad minchiam) ci vorranno si e no cinque minuti a voce (per verificare la congruenza della validità di alcune specie in alcuni casi avevo impiegato giorni). Per verificare 100 mila voci occorrerebbero, sottostimando, 500 mila minuti, pari a oltre 8000 ore. Ipotizzando una immersione totale di 10 ore al giorno, per fare questa verifica occorrono 800 giorni, ovvero più di due anni-uomo di lavoro compresi natale capodanno pasqua e ferragosto. Quanti sono gli utenti che si occupano di insetti su it.wiki? Riuscite a trovare una decina di utenti in modo da ridurre i tempi di questa verifica a soli tre mesi? Secondo me non ci sono e parlo con cognizione di causa. Mi risulta che su it.wiki ci sia un solo utente che si occupa sistematicamente di insetti, gli altri sono passati a miglior vita. E quell'utente rimasto si occupa peraltro di lepidotteri, non di coleotteri. Immagino che gli vogliate un gran bene per pensare di distoglierlo dai suoi interessi e pretendere che per due anni si occupi di un lavoro più frustrante di quello di un avvitatore di bulloni in una catena di montaggio.
Tenere i piedi per terra ed evitare i voli pindarici buttando dalla rupe gli altri, no? mah... --93.70.134.226 (msg) 18:59, 3 gen 2012 (CET)[rispondi]
Aggiungo (@Raoli e Lou Crazy): quando parlate di insetti avete una vaga idea della complessità della materia per pensare di affidarla ad un bot? Prendete a caso 10 cataloghi on line commensurabili e otterrete 11 liste diverse --93.70.134.226 (msg) 19:05, 3 gen 2012 (CET)[rispondi]
Penso che ogni wikipedia sia affidabile poichè in ognuna vi sono utenti che ne controllino la qualità (tranne in quelle nascenti). Questa stima è perfetta. Ci sono cioè 8000 ore di lavoro. Bene, a parte la verifica da queste supposte banche dati c'è anche quella da Wikispecies, sempre affidabile. Non penso che a questo progetto partecipi solo l'utente che si occupi del progetto:Insetti. Non staremo tutti qui a parlare. Io penso che molti utenti vi parteciperanno e ripeto di tener conto di quello detto sopra. 8000 ore totali di lavoro diviso 2 ore uguale 4000 ore. Cioè servirebbero solo 4000 utenti in un giorno che spendino ciascuno massimo 2 ore per la revisione. L'elenco statistiche dice che ci sono circa 8000 utenti attivi al momento: Speciale:Statistiche. Quindi se una buona fetta fosse avvisata la cosa si potrebbe fare nel giro di un giorno o due. Altrimenti più ragionevolmente in una settima o massimo 2 contando varie variabili. Riusciremo a trovare degli utenti sia parlandone sia secndo me con un avviso in alto. Il lavoro su Wikipedia non è mai facile, pensa che in un giorno mi imparai ad usarla, le cose da fare sembrano difficli ma in realtà non lo sono, è un'impressione. Questo processo deve iniziare. --Raoli ๏̯͡๏ (msg) 21:11, 3 gen 2012 (CET)[rispondi]
Raoli, mi dispiace deluderti, ma dubito fortemente che , 1) si riuscirà a coinvolgere 4000 utenti in questa impresa (ai vagli, che sono molto meno faticosi, generalmente non partecipano più di 6-7 utenti), e soprattutto, 2) che questi ipotetici 4000 utenti possiedano le competenze per correggere voci così specialistiche. Ma poi che bisogno c'è di fare numero? Questa mi sembra una deriva pericolosa, trasformare Wikipedia in una fabbrica di stub "purché siano" non giova a nessuno. Non è meglio piuttosto cominciare a eliminare errori, approssimazioni, bufale, POV e quant'altro dalle voci già esistenti, prima di imitare il peggio degli altri Progetti? --Mari (msg) 21:56, 3 gen 2012 (CET)[rispondi]
(conflittato)>Penso che ogni wikipedia sia affidabile: falso. Se non ti fidi posso darti i riferimenti per verificare che qualche voce di en.wiki (per citarne una) riporta classificazioni errate, incomplete, superate o incoerenti.
>a parte la verifica da queste supposte banche dati c'è anche quella da Wikispecies: ancora più falso. Wikispecies è ancora più incompleta e incongruente
>Non penso che a questo progetto partecipi solo l'utente che si occupi del progetto:Insetti ecc.: ho capito, parli senza cognizione di causa perché non ti rendi conto della complessità del problema. Sicuramente non hai mai letto una revisione tassonomica in ambito di entomologia, figuriamoci spulciarti la letteratura per riuscire a risalire al numero di specie attualmente considerate valide all'interno di un taxon. Probabilmente non sai cos'è un nomen nudum, uno junior synonym, un senior synonym, un misspelling, probabilmente non sai che ci sono specie che hanno avuto 10-20 nomi differenti, di cui 4 o 5 sono ancora ricorrenti in fonti diverse. Probabilmente non sai che certi cataloghi sono basati su fonti che risalgono a 20-30 anni fa. Se il tuo concetto di verifica consiste nel consultare la prima lista che ti passa per le mani allora sono d'accordo, il lavoro si può fare in un giorno o due. Ma si tratta di un lavoro alla carlona, come dicevo prima, e completamente privo di fondamento.
>Il lavoro su Wikipedia non è mai facile, pensa che in un giorno mi imparai ad usarla, le cose da fare sembrano difficli ma in realtà non lo sono. Scrivere è facile, scrivere su wikipedia un po' meno, scrivere cose fondate su wikipedia ancora meno facile, soprattutto quando si pretende di scrivere senza aver cognizione della materia. Dato che parliamo in lingue differenti e da pianeti distanti chiudiamola pure qui, cercare di farti capire il problema è solo una perdita di tempo. :) --93.70.134.226 (msg) 22:12, 3 gen 2012 (CET)[rispondi]
@Mary Il fatto è che con un avviso in alto in tutte le pagine si potrebbero trovare un buon numero di utenti disposti. Questo processo è rivoluzionario poichè si affiderà ai bot, istruiti dagli umani, per un breve periodo, un'attività onerosa di solito umana. il nuemro serve poichè più saremo meglio il lavoro post-bot sarà. Io penso che una volta nel 2004 non vi fossero molte pagine e molte di quelli presenti fossero stub, quindi creando un complesso di pagine stub (pure fosse su argomenti poco interessanti) si aumenterebbe la quantità di informazioni che wikipedia sarebbe in grado di dare agli utenti. Lo so che gli stub fanno diminuire il livello qualitativo medio di Wikipedia e mi sono posto pure io questo problema, ma è meglio offrire gratuitamente più informazioni possibili (con avviso di inesattezze incluso). Hai perfettamente ragione che bisogna corregere errori, approssimazioni, bufale, POV e quant'altro dalle voci già esistenti, ma sai bene che è un lavoro continuo che non finirà mai perchè vi saranno sempre IP o utenti che faranno queste cose. Invece questo Processo è un lavoro finito ed è un'iniziativa abbastanza positiva, (mica tutto quello fatto dalle macchine è negativo; pensa che se i computer fossero fatti da artigiani, si verrebbero meglio, ma ve ne sarebbero di meno quindi costerebbero di più e quindi li userebbero solo i ricchi e quindi Wikipedia avrebbe molti, ma molti mento utenti volontari) che espande la cultura su questi insetti. Sulle capacità degli utenti non posso esprimermi poiché non conoscendoli tutti non saprò mai che conoscenze abbiano, ma so che con un po' di buona volontà ognuno riesce in quello che vuole. --Raoli ๏̯͡๏ (msg) 23:07, 3 gen 2012 (CET)[rispondi]
@93.70.134.226 Non penso che se alcune wikipedie abbiano qualche discrepanza sulle fonti sia un buon motivo per non far partire questo processo. Se dici che Wikipedia e Wikispecies non sono affidabile mini i fondamenti di ogni Wikipedia e affermi che nessuna Wikipedia dice cose certe. Allora cos'è la certezza. Quello che dicono gli altri siti? Beh, alcuni protrebbero esserlo, ma non puoi avere la certezza poichè alloa tu ti baseresti su quegli altri siti. E chi ti dice che sono quelli che sono più aggiornati sulla classificazione? Non puoi verificarlo. Quindi io come Wikimediano mi baso per costruire Wikipedia sui Progetti sorella e su Wikipedia in tutte le lingue. Come potrebbe essere diversamente?
No sinceramente non conosco nè la tassonomia nè come funzioni ma sono pronto a impararla. Ma, scusa non potresti aiutarci scrivendo una pagina sul modo generale con cui si effettua questa revisone. Basta che prendi una voce in questione da nl.wikipedia e stili poche righe su quello che si deve fare per verificarlo con fonti. Se non si tratta di settimane si tratta di un mese ma l'importante e che questo processo parta, ripeto non solo per superare in classifica nl.wikipedia che sarebbe un motivo in più per i contributori a contribuire, ma soprattutto fondamentalmente per ampliare la conoscenza umana in italiano di queste specie. Pensa ai futuri ambiti di uso. Non restringere il processo a Wikipedia, allrga gli orizzonti e pensa che ci potresti aiutare con una brevissima guida su come si dovrebbe revisionare una voce del genere.
Ti ripeto se vuoi ti do ragione, ma a me non importa di dare ragione o di averla. Non penso parliamo da pianeti diversi. Si,l'affermazione riconosco è criptica, ma in se ha una buona motivazione. La motivazione viene prima di tutto. Lo sai perchè ti rispondo? Perchè credo che sia profondamente ingiusto per Wikipedia non avere questo processo e per te non parteciparvi. Io non ho nulla contro le tue opinioni, le condivido, ma ho una motivazione diversa dalla tua. Io pur di farla rinuncierei a vivere per distribuire il sapere/conoscenza in Italia. Sai in Italia ce ne sta davvero poco. Pensa a tutta la gente che vive di Camorra, Mafia, povertà e pensa all'ignoranza che ci sia in questi ambienti. Poi pensa sempre a quelli che vedi per strada che parlano di calcio, donne quando su loro stesse c'è un debito pubblico gigantesco. Pensa che gli italiani hanno le tasse tra più alte nell'Europa con pochissimi servizi, pensa alla corruzione in politica, alle caste, alle loggie massoniche, a quanto possa contare un italiano nel mondo. Il nostro governo è labile e cerca sempre più di ridurre l'intelligenza del paese. é strano, ma è così. Pensa alla nazione delle intelligenze di Cattaneo (L'Italia deve tenesi all'unisono con l'Europa). Non è giusto quello che dici. Dobbiamo cercare su Wikipedia di dare informazioni il più possibile veritiere e indipendenti ma se ad un certo punto non le diamo tutti ne vengono limitati. Solo combattento l'ignoranza e l'alfabetizzazione superficiale (come dice Leopardi nelle Operette Morali) si ottiene una società migliore e chi lo può fare meglio dell'intellettuale (i wikipediani sono intellettuali moderni) e pensatore? (Diceva Zolà) Ecco per questo ogni processo per me va in questa direzione. E per questo volevo tanto far partire questo processo. --Raoli ๏̯͡๏ (msg) 23:38, 3 gen 2012 (CET)[rispondi]
Ti ripeto se vuoi ti do ragione. Non voglio avere ragione, volevo solo dare un suggerimento sull'opportunità di certe proposte, che vanno applicate secondo il contesto adatto. Il resto te l'ho spiegato via mail, non intendo discutere oltre perché non m'interessa far valere la mia opinione. Non è un problema mio ;) --93.70.134.226 (msg) 00:45, 4 gen 2012 (CET)[rispondi]
Ok, va bene. Mi hai convinto. Comunque la mia era solo una modestissima opinione. Ciao ;) --Raoli ๏̯͡๏ (msg) 01:26, 4 gen 2012 (CET)[rispondi]
Raoli, il tuo modo di pensare mi lascia perplesso. Va bene che sei (o sei stato, non lo so) favorevole a creare voci con i bot, ma si possono vedere un milione di problemi a riguardo, tranne quello del fare in fretta. Detto questo:93.70.ecc, Mari: non c'è nulla di nulla, IMHO, da aggiornare nelle voci sugli insetti, oppure da modificare con periodicità, eccetera, visto che le liste, al massimo, si arricchiscono, rarissimamente (o forse mai? sarebbe da chiedere...) riclassificano, ridescrivono e modificano le informazioni contenute in ciascuna voce. IMHO, creare voci sugli insetti è utilissimo. Facciamo pure il nome di quello che si occupa di insetti assiduamente, tanto lo sappiamo tutti:è Eumolpo. E' un utente estremamente accurato, meticoloso, esperto e voglioso di migliorare il progetto, ma nonostante questo... non c'è una grande differenza, con un "prototipo" di voci, sul medesimo argomento, sviluppate automaticamente. Forse si aggiungono poche informazioni prettamentne "testuali", ma ha tutta questa importanza, mi chiedo io? So bene che, con pagine accuratamente scritte, con nozioni specifiche sul soggetto trattato, tutti saremmo più soddisfatti di queste, rispetto ad eventuali pagine create da un bot (e curate esclusivamente da un bot); ma ha senso avere voci di 50 kilobyte (dico per fare un esempio) su qualche ragno in via di estinzione delle mangrovie del Madagascar, ma non avere voci di aracnidi (n.b.:anche la classe degli aracnidi è un esempio) che popolano a miliardi il mondo, e che magari, per molti altri anni, mai verranno create, perchè si dà la precedenza a voci molto meno di rilevanza "effettiva", ma perchè dispongono di 2000 parole sul comportamento, anzichè 1000? --Farberking 18:40, 4 gen 2012 (CET)[rispondi]
Per l'IP: ho forse mai detto di sapere tutto sugli insetti? Non mi pare. Non attribuiamo agli altri posizioni mai espresse.
Sono a favore di interventi specifici e solo laddove chi si occupa del campo lo ritenga fattibile, dove ci siano fonti attendibili, e dove sia pensabile che tutte queste voci vadano negli osservati speciali di qualcuno.
Per Nickanc: grazie della dritta.
--Lou Crazy (msg) 19:59, 4 gen 2012 (CET)[rispondi]
P.S. Non amo che i miei commenti vengano riformattati da altri.
(conflittato) Facciamo pure il nome di quello che si occupa di insetti assiduamente. Errato, non è Eumolpo, lui si occupa di ragni, non di insetti. L'utente a cui mi riferivo è molto più "anonimo" perché sconosciuto al 99,99% dei wikipediani dal momento che non appare mai sul namespace wikipedia. Si tratta di Massimiliano Panu, presente su Wikipedia da meno di un anno. In poco più di 10 mesi ha all'attivo oltre 3500 edit nel ns0 e 109 nuove voci di Lepidotteri. Magari, aggiungiamoci il jolly Esculapio per non fare discriminazioni nella menzione. --93.70.134.226 (msg) 20:18, 4 gen 2012 (CET)[rispondi]
@ Lou Crazy. Non intendevo attribuirti posizioni mai espresse, mi sono espresso male o comunque sono stato frainteso: intendevo solo sottolineare che non c'è fattibilità nell'ambito dell'entomologia (come per altri ambiti tematici, sia chiaro). Se ti ho tirato in ballo è perché la tua richiesta in merito all'utilizzo di altre wikipedie come banca dati d'origine per la tassonomia non è compatibile con il requisito di affidabilità della fonte. In privato ho spiegato a Raoli il perché della mia considerazione. --93.70.134.226 (msg) 20:18, 4 gen 2012 (CET)[rispondi]
Cerco di fare un po' il punto della situazione. Abbiamo in fieri l'Operazione Cycadales, dove circa due mesi fa si è chiesto ad un botolatore collaborazione per la creazione di 7 generi e soprattutto 326 specie di questo ordine di piante. Si stanno inserendo le voci genere per genere, poi un numero ristretto e competente di utenti passa a migliorare e destubbare le voci stesse prima che il bot passi al genere successivo. Dopo quasi due mesi si è a metà del lavoro, perché è proprio la fase due, di incremento e destubbo delle voci quella più doverosa e impegnativa. La collaborazione bot-utenti in questo caso ha un che di positivo, però a patto che 6-7 utenti capaci collaborino con un botolatore per tre mesi alla creazione di circa 330 voci. Questa è la velocità giusta di incremento delle voci. Non so se gli utenti che hanno/stanno collaborando nella suddetta operazione Cycadales, nello stesso tempo avrebbero ottenuto lo stesso risultato anche senza il botolatore ma, imho, poco ci manca. Il concetto di fondo è fare delle voci di buon livello: Manduca sexta è una delle voci dell'Utente:Massimiliano Panu sui Lepidotteri e questa è la sua versione olandese...e parliamo di un insetto abbastanza conosciuto... In questo tipo di voci non ci si improvvisa, oltre le fonti in rete vanno ricercate le pubblicazioni originali delle specie, confrontate le descrizioni, riportarle con note, avere dimestichezza con la terminologia, ecc. Non ci si può improvvisare esperti, si farebbero danni colossali...e a ripararli poi.... Quindi la stesura delle voci o avviene secondo la collaborazione bot-utenti di cui prima (max. 300 voci in due-tre mesi di lavoro) o, imho, e meglio non farne niente.
@ LouCrazy e Raoli, a quanto so vi sono numerosi altri progetti in cui il botolatore potrebbe lavorare con profitto in quanto su tante voci non sono disponibili che pochissime informazioni: mi riferisco a decine di migliaia di isole e isolette, centinaia di migliaia di villaggi, centinaia di migliaia di montagne, colline, grotte, laghi, fiumi su cui non vi sono studi specifici di settore, ma se ne possono indicare solo poche informazioni, l'ideale per un bot. Le forme di vita sono alquanto più complesse e vanno studiate e descritte accuratamente.--Eumolpo (πῶς λέγεις;) 21:02, 4 gen 2012 (CET)[rispondi]
@Raoli: continui a tentare di leggermi nel pensiero, ma senza successo. Ho solo chiesto se c'erano strumenti per prendere dei dati dai template di una wiki, non ho detto che volevo prendere dei dati di tassonomia da nl.wiki (peraltro, se proprio uno lo volesse fare, e non credo che sarebbe il caso di farlo, e` quasi certamente piu` comodo andare direttamente alla fonte originale usata dagli olandesi, che se ho capito bene e` ben organizzata in forma tabellare). Avevo in mente un altro caso di circa 300 voci che prima o poi sono da creare, e per le quali sarebbe utile attingere ai template delle voci corrispondenti di en.wiki. Li` la fonte che e` stata usata e` affidabile, ma i dati di quella fonte non sono ben organizzati in forma tabellare, dunque e` piu` semplice pescarseli da li`. In quel caso, secondo me, sarebbe utile usare uno strumento automatico per crearle, e sarebbero gia` ad un ottimo stadio, poi potremmo in poco tempo fare a mano gli ultimi aggiustamenti.
--Lou Crazy (msg) 12:18, 10 gen 2012 (CET)[rispondi]