Wikipedia:Bar/Discussioni/Desiderata di libri da scansionare presso l'Internet Archive

Desiderata di libri da scansionare presso l'Internet Archive


Ciao, immagino che questa mail passata in lista Wikisource internazionale possa interessarvi. Una delle possibili applicazioni per Wikipedia penso possa essere l'ottenere delle immagini di libri antichi (frontespizi, esempi, ecc.) da inserire nelle voci di Wikipedia relative ai libri stessi, agli autori ed in altre voci rilevanti (come per esempio le voci di letteratura, di storia, ecc.). Wikimedia Italia, una volta capita l'entità dei costi, può aiutare. Intanto se volete iniziare a scrivere una lista potete coordinarvi anche con gli utente di Wikisource... A presto. -- CristianCantoro - Cieli azzurri! (msg) 10:07, 23 lug 2012 (CEST)[rispondi]

Interessante veramente, grazie dell'avviso. --Bramfab Discorriamo 10:46, 23 lug 2012 (CEST)[rispondi]
[OT] dato che si parla di Internet Archive e Wikisource, colgo l'occasione per segnalare di aver messo gli occhi su questo volume (dovrebbe esserci anche il primo, ma non ricordo l'URL) che di fatto è la base del progetto (copyrighted) etimo.it.
se si riesce a travasare il testo su Wikisource secondo me ne può trarre beneficio anche il Wikizionario (si andrebbero a colmare le centinaia di "Etimologia mancante" utilizzando quel vocabolario come una delle fonti). --valepert 13:34, 23 lug 2012 (CEST)[rispondi]
+1 - OrbiliusMagister - εΔω 16:10, 23 lug 2012 (CEST)[rispondi]
Il dizionario etimologico Piangiani è disponibile su google books (ce n'è una versione oscurata e una no, dovrei ricercarlo), l'utilità di quel volume è altissima, a mio parere, e anche la sua qualità, davvero ottimo. --Lucas 16:16, 23 lug 2012 (CEST)[rispondi]
[OT] qui c'è il dejavu. --valepert 17:37, 23 lug 2012 (CEST)[rispondi]
toh, eccolo! :) --Lucas 20:08, 23 lug 2012 (CEST)[rispondi]

(rientro) WMI ha fatto anche digitalizzare questo vocabolario della lingua italiana Zingarelli del 1922 con l'idea di usarlo aiutare Wikizionario, ma l'OCR è andato meno bene di quanto sperassimo. Chiedete a Nemo se volete il quadro più aggiornato della situazione (o aspettate che risponda lui stesso :P). -- CristianCantoro - Cieli azzurri! (msg) 02:15, 24 lug 2012 (CEST)[rispondi]

Visto che siamo nell'OT più totale, cosa avete usato per l'ORC? quella roba costa un occhio dalla testa. :) --Lucas 09:45, 24 lug 2012 (CEST)[rispondi]
L'OCR? Stare gratis! I.A. te lo fornisce nel mazzo, con Any2djvu si ottiene senza particolare sforzo e senza un centesimo. Poi se hai Office hai MODI. Peccato che la qualità sia -in genere ma non sempre- un po' bassa; come si sa moltissimo dipende dalla qualità dell'immagine. Vero è che con OCR professionali (non poi tanto costosi) si lavora meno con le dita :) --Silvio Gallio (msg) 10:17, 24 lug 2012 (CEST)[rispondi]
Interessante! Ero rimasto ai costi per scandire in automatico un libro intero (tipo i sistemi della libreria di google books), lì le cose si fanno più scure, a quanto mi risultava. Thanks! ;) --Lucas 14:11, 24 lug 2012 (CEST)[rispondi]

Ah, beh, 'Quell'OCR è altra cosa! Io parlavo di roba per noi poveretti :). D'altra parte vedo che, alla fine, i prodotti "industriali" sono meno buoni di quelli "artigianali" fatti in casa (ma per me è ovvio!). Certo che mettersi con lo scanner di casa a pelare 8/900 pagine... Forse l'OCR è andato male perché è stato usato il formato jpg. Ovviamente meglio TIF che però non è compresso... e da quello passare al djvu. Roba che uno da solo ci mette un anno :( --Silvio Gallio (msg) 20:25, 26 lug 2012 (CEST)[rispondi]