Utente:Jilliams89/Sandbox

Ti diamo il benvenuto nella pagina delle prove (o sandbox) di Wikipedia!

Lo scopo della presente pagina è quello di permettere liberamente di fare degli esperimenti senza conseguenze su pagine attive. Per fare le prove clicca sulla linguetta Modifica wikitesto, scrivi, usa il pulsante Visualizza anteprima e, quando sei soddisfatto, clicca sul tasto Pubblica le modifiche. Il tuo testo non rimarrà a lungo: la pagina è sovente sovrascritta da altri utenti e ripulita regolarmente. Per maggiori informazioni, vedi Aiuto:Pagina delle prove.

Se vuoi fare una prova di modifica con la nuova interfaccia di modifica VisualEditor puoi utilizzare la relativa pagina delle prove o la funzionalità dedicata.

Se sei un utente registrato, puoi anche decidere di usare una sandbox personale.

Benché sia una pagina delle prove, anche questa pagina deve sottostare alle linee guida di Wikipedia in materia di comportamenti degli utenti e diritto d′autore. Quindi non devi mai inserirvi contenuti sotto copyright od offensivi o financo diffamatori. A titolo d′esempio, non è permesso fare copia-incolla da altri siti Internet (nemmeno fosse il tuo sito web personale!), perché, salvo poche eccezioni, è una violazione della legge.

Buon lavoro.
L’estrazione terminologica è una sottocategoria dell’estrazione di informazioni che consiste nell’identificare (automaticamente) i termini rilevanti in un Corpus dato.

Scopo dell’estrazione terminologica è generare materiale utile per la creazione di un glossario terminologico o di un’ontologia, oppure di supporto per la traduzione umana e automatica. Una volta estrapolati, i potenziali termini di interesse vengono filtrati sulla base di ricorrenza, specificità e tasso di ambiguità. Questa operazione si realizza solitamente mediante programmi informatici dedicati (i cosiddetti estrattori terminologici).

L’estrazione può essere monolingue o bilingue. L’estrazione terminologica monolingue è finalizzata all’identificazione di termini candidati, mentre l’estrazione terminologica bilingue si basa sull’analisi di testi di partenza e relative traduzioni per identificare potenziali termini e i loro traducenti. Esistono tool di estrazione terminologica di approccio linguistico, più adatti a lavorare su un’unica lingua dato che cercano combinazioni di parole che corrispondono a determinate strutture nel discorso. I tool dall’approccio più statistico identificano invece le sequenze ripetute di segmenti lessicali e il vantaggio è l’indipendenza rispetto alla lingua considerata. Trattandosi di un processo che sfrutta programmi automatici, e per questo non infallibili, l’intervento umano nell’estrazione terminologica è necessario per escludere errori, imprecisioni e parole non rilevanti. In questo senso, l’estrazione di termini può quindi definirsi un processo di selezione assistito o semi-automatico.
Ulrich Heid, esperto di lessicografia computazionale, docente presso le Università di Stoccarda e Hildesheim e membro del gruppo di ricerca IMS Corpus/Lexicon Research Group, sostiene che l’estrazione terminologica automatica debba seguire tre principi:

1)Un sistema di estrazione deve sempre permettere la correzione manuale e quindi essere semi-automatico.

2)L’estrazione di termini candidati sarà sempre accompagnata da un certo rumore, cioè dalla presenza di termini indesiderati, e quindi l’obiettivo di chi sviluppa tali sistemi deve essere quello di ridurre al minimo il livello di rumore.

3)Un sistema di estrazione terminologica dovrebbe per contro ridurre al minimo il numero di candidati buoni che non vengono estratti, cioè il cosiddetto silenzio.

Sempre secondo il professor Heid, l’estrazione si svolge in due fasi: l’identificazione dei termini canditati e il successivo filtraggio per ridurre rumore e silenzio.

Per l’estrazione semi-automatica di termini da corpora elettronici di riferimento si possono utilizzare vari programmi. Il più conosciuto è il Multiterm di Trados, creato nel 1992. Altri programmi utili sono WordSmith Tools, TextStat, AntConc e strumenti sul web come WebCorp10.


Collegamenti esterni

modifica
[[Categoria:Linguistica]]