Information retrieval: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Folto82 (discussione | contributi)
mNessun oggetto della modifica
m non stiamo scrivendo un SMS, su Wikipedia non ci sono problemi di spazio
Riga 1:
L''''information retrieval''' ('''IR)''') (in [[lingua italiana|italiano]] ''recupero delle informazioni'') è l'insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, [[pagina web|pagine web]], [[catalogo|cataloghi]] online e oggetti [[multimedialità|multimediali]]. Il termine è stato coniato da [[Calvin Mooers]] alla fine degli [[anni quaranta]] del [[Novecento]], ma oggi è usato quasi esclusivamente in ambito [[informatica|informatico]].
 
L'IRinformation retrieval è un campo interdisciplinare che nasce dall'incrocio di discipline diverse coinvolgendo la [[psicologia cognitiva]], l'architettura informativa, la [[filosofia]] (vedi la voce [[Ontologia (informatica)|ontologia]]), il ''[[disegno industriale|design]]'', il comportamento umano sull'informazione, la [[linguistica]], la [[semiotica]], la [[scienza dell'informazione]] e l'[[informatica]]. Molte università e [[biblioteca|biblioteche pubbliche]] utilizzano sistemi di IRinformation retrieval per fornire accesso a pubblicazioni, libri ed altri documenti.
 
== Scopo dell'IRinformation retrieval ==
Lo scopo dell'IRinformation retrieval è di soddisfare il cosiddetto "bisogno informativo dell'utente", ovvero garantire a quest'ultimo, in seguito ad una sua ricerca, i documenti e le informazioni che rispondono alla sua richiesta.
 
Due concetti sono di fondamentale importanza per analizzare un sistema di IRinformation retrieval: [[query]] ed oggetto.
* Le '''[[query]]''' ("interrogazioni") sono stringhe di parole-chiavi rappresentanti l'informazione richiesta. Vengono digitate dall'utente in un sistema IR (per esempio, un [[motore di ricerca]]) e sono la concretizzazione del reale bisogno informativo dell'utente.
* Un '''oggetto''' è un'entità che possiede informazioni le quali potrebbero essere risposta dell'interrogazione dell'utente. Un documento di testo, per esempio, è un oggetto di dati.
 
=== Task dell'IR ===
Comunemente, si definisce '''task''' di un sistema di ''information retrieval'' una situazione tipica che un sistema di questo genere deve risolvere.
 
Nel momento in cui un utente intende usare un qualsiasi sistema di reperimento dell'informazione (per esempio, un [[motore di ricerca]]) per acquisire informazioni su un determinato argomento, questi deve tradurre tale necessità in una [[query]]; il sistema di IRinformation retrieval ha il compito di restituire, a partire da essa, tutti i documenti rilevanti alla richiesta effettuata.
 
== Misure di prestazione ==
Riga 26:
La precisione può anche essere valutata rispetto a un certo valore soglia, indicato con ''P@n'', piuttosto che relativamente a tutti i documenti recuperati: in questo modo, si può valutare quanti fra i primi ''n'' documenti recuperati sono rilevanti per la query.
 
Il significato e l'uso del termine ''precisione'' nel campo dell'IRinformation retrieval differiscono quindi dalla definizione di [[accuratezza]] e [[precisione]] tipiche di altre discipline scientifiche e tecnologiche.
 
=== Recupero ===
Riga 115:
* {{Collegamenti esterni}}
'''Sistemi di Information Retrieval in campo scientifico'''
* {{en}} {{Collegamento interrotto|1=[http://www.ihop-net.org/UniPub/iHOP/ iHOP] |date=settembre 2018 |bot=InternetArchiveBot }} Sistema di IRinformation retrieval nel settore biomedico
* {{en}} [http://www.sphinxsearch.com/ Sphinx] motore che effettua ricerche su interi testi
* {{en}} [http://www.lemurproject.org/ Lemur] Toolkit di modellizzazione del linguaggio
Riga 123:
<br />
'''Software di Information Retrieval Open Source'''
* [http://ir.dcs.gla.ac.uk/terrier Terrier] TERabyte RetrIEveR, motore di ricerca con funzioni di IRinformation retrieval
* [http://www.galaxquery.com/galatex/ GalaTex] versione open source dello standard XQuery (ricerca testuale su documenti in XML)
* {{collegamento interrotto|1=[http://www.htdig.org/ ht://dig] |date=marzo 2018 |bot=InternetArchiveBot }} software per effettuare ricerche mirate dentro intranet o singoli domini web
* [http://www.cs.uni.edu/~okane/source/ISR/isr.html Toolkit Mumps] software per effettuare esperimenti di IRinformation retrieval
* [http://lucene.apache.org/java/docs/ Lucene (Apache)] tecnologia per la ricerca testuale
* [https://web.archive.org/web/20060418000941/http://www.nzdl.org/html/mg.html MG-1.3] serve per indicizzare e compattare i documenti ricercati