Paolo Ferragina

docente universitario e informatico italiano

Paolo Ferràgina (Catanzaro, 27 giugno 1969) è un informatico italiano.[1] Si è occupato principalmente della progettazione e implementazione di algoritmi per l'analisi, la memorizzazione compressa, l'indicizzazione e la ricerca su big data.

Con Giovanni Manzini ha ideato l'FM-index, una struttura dati con numerose applicazioni in bioinformatica;[2][3][4][5] è proprio per l'FM-index che Ferragina e Manzini hanno ricevuto, insieme con Micheal Burrows, il premio ACM Paris Kanellakis (edizione 2022) con la seguente motivazione:

«Per aver inventato la trasformata BW e l'FM-index che hanno fatto progredire notevolmente il campo delle strutture di dati compressi con un impatto fondamentale sulla compressione dei dati e sulla biologia computazionale».[6]

Ferragina e Manzini sono stati i primi italiani e quarti europei a ricevere il premio.[7][8] Ferragina ricopre dal 2007 la cattedra di professore ordinario di algoritmi presso l'Università di Pisa.[9] Nel 2019 è insignito dell'Ordine del Cherubino, premio conferitogli dall'ateneo pisano per aver «contribuito ad accrescerne il prestigio, per particolari meriti scientifici, e [per aver] fornito un rilevante supporto alla vita e al funzionamento dell’Università, avendo ricoperto al suo interno significative cariche istituzionali ed organizzative»;[9][10] nel 2021, è nominato ACM Senior member dell'Association of Computing Machinery (USA).[11]

Formazione modifica

Paolo Ferragina consegue il dottorato di ricerca in informatica presso l'Università di Pisa (1996), dov'è allievo di Fabrizio Luccio;[12] prosegue poi gli studi con un post-dottorato presso il Max-Planck-Institut für Informatik (1998),[13] sotto la supervisione di Kurt Mehlhorn.

Trascorre periodi di formazione e di ricerca in vari istituti e industrie; oltre a quelli già citati: MGH/Harvard Medical School (Boston, MA), Massachusetts Institute of Technology (Boston, MA), Courant Institute (Università di New York), University of North Texas, IBM Research (Roma), AT&T Shannon Lab (Florham Park, NJ), Yahoo! Research (Barcellona), Google (Zurigo).[13]

Attività accademica modifica

Dopo aver fatto ritorno all'Università di Pisa, diviene professore ordinario a decorrere dal 2007.[10][14] I suoi primi anni di attività di ricerca sono sostenuti da un piano di finanziamento quinquennale di Yahoo!, in particolare tramite un Faculty Award, dal 2006 al 2010 — all'epoca il primo in Europa — grazie ai suoi contributi nel campo della compressione dei dati e delle strutture dati efficienti su disco.[14] Dirige un gruppo di ricerca denominato Acube Lab (cioè «Laboratorio A al cubo», perché si occupa di Algoritmi Avanzati e Applicazioni),[15] che ha collaborato con importanti aziende tecnologiche del settore ICT, tra cui Google, l'Unione europea di radiodiffusione (UER/EBU), Bloomberg, Yahoo!, ST Microelectronics, ENEL, CERVED, Tiscali, ecc.

Ha avuto un'intensa produzione scientifica[16] su riviste e conferenze internazionali (sottoposte a revisione tra pari) nell'ambito dell'informatica teorica, dell'Algoritmica e dell'Information Retrieval. Ha pubblicato più di 170 articoli, è stato citato più di 10 mila volte e detiene un indice H pari a 40 (dati di Google Scholar, marzo 2023).[17] Su Scopus, detiene un indice H pari a 36 e più di 6.000 citazioni (dati di marzo 2023).[18] I suoi articoli sono apparsi cinque volte sulla rivista Journal of the ACM, tre volte su SIAM Journal on Computing, quattro su ACM Transactions on Algorithms, sette su Algorithmica, sette su Theoretical Computer Science, due su ACM Transactions on Information Systems.[14] Per quanto riguarda le conferenze, i suoi articoli sono stati pubblicati tre volte sugli atti dell'ACM Symposium on the Theory of Computing (STOC), cinque volte su IEEE Foundations of Computer Science (FOCS), sette volte su ACM-SIAM Symposium on Discrete Algorithms (SODA), tredici volte su European Symposium on Algorithm (ESA), sei volte su World Wide Web Conference (WWW), tre volte su ACM Web Search and Data Mining (WSDM).[14] È co-depositario di quattro brevetti statunitensi,[14][19] co-autore di cinque libri d'informatica (tre in italiano, pubblicati da Boringhieri, Pisa University Press e Il Mulino, e uno in inglese, pubblicati da Springer[20]. È autore di un testo in lingua inglese sull'ingegneria degli algoritmi pubblicato da Cambridge University Press,[21] e di alcuni capitoli in testi in lingua inglese pubblicati da Springer[14] e da CRC Press.[22]

È tra gli ideatori, oltre che dell'FM-index, anche di TagMe,[23][24] il primo entity-linker per la lingua italiana, multilingue (disponibile anche in inglese e tedesco) e liberamente fruibile sull'infrastruttura di ricerca europea SoBigData. È citato tra i contributori delle ricerche che hanno dato origine al compressore Brotli di Google,[25][26] il quale è adottato da più del 94% dei browser moderni (marzo 2023).[27] È anche co-autore del PGM-index, struttura dati per l'indicizzazione di sequenze d'interi come, ad esempio, colonne di basi dati o le liste invertite dei motori di ricerca;[28] la libreria software del PGM[29] ha ottenuto 670+ stelle su GitHub[30] e 580+ voti positivi su Hacker News[31] ed è stata adottata nella base dati open source Manticore.[32] È tra gli autori dello String B-tree,[33] la prima struttura dati per la gestione di dizionari di stringhe a lunghezza variabile che ottiene prestazioni ottime in termini di scritture su disco, definita come «elegante» da Donald Knuth a pagina 489 del volume terzo della sua opera The Art of Computer Programming[34].

Cariche accademiche modifica

Nel corso della carriera accademica ha ricoperto diversi ruoli istituzionali presso l’Università di Pisa. Dal 2006 al 2009 è stato vicedirettore del Dipartimento d'Informatica;[35] dal 2010 al 2016, è stato prorettore per «la ricerca applicata e l’innovazione»:[1] in questo periodo è l'ideatore e fautore di due iniziative per la promozione della ricerca di eccellenza (MIT-Italy, col Massachusetts Institute of Technology)[36] e della formazione alla cultura imprenditoriale: il PhD Plus.[37][38] Dal 2018 al 2020, ha svolto il ruolo di Coordinatore del dottorato (regionale) di ricerca in Informatica, che coinvolge anche le Università di Firenze e Siena, di cui è membro dal 2002;[39] dal 2019 al 2022, è Prorettore per l’Informatica[10] e ha definito la strategia digitale d'ateneo durante l'emergenza legata alla pandemia da COVID-19.

Comitati scientifici internazionali modifica

Tra gli incarichi scientifici di maggior rilevanza, si segnalano:

  • Dal 2011 è membro del comitato editoriale della rivista internazionale Journal on Graph Algorithms and Applications (JGAA);[40]
  • Aea editor della (EN) Ming-Yang Kao (a cura di), Encyclopedia of Algorithms, New York, Springer New York, DOI:10.1007/978-1-4939-2864-4.
  • Area editor della (EN) Albert Zomaya, Javid Taheri e Sherif Sakr (a cura di), Encyclopedia of Big Data Technologies, Springer Cham, DOI:10.1007/978-3-319-63962-8.
  • Co-direttore della scuola estiva internazionale di dottorato Jacob T. Schwartz sul tema Computational Social Sciences, che si tiene annualmente sull'isola di Lipari dal 2016.[41]
  • Nel 2019, è membro del comitato di valutazione dei progetti europei di ricerca ERC Advanced Grants per il settore «PE6 - Computer Science and Informatics».[42]
  • Membro del comitato direttivo della conferenza Symposium on String Processing and Information Retrieval (SPIRE; dal 2006 al 2009)[43] e dello European Symposium on Algorithms (ESA; dal 2012 al 2014).[44]

Premi e riconoscimenti modifica

  • Best Land Transportation Paper Award, IEEE Vehicular Technology Society (1995);
  • Philip Morris Award on Science and Technology (1997);
  • EATCS Doctoral Dissertation Thesis Award (1997);[45]
  • Research Capital award, assegnato dall’Università di Pisa (2002);
  • Yahoo! faculty award (2006-2010);
  • Working Capital Award, assegnato da Telecom Italia (2010);
  • Top-100 renowned scientists secondo Google EMEA (2012);
  • 3 research awards assegnati da Google (2010, 2012 e 2016);[46]
  • Bloomberg Data Science research grant (2017);[47]
  • Educator grant award assegnato da Google (EMEA) per la disseminazione del pensiero computazionale tra i docenti e gli studenti delle scuole superiori italiane (2018);[48]
  • Google Cloud Research Innovator program (2022).[49]
  • 2022 ACM Paris Kanellakis Theory and Practice Award[6][7][8]

Opere modifica

Libri
Pubblicazioni su rivista

Note modifica

  1. ^ a b Paolo Ferragina - Prorettore per la ricerca applicata e l’innovazione, su unipi.it. URL consultato il 13 marzo 2023.
  2. ^ Heng Li, Richard Durbin, Fast and accurate short read alignment with Burrows-Wheeler transform, in Bioinformatics, vol. 25, n. 15, 18 maggio 2009, pp. 1754-1760, DOI:10.1093/bioinformatics/btp324.
  3. ^ Jared Simpson, Richard Durbin, Efficient construction of an assembly string graph using the FM-index, in Bioinformatics, vol. 26, n. 12, 15 giugno 2010, pp. i367–i373, DOI:10.1093/bioinformatics/btq217, ISSN 1367-4803 (WC · ACNP), PMC 2881401, PMID 20529929.
  4. ^ Langmead B, Trapnell C, Pop M, Salzberg SL, Ultrafast and memory-efficient alignment of short DNA sequences to the human genome, in Genome Biology, vol. 10, R25, 4 marzo 2009, DOI:10.1186/gb-2009-10-3-r25.
  5. ^ (EN) Ben Langmead, Bowtie2: A fast and sensitive gapped read aligner, su github.com. URL consultato il 12 marzo 2023.
  6. ^ a b (EN) Paolo Ferragina, su awards.acm.org. URL consultato il 9 maggio 2023.
  7. ^ a b Due docenti dell'Università di Pisa entrano nella storia dell'informatica, 4 maggio 2023. URL consultato il 5 maggio 2023.
  8. ^ a b Pisa, traguardi internazionali I professori Ferragina e Manzini nella storia dell’informatica, su lanazione.it, 5 maggio 2023. URL consultato il 5 maggio 2023.
  9. ^ a b Paolo Ferragina ‒ Ordine del Cherubino, su unipi.it. URL consultato l'11 marzo 2023.
  10. ^ a b c Paolo Ferragina prorettore per l'informatica, su unipi.it. URL consultato il 9 marzo 2023.
  11. ^ (EN) Paolo Ferragina ‒ ACM Senior Member, su awards.acm.org. URL consultato il 13 marzo 2023.
  12. ^   Fabrizio Luccio, gruppo di ricerca. 2001. URL consultato il 13 marzo 2023 L'immagine è stata tratta da: http://pages.di.unipi.it/luccio/ In foto: a sinistra Linda Pagli, al centro in primo piano Fabrizio Luccio; Ferragina è il secondo da destra. Pisa 2001.
  13. ^ a b (EN) Paolo Ferragina, su pages.di.unipi.it. URL consultato il 13 marzo 2023.
  14. ^ a b c d e f (EN) Paolo Ferragina, pagina personale, su pages.di.unipi.it. URL consultato il 9 marzo 2023.
  15. ^ (EN) A³ Lab, su acube.di.unipi.it. URL consultato l'11 marzo 2023.
  16. ^ (EN) Paolo Ferragina, su dblp.org. URL consultato il 13 marzo 2023.
  17. ^ Paolo Ferragina, su scholar.google.com. URL consultato il 14 marzo 2023.
  18. ^ (EN) Ferragina, Paolo, su scopus.com. URL consultato il 13 marzo 2023.
  19. ^ (EN) Paolo Ferragina, brevetti, su patents.google.com. URL consultato il 13 marzo 2023.
  20. ^ (EN) The Power of Algorithms, Springer, 2013, DOI:10.1007/978-3-642-39652-6, ISBN 978-3-642-39651-9.
  21. ^ (EN) Paolo Ferragina, Pearls of Algorithm Engineering, Cambridge University Press, 2023, ISBN 978-1009123280.
  22. ^ (EN) Handbook of Computational Molecular Biology, Chapman & Hall, dicembre 2005, ISBN 9781584884064.
  23. ^ (EN) TagMe - TagMe Demo, su sobigdata.d4science.org. URL consultato il 13 marzo 2023.
  24. ^ (EN) Paolo Ferragina e Ugo Scaiella, Fast and Accurate Annotation of Short Texts with Wikipedia Pages, in IEEE Software, vol. 29, n. 1, gennaio-febbraio 2012, pp. 70‒75, DOI:10.1109/MS.2011.122.
  25. ^ (EN) Jyrki Alakuijala, Andrea Farruggia, Paolo Ferragina, Eugene Kliuchnikov, Robert Obryk, Zoltan Szabadka e Lode Vandevenne, Brotli: A General-Purpose Data Compressor, in ACM Transactions on Information Systems, vol. 37, n. 1, pp. 1‒30, DOI:10.1145/3231935.
  26. ^ (EN) google, google/brotli, su github.com. URL consultato il 19 marzo 2023.
  27. ^ (EN) Brotli Accept-Encoding/Content-Encoding, su caniuse.com. URL consultato il 19 marzo 2023.
  28. ^ (EN) Paolo Ferragina e Giorgio Vinciguerra, The PGM-index: a multicriteria, compressed and learned approach to data indexing, in Proceedings of the VLDB Endowment, vol. 13, n. 8, pp. 1162–1175, DOI:10.14778/3389133.3389135.
  29. ^ (EN) The PGM-index, su pgm.di.unipi.it. URL consultato il 14 marzo 2023.
  30. ^ (EN) gvinciguerra, PGM-index, su github.com. URL consultato il 14 marzo 2023.
  31. ^ (EN) PGM Indexes: Learned indexes that match B-tree performance with 83x less space, Hacker News. URL consultato il 14 marzo 2023.
  32. ^ (EN) Manticore Search, su manticoresearch.com. URL consultato il 14 marzo 2023.
  33. ^ (EN) Paolo Ferragina e Roberto Grossi, The String B-tree: a new data structure for string search in external memory and its applications, in Journal of the ACM, vol. 46, n. 2, 1999, pp. 236-280, DOI:10.1145/301970.301973.
  34. ^ (EN) Donald E. Knuth, The Art of Computer Programming, Addison-Wesley Professional, marzo 2011, ISBN 978-0321751041.
  35. ^ (IT) , (EN) Dipartimento d'Informatica, Università di Pisa, su di.unipi.it. URL consultato il 13 marzo 2023.
  36. ^ Per la ricerca dell’Università di Pisa si aprono le porte del MIT. URL consultato il 13 marzo 2023.
  37. ^ (EN) PHD+ 2022, su contaminationlab.unipi.it. URL consultato il 13 marzo 2023.
  38. ^ L’Università insegna a fare impresa: al via il PhD plus. URL consultato il 13 marzo 2023.
  39. ^ (EN) Dottorato, Università di Pisa, su dottorato.di.unipi.it. URL consultato il 13 marzo 2023.
  40. ^ (EN) Journal of Graph Algorithms and Applications, su jgaa.info. URL consultato il 13 marzo 2023.
  41. ^ (EN) J.T. Schwartz International School for Scientific Research, su liparischool.it. URL consultato il 13 marzo 2023.
  42. ^ (EN) ERC Advanced Grant Panel 2019 ‒ Members of the ERC Peer Review Panels (PDF), su erc.europa.eu. URL consultato il 13 marzo 2023.
  43. ^ (EN) International Symposium on String Processing and Information Retrieval, su link.springer.com. URL consultato il 13 marzo 2023.
  44. ^ (EN) European Symposia on Algorithms, su esa-symposium.org. URL consultato il 13 marzo 2023.
  45. ^ (EN) EATCS Distinguished Dissertation Award, su eatcs.org, European Association for Theoretical Computer Science. URL consultato il 13 marzo 2023.
  46. ^ (EN) Faculty research awards program (2005 - 2019), su research.google. URL consultato il 13 marzo 2023.
  47. ^ Data Science Research Grant Program, su bloomberg.com. URL consultato il 13 marzo 2023.
  48. ^ Fabrizio De Angelis Puglisi, Google finanzia un progetto sul pensiero computazionale rivolto ai docenti italiani, 15 gennaio 2019. URL consultato il 13 marzo 2023.
  49. ^ Google Cloud Research Innovator, su cloud.google.com. URL consultato il 13 marzo 2023.

Voci correlate modifica

Collegamenti esterni modifica

Controllo di autoritàVIAF (EN14534239 · ISNI (EN0000 0000 7909 9381 · SBN BVEV053733 · ORCID (EN0000-0003-1353-360X · LCCN (ENno2006112907 · GND (DE1203402368 · BNF (FRcb17215637w (data) · J9U (ENHE987007427840205171