IRIS UniCatt

In questo articolo presentiamo I-CAB (Italian Content Annotation Bank), un corpus di articoli in lingua italiana annotato semanticamente. L’attività di annotazione, realizzata in modo completamente manuale, prevede tre livelli: le espressioni temporali, le entità (cioè persone, organizzazioni, luoghi ed entità geo-politiche) e le relazioni tra entità (per esempio la relazione di affiliazione che collega una persona a un’organizzazione). I primi due livelli di annotazione sono completi, mentre il terzo livello è in fase di realizzazione. Avendo come scopo quello di fare di I-CAB un corpus di riferimento per diversi task di Estrazione automatica di Informazione, abbiamo seguito una politica di riutilizzo di linguaggi di annotazione già disponibili. In particolare, abbiamo adottato gli schemi di annotazione sviluppati per il task ACE Entity Detection and Recognition e per il task Time Expression Recognition and Normalization. Poiché le linee-guida di questi task sono state sviluppate originariamente per l’inglese, è stato necessario adattarle alle caratteristiche morfo-sintattiche dell’italiano; si è deciso inoltre di estenderle in modo tale da includere un insieme più ampio di entità, come ad esempio le congiunzioni.

Magnini, B., A., C., Pianta, E., Speranza, M., V., B., Sprugnoli, R., Romano, L., Girardi, C., Negri, M., Annotazione di contenuti concettuali in un corpus italiano: I-CAB, Paper, in IX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006), (Firenze, Italy, 14-17 June 2006), SILFI, Firenze 2006: 321-328 [http://hdl.handle.net/10807/132985]

Annotazione di contenuti concettuali in un corpus italiano: I-CAB

Magnini, Bernardo;A. Cappelli;Pianta, Emanuele;Speranza, Manuela;V. Bartalesi;Sprugnoli, Rachele;Romano, Lorenza;Girardi, Christian;Negri, Matteo

2006

Abstract

In questo articolo presentiamo I-CAB (Italian Content Annotation Bank), un corpus di articoli in lingua italiana annotato semanticamente. L’attività di annotazione, realizzata in modo completamente manuale, prevede tre livelli: le espressioni temporali, le entità (cioè persone, organizzazioni, luoghi ed entità geo-politiche) e le relazioni tra entità (per esempio la relazione di affiliazione che collega una persona a un’organizzazione). I primi due livelli di annotazione sono completi, mentre il terzo livello è in fase di realizzazione. Avendo come scopo quello di fare di I-CAB un corpus di riferimento per diversi task di Estrazione automatica di Informazione, abbiamo seguito una politica di riutilizzo di linguaggi di annotazione già disponibili. In particolare, abbiamo adottato gli schemi di annotazione sviluppati per il task ACE Entity Detection and Recognition e per il task Time Expression Recognition and Normalization. Poiché le linee-guida di questi task sono state sviluppate originariamente per l’inglese, è stato necessario adattarle alle caratteristiche morfo-sintattiche dell’italiano; si è deciso inoltre di estenderle in modo tale da includere un insieme più ampio di entità, come ad esempio le congiunzioni.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno pubblicazione
	
				2006
			
	Lingua del contenuto
	
				Italiano
			
	Titolo del volume che raccoglie gli atti
	
				IX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006)
			
	Denominazione evento
	
				IX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006)
			
	Luogo dell'evento
	
				Firenze, Italy
			
	Tipo di contributo
	
				Paper
			
	Data inizio evento
	
				14-giu-2006
			
	Data fine evento
	
				17-giu-2006
			
	Editore
	
				SILFI
			
	Citazione
	
				Magnini, B., A., C., Pianta, E., Speranza, M., V., B., Sprugnoli, R., Romano, L., Girardi, C., Negri, M., Annotazione di contenuti concettuali in un corpus italiano: I-CAB,  Paper, in IX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006), (Firenze, Italy,  14-17 June 2006), SILFI, Firenze 2006: 321-328 [http://hdl.handle.net/10807/132985]
			
	Appare nelle tipologie:
	
				Paper, Selected paper, Contributed paper, Working paper, Poster, Poster paper, Comunicazione, Relazione (in volume)

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10807/132985

Citazioni

ND

ND

ND

social impact