Vai al contenuto
Menu principale
Menu principale
sposta nella barra laterale
nascondi
Navigazione
Pagina principale
Ultime modifiche
Una pagina a caso
Aiuto su MediaWiki
Unipedia
Ricerca
Ricerca
entra
Strumenti personali
entra
Pagine per utenti anonimi
ulteriori informazioni
contributi
discussioni
Modifica di
Linguistica computazionale
(sezione)
Pagina
Discussione
italiano
Leggi
Modifica
Cronologia
Strumenti
Strumenti
sposta nella barra laterale
nascondi
Azioni
Leggi
Modifica
Cronologia
Generale
Puntano qui
Modifiche correlate
Pagine speciali
Informazioni pagina
Attenzione:
non hai effettuato l'accesso. Se effettuerai delle modifiche il tuo indirizzo IP sarà visibile pubblicamente. Se
accedi
o
crei un'utenza
, le tue modifiche saranno attribuite al tuo nome utente, insieme ad altri benefici.
Controllo anti-spam.
NON
riempirlo!
=== Dato linguistico: parole, frasi, enunciati === Per '''dato linguistico''' si intende il prodotto del linguaggio che è oggetto del processo di analisi della linguistica computazionale. I dati linguistici possono assumere forme diverse ed essere utilizzati per finalità differenti: *''Le parole'' vengono utilizzate come unità per le analisi morfologiche (dove è richiesto di identificare suffissi, prefissi o radici) oppure per rappresentare il contenuto semantico di un testo. *''Le frasi'' vengono utilizzate per identificare la struttura sintattica e quindi le relazioni grammaticali che intercorrono tra le parole che le compongono. *''Gli enunciati'' vengono studiati per riconoscerne la funzione comunicativa. Uno dei principali problemi del linguista è quello di individuare le fonti da analizzare: il primo tipo di fonti sono i testi dei parlanti di una lingua, intesi come qualsiasi prodotto dell'attività linguistica dei parlanti elaborato o trascritto come sequenza di caratteri, il secondo tipo sono i parlanti stessi. I dati linguistici possono essere ecologici oppure controllati. I dati controllati sono ricavati dallo studio di un particolare fenomeno; sostanzialmente, il linguista somministra test preparati ad hoc a un gruppo selezionato di parlanti, e le risposte dei parlanti costituiscono i dati oggetto dell'indagine. I dati ecologici, invece, sono quelli estratti da testi osservati nel loro ambiente naturale, e dunque conservano tutta la loro naturalezza. Le '''parole''' sono le unità di base del testo su cui si lavora in linguistica, e sono spesso trattate come token. Le '''frasi''' sono una sequenza di parole che esprime un’idea completa e grammaticalmente corretta. Nella LC, l’analisi delle parole è cruciale per la creazione di alberi sintattici che rappresentano la struttura grammaticale della frase. Gli '''enunciati''' sono unità di significato che vanno oltre le singole frasi e possono comprendere interi discorsi o conversazioni. <ref> Lenci, Montemagni, Pirrelli, ''Testo e computer'', p. 24. </ref>
Oggetto:
Per favore tieni presente che tutti i contributi a Unipedia possono essere modificati, stravolti o cancellati da altri contributori. Se non vuoi che i tuoi testi possano essere alterati, allora non inserirli.
Inviando il testo dichiari inoltre, sotto tua responsabilità, che è stato scritto da te personalmente oppure è stato copiato da una fonte di pubblico dominio o similarmente libera (vedi
Unipedia:Copyright
per maggiori dettagli).
Non inviare materiale protetto da copyright senza autorizzazione!
Annulla
Guida
(si apre in una nuova finestra)
Toggle limited content width