lingüística computacional

f
Lingüística i sociolingüística

Part de la lingüística que s’ocupa de la comprensió i producció de llenguatges naturals mitjançant sistemes computacionals.

Iniciada els anys cinquanta, bàsicament amb treballs sobre traducció automàtica, el seu gran desenvolupament es produí a partir de la dècada dels setanta. Les seves aplicacions principals són la traducció automàtica, la recuperació automàtica de la informació i els sistemes de pregunta i resposta. També s’ha ocupat de la representació del coneixement, aspecte en què s’han desenvolupat alguns conceptes generals per estructurar la informació. L’interès pel procés de comprensió del llenguatge de forma global ha portat a la creació de la ciència cognitiva, un nou camp d’estudi interdisciplinari. En l’àmbit de la lingüística aplicada, una de les àrees que més desenvolupament experimentà els darrers anys és la lingüística computacional. Diversos factors permeteren avenços fonamentals en aquesta disciplina i facilitaren un nou disseny lingüístic i de software: el desenvolupament de llenguatges d’alt nivell (PROLOG-1973) enfront del llenguatge màquina, la gramàtica generativa i les gramàtiques d’unificació, els Chart Parsers i la declarivitat, i el sistema operatiu UNIX. La recerca se centra fonamentalment en l’àmbit de la traducció automàtica i en la creació d’eines per a l’anàlisi de col·leccions de texts de gran abast, que s’utilitzen especialment en el món editorial per a la creació de concordances, diccionaris, etc. Cal destacar la tasca desenvolupada per la Unitat de Recerca de Lingüística Computacional de l’Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra, el responsable de la qual és Toni Badia. La seva activitat principal està relacionada amb l’elaboració de gramàtiques estàndards i amb el camp de la traducció automàtica; el 1995 s’inicià un projecte de recerca que té com a objectiu la construcció d’un analitzador morfològic automàtic de dos nivells per tractar morfològicament corpus textuals catalans. Des del curs 1993-94 s’hi celebra un seminari de lingüística computacional, de periodicitat quinzenal. Cal destacar també el grup d’investigació en lingüística computacional de la Universitat de Barcelona (gilcUB), creat pel professor Ramon Cerdà el 1986. La seva recerca se centra també en la traducció automàtica, la formalització de gramàtiques computacionals, la lexicografia aplicada a eines informàtiques, etc. Tots dos centres de recerca han intervingut en diversos projectes d’àmbit europeu, com l’LS-GRAM (Large Scale Grammars for EC Languages), l’objectiu del qual és la construcció d’una gramàtica computacional per al castellà en el formalisme d’unificació implementat en la plataforma de treball ALEP. Altres àrees d’estudi de la lingüística computacional són la creació assistida de corpus lingüístics, el disseny d’analitzadors (parsers) dels llenguatges naturals, el disseny d’etiquetadors o lematitzadors, la relació entre llenguatges formals i naturals i la traducció automàtica.