El projecte

Els corpus en les llengües de signes

Un corpus és una col·lecció representativa de mostres d’una llengua en format llegible per una màquina, que s’utilitza per a estudiar el tipus i la freqüència d’unitats lingüístiques. A més, constitueix una representació àmplia de la llengua i de les seves varietats geogràfiques, de registres i generacionals. Quant als corpus de llengües de signes, es caracteritzen per ser col·leccions de vídeos anotats que contenen material escrit alineat amb les dades principals en llengua de signes. També constitueixen una mostra representativa de la llengua en qüestió.

El corpus de l’LSC

L’any 2007, l’IEC, la Federació de Persones Sordes de Catalunya, la Universitat Pompeu Fabra, la Fundació Barcelona Media i Linguamón van prendre la iniciativa de col·laborar de cara a crear un corpus de referència de l’LSC. En aquell moment, però, la falta de finançament no va permetre dur endavant el projecte. A finals de l’any 2012 l’Institut d’Estudis Catalans va oferir la possibilitat d’iniciar un primer projecte de constitució de corpus amb una fase preparatòria i una prova pilot, que va ser possible gràcies al suport del Departament de Política Lingüística de la Generalitat de Catalunya i a una subvenció de l’Obra Social “La Caixa”.