Formación dun corpus informatizado
de fala bilingüe galego / castelán

Este proxecto incorpora os seguintes aspectos esenciais: 

  • Lingüística de corpus: a formación de corpus para a investigación lingüística está en plena expansión nas distintas disciplinas que estudian a linguaxe. Isto é así porque un corpus permite operar sobre a base de datos reais de lingua, axeitadamente representativos, e de acceso inmediato gracias ós programas informáticos de automatización dos mesrnos.
  • Estudio da lingua falada: centrándonos na fala, na lingua falada tal cal esta se manifesta nos milleiros de conversas da nosa vida cotiá, moi especialmente nas interaccións cara a cara. As variedades estudiadas serán pois predominantemente coloquiais.
  • Estudio das variedades bilingües coloquiais: interésanos concretamente a fala bilingüe. Dentro das variedades coloquiais de Galicia é moi frecuente a adopción dun estílo conversacional bilingüe. Ademais, o repertorio verbal bilingüe inclúe variedades estructuralmente mixtas.
  • Estudio do bilingüísmo e contacto lingüístico galego / castelán: de acordo co punto precedente, a través da nosa base de datos poderemos estudiar básicamente dous tipos de fenómenos:
      A) a adopción dun estilo conversacional bílíngüe vai supor a aparición de fenómenos de relevancia pragmática, como é o code-switching ou alternancia de códigos, fenómeno inserto nos procesos conversacionais da negociación da escolla de código e, de maneira xeral, na creación conversacional das identidades dos participantes;

      B) nas variedades estructuralmente mixtas atoparemos fenómenos de interés gramatical (como o code-mixing e as interferencias) ou léxico (os préstamos). A análise do code-mixing conleva atopar as restriccións gramaticais da fala bilingüe. A análise das interferencías e préstamos supón unha perspectiva diacrónica e, xa que logo, un rastreo dos procesos de reorganización formal dos sistemas lingüísticos en contacto.

 
  • Aplicación LIDES (Language Interaction Data Exchange System) á nosa base de datos bilingües: elaborado polo grupo de investigación LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers), que é unha rede europea representada en España polo grupo da profesora Melissa Moyer, da Univ. Autónoma de Barcelona. 0 LIDES é unha adaptación do clásico CHILDES para a análise da fala, e está sendo aplicado por varios grupos de investigación europeos a diferentes corpus de datos bilingües. Deste xeito, o noso corpus pasará a formar parte da base de datos internacional do LIDES, cousa que permitirá estudiar o bilingüismo galego / castelán en contraste con outras situacións bilinguies do mundo. Sinalemos que o LIDES permite tanto o tratamento cualitativo como cuantitativo dos datos a través do paquete de ferramentas CLAN.