Seminario de Lingüística Informática
Universidade de Vigo
Ligazóns de lingüística computacional
ÍNDICE
Coordinador desta páxina
- Introducións, directorios, asociacións e publicacións
- Lingüística de corpus
- Modelos, formalismos e programas de análise gramatical
- Lexicoloxía e lexicografía computacional
- Interacción persoa-ordenador
- Recoñecemento e síntese da fala
- Tradución automática e tradución asistida por ordenador
- Ensino de idiomas asistido por ordenador
- Recuperación de información e procesamento documental
- Integración de recursos lingüísticos
- Apéndice: Informática en galego e I+D en PLN
![]()
Xavier Gómez Guinovart, 2/12/09
INTRODUCIÓNS, DIRECTORIOS, ASOCIACIÓNS E PUBLICACIÓNS
Introducións á lingüística computacional
Catálogos xerais de ligazóns
- [pdf] Manual de lingüística computacional (Xavier Gómez Guinovart)
- [pdf] Lingüística y tecnologías del lenguaje (Joaquim Llisterri)
- NLP FAQ: Natural Language Processing Frequently Asked Questions (Dragomir R. Radev)
- WWW Info on Computational Linguistics/Language Technology (Hans Uszkoreit)
- La ingeniería lingüística en la sociedad de la información (M. A. Martí e J. Llisterri)
- The NLP Dictionary (Bill Wilson)
Catálogos de recursos para o galego
- The ACL NLP/CL Universe (Association for Computational Linguistics)
- CLUK: Computational Linguistics UK (Martin Stower)
- Linguateca
- Interactive online CL Demos (Martin Volk)
- Natural Language Software Registry
Asociacións profesionais
- Lista de recursos de língua galega (Ciberirmandade da Fala)
- Recursos en galego e de lingua galega na rede (Calidonia)
- Recursos lingüísticos (Deputación da Coruña)
- Ferramentas lingüísticas (Mancomún)
- O galego nas novas tecnoloxías (Secretaría Xeral de Política Lingüística)
- De bolina (Consello da Cultura Galega)
- Recursos de galego (IES de Mos)
- En galego (Universitat de Barcelona)
- Recursos sobre a lingua galega (Loia.org)
Revistas e documentos
- The Association for Computational Linguistics (ACL)
- Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN)
- Association for Computers and the Humanities (ACH)
- Asociación Interacción Persona-Ordenador (AIPO)
- ACL Wiki for Computational Linguistics (ACL)
- Procesamiento del Lenguaje Natural (SEPLN)
- ELSNews (revista trimestral de ELSNET)
- Novatica (ATI, Asociación de Técnicos de Informática)
- Journal of Artificial Intelligence Research (JAIR)
- Artificial Intelligence (Elsevier)
- Revista Digital d'Humanitats (Universitat Oberta de Catalunya)
- Boletín electrónico da Sociedade Española para o Procesamento da Linguaxe Natural (SEPLN)
- Revista Tradumàtica: Traducció i Tecnologies de la Informació (Universitat Autònoma de Barcelona)
- Translation Journal (Accurapid)
- Linguamática (Universidade do Minho e Universidade de Vigo)
Volver ao índice da páxina
LINGÜÍSTICA DE CORPUS
Textos electrónicos
Corpus accesibles en Internet
- Project Gutenberg
- The Oxford Text Archive
- CETH - Directory of Electronic Text Centers
- The EServer: Accessible Online Publishing
- IPL Online Text Collection (Internet Public Library)
- BiVir - Biblioteca Virtual (Literatura Universal en Galego)
- Biblioteca Virtual Galega (Literatura Galega)
- Projecto Vercial (Literatura Portuguesa)
Programas de análise textual e catálogos de corpus
- Corpus Lingüístico da Universidade de Vigo (CLUVI)
- Tesouro Informatizado da Lingua Galega (TILGA) (corpus histórico)
- Corpus de Referencia do Galego Actual (CORGA)
- Corpus Técnico do Galego (CTG)
- Tesouro Medieval Informatizado da Lingua Galega (TMILG)
- Arquivo Sonoro de Galicia - [ASG] - A nosa fala (corpus oral)
- RILG: Recursos Integrados da Lingua Galega
- Acesso a corpora de português: Projecto AC/DC
- Corpus do Português [Davies/Ferreira]
- CQP Online Demos (Universidade de Stuttgart)
- Concordances of Great Books
- British National Corpus (BNC)
- Collins WordbanksOnline English
- Lampeter Corpus of Early Modern English
- Corpus Textual Informatitzat de la Llengua Catalana
- Corpus del Español histórico y moderno (Mark Davies, Universidade de Illinois)
- Corpus de Referencia del Español Actual (CREA)
- Korpus 2000 (corpus do dinamarqués)
- The IPI PAN Corpus (corpus do polonés)
- Corpus Paralelo COMPARA portugués-inglés
- NAT-QI: NATools Corpora Query Interface (pt-en,fr,es)
- OPUS - an open source parallel corpus
- CRATER Multilingual Aligned Annotated Corpus
- Penn Treebank Online(buscas en corpus do inglés analizados sintacticamente)
Codificación lingüística de corpus e etiquetarios
- Text Analysis Computing Tools (TACT para MS-DOS, v. 2.1.5, 1995, distribución gratuíta)
- MonoConc (Athelstan)
- European Language Resources Association (ELRA)
- Linguistic Data Consortium (LDC)
Documentos e páxinas con ligazóns
- TEI Consortium
- TEI Guidelines for Electronic Text Encoding and Interchange (P4)
- Corpus Encoding Standard (Eagles, UE)
- SGML (Joseba Abaitua)
- Recommendations for the Morphosyntactic Annotation of Corpora (Eagles, UE)
- Synopsis and Comparison of Morphosyntactic Phenomena Encoded in Lexicons and Corpora (Eagles, UE)
- Etiquetario morfosintáctico do SLI para corpus de lingua galega (SLI, Universidade de Vigo)
- Una propuesta de codificación morfosintáctica para corpus de referencia en lengua española (Aurora Martín de Santa Olalla)
- [pdf] Lingüística de Corpus: Histórico e Problemática (Tony Berber Sardinha)
- Corpus Linguistics (McEnery & Wilson)
- The London-Lund Corpus of Spoken English (Sidney Greenbaum & Jan Svartvik) (ICAME)
- London/Oslo/Bergen (LOB) Corpus Manual (Stig Johansson) (ICAME)
- The tagged LOB Corpus Users' Manual (Stig Johansson) (ICAME)
- The Helsinki Corpus of English Texts Manual (Merja Kytö) (ICAME)
- Archives of CORPORA (Text Corpora Distribution List)
- [pdf] Tratamiento de corpora bilingües (Joseba Abaitua)
- Corpora y otros depósitos textuales
- Corpus resources: Corpora and electronic text databases (Emily M. Bender)
- Gateway to Corpus Linguistics on the Internet (Yvonne Breyer)
- Well-known and influential corpora: A survey (R. Xiao)
Volver ao índice da páxina
MODELOS, FORMALISMOS E PROGRAMAS DE ANÁLISE GRAMATICAL
Sistemas accesibles en Internet
Modelos e formalismos gramaticais
- Freeling Galego - Análise lingüística automática do galego
- Freeling - An Open Source Suite of Language Analyzers (inglés, castelán, catalán, italiano, galego)
- ENGCG: Constraint Grammar Parser of English
- Flexionador y lematizador de palabras del español (castelán)
- TnT -- Statistical Part-of-Speech Tagging
- Part of Speech Tagging Online Demonstration
- Shallow Parsing Online Demonstration
- Link Grammar English Parser
- WinBrill (CNRS)
- TreeTagger - a language independent part-of-speech tagger
- Linguistic Demos - Xerox XRCE (tokenization, morphological analysis and disambiguation for Portuguese, Spanish, English, French, German and more)
Documentos e páxinas con ligazóns
- PC-PATR (distribución e documentación oficial)
- Lexical Functional Grammar (U. of Essex)
- Lexical Functional Grammar. The Stanford Web Site.
- Compilador de LFG para Windows (Avery Andrews)
- HPSG Homepage
- The AGFL Grammar Work Lab
- Introducción á gramática xerativa
- Survey of the State of the Art of Human Language Technology: Language Analysis and Understanding
- A Web of On-line Grammars (ligazóns a gramáticas)
- Online Resources for Studying English Syntax
- [pdf] Foundations of statistical natural language processing
Volver ao índice da páxina
LEXICOLOXÍA E LEXICOGRAFÍA COMPUTACIONAL
Dicionarios accesibles en Internet
Formalismos léxicos e léxicos computacionais
- Dicionario de Galego Ir Indo
- Vocabulario Ortográfico da Lingua Galega (VOLGa)
- Dicionario da Real Academia Galega (RAG)
- e-Estraviz - Dicionário da Língua Galego-Portuguesa
- Termoteca - Banco de Datos Terminolóxico da Universidade de Vigo
- Neoteca - Banco de Datos de Neoloxismos da Universidade de Vigo
- Dicionario CLUVI inglés-galego
- Dicionario galego-alemán (RAG)
- Dicionario de Galego (CRTVG)
- RILG: Recursos Integrados da Lingua Galega
- Dicionário Universal da Língua Portuguesa (Texto Editora e Priberam Informática)
- The Wordsmyth Educational Dictionary-Thesaurus
- Merriam-Webster Dictionary & Thesaurus
- ARTFL Project: Webster's Revised Unabridged Dictionary
- Gran diccionari de la llengua catalana (Enciclopèdia catalana)
- Diccionarios.com (Vox)
- ASL Dictionary
- ARTFL Project: Roget's Thesaurus, 1911 edition
- Dicionario Euskara-Inglés Morris Student Plus (Imaxin Software)
- Dicionário de Caboverdiano Português On-Line (Verbalis e Priberam)
- Glosario de Internet: Galego-inglés-castelán-portugués
- [pdf] Léxico panlatino de Internet. Catalán-español-francés-galego-italiano-portugués-romanés
- Fraseoloxía xurídico-administrativa: galego-alemán-inglés-castelán
- Vocabulario das artes gráficas (obradoiro de encadernación): galego-español-inglés
- Dicionario visual da construción
- Dicionario da vestimenta tradicional galega
- [pdf] Vocabulario de Química. Galego-español-inglés
- Dicionario Galego da Construción Naval
- Vocabulario de ecoloxía e ciencias ambientais
- IATE (Inter-Active Terminology for Europe) (repertorio terminolóxico da Unión Europea)
- Cercaterm do Termcat (sistema de buscas no repertorio terminolóxico do Termcat)
- Neoloteca do Termcat (repertorio terminolóxico do Termcat)
- Euskalterm: euskara-castelán-francés-inglés-latín
- RhymeZone (inglés)
- Dictionnaires d'autrefois (francés)
Documentos e páxinas con ligazóns
- The DATR Web Pages at Sussex
- The DATR Lexical Knowledge Representation Language
- WordNet Home Page
- WordNet 1.7 Interface at Kyoto
- EuroWordNet Home Page
- Web EuroWordNet Interface (v. 0.2)
- Wordnet MCR Interface Meaning
- The Acquilex projects
- Survey of the State of the Art of Human Language Technology: Language Resources
- Morphosyntactic Phenomena Encoded in Lexicons and Corpora (EAGLES Recommendations)
- ACL SIGLEX (Special Interest Group on the Lexicon)
- Consortium for Lexical Research
- Plugins de busca en dicionarios para navegadores de Mozilla
- Andel de traballos terminográficos do SNL-USC
- Diccionarios e glosarios (O Tradutor Virtual)
- Lexicool - Directory of bilingual and multilingual dictionaries
- The Linguist List: Dictionaries
- List of Dictionaries
- yourDictionary.com
- Página de la Lengua Española: Diccionarios
- Diseño e implementación de un lexicón computacional para lexicografía y traducción automática (Antonio Moreno Ortiz)
- Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento (Chantal Pérez Hernández)
- Individuación e información Parte-Todo: Representación para el procesamiento computacional del lenguaje. (Salvador Climent Roca)
Volver ao índice da páxina
INTERACCIÓN PERSOA-ORDENADOR
Empresas e produtos
Sistemas accesibles en Internet
Documentos e páxinas con ligazóns
- BotSpot: ChatBots
- ELIZA
- Eliza en JAVA
- Zabaware - Bring Out the Person in your PC!
- The Simon Laven Page
- Asociación Interacción Persona-Ordenador
- Survey of the State of the Art of Human Language Technology: Discourse and Dialogue
- ACL SIGDIAL (Special Interest Group on Dialogue)
- ACM SIGCHI (Special Interest Group on Computer-Human Interaction)
Volver ao índice da páxina
RECOÑECEMENTO E SÍNTESE DA FALA
Empresas e produtos
Sistemas accesibles en Internet
- IBM ViaVoice
- Dragon Systems
- Philips
- Lernout & Hauspie (Kurzweil)
- SpeechDepot (Unisys)
Documentos e páxinas con ligazóns
- Cotovía (síntese de fala do galego)
- Loquendo (síntese de fala do galego)
- Text-to-Speech Demo for Spanish (UPM)
- Interactive Multi-Lingual Demo (ATT Labs)
- Transcriptor fonético automático del español
- Speech at Carnegie Mellon University
- comp.speech FAQ (Frequently Asked Questions)
- Survey of the State of the Art of Human Language Technology: Spoken Language Input
- Survey of the State of the Art of Human Language Technology: Spoken Output Technologies
- Incorporación de conocimientos fonéticos a las tecnologías del habla (L. Aguilar, J.M. Garrido e J. Llisterri)
Volver ao índice da páxina
TRADUCIÓN AUTOMÁTICA E TRADUCIÓN ASISTIDA POR ORDENADOR
Sistemas accesibles en Internet
Empresas e produtos
- Tradutor OpenTrad apertium español-galego galego-español (Universidade de Vigo)
- Tradutor OpenTrad imaxin software
- Tradutor inglés<->galego OpenTrad
- Tradutor español-galego da Secretaría Xeral de Política Lingüística
- Google Traducións
- FreeTranslation.com (inglés, noruegués, portugués, castelán, alemán, francés, italiano, chinés)
- Systran (inglés, neerlandés, portugués, castelán, alemán, francés, italiano, chinés, xaponés, coreano, ruso)
- PROMT (ruso, inglés, castelán, alemán, francés, italiano)
- Voilà (Systran) (inglés, neerlandés, portugués, castelán, alemán, francés, italiano, ruso)
- AltaVista (Systran)
- FoxLingo para navegadores de Mozilla (interfaz a servizos gratuitos de tradución para 37 linguas)
- AJAX Translator (italiano, castelán, portugués, alemán, francés, inglés)
- OpenTrad (español-catalán, galego, euskara)
- Prototipo OpenTrad apertium (español-catalán, galego, portugués)
- interNOSTRUM (castelán-catalán)
- AutomaticTrans (castelán-catalán, galego, portugués, francés, inglés)
- Translendium (castelán, catalán, alemán, francés, inglés, galego)
- N-II: tradutor estatístico (castelán-catalán)
- Proxecto Rianxo (galego-castelán)
- Traduce Gratis - Systran (inglés-alemán-castelán-portugués)
- NewsTran: Multilingual MetaNews Translator (novas vía AltaVista)
- TextCat Language Guesser (Van Noord)
- Reconhecedor automático de idiomas (Insite)
- Atril Déjà Vu (memoria de tradución, inclúe distribución promocional)
- WordFast (memoria de tradución)
- SALT (castelán-catalán; distribución gratuíta)
- Star Transit (memoria de tradución)
- TRADOS Translator's Workbench (memoria de tradución)
- PAHO - Machine Translation at PAHO (ACG/T)
- Tradutor automático Traduza-g (castelán-galego)
- Babylon (PC-Internet)
- Xanadu (PC-Internet)
Documentos e páxinas con ligazóns
- Machine Translation at Carnegie Mellon University
- European Association for Machine Translation (EAMT)
- Translation, theory and technology
- Quince años de traducción automática en España (Joseba Abaitua)
- Survey of the State of the Art of Human Language Technology: Multilinguality
- Traducción automática: presente e futuro (Joseba Abaitua)
- [pdf] Automation of Translation: Past, Presence, and Future (Karl-Heinz Freigang)
- Recursos para a tradución en Internet (Nuria Andión)
Volver ao índice da páxina
ENSINO DE IDIOMAS ASISTIDO POR ORDENADOR
Sistemas accesibles en Internet
Documentos e páxinas con ligazóns
- Hot Potatoes (U. of Victoria freeware)
- Galingua (curso de galego)
- é-galego (curso de galego)
- Curso de galego (Dorinda Castro Soliño e Rosa Gullón González)
- Etnonet 2.0 - Enciclopedia Interactiva da Cultura Galega (Xosé Antón Vicente Rodríguez - CEIP O Piñeiriño)
- Português para nós (Curso multimédia de português para galegos)
- The Virtual CALL Library (U. of Sussex at Brighton)
- Authoring
- Computer-Assisted Language Learning: an Introduction (Warschauer, M.)
Volver ao índice da páxina
RECUPERACIÓN DE INFORMACIÓN E PROCESAMENTO DOCUMENTAL
Sistemas accesibles en Internet
Documentos e páxinas con ligazóns
- Corrector ortográfico en liña do galego OrtoGal (SLI)
- Corrector ortográfico de galego para MS Office
- Corrector ortográfico de galego para OpenOffice
- Corrector gramatical de galego para OpenOffice
- Corrector ortográfico para Mac OS X
- Corrector de linguaxe sexista do galego (Tagenata)
- Corrector ortográfico do português FLiP (Priberam)
- WebJspell (portugués, inglés) (Univ. do Minho)
- JSpell OnLine Spell Checker (inglés, español, francés)
- Guionizador de galego (Mancomún)
- Cloze Readability Test (Lexibilidade das comunicacións bancarias sobre privacidade)
- SweSum - Automatic Text Summarize (Hercules Dalianis and Martin Hassel)
- TwentyOne demonstrator (sistema de recuperación multilingüe de documentos sobre o medio ambiente en Europa)
- Procurar e traducir con Google
- Web-based question answering system (MIT)
Manuais de XML e HTML
- Oportunidades para la ingeniería lingüística (Piek Vossen)
- Sistemas de resumen automático de documentos (Salvador Climent)
- Information Retrieval & Natural Language Processing (Felisa Verdejo, Julio Gonzalo e Anselmo Peñas, UNED)
- ReGra (corrector gramatical para portugués de Brasil)
- How to write plain English (Rudolf Flesch)
- Measuring the reading age of books and other reading matter (Chris & Keith Johnson)
- Everything you ever wanted know about readability tests but were afraid to ask
- Search Engine Watch
- Search Engine Showdown
- Survey of the State of the Art of Human Language Technology: Document Processing
- A gentle introduction to XML
- Extensible Markup Language (XML) 1.0 (Second Edition) (W3C)
- The XML FAQ
- The XML Cover Pages
- Writing HTML
- HTML Home Page (World Wide Corsortium - W3C)
- Webmonkey
Volver ao índice da páxina
INTEGRACIÓN DE RECURSOS LINGÜÍSTICOS
- RILG: Recursos Integrados da Lingua Galega
- CLARIN-ES
- CLARIN: Common Language Resources and Technologies
Volver ao índice da páxina
APÉNDICE: INFORMÁTICA EN GALEGO E I+D EN PLN
Informática en galego
Investigación e desenvolvemento en PLN
- Windows XP en galego
- Windows Vista en galego
- MS Office 2003 en galego
- MS Office 2007 en galego
- Linux Trisquel en galego
- Linux Galinux (versión orixinal) en galego
- Linux Galinux (versión de Mancomún) en galego
- OpenOffice en galego
- Firefox en galego
- Thunderbird en galego
- A Internet en galego: o dominio .gal
- Portal institucional de software libre
- Tradución de software libre ao galego
- Programas gratis en galego
- Programas libres en galego para Windows
- Programas libres en galego para Linux
- Programas libres en galego para Mac
Volver ao índice da páxina
Gracias por consultar a páxina