Lingüística con corpus (I)

Milka Villayandre Llamazares

Resumen


En este artículo hacemos una introducción a la metodología lingüística basada en el trabajo con corpus. En primer lugar, repasamos los diferentes conceptos de corpus en relación con las corrientes teóricas más influyentes en los últimos siglos. En un segundo punto fijamos las características que definen el concepto actual de corpus y que lo diferencian de otras recopilaciones de textos. Por último, revisamos los principales tipos de corpus y comentamos algunos de los ejemplos más representativos, con especial énfasis en los corpus para el español y otras lenguas peninsulares

Palabras clave


Lingüística; Corpus; Empirismo; Lingüística;

Texto completo:

PDF

Referencias


Aarts, J. y Meijs, W. (eds.) (1984): Corpus Linguistics, Amsterdam, Rodopi.

Abaitua, J. (2002): “Tratamiento de corpora bilingües”, en M. A. Martí y J. Llisterri (eds.): Tratamiento del lenguaje natural: tecnología de la lengua oral y escrita, Soria/Barcelona, Fundación Duques de Soria/Edicions de la Universitat de Barcelona, 61-90.

Abercrombie, D. (1965): Studies in Phonetics and Linguistics, London, Oxford

Aijmer, K. y Altenberg, B. (eds.) (1991): English Corpus Linguistics. Studies in Honour of Jan Svartvik, Londres, Longman.

Arquivo Sonoro de Galicia (ASG) http://www.consellodacultura.org/arquivos/asg/anosafala.php

Base de Datos Sintácticos del Español Actual (BDS) http://www.bds.usc.es/

Biber, D., Conrad, S. y Reppen, R. (1998): Corpus Linguistics. Investigating Language Structure and Use, Cambridge, C.U.P.

Brown University Corpus of American English (Brown Corpus) http://icame.uib.no/brown/bcm.html (manual)

CESS-ECE, Corpus etiquetado sintáctico-semánticamente (español, catalán, euskera) http://clic.ub.edu/cessece/

CLUVI, Corpus Lingüístico da Universidade de Vigo http://sli.uvigo.es/CLUVI/info.html

Corpus de conversación coloquial del grupo Val.Es.Co. http://www.uv.es/~valesco/valesco_5.html

Corpus de Referencia del Español Contemporáneo (CREA) http://www.rae.es/

Corpus de Referencia do Galego Actual (CORGA) http://corpus.cirp.es/corga/

Corpus Diacrónico del Español (CORDE) http://www.rae.es/

Corpus estadístico del euskera del siglo XX ttp://www.uzei.com/antbuspre.asp?nombre=1901&cod=1901&sesion=1

Corpus textual especializado plurilingüe, IULA http://www.iula.upf.edu/corpus/corpuses.htm

Corpus Textual Informatitzat de la Llengua Catalana (CTILC) http://www.iec.cat/gc/ViewPage.action?siteNodeId=690&languageId=1&contentId=3284; http://ctilc.iec.cat/

Francis, W. N. (1992): “Language Corpora B.C.”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York, Mouton de Gruyter, 17-32.

Labov, W. (1969): “The logic of non-standard English”, Georgetown Monographs on Language and Linguistics, 22.

Lancaster-Oslo/Bergen Corpus (LOB) http://khnt.hit.uib.no/icame/manuals/lob/INDEX.HTM (manual) http://khnt.hit.uib.no/icame/manuals/lobman/INDEX.HTM (anotaciones)

Lavid, J. (2005): Lenguaje y nuevas tecnologías. Nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI, Madrid, Cátedra.

Leech, G. (1992): “Corpora and theories of linguistic performance”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin, Mouton de Gruyter, 105-122.

Martí Antonín, M. A. y Castellón Masalles, I. (2000): Lingüística computacional, Barcelona, Universitat de Barcelona.

McEnery, T. (2003): “Corpus Linguistics”, en R. Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford, Oxford University Press, 448-463.

McEnery, T. y Wilson, A. (1996): Corpus Linguistics, Edinburgh, Edinburgh University Press. Suplemento web disponible en la dirección: http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents.htm

McEnery, T., Xiao, R. y Tono, Y. (2006): Corpus-Based Language Studies. An advanced resource book, London/New York, Routledge.

Moreno Sandoval, A. (2001): Gramáticas de unificación y rasgos, Madrid, A. Machado Libros.

Moure, T. y Llisterri, J. (1996): “Lenguaje y nuevas tecnologías: el campo de la lingüística computacional”, en M. Fernández Pérez (coord.): Avances en Lingüística aplicada, Universidade de Santiago de Compostela, Servicio de Publicacións e Intercambio Científico, 147-227. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/llisterri_moure_96.html Real Academia Española (2001): Diccionario de la lengua española, Madrid, Espasa.

PRESEEA, Proyecto para el Estudio Sociolingüístico del Español de España y de América http://www.linguas.net/Default.aspx?alias=www.linguas.net/portalpreseea

Proyecto COBUILD http://www.collins.co.uk/books.aspx?group=140

Santalla del Río, M.ª P. (2005): “La elaboración de corpus lingüísticos”, en M. Cal, P. Núñez e I. M. Palacios (eds.): Nuevas tecnologías en Lingüística, Traducción y Enseñanza de lenguas, Universidade de Santiago de Compostela, Servizo de Publicacións e Intercambio Científico, 45-63.

Sinclair, J. (1994): EAGLES, Document EAG-CWG-IR-2.

Sinclair, J. (1996): EAGLES Preliminary recommendations on Corpus Typology. Documento electrónico en: http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html

SpeechDat http://www.speechdat.org/

Survey of English Usage (SEU) http://www.ucl.ac.uk/english-usage

Survey of Spoken English (SSE) y London-Lund Corpus of Spoken English (LLC) http://icame.uib.no/london-lund/ http://khnt.hit.uib.no/icame/manuals/LONDLUND/INDEX.HTM

Svartvik, J. (1992): “Corpus linguistics comes of age”, en J. Svartvik (ed.): Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York:, Mouton de Gruyter, 7-13.

Tesouro Medieval Informatizado da Lingua Galega (TMILG) http://ilg.usc.es/tmilg/

The Bank of English http://www.titania.bham.ac.uk/

The British National Corpus (BNC) http://www.natcorp.ox.ac.uk/

The International Corpus of English (ICE) http://www.ucl.ac.uk/english-usage/projects/ice.htm http://www.ucl.ac.uk/english-usage/ice/index.htm

Torruella, J. y Llisterri, J. (1999): “Diseño de corpus textuales y orales”, en J. M. Blecua, G. Clavería, C. Sánchez y J. Torruella (eds.): Filología e informática. Nuevas tecnologías en los estudios filológicos, Barcelona, Milenio/Universidad Autónoma de Barcelona, Dpto. de Filología Española, 45-77. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/Torruella_Llisterri_99.pdf University Press.




DOI: http://dx.doi.org/10.18002/ehf.v0i30.2847

Enlaces refback

  • No hay ningún enlace refback.




Copyright (c) 2008 Milka Villayandre Llamazares

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.

Estudios humanísticos. Filología
ISSN 0213-1382 (Ed. impresa)
ISSN 2444-023X (Internet)

Contacto: estudioshumanisticosfilologia@unileon.es
Soporte técnico: journals@unileon.es

Editada por el Área de Publicaciones de la Universidad de León