Lingüística con corpus (I)
DOI:
https://doi.org/10.18002/ehf.v0i30.2847Palabras clave:
Lingüística, Corpus, Empirismo,Resumen
En este artículo hacemos una introducción a la metodología lingüística basada en el trabajo con corpus. En primer lugar, repasamos los diferentes conceptos de corpus en relación con las corrientes teóricas más influyentes en los últimos siglos. En un segundo punto fijamos las características que definen el concepto actual de corpus y que lo diferencian de otras recopilaciones de textos. Por último, revisamos los principales tipos de corpus y comentamos algunos de los ejemplos más representativos, con especial énfasis en los corpus para el español y otras lenguas peninsularesDescargas
Métricas alternativas
Citas
Aarts, J. y Meijs, W. (eds.) (1984): Corpus Linguistics, Amsterdam, Rodopi.
Abaitua, J. (2002): “Tratamiento de corpora bilingües”, en M. A. Martí y J. Llisterri (eds.): Tratamiento del lenguaje natural: tecnología de la lengua oral y escrita, Soria/Barcelona, Fundación Duques de Soria/Edicions de la Universitat de Barcelona, 61-90.
Abercrombie, D. (1965): Studies in Phonetics and Linguistics, London, Oxford
Aijmer, K. y Altenberg, B. (eds.) (1991): English Corpus Linguistics. Studies in Honour of Jan Svartvik, Londres, Longman.
Arquivo Sonoro de Galicia (ASG) http://www.consellodacultura.org/arquivos/asg/anosafala.php
Base de Datos Sintácticos del Español Actual (BDS) http://www.bds.usc.es/
Biber, D., Conrad, S. y Reppen, R. (1998): Corpus Linguistics. Investigating Language Structure and Use, Cambridge, C.U.P.
Brown University Corpus of American English (Brown Corpus) http://icame.uib.no/brown/bcm.html (manual)
CESS-ECE, Corpus etiquetado sintáctico-semánticamente (español, catalán, euskera) http://clic.ub.edu/cessece/
CLUVI, Corpus Lingüístico da Universidade de Vigo http://sli.uvigo.es/CLUVI/info.html
Corpus de conversación coloquial del grupo Val.Es.Co. http://www.uv.es/~valesco/valesco_5.html
Corpus de Referencia del Español Contemporáneo (CREA) http://www.rae.es/
Corpus de Referencia do Galego Actual (CORGA) http://corpus.cirp.es/corga/
Corpus Diacrónico del Español (CORDE) http://www.rae.es/
Corpus estadístico del euskera del siglo XX ttp://www.uzei.com/antbuspre.asp?nombre=1901&cod=1901&sesion=1
Corpus textual especializado plurilingüe, IULA http://www.iula.upf.edu/corpus/corpuses.htm
Corpus Textual Informatitzat de la Llengua Catalana (CTILC) http://www.iec.cat/gc/ViewPage.action?siteNodeId=690&languageId=1&contentId=3284; http://ctilc.iec.cat/
Francis, W. N. (1992): “Language Corpora B.C.”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York, Mouton de Gruyter, 17-32.
Labov, W. (1969): “The logic of non-standard English”, Georgetown Monographs on Language and Linguistics, 22.
Lancaster-Oslo/Bergen Corpus (LOB) http://khnt.hit.uib.no/icame/manuals/lob/INDEX.HTM (manual) http://khnt.hit.uib.no/icame/manuals/lobman/INDEX.HTM (anotaciones)
Lavid, J. (2005): Lenguaje y nuevas tecnologías. Nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI, Madrid, Cátedra.
Leech, G. (1992): “Corpora and theories of linguistic performance”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin, Mouton de Gruyter, 105-122.
Martí Antonín, M. A. y Castellón Masalles, I. (2000): Lingüística computacional, Barcelona, Universitat de Barcelona.
McEnery, T. (2003): “Corpus Linguistics”, en R. Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford, Oxford University Press, 448-463.
McEnery, T. y Wilson, A. (1996): Corpus Linguistics, Edinburgh, Edinburgh University Press. Suplemento web disponible en la dirección: http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
McEnery, T., Xiao, R. y Tono, Y. (2006): Corpus-Based Language Studies. An advanced resource book, London/New York, Routledge.
Moreno Sandoval, A. (2001): Gramáticas de unificación y rasgos, Madrid, A. Machado Libros.
Moure, T. y Llisterri, J. (1996): “Lenguaje y nuevas tecnologías: el campo de la lingüística computacional”, en M. Fernández Pérez (coord.): Avances en Lingüística aplicada, Universidade de Santiago de Compostela, Servicio de Publicacións e Intercambio Científico, 147-227. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/llisterri_moure_96.html Real Academia Española (2001): Diccionario de la lengua española, Madrid, Espasa.
PRESEEA, Proyecto para el Estudio Sociolingüístico del Español de España y de América http://www.linguas.net/Default.aspx?alias=www.linguas.net/portalpreseea
Proyecto COBUILD http://www.collins.co.uk/books.aspx?group=140
Santalla del Río, M.ª P. (2005): “La elaboración de corpus lingüísticos”, en M. Cal, P. Núñez e I. M. Palacios (eds.): Nuevas tecnologías en Lingüística, Traducción y Enseñanza de lenguas, Universidade de Santiago de Compostela, Servizo de Publicacións e Intercambio Científico, 45-63.
Sinclair, J. (1994): EAGLES, Document EAG-CWG-IR-2.
Sinclair, J. (1996): EAGLES Preliminary recommendations on Corpus Typology. Documento electrónico en: http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html
SpeechDat http://www.speechdat.org/
Survey of English Usage (SEU) http://www.ucl.ac.uk/english-usage
Survey of Spoken English (SSE) y London-Lund Corpus of Spoken English (LLC) http://icame.uib.no/london-lund/ http://khnt.hit.uib.no/icame/manuals/LONDLUND/INDEX.HTM
Svartvik, J. (1992): “Corpus linguistics comes of age”, en J. Svartvik (ed.): Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York:, Mouton de Gruyter, 7-13.
Tesouro Medieval Informatizado da Lingua Galega (TMILG) http://ilg.usc.es/tmilg/
The Bank of English http://www.titania.bham.ac.uk/
The British National Corpus (BNC) http://www.natcorp.ox.ac.uk/
The International Corpus of English (ICE) http://www.ucl.ac.uk/english-usage/projects/ice.htm http://www.ucl.ac.uk/english-usage/ice/index.htm
Torruella, J. y Llisterri, J. (1999): “Diseño de corpus textuales y orales”, en J. M. Blecua, G. Clavería, C. Sánchez y J. Torruella (eds.): Filología e informática. Nuevas tecnologías en los estudios filológicos, Barcelona, Milenio/Universidad Autónoma de Barcelona, Dpto. de Filología Española, 45-77. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/Torruella_Llisterri_99.pdf University Press.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2008 Milka Villayandre Llamazares
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores o autoras que publican en esta revista están de acuerdo con los siguientes términos:
- Los autores o autoras conservan los derechos de autoría de su trabajo y ceden de forma no exclusiva los derechos de explotación (reproducción, distribución, comunicación pública, transformación) a la Universidad de León, por lo que pueden establecer, por separado, acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, alojarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en esta revista.
- Este trabajo se encuentra bajo la Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. Puede consultarse desde aquí la versión informativa y el texto legal de la licencia.
- Se permite y se anima a los autores y autoras a difundir electrónicamente las versiones pre-print (versión antes de ser evaluada) y/o post-print (versión evaluada y aceptada para su publicación) de sus obras antes de su publicación, ya que favorece su circulación y difusión más temprana y con ello un posible aumento en su citación y alcance entre la comunidad académica.