(Fuente: RAE.es).- La Real Academia Española (RAE) y la Asociación de Academias de la Lengua Española (ASALE) publican una nueva actualización del Corpus del Español del Siglo XXI (CORPES XXI), la versión 0.91, disponible gratuitamente en el portal web académico gracias al apoyo del Santander.
Dirigido por el académico Guillermo Rojo, el CORPES XXI cuenta en la actualidad con más de 285 000 documentos que suman alrededor de 286 millones de formas, procedentes de textos escritos y de transcripciones de textos orales. Con respecto a la versión anterior, publicada en julio de 2018, supone un incremento de 10 millones de formas. Aproximadamente cuatro millones están constituidos por textos orales y se ofrece, en una parte de ellos, el sonido alineado correspondiente a la transcripción. Además, en bastantes casos es posible la descarga del archivo de audio o la visualización del vídeo del documento fuente.



Los textos procedentes de libros suponen más de 140 millones de formas. Por lo que respecta al bloque de ficción (novelas, guiones, relatos, obras de teatro) las formas del CORPES XXI sobrepasan los 81 millones, mientras que las contenidas en textos de no ficción (ciencias sociales, salud, política, artes, tecnología…) se acercan a los 207 millones.
Por otro lado, la prensa está representada con aproximadamente 142 millones de formas. Cinco millones más provienen de blogs, entrevistas digitales y miscelánea.

--
Leer artículo completo en RAE.es

Deja tu comentario

Artículo Anterior Artículo Siguiente