<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2079-312X</journal-id>
<journal-title><![CDATA[Lingüística]]></journal-title>
<abbrev-journal-title><![CDATA[Lingüística]]></abbrev-journal-title>
<issn>2079-312X</issn>
<publisher>
<publisher-name><![CDATA[Asociación de Lingüística y Filología de América Latina]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2079-312X2017000100121</article-id>
<article-id pub-id-type="doi">10.5935/2079-312x.20170008</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[SOBRE LA CONFIGURACIÓN ESTADÍSTICA DE LOS CORPUS TEXTUALES]]></article-title>
<article-title xml:lang="en"><![CDATA[ON THE STATISTICAL STRUCTURE OF TEXTUAL CORPORA]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rojo]]></surname>
<given-names><![CDATA[Guillermo]]></given-names>
</name>
<xref ref-type="aff" rid="Aff"/>
</contrib>
</contrib-group>
<aff id="Af1">
<institution><![CDATA[,Universidade de Santiago de Compostela  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2017</year>
</pub-date>
<volume>33</volume>
<numero>1</numero>
<fpage>121</fpage>
<lpage>134</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.edu.uy/scielo.php?script=sci_arttext&amp;pid=S2079-312X2017000100121&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.edu.uy/scielo.php?script=sci_abstract&amp;pid=S2079-312X2017000100121&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.edu.uy/scielo.php?script=sci_pdf&amp;pid=S2079-312X2017000100121&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Resumen: La estructura estadística de los textos y de los corpus textuales es un tema al que se ha prestado muy escasa atención en la lingüística hispánica. El presente trabajo se propone revisar algunos de sus aspectos más importantes en dos direcciones distintas. Por una parte, mediante la aplicación a los datos procedentes de una versión intermedia del CORPES de los análisis realizados previamente sobre el CREA. Por otra, aprovechando los resultados de la anotación morfosintáctica del CORPES, tomando en consideración no solo las formas ortográficas, sino también los lemas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Abstract: The statistical structure of texts and textual corpora is a topic to which little attention has been paid in Hispanic linguistics. This paper tries to review some of their more relevant aspects in two different senses. On the one hand, through the application of the techniques previously applied to CREA on an intermediate version of CORPES. On the other hand, working on the morphosyntactically tagged version of CORPES, taking into consideration not only orthographic forms, but also lemmas.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[lingüística estadística]]></kwd>
<kwd lng="es"><![CDATA[frecuencia]]></kwd>
<kwd lng="es"><![CDATA[lingüística de corpus]]></kwd>
<kwd lng="en"><![CDATA[statistical linguistics]]></kwd>
<kwd lng="en"><![CDATA[frequency]]></kwd>
<kwd lng="en"><![CDATA[corpus linguistics]]></kwd>
</kwd-group>
</article-meta>
</front><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Almela Pérez]]></surname>
<given-names><![CDATA[Ramón]]></given-names>
</name>
<name>
<surname><![CDATA[Cantos]]></surname>
<given-names><![CDATA[Pascual]]></given-names>
</name>
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[Aquilino]]></given-names>
</name>
<name>
<surname><![CDATA[Sarmiento]]></surname>
<given-names><![CDATA[Ramón]]></given-names>
</name>
<name>
<surname><![CDATA[Almela]]></surname>
<given-names><![CDATA[Moisés]]></given-names>
</name>
</person-group>
<source><![CDATA[Frecuencias del español. Diccionario y estudios léxicos y morfológicos]]></source>
<year>2005</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Universitas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bybee]]></surname>
<given-names><![CDATA[Joan]]></given-names>
</name>
</person-group>
<source><![CDATA[Frequency of Use and the Organization of Language]]></source>
<year>2007</year>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<article-title xml:lang=""><![CDATA[El inglés y el español desde una perspectiva cuantitativa y distributiva: equivalencias y contrastes]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cantos]]></surname>
<given-names><![CDATA[Pascual]]></given-names>
</name>
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[Aquilino]]></given-names>
</name>
</person-group>
<source><![CDATA[Estudios ingleses de la Universidad Complutense]]></source>
<year>2011</year>
<volume>19</volume>
<page-range>15-44</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<article-title xml:lang=""><![CDATA[Métodos para medir la riqueza léxica de un texto. Revisión y propuesta. Aplicación en el Corpus Informatizado del Catalán Antiguo]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Capsada]]></surname>
<given-names><![CDATA[Ramón]]></given-names>
</name>
<name>
<surname><![CDATA[Torruella]]></surname>
<given-names><![CDATA[Joan]]></given-names>
</name>
</person-group>
<source><![CDATA[Verba]]></source>
<year></year>
<volume>44</volume>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Davies]]></surname>
<given-names><![CDATA[Mark]]></given-names>
</name>
</person-group>
<source><![CDATA[A Frequency Dictionary of Spanish. Core Vocabulary for Learners]]></source>
<year>2006</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Routledge]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<article-title xml:lang=""><![CDATA[Moliner, María (1966-1967). 19982, 20073 y 20164]]></article-title>
<collab>DUE</collab>
<source><![CDATA[Diccionario de uso del español]]></source>
<year></year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Gredos]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<article-title xml:lang=""><![CDATA[The odd couple: The linguist and the software engineer. The struggle for high quality computerized language aids]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ku&#269;era]]></surname>
<given-names><![CDATA[Henry]]></given-names>
</name>
</person-group>
<source><![CDATA[Svartvik]]></source>
<year>1992</year>
<page-range>401-20</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojo]]></surname>
<given-names><![CDATA[Guillermo]]></given-names>
</name>
</person-group>
<article-title xml:lang=""><![CDATA[La explotación de la Base de datos sintácticos del español actual (BDS)]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[De Kock]]></surname>
<given-names><![CDATA[Josse]]></given-names>
</name>
</person-group>
<source><![CDATA[Lingüística con corpus. Catorce aplicaciones sobre el español (= Gramática española. Enseñanza e investigación I.7)]]></source>
<year>2001</year>
<page-range>255-86</page-range><publisher-loc><![CDATA[Salamanca ]]></publisher-loc>
<publisher-name><![CDATA[Univ. de Salamanca]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojo]]></surname>
<given-names><![CDATA[Guillermo]]></given-names>
</name>
</person-group>
<article-title xml:lang=""><![CDATA[La frecuencia de los esquemas sintácticos clausales en español]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Moreno Fernández]]></surname>
<given-names><![CDATA[Francisco]]></given-names>
</name>
<name>
<surname><![CDATA[Gimeno Menéndez]]></surname>
<given-names><![CDATA[Francisco]]></given-names>
</name>
<name>
<surname><![CDATA[Samper]]></surname>
<given-names><![CDATA[José Antonio]]></given-names>
</name>
<name>
<surname><![CDATA[Gutiérrez Araus]]></surname>
<given-names><![CDATA[M.ª Luz]]></given-names>
</name>
<name>
<surname><![CDATA[Vaquero]]></surname>
<given-names><![CDATA[María]]></given-names>
</name>
<name>
<surname><![CDATA[Hernández]]></surname>
<given-names><![CDATA[César]]></given-names>
</name>
</person-group>
<source><![CDATA[Lengua, variación y contexto. Estudios dedicados a Humberto López Morales]]></source>
<year>2003</year>
<volume>vol. I</volume>
<page-range>413-24</page-range><publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Arco]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojo]]></surname>
<given-names><![CDATA[Guillermo]]></given-names>
</name>
</person-group>
<source><![CDATA[Lingüística de corpus y lingüística del español]]></source>
<year>2008</year>
<conf-name><![CDATA[ XVcongreso de la Asociación de Lingüística y Filología de América Latina]]></conf-name>
<conf-date>18-21 de agosto de 2008</conf-date>
<conf-loc>Montevideo </conf-loc>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<article-title xml:lang=""><![CDATA[Frecuencia de inventario y frecuencia de uso]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojo]]></surname>
<given-names><![CDATA[Guillermo]]></given-names>
</name>
</person-group>
<source><![CDATA[Revista española de lingüística]]></source>
<year>2011</year>
<volume>41</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>5-43</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<article-title xml:lang=""><![CDATA[Predictability of Word Forms (types) and Lemmas in Linguistic Corpora. A Case Study Based on the Analysis of the Cumbre Corpus: An 8-Millon-Word Corpus of Contemporary Spanish]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sánchez]]></surname>
<given-names><![CDATA[Aquilino]]></given-names>
</name>
<name>
<surname><![CDATA[Cantos]]></surname>
<given-names><![CDATA[Pascual]]></given-names>
</name>
</person-group>
<source><![CDATA[IJCL]]></source>
<year>1997</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>259-80</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<article-title xml:lang=""><![CDATA[Lexical Statistics and Typological Structures: a Measure of Lexical Richness]]></article-title>
<person-group person-group-type="author">
<name>
<surname><![CDATA[Torruella]]></surname>
<given-names><![CDATA[Joan]]></given-names>
</name>
<name>
<surname><![CDATA[Capsada]]></surname>
<given-names><![CDATA[Ramón]]></given-names>
</name>
</person-group>
<source><![CDATA[Procedia. Social and Behavioral Sciences]]></source>
<year>2013</year>
<volume>95</volume>
<page-range>447-54</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
