SciELO - Scientific Electronic Library Online

 
vol.36 número1PADRÕES TONAIS NUCLEARES DE DECLARATIVAS E INTERROGATIVAS NEUTRAS DO PORTUGUÊS ANGOLANO DO LIBOLOCOMO POSSO TE ACHAR NO FACEBOOK? VOCÊ ME ACHA COMO... QUESTÕES SOBRE METONÍMIA, MODERNIDADE LÍQUIDA E EMOÇÃO NA ANTROPONÍMIA índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Links relacionados

Compartir


Lingüística

versión On-line ISSN 2079-312X

Lingüística vol.36 no.1 Montevideo  2020  Epub 01-Jun-2020

https://doi.org/10.5935/2079-312x.20200004 

Artículos

FORMALIZAÇÃO DOS NÍVEIS DE REPRESENTAÇÃO FONOLÓGICOS NA PRODUÇÃO E NO RECONHECIMENTO DAS CONSOANTES PLOSIVAS EM CODA MEDIAL NO PE: UMA ANÁLISE BIDIRECIONAL

FORMALIZING LEVELS OF PHONOLOGICAL REPRESENTATION IN THE PRODUCTION AND RECOGNITION OF WORD-MID STOP CODAS IN EUROPEAN PORTUGUESE: A BIDIRECTIONAL ANALYSIS

Roberta Quintanilha Azevedo1 
http://orcid.org/0000-0001-6076-9768

Carmen Lúcia Barreto Matzenauer2 
http://orcid.org/0000-0003-4505-7521

Ubiratã Kickhöfel Alves3 
http://orcid.org/0000-0001-6694-8476

1Instituto Federal de Educação, Ciência e Tecnologia Sul-rio-grandense, betanilha@gmail.com

2Universidade Católica de Pelotas, carmenluc@gmail.com

3Universidade Federal do Rio Grande do Sul, ukalves@gmail.com


Resumo:

O estudo discute a epêntese vocálica no português europeu (PE) em uma abordagem fonético-fonológica. Com dados empíricos de produção e percepção de falantes nativos do PE, evidencia que, em palavras com encontros consonantais heterossilábicos em contextos mediais, propícios ao aparecimento de segmento epentético, a epêntese vocálica é variável, com a possibilidade da existência de uma epêntese surda. Os dados de produção, analisados acusticamente com osoftwarePRAAT (Boersma e Weenink 2013), foram relacionados aos dados de percepção, obtidos por instrumento elaborado a partir dosoftwareTP (Rauberet al. 2009), aplicado aos mesmos informantes participantes do teste de produção. Com esse arcabouço empírico, o objetivo geral do estudo foi a proposição de uma formalização para o fenômeno da epêntese vocálica nos níveis fonológicos do Modelo de Processamento Bidirecional de L1 - BiPhon (Boersma 2006, 2007, 2008, 2010; Boersma e Hamann 2009), assumindo produção e percepção como partes de uma única gramática.

Palavras-chave: Epêntese no Português Europeu; Modelo BiPhon; Abordagem por Restrições; Percepção e Produção

Abstract:

The present study approaches the phenomenon of vowel epenthesis in European Portuguese from a phonetic-phonological approach. By presenting perception and production data, it shows the variability of vowel epenthesis in European Portuguese in word-mid contexts of heterosyllabic consonant clusters (‘p.n’ - apneia, ‘t.n’ - etnia), the study also considers the possible existence of a voiceless epenthetic vowel. The acoustic verification of the production data was carried out with PRAAT (Boersma e Weenink 2013). The instrument used to check the perception of epenthesis in Portuguese was designed on the TP software (Rauber et al. 2009) and applied to the same participants in the production task. Departing from this empirical framework, our aim is to propose a formalization for the vowel epenthesis phenomenon in the bidirectional processing model of L1 - BiPhon (Boersma 2006, 2007, 2008, 2010; Boersma e Hamann 2009), as we assume perception and production to be parts of the same grammar system.

Keywords: Vowel Epenthesis in EP; Perception and Production; Constraint-Based Approach; BiPhon Model

0. Introdução

Este estudo tem como objetivo a proposição de uma formalização para o fenômeno da epêntese vocálica vozeada e surda no português europeu (PE), em palavras que contenham o contexto de coda plosiva medial (como ‘p.n’ - apneia, ‘t.n’ - etnia), em uma abordagem formal/fonológica, com o suporte do Modelo de Processamento Bidirecional de L1 - BiPhon (Boersma 2006, 2007, 2008, 2010; Boersma e Hamann 2009). Tal modelo de análise linguística divide o processamento da gramática em três níveis - forma subjacente, forma fonológica de superfície e forma fonética -, que são articulados por restrições de fidelidade, de estrutura e de pista. O modelo ainda tem característica bidirecional porque, unindo fonética e fonologia, dá conta, na formalização da gramática, do processo de produção da língua pelo falante e de compreensão pelo ouvinte.

Neste trabalho, concebe-se a epêntese vocálica como um fenômeno caracterizado pela inserção de um segmento vocálico na fala (Cagliari 1981; Lee 1993; Collischonn 1996), sob a hipótese de que, em contexto de coda com plosiva medial, constituindo, com o onset da sílaba subsequente, uma sequência consonantal não licenciada pela língua, há no português europeu uma epêntese surda, isto é, uma manifestação vocálica sem vibração das pregas vocais. Tais vogais vêm sendo observadas na literatura, comumente em contextos em que a consoante precedente é surda, em sílabas abertas; trata-se das vogais altas (i) e (u), além do schwa (Crystal 1988). Acredita-se que as vogais altas, tendo menor duração comparativamente às demais vogais, tendem a perder vozeamento, o que se manifesta acusticamente através da ausência da periodicidade do sinal acústico, característico das vogais.

A verificação do fenômeno nos dados foi realizada por meio da análise das características do contexto precedente a essa possível epêntese. Especificamente, examinou-se a presença ou não, na soltura da plosiva, ou seja, do primeiro elemento da sequência consonantal estudada, de efeitos coarticulatórios de uma vogal. Essa etapa permitiu verificar-se se a consoante “perdida”, nas sequências consonantais estudadas, poderia estar denunciando a presença de uma vogal desvozeada. Oito falantes do português europeu de Lisboa - Portugal participaram da pesquisa, tendo sido submetidos a testes de produção e de percepção linguística.

O estudo foi norteado por três questões basilares:

  • 1) Há epêntese, no PE, na produção de palavras com o contexto de coda plosiva medial? Qual é a frequência de ocorrência e o tipo de vogal epentética (surda ou sonora)?

  • 2) Há a percepção da vogal epentética nos contextos (p.t, p.n, t.n)? A percepção é condizente com os estímulos fornecidos no experimento, dada a gramática fonológica do português?

  • 3) Quais as restrições relevantes para representar o fenômeno da epêntese no português em codas mediais, com base no Modelo de Processamento Bidirecional de L1, e qual a hierarquia de restrições (a gramática) capaz de caracterizar a produção e a percepção linguísticas dos sujeitos da pesquisa, com relação ao fenômeno explorado, tendo em conta os níveis fonológicos do modelo (Produção Fonológica e Reconhecimento)?

A apresentação deste estudo está dividida em cinco seções. Seguindo a Introdução, a Seção 1 traz os fundamentos da análise formal da epêntese, a Seção 2 trata dos aspectos metodológicos e a Seção 3 apresenta os dados coletados, referentes à produção e à percepção da epêntese. Tais seções tornam possível trazer-se, na Seção 4, a formalização destes dados no Modelo Bidirecional. A Seção 5 conclui o estudo, com a retomada das questões norteadoras.

1. Fundamentos da análise formal da epêntese

Embora as análises de fenômenos das fonologias das línguas tenham majoritariamente o foco em dados de produção linguística, já há algum tempo a literatura propõe explicações perceptuais para padrões fonológicos (Liljencrants e Lindblom 1972; Lindblom 1986; Ohala 1981, 1990a, 1990b, 1993; Hume e Johnson 2001; Boersma 2008, 2009, 2011). Apesar de essa área vir se mostrando bastante produtiva e vir apresentando evidências para a importância de informações perceptuais, ainda é pequeno o consenso sobre uma adequada formalização da influência da percepção da fala sobre a fonologia.

Boa parte dos pesquisadores que investigam a percepção de processos fonológicos, como Steriade (1995, 2001) e Wright (2001), afirmam que, embora se refira à fonologia, a percepção está fora do âmbito da teoria fonológica. Diferentemente, Boersma, em sua Tese Doutoral (1998) e em trabalhos posteriores, bem como Pater (2004), afirma que a percepção da fala é parte do conhecimento fonológico e, portanto, deve estar incluída na teoria fonológica.

Ao considerar-se a percepção como o mapeamento de uma forma fonética universal para a estrutura fonológica de determinada língua, a inclusão da percepção na gramática requer a depreensão de uma forma fonética com a qual o ouvinte é confrontado e com base na qual deve construir uma estrutura de superfície abstrata daquela língua específica. A partir dessa discussão, levando também em conta outros modelos de gramática, como o de Tesar (1997, 1998, 1999, 2000) e Tesar e Smolensky (1998, 2000), que já consideravam três tipos de representações (nesse caso, underlying form - full structural description - overt form), Boersma assume um modelo bidirecional de gramática que se diferencia do modelo de Tesar e Smolensky por envolver, no módulo da percepção, restrições de pista, conforme mostra a Figura 1; observe-se que cabe a restrições a articulação entre os três níveis de representação que integram o Modelo.

Fonte: Boersma e Hamann (2009, p. 1).

Figura 1: Representação do Modelo de Processamento de L1 e de Gramática 

Nesse modelo, Boersma assume que o processo de compreensão do ouvinte se dá a partir de uma representação fonética auditiva e visa a alcançar uma representação fonológico-lexical. Do lado direito da Fig.1, o processo de produção do falante começa de uma representação fonológico-lexical, que visa a alcançar uma representação fonético-articulatória. Esse modelo de gramática proposto por Boersma é inovador, ao lidar com o processamento em dois módulos, com três níveis de representação, e ao acrescentar, às restrições propostas na OT, as restrições de pista, que se constituem em restrições de fidelidade “auditivo-para-fonológico” (auditory-to-phonological). Assim, subentende-se que, na percepção, o ouvinte não tem acesso ao nível lexical, não sendo necessário o acesso ao léxico para resolver as ambiguidades entre a produção e a compreensão.

Dessa forma, considerar os detalhes acústico-articulatórios a partir de uma análise empírica detalhada, sem sacrificar a modularidade representacional da fonologia, parece uma abordagem adequada, particularmente em um modelo que prevê como interagem os níveis representacionais: o resultado da gramática tem modularidade representacional, mas é interativo, já que, por meio dos diferentes tipos de restrições, está conectado ao nível semântico e ao nível fonético.

Para a aplicação do modelo BiPhon no presente estudo, opta-se pela OT-Estocástica na avaliação do candidato a output, por ser o tipo de avaliação utilizado pelo autor do Modelo BiPhon em seus trabalhos, e por estar vinculada a um algoritmo de aprendizagem gradual também proposto por Boersma e Hayes (2001)1.

Na linha da linguística gerativa, que objetiva uma análise da capacidade de formação da gramática como tarefa de aprendizagem da língua nativa (Chomsky 1965), de forma mais flexível, o modelo BiPhon, assim como já ocorria na Teoria da Otimidade standard (Prince e Smolensky 1993), pressupõe que a gramática universal lida com um conjunto de restrições universais capazes de avaliar objetos linguísticos. Dessa forma, as restrições devem estar presentes nas gramáticas das línguas e devem ser simples e generalizáveis, e a descrição estrutural deve ser ótima (e não perfeita), no sentido de melhor satisfazer as restrições universais, a partir de um dado fenômeno.

As diferenças entre as línguas, assim, emergem como formas variadas permitidas para resolver os conflitos que são inerentes a um conjunto de restrições universais. Em outras palavras, a interação entre restrições, que possibilita a emergência das gramáticas, é a alma desses modelos teóricos. A gramática é uma especificação formal da estrutura de uma língua, que é tipicamente organizada como um mapeamento de um ‘input’ - forma subjacente, que pode ser considerada como a representação fonológica lexical da palavra -, para um ‘output’, forma de superfície fonológica, que pode ser considerada como uma estrutura ramificada de elementos fonológicos abstratos, como traços, segmentos, sílabas, por exemplo.

Uma das críticas do autor do Modelo Bidirecional aos modelos de processamento de língua, anteriores ao BiPhon, diz respeito ao fato de que os modelos de produção que são meramente fonológicos acabam criando exceções para fenômenos fonéticos, que sejam funcionalmente vantajosas para a análise. A solução para esse problema seria permitir que a fonologia interagisse com a fonética, pois, assim, questões frequentemente atribuídas à marcação inata não necessariamente teriam que ser resolvidas por restrições estruturais, mas por restrições auditivas ou articulatórias.

Entretanto, por estar o foco do presente estudo na formalização do fenômeno da epêntese vocálica nos níveis fonológicos do BiPhon, apenas os dois níveis de representação superiores da Figura 1, nos módulos da Compreensão e da Produção, serão objeto de discussão.

2. Aspectos Metodológicos

Na busca do objetivo geral de propor uma formalização para o fenômeno da epêntese vocálica no Modelo de Processamento Bidirecional de L1 (Boersma 2006, 2007, 2008, 2010; Boersma e Hamann 2009), em palavras com sequências heterossilábicas consonantais mediais, foi necessário estabelecer as características acústicas da vogal epentética produzida, bem como os padrões de percepção de falantes nativos do PE diante de contextos propícios à inserção vocálica. Três foram as sequências heterossilábicas que integraram a pesquisa: p.t, p.n, t.n. Reuniram-se duas categorias de dados para o PE: (a) dados para a caracterização da produção da epêntese e (b) dados para a caracterização da percepção da epêntese. As seções seguintes explicitam os procedimentos metodológicos propostos para a coleta dos dois tipos de dados. Conforme já referido, oito falantes do Português Europeu de Lisboa participaram do estudo.

Destaca-se que os instrumentos utilizados buscaram verificar a ocorrência da epêntese com vibração das cordas vocais e da epêntese surda, possivelmente presentes entre os encontros consonantais heterossilábicos propostos. Vale destacar que, dentre as possibilidades de consoante plosiva que podem aparecer em posição de coda (exs.: /k/ - acne, /b/ - obtuso, /t/ - etnia), o interesse do trabalho recaiu sobre os pontos coronal e labial, considerando a não marcação de ‘coronal’, representada, tal como em Prince e Smolensky (1993, p. 198), a partir de uma escala de harmonia universal na qual “place/coronal” é mais harmônico do que “place/labial”. Convertendo a escala de harmonia para um ranking de restrições em dominância, tem-se que a restrição *PL/labial universalmente domina a restrição *PL/coronal: *PL/labial >>*PL/coronal. Com isso, justifica-se a opção por lidar, na análise final, apenas com as sequências formadas de plosiva labial e coronal em coda.

2.1. Levantamento de Dados 1 - Produção da Epêntese

Na elaboração do teste de produção, um primeiro recorte para que se chegasse às sequências eleitas, no Português, foi a escolha de palavras de no máximo quatro sílabas, de apenas duas classes morfológicas (substantivos e adjetivos), e com estrutura morfológica sem prefixo, dando-se preferência a palavras primitivas, o que se levou a efeito com a utilização do Dicionário Aurélio (1999), utilizando-se o mecanismo de busca por ele disponibilizado.

A partir das sequências eleitas para integrar o trabalho (‘p.t, p.n, t.n’), que contêm plosiva em coda com os pontos de articulação labial e coronal, foram escolhidas três palavras para cada sequência: ‘pt’ - corrupto, captura e adaptador; ‘pn’ - acápno, apneia e hipnofone; ‘tn’ - étnico, Vietnam e etnografia. As palavras obedeceram aos critérios assumidos em Quintanilha-Azevedo (2011).

Em uma cabine com isolamento acústico, os oito informantes foram convidados a ler de forma espontânea o instrumento disposto em um modo de apresentação ppt (Microsoft PowerPoint 2010), em um computador do tipo laptop. Os dados obtidos foram submetidos a uma análise acústica para verificar a ocorrência de vogais surdas e sonoras, quando detectada a presença de epêntese; afinal, apenas a verificação acústica da presença desta vogal foi suficiente para que se satisfizesse o objetivo geral deste trabalho de formalizar o fenômeno no modelo BiPhon.

No que se refere à produção, a teoria fonte-filtro (Fant 1970) descreve o som como um processo de duas fases que envolvem a fonte de geração do som: (a) a sua própria forma espectral e (b) a passagem do ar com alguma constrição no trato vocal (lábios, ponta da língua, corpo da língua e véu palatino). Assim, para as vogais, a fonte do som é oriunda da glote; o som é produzido pela vibração das pregas vocais. A frequência fundamental será uma característica da fonte glotal, enquanto as frequências formânticas das vogais são características do filtro do trato vocal.

Nesse sentido, a diferença básica entre a epêntese surda e a sonora é de que a vogal surda, por vezes possível de ser identificada também por oitiva, apresenta a coarticulação palatal, mas não o vozeamento, isto é, manifesta-se acusticamente pela ausência da periodicidade do sinal acústico, característico das vogais. É uma vogal sem fonte sonora, mas com o filtro articulatório típico de uma vogal. Os parâmetros analisados, no caso da epêntese sonora, foram a duração absoluta e os dois primeiros formantes (F1 - referente à altura e F2 - referente à anterioridade da vogal vozeada). Para a verificação da epêntese surda, foram observados os efeitos coarticulatórios de uma vogal sem vozeamento, após a soltura da primeira consoante dos contextos mediais considerados.

As respostas dos testes de produção contaram como output na formalização, pelo BiPhon, dos níveis fonológicos da Produção (ver Figura 1) e da Produção Fonológica (input - forma subjacente / output - forma fonológica de superfície). Consideraram-se como input as formas (‘p.t, p.n, t.n’), sem epêntese.

2.2. Levantamento de Dados 2 - Percepção da Epêntese

De início ressalta-se que os mesmos informantes que participaram do levantamento de dados de produção da epêntese participaram, também, do teste de percepção da epêntese, que sucedeu o teste de produção.

Observa-se, também, que o teste de percepção foi aplicado um mês depois do teste de produção, pois foi fundamental conhecer os padrões de produção das palavras com contexto para a ocorrência da epêntese,. Foi necessário, preliminarmente, verificar o comportamento da plosiva nessa sequência medial heterossilábica imprópria no português (se com soltura longa, com burst ou até com apagamento) e conhecer as características acústicas das vogais epentéticas em cada contexto. Com esses dados analisados, foi possível observar questões relevantes, tais como: (a) a produção da epêntese tem duração bem inferior à de uma vogal lexical, (b) variavelmente, os informantes podem incorrer em não soltura da plosiva em posição de coda.

A elaboração do teste de percepção atendeu a cuidados expressos na literatura, como a constatação, por Ryalls e Lieberman (1982), de que o F0 (frequência fundamental) pode influir diretamente no processo de percepção vocálica. Os autores, manipulando o valor de F0, encontraram diferenças importantes na informação utilizada pelo ouvinte. Por isso, foi decidido, neste trabalho, que os estímulos, no teste, contariam com uma voz feminina e uma voz masculina, representadas por dois falantes nativos do português europeu, que tinham as mesmas características de idade e de escolaridade dos informantes da pesquisa.

Sabendo-se que a frequência fundamental da onda sonora (F0) corresponde ao número de vezes em que um ciclo completo de vibrações se repete em um segundo, é possível afirmar que, quanto maior o número de ciclos de vibração, mais alto será o pitch (correspondente acústico da frequência fundamental que representa a diferença entre os harmônicos) e mais agudo será o som. Ou seja, quanto maior a frequência, mais agudo é o som. Tal parâmetro não altera a identidade fonética da vogal, mas é uma informação que apresenta diferença entre homens e mulheres e que, portanto, deve ser cuidada e conhecida, inclusive quando se objetiva trabalhar com a percepção de dados linguísticos.

O teste de percepção caracterizou-se como ‘teste de identificação’ e foi constituído com logatomas que continham contextos favorecedores da ocorrência da epêntese no português (ex.: letna). A opção pelo uso de não-palavras se deveu ao cuidado de que os sujeitos não recorressem ao léxico para responder ao teste. Os contextos (p.n, p.t, t.n) foram escolhidos a partir da investigação de Quintanilha-Azevedo (2011), que abordou também o fenômeno da epêntese, trabalho esse que teve o foco no português brasileiro como língua estrangeira, com análise fundamentada nos modelos da OT Estocástica (Boersma e Hayes 2001) e da Gramática Harmônica (Legendre et al. 1990; Smolensky e Legendre 2006), com foco apenas na produção linguística.

Cada uma das vozes reproduziu todos os logatomas, para que os informantes recebessem as mesmas informações, aleatoriamente, com frequências fundamentais (F0) diferentes. Foram nove os logatomas propostos (lApno, lapnE, lipnofA, lUpto, laptU, laptadE, lEtni, letnA, letnogrI)2, com três produções diferentes (epêntese vozeada, desvozeada e sem epêntese), e duas vozes (feminina e masculina), que totalizaram 54 estímulos - o sujeito deveria apontar se ouviu a palavra com a inserção vocálica, sem a inserção vocálica ou com apagamento da coda.

Para a epêntese vozeada, buscaram-se estímulos que mantivessem as características vocálicas encontradas na produção dos informantes, inclusive no que se refere à duração da epêntese, que é menor do que a de uma vogal lexical, conforme registra Quintanilha-Azevedo (2016). Os estímulos com epêntese surda tiveram de respeitar o tempo de soltura/duração previsto na produção, pelos informantes, do primeiro segmento do cluster medial, vinculado ao efeito da coarticulação palatal.

Já em se considerando os estímulos sem epêntese, houve o cuidado para que não apresentassem resquício algum de um segmento vocálico no encontro consonantal, principalmente em encontros com nasais. Atentou-se para que o ritmo da realização dos estímulos fosse mantido, já que as palavras eram lidas pelos locutores, e cuidou-se para que todas as produções dos estímulos fossem realizadas com a soltura da plosiva em coda. Essas precauções foram tomadas para que os estímulos não causassem respostas embasadas em outros aspectos acústicos que não dissessem respeito à presença ou à ausência da epêntese.

O software escolhido para a elaboração do teste foi o TP3, versão 3.1, (Rauber et al. 2009) - Teste de Percepção -, pois, além de ser do tipo de plataforma user-friendly, pode ser acessado de qualquer computador, sem que, necessariamente, seja instalado na máquina.

A opção pelo teste de identificação foi consistente com o objetivo do estudo e com o suporte do BiPhon. Em consonância com o direcionamento dado pelo modelo BiPhon, acredita-se que, fonologicamente, a tarefa de perceber, para um ouvinte, implica estabelecer um mapeamento da representação contínua para uma estrutura de superfície fonológica discreta. Para Boersma (2009), esta tarefa corresponde à identificação, que mede o que o ouvinte considera como estrutura de superfície fonológica específica mais provável, ou seja, envolve a atribuição de um rótulo de categoria a um determinado estímulo sonoro. Isso é diferente da tarefa de discriminação, que intenta entender se duas formas auditivas distintas são percebidas como estruturas fonológicas iguais ou não. Entretanto, a questão é que o fato de o ouvinte dizer que as formas auditivas são iguais não quer dizer que ele não possa discriminá-las acusticamente. Esta possibilidade motivou a escolha por um teste de identificação.

Os testes de percepção foram aplicados em seções individuais, com o uso de um laptop Acer, modelo Aspire E1-571-6824. Todos os informantes usaram um headset Multilaser PH53102 (microfone com fone de ouvido) para que o som fosse ouvido de forma clara e sem interferência externa. Os participantes receberam instruções sobre o funcionamento do teste e também realizaram uma tarefa de familiarização.

As respostas dos testes de percepção contaram como input na formalização, à luz do Modelo BiPhon, dos níveis fonológicos da Compreensão (ver Figura 1) e do Reconhecimento Fonológico (input - forma fonológica de superfície / output - forma subjacente). Consideraram-se como output do Reconhecimento Fonológico as formas ‘p.t, p.n, t.n’ sem epêntese.

3. Análise dos dados de produção e de percepção da epêntese

3.1. Dados de produção da epêntese

A presente seção discute o comportamento de falantes do PE frente à possibilidade de uso da epêntese nas sequências que trazem plosivas na posição de coda silábica, em contextos como os das palavras apneia e rapto . Destaca-se que os falantes do PB, considerando que o português não admite, em sua estrutura silábica, plosivas em coda silábica, tendem a produzir uma vogal epentética após o segmento consonantal (Quintanhilha-Azevedo 2016).

A Tabela 1 apresenta os resultados do teste de produção aplicado neste estudo com falantes de PE.

Tabela 1: Índices de produção de epêntese surda e vozeada no PE 

A Tabela 1 mostra que, quando a plosiva em coda medial de palavra é a labial /p/, a epêntese é produzida variavelmente por falantes de PE. Ainda é possível afirmar que os casos com epêntese surda, para dois dos contextos mediais (‘p.n’ = 33,33%, ‘p.t’ = 39,58%), foram altos, comparados à ausência do fenômeno com a coda coronal. Esses resultados da presença de epêntese desvozeada em uma sequência com plosiva surda em coda vai ao encontro da afirmação de Crystal (1988) e Meneses (2012) de que as vogais tendem a ser desvozeadas em contextos em que a consoante precedente é surda. Vale ressaltar ainda que o contexto subsequente também parece poder exercer influência. No caso em que a sequência heterossilábica é formada apenas por segmentos surdos (‘p.t’) em comparação com a sequência ‘p.n’, os índices de ocorrência de vogal surda são maiores, ainda que esta última sequência fira em maior grau a lei do contato silábico do que a sequência ‘p.t’.

Deve-se considerar ainda que uma sequência contendo um segmento vozeado /t.n/, no PE, não registrou ocorrência de epêntese, nem surda, nem vozeada. Porém, deve ser observado que, dentre as sequências testadas, é a única formada por segmentos homorgânicos adjacentes; o compartilhamento do ponto de articulação pode requerer menor ocorrência da vogal epentética, especialmente em se tratando de um cluster complexo quanto à sequência de sonoridade, tal como o que se está discutindo. Os resultados expressos na Tabela 1 apontam que, na produção de sequências consonantais heterossilábicas mediais de palavras, os falantes de PE não apresentam epêntese vocálica vozeada, mas podem mostrar epêntese surda, quando uma plosiva labial ocupa a posição de coda silábica.

3.2. Dados de percepção da epêntese

Apresentam-se, nesta seção, os dados relativos à percepção da epêntese, obtidos com os mesmos informantes que participaram do teste de produção. Ressalta-se que, no teste de percepção, os sujeitos foram expostos a estímulos com epêntese vozeada, sem epêntese e com epêntese surda, devendo apontar se o estímulo continha ou não uma vogal entre a sequência consonantal.

A Tabela 2 apresenta os resultados do teste de percepção aplicado neste estudo.

Tabela 2: Índices de percepção de epêntese surda e vozeada no PE 

Começando-se a descrição dos dados pela sequência ‘p.t’, a partir da Tabela 2 pode-se observar que, quando a sequência, no estímulo, continha epêntese plenamente vozeada (pi.t), não houve “engano” de percepção (48/48 = 100%). De forma semelhante, quando as produções dos estímulos não tinham epêntese, os sujeitos apresentaram apenas 1 engano de percepção em 48 ocorrências, ou seja, apenas um dos 8 informantes se equivocou, o que leva a considerar-se que, para os estímulos produzidos com a plosiva em coda, sem núcleo silábico, praticamente também não houve engano. Já nos casos em que os sujeitos ouviam as produções com a soltura longa do (p) com uma coarticulação vocálica desvozeada, os sujeitos demonstraram dúvidas, mostrando o índice de 75% de percepção com epêntese.

Retomando os dados de produção desses mesmos sujeitos (Tabela 1), vê-se que houve apenas produções com epêntese surda e produções sem epêntese, o que quer dizer que, dentre os três tipos de estímulos apresentados na aplicação do teste de percepção, apenas dois dos padrões eram efetivamente utilizados por aqueles participantes. Sendo assim, parece coerente não haver engano na percepção, especialmente nos casos nos quais os estímulos eram produzidos com epêntese vozeada.

Ainda no que diz respeito à sequência /p.t/, os dados com epêntese surda foram considerados como com núcleo silábico após a plosiva em coda na maior parte das respostas (36/48 = 75%), ou seja, parece que os sujeitos consideram, como instâncias de um mesmo padrão silábico, a inserção vocálica vozeada e a produção do (p) com uma coarticulação vocálica em sua soltura.

Trata-se, agora, dos dados de percepção para a sequência que apresenta um aumento de sonoridade entre a plosiva em coda e o onset da sílaba seguinte: /p.n/ e /t.n/. Quando os estímulos das sequências com (p.n) foram produzidos com epêntese plenamente vozeada, todos os informantes, em todos os estímulos, identificaram epêntese, conforme já havia sido relatado para (p.t). Na verdade, esse resultado se confirma para todas as sequências.

Nos casos em que os sujeitos ouviam as produções com epêntese surda, ainda na sequência /p.n/, consideraram haver epêntese em 33/48 ocorrências (69%). A soltura longa do (p) em coda com a coarticulação de uma vogal foi uma possibilidade na produção dos informantes da variedade europeia, mas, nas produções, com frequência inferior à metade dos casos. Assim, acredita-se que a frequência da percepção da diferença entre a epêntese surda e a epêntese sonora tenha a ver com esse fato. Mais uma vez, no caso das produções dos estímulos sem epêntese, não houve dúvida na percepção.

A última sequência consonantal trata de uma plosiva com ponto de articulação coronal em coda, seguida de uma consoante nasal /t.n/. Na percepção de palavras formadas pela sequência heterossilábica /t.n/ com epêntese surda, obteve-se o menor número das respostas marcadas como se os estímulos tivessem vogal (15/48 = 31%). Nos demais casos, nos quais as produções dos estímulos foram realizadas com epêntese ou sem epêntese vozeada, os sujeitos não demonstraram engano na percepção.

Voltando-se para a tabela da produção da epêntese (Tabela 1), vê-se que, na sequência (t.n), não houve qualquer ocorrência de epêntese, surda ou vozeada, fato que talvez explicasse a menor confusão no teste de percepção dessa sequência; além disso, /t/ é a coda com ponto de articulação menos marcado e está aliada ao fato de esta sequência estar constituída por consoantes homorgânicas.

Logo, parece que o fato de a produção de uma sequência consonantal medial de palavras ser homorgânica pode resultar em outputs, na implementação fonética, com contraste “mais perceptível”.

Os resultados do teste de percepção, portanto, evidenciam consistência com aqueles obtidos no teste de produção, sendo a epêntese vozeada identificada em 100% das ocorrências, alcançando praticamente o mesmo índice de acerto os casos de estímulos sem epêntese.

4. Formalização dos dados

Antes da formalização final dos dados, é fundamental a escolha das restrições que fazem parte da gramática na representação do fenômeno estudado. Assim, a seção a seguir tem o objetivo de apresentar as restrições, bem como explicar a motivação para a escolha de cada uma.

4.1. Restrições

Conforme já relatado, para a formalização dos níveis do BiPhon identificados como Reconhecimento e Produção Fonológica (veja-se Figura 1), dois tipos de restrições são relevantes: as Restrições de Fidelidade e as de Estrutura. As Restrições de Fidelidade são responsáveis pela manutenção das formas presentes no nível subjacente; no presente estudo, são formas com a plosiva em posição de coda |pt|, |pn| e |tn|, tanto na produção, quanto na percepção. As Restrições de Fidelidade que, neste estudo, compuseram a formalização do nível lexical, tanto para a produção quanto para a compreensão, foram duas:

  • 1. Dep - Segmentos do output têm correspondentes idênticos no input - não insira (McCarthy e Prince 1995).

  • 2. Max - Segmentos do input têm correspondentes idênticos no output - não apague (McCarthy e Prince 1995).

A restrição Dep é violada por um candidato que, no nível /fonológico de superfície/, não tem correspondente segmental com o nível |fonológico subjacente|. Por sua vez, a restrição Max é violada por um candidato que, no nível |fonológico subjacente|, não tem correspondência com o nível /fonológico de superfície/. Para o caso ora posto, de plosivas em posição de coda medial de palavra, as restrições de fidelidade Dep e Max dão conta dos dados, pois as alternativas prováveis utilizadas para a correção de uma estrutura imprópria em coda, no PE, são apagamento e epêntese.

Quanto às Restrições de Estrutura (ver Figura 1), referem-se apenas às formas de output (/forma fonológica de superfície/), sendo cegas ao input (|forma subjacente|), na produção fonológica. Por sua vez, no reconhecimento, as Restrições de Estrutura se referem às formas de input (/forma fonológica de superfície/), sendo cegas ao output (|forma subjacente|). Alves (2008) e Quintanilha-Azevedo (2011) já haviam proposto restrições para a formalização das mesmas sequências escolhidas neste trabalho, na Teoria da Otimidade Estocástica (Prince e Smolensky 1993, 2004; Boersma e Hayes 2001) e na Gramática Harmônica (Legendre et al. 1990). A coerência das restrições propostas por Alves, para a aquisição do Inglês por falantes nativos do PB, e por Quintanilha-Azevedo, para a aquisição do PB como língua estrangeira, fez com que se pensasse na transposição dessas restrições para o status das restrições de estrutura.

Sendo assim, a primeira decisão tomada foi a da utilização do mecanismo de Alinhamento Harmônico, de Prince e Smolensky (1993), pois esse mecanismo propicia um conjunto de restrições que pode mostrar quais segmentos se apresentam mais aptos a ocorrer em coda silábica a partir de uma escala linguística. Além disso, seguindo-se Alves (2008) e Quintanilha-Azevedo (2011), considerou-se pertinente que as restrições fossem formalizadas através de uma hierarquia em relação de estringência, que permite dizer-se que líquidas ou nasais em coda, por exemplo, nunca serão mais marcadas do que as plosivas em coda, mas podem ser igualmente marcadas na interação das restrições no ranking4. Junto às Restrições de Alinhamento Harmônico, a escala de ponto merece destaque. O fato de as sequências formadas de labiais /p.t/ e /p.n/ apresentarem maior número de epênteses, em comparação à sequência /t.n/, revela que diferenciar o ponto da plosiva em coda é crucial. Assim:

codacodacodacodacoda

Ainda agregam-se, às Restrições de Estrutura, as Restrições de Alinhamento Relacional (Gouskova 2004). Uma representação de distância de sonoridade, que identifique o contexto, na sequência heterossilábica, parece pertinente para representar os casos com maior produção de epêntese, ainda no nível fonológico. O mecanismo de alinhamento relacional de Gouskova (2004) vai combinar a escala de sonoridade de coda com a de onset, determinando quais distâncias são mais marcadas entre os segmentos heterossilábicos em análise neste estudo.

A restrição Dist{+1} representa um acréscimo de sonoridade de um ponto, isto é, representa a distância entre o segmento plosivo e o nasal em /t.n/ e /p.n/, e Dist{0}, por sua vez, representa o encontro de dois segmentos plosivos, o que corresponde a um plateau de sonoridade, como em /p.t/. Assim, Gouskova (2004) transforma em índices numéricos as diferenças de sonoridade entre coda e onset da sílaba seguinte. Em outras palavras, é preferível um encontro /p.t/ (‘rapto’) a um /p.n/ (‘hipnose’).

3) *Dist{1}, *Dist{1,0} ( indicam as dificuldades estabelecidas pelo contato silábico em uma sequência heterossilábica.

Por fim, levando-se em conta que as Restrições de Estrutura propostas estão expressas a partir de uma escala de sonoridade e uma escala de ponto de articulação, têm-se, então, as restrições referentes à distância de sonoridade, garantindo a relação de marcação /p.n, t.n/ >> /p.t/. Entretanto, ainda se faz necessária uma relação entre ponto de articulação e distância de sonoridade, que garanta a relação de marcação /p.n/ >> /p.t/ >> /t.n/.

Para tanto, na esteira da utilização de restrições conjuntas propostas por Alves (2008), propõe-se a conjunção entre ponto de articulação da plosiva em coda e distância de sonoridade, conforme aparece em (4):

4) *{labial}coda&{Dist1}, *{labial}coda&{Dist1,Dist0}, *{labial,coronal}coda&{Dist1,Dist0} ( reúnem as dificuldades estabelecidas pelo contato silábico em uma sequência heterossilábica e as dificuldades estabelecidas pela plosiva em coda, com relação ao ponto de articulação, na busca de uma generalização que preserve a relação de marcação entre /p.n/ >> /p.t/ >> /t.n/.

Observa-se que as restrições de Alinhamento Harmônico foram utilizadas por serem pertinentes na análise da epêntese vozeada, conforme mostram os estudos de Alves (2008) e Quintanilha-Azevedo (2011). Entretanto, suscitam uma reflexão interessante sobre a possibilidade de um status diferente para as epênteses surdas, talvez um status mais fonético do que fonológico. Nesse sentido, apenas as epênteses sonoras estariam formalizadas no nível fonológico. Esta linha de raciocínio não será seguida neste trabalho, mas poderia explicar o fato de ‘p.t’ se sobrepor a ‘p.n’ no número de epêntese.

Nesse sentido, foram convenientes as duas últimas restrições, a seguir:

5) Agree{ponto} ( garante a concordância de ponto entre as consoantes que compõem a sequência heterossilábica.

6) Dist{0}&Agree{ponto} ( envolve contato silábico e concordância de ponto, permitindo que /p.t/ possa se sobrepor a /p.n/ (/p.t/>>/p.n/), de forma que seja preservada a hierarquia de distância de sonoridade e a escala de ponto de articulação.

A seguir, a partir das Restrições de Estrutura e Fidelidade propostas, apresenta-se a formalização dos dados. Começa-se pela produção fonológica, que integra o Módulo da Produção (veja-se Figura 1), porque é um nível de representação conhecido nas análises fonológicas, o qual lida com a passagem da |forma subjacente| para a /forma fonológica de superfície/. Após isso, apresenta-se a formalização do reconhecimento, que é o caminho inverso (passagem da /forma fonológica de superfície/ para a |forma subjacente|), integrando o Módulo da Compreensão.

Vale ressaltar que, sendo Compreensão e Produção partes de uma mesma gramática, as restrições, bem como a hierarquia das restrições, devem ser as mesmas.

4.2. Formalização do fenômeno no modelo BiPhon

4.2.1. Produção fonológica no PE - Módulo da Produção

Na produção fonológica do PE, considerando-se as formas subjacentes |pt, pn, tn|, a partir da coleta de dados realizada, têm-se as representações mostradas em (1).

(1) 

Com foco na formalização dos níveis meramente fonológicos (|forma subjacente| (input) e /forma fonológica de superfície/ (output)), a descrição dos padrões encontrados na produção do PE foi organizada, dividindo-se a análise nos dois processamentos: Produção Fonológica e Reconhecimento.

A partir dos dados de produção de palavras formadas pelas sequências heterossilábicas com segmentos plosivos /p.t, p.n, t.n/, em coda medial (Tabela 1), as possibilidades de candidatos com as quais o algoritmo foi alimentado aparecem em (2).

(2) 

Conforme é possível ver no esquema em (2), os dados de produção do PE não apresentaram epêntese na sequência /t.n/, corroborando o fato de que a sequência com a coronal em coda é “melhor” do que uma sequência com a labial em coda.

Uma questão interessante se refere ao fato de o PE apresentar maior frequência de vogal epentética na sequência /p.t/ em relação à sequência /p.n/, já que esta contém um segmento vozeado; cabe, no entanto, a observação de que esta epêntese é surda6.

Na Tabela 3, apresenta-se, para o nível de produção fonológica, o resultado da simulação computacional com o GLA com referência à gramática do PE, que aponta a plosiva em coda como imprópria na língua e sofre ação da epêntese surda como forma de correção.

Tabela 3: Produção fonológica para os outputs /pi.n/, /pi.t/ e /t.n/, no PE 

A Tabela 3 mostra que a gramática do PE, na produção fonológica, mapeia, da |Representação Subjacente| para a /Forma Fonológica de Superfície/, estas formas como ótimas: |p.t|(/pit/; |p.n|(/pin/; |t.n|(/tn/. Tal tabela mostra a possibilidade de epêntese para as sequências com coda labial.

No que se refere à organização das restrições em um nível puramente fonológico na produção, evidencia-se que a sequência /p.t/ apresentou maior ocorrência de epêntese do que a sequência /p.n/. Tal relação está sendo mostrada pela restrição conjunta *Dist{0}&Agree{ponto}, que possui valor central 99.480, posicionada acima da restrição *{labial}coda&{Dist1} (valor central = 98.442). Embora os valores centrais mostrem proximidade a ponto de evidenciar a possibilidade de flutuação entre as restrições (distância inferior a 10 pontos) e, portanto, a possibilidade de variação entre os outputs com e sem epêntese, a hierarquia *Dist{0}&Agree{ponto} >> *{labial}coda&{Dist1} implica que a forma com epêntese p(i)t é mais frequente do que a forma com epêntese p(i)n.

O resultado foi categórico, no PE, para a ausência de epêntese na sequência /t.n/, e pode ser observado nos valores centrais que acusam a restrição *{labial, coronal}coda (84.844) e a restrição *{labial, coronal}coda&*{Dist1, Dist0} (84.844) em relação à restrição Dep (101.173): a distância acima de 10 pontos representa que, independentemente do número de produções, Dep sempre estará em posição mais alta no ranking, o que implica que sempre o candidato com a plosiva coronal em coda, sem epêntese, será escolhido na disputa; Dep, assim, interage com as Restrições de Estrutura de forma a representar o output invariável.

Além disso, tem-se a restrição Max garantindo uma posição bastante alta no ranking, explicitando que a correção para a estrutura ilícita não é o apagamento. De forma diferente da coronal em coda, as sequências com a labial em coda ‘p.n, p.t’ mostraram outputs variáveis, conforme mostra a Tabela 4 a seguir.

Tabela 4: Produção fonológica para os outputs /p.n/, /p.t/ e /t.n/, no PE 

A Tabela 4 expressa um momento de produção em que as formas ótimas não mostram epêntese nem sequer para as sequências com coda labial, dado que o mapeamento agora é: |p.t|/(/pt/; |p.n|(/pn/; |t.n|(/tn/. A diferença está em que, na tabela anterior (Tabela 3), a restrição Dep ocupou uma posição mais baixa no ranking, o que fez com que pudesse emergir a epêntese apenas para aqueles candidatos com o segmento labial em coda. No entanto, no momento de produção expresso pela Tabela 4, a restrição Dep assumiu uma posição mais acima no ranking, revelando que um candidato com a labial em coda (p.t, p.n), sem epêntese, também é possível. Observe-se que o movimento no ranking envolveu as restrições cujos valores centrais apresentavam distância inferior a 10 pontos.

No que se refere à restrição conjunta *Dist{0}&Agree{ponto} (valor central = 99.480), pode-se dizer que não por acaso tal restrição recebeu o valor central mais próximo do valor da restrição Dep (valor central = 101.173). Para que /p.t/ mostrasse índices de epêntese maiores do que /p.n/, foi importante que a restrição conjunta *Dist{0}&Agree{ponto} ficasse acima da restrição *{labial}coda&{Dist1} (valor central = 98.442), possibilitando que a sequência com o platô (/p.t/) superasse a distância mais marcada com relação ao contato silábico, sem quebrar esta relação.

A restrição que proíbe a plosiva em coda (*stopcoda) ocupou uma posição baixa no ranking. Como se optou por não trazer candidatos com a fricativa em coda - que também recorrem à epêntese, no caso de (f) -, essa restrição parece redundante; no entanto, tal restrição foi mantida nas tabelas por ter-se considerado relevante para explicitar que as obstruintes são o foco do estudo.

A Figura 2 apresenta as probabilidades de ocorrências do conjunto de candidatos a output. Com a apresentação dos Output Distributions, pretende-se afirmar a acuidade dos valores fornecidos pelo algoritmo, levando-se em conta um resultado categórico apenas para a sequência formada pela coronal em posição de coda.

Figura 2: Output Distributions da Produção Fonológica do PE, para as sequências /p.n/, /p.t/ e /t.n/ 

Com os dados da Figura 2, é possível comprovar que a gramática em questão apresenta os índices percentuais desejados, de 100% de produção sem epêntese para o caso da sequência formada de coronal em coda /t.n/, bem como de um resultado variável para as sequências /p.n/, /p.t/, formadas pela consoante labial em posição de coda.

4.2.2. Reconhecimento (fonológico) no PE - Módulo da Compreensão

Na compreensão do PE, considerando-se formas auditivas variáveis, que remetem a uma única Forma Subjacente (|pt, pn, tn|), a partir da coleta de dados realizada, tem-se a representação a seguir, mostrada em (3).

(3) 

Tal como está representado no esquema em (3), a análise da Compreensão começa com a Percepção, que envolve a passagem da (Forma Auditiva) para a /Forma Fonológica de Superfície/; entretanto, dado que o foco deste trabalho está na formalização apenas dos níveis fonológicos, apresenta-se o Reconhecimento, representado pela passagem da /Forma Fonológica de Superfície/ (input) para a |Forma Subjacente| (output).

Vejam-se os resultados relativos ao PE expressos em (4), e que são considerados como input nesta análise:

(4) 

A partir dos dados coletados, foi possível determinar que, no PE, o ouvinte deve diferenciar as plosivas pelo ponto e pelo contato silábico; dessa forma, a percepção dos ouvintes europeus sofreu engano apenas diante dos estímulos com epêntese surda. Quando ouviram palavras com epêntese vozeada e sem epêntese, os participantes de Lisboa identificaram a forma ouvida em quase 100% das vezes. Os acertos no teste de percepção foram quase categóricos. Isso certamente está relacionado ao fato de não ter sido observada epêntese vozeada nas produções das sequências /p.n/, /p.t/ e /t.n/.

Por outro lado, o Reconhecimento da sequência /p.t/ apresentou um índice pouco maior de epêntese ilusória do que o da sequência /p.n/. Tal situação demonstra a pertinência do uso da restrição conjunta (*Dist{0}&Agree{ponto}) também no Módulo da Compreensão.

Tabela 5: Reconhecimento para os outputs /pi.n/|pn|, /pi.t/|pt| e /ti.n/|tn|, no PE 

A Tabela 5 evidencia que o Reconhecimento da gramática da língua, por falantes europeus, no Módulo da Compreensão, mapeia, da /Forma Fonológica de Superfície/ para a |Representação Subjacente|, as seguintes formas como ótimas: /pit/(|pt|; /pin/(|pn|; /tin/(|tn|, ou seja, as formas da |Representação Subjacente| contêm a sequência consonantal sem epêntese, mesmo que as /Formas Fonológicas de Superfície/ apresentem epêntese.

A hierarquia das restrições no nível do Reconhecimento tem a mesma coerência da disputa que aconteceu entre elas, na produção. A restrição Max domina a hierarquia e apresenta valor central 108.924, com diferença superior a 10 pontos das demais restrições. A restrição Dep, com valor central de 97.370, apresenta valor alto na hierarquia, mas é um valor que a distancia de Max e que a aproxima das Restrições de Estrutura, para que se possam emergir tanto candidatos fiéis (/t.n/ |tn|, /p.n/ |pn|, /p.t/ |pt|), quanto candidatos que tenham que adequar a sua estrutura ao léxico (/pi.t/ |pt|, /pi.n/ |pn|, /ti.n/ |tn|).

No que se refere à restrição conjunta (Dist{o}&Agree{ponto}), pode-se dizer que essa cumpriu o seu papel de se sobrepor às restrições Dist{1} e Dist{1,0}, pois seu efeito acaba revertendo as implicações deste ranking estringente, justificando a sua existência.

Na Tabela 6, diferentemente da Tabela 3, tem-se a emergência dos pares fiéis /p.n/(|pn|, /p.t/(|pt| e /t.n/(|tn|, o que quer dizer que as formas da |Representação Subjacente| contêm a sequência consonantal sem epêntese, tendo como input /formas fonológicas de superfície/ também sem epêntese. O que permitiu o movimento entre as restrições foram os valores de ponto de seleção: no Tabela 6, as duas Restrições de Fidelidade passaram a dominar o ranking.

Tabela 6: Reconhecimento para os outputs /p.n/|pn|, /p.t/|pt| e /t.n/|tn|, no PE 

Conforme exposto, a restrição Dep teve que subir no ranking para que, neste momento de avaliação, os candidatos fiéis pudessem emergir. Note-se que as relações entre as restrições permanecem as mesmas.

O que permite que haja variação entre os candidatos a output são as distâncias entre os pesos centrais das restrições, que são estabelecidas pelo Algoritmo de Aprendizagem Gradual, vinculado ao modelo.

O resultado dos output distributions, dado pela Figura 3, a seguir, representa as probabilidades de ocorrência de cada uma das sequências dadas nesta análise final.

Figura 3: Output Distributions do Reconhecimento do PE, para as sequências /p.n/, /p.t/ e /t.n/ 

Pelos resultados obtidos na Figura 3, pode-se confirmar que os valores fornecidos pelo algoritmo ratificam exatamente os índices encontrados nos dados de Reconhecimento para os informantes, falantes nativos do PE.

5. Considerações Finais

Considerando uma abordagem sincrônica, esta pesquisa visou à proposição de uma formalização para o fenômeno da epêntese vocálica nos níveis fonológicos do Modelo de Processamento Bidirecional de L1 - BiPhon, a partir da variação que há no português europeu no tocante ao fenômeno da epêntese em sequências consonantais mediais, descrevendo a atuação de restrições em um modelo que pode ser operado com três níveis de processamento: dois níveis fonológicos e um fonético (nível fonológico subjacente, nível fonológico de superfície e nível fonético). O foco do estudo foram os níveis de representação fonológicos, considerando tanto a Produção como a Compreensão do fenômeno.

Com o uso do BiPhon, o fenômeno da epêntese, que não integra a fonologia vernacular da língua, pode e deve ser analisado também como pertencente à gramática da língua. Nesse sentido, o presente estudo mostra-se convergente com os resultados de Boersma e Hamann (2009), que, com o modelo bidirecional, resolveram o problema dos empréstimos linguísticos de forma econômica, sem que fosse necessário recorrer a explicações em tabelas diferentes, como faz a OT Clássica (ou seja, sem considerar que os empréstimos representam uma gramática própria, separada da gramática da língua).

Acrescente-se ainda a vantagem de Compreensão e Produção terem sido formalmente articuladas no BiPhon: assumir-se um modelo de formalização como o da OT, mesmo com restrições de base articulatória, excluiria da pauta a questão da percepção como parte do modelo linguístico, o que também foi preocupação deste trabalho.

A análise proposta permitiu chegar-se às respostas buscadas pelas três questões que nortearam a pesquisa. Com relação à primeira questão, quanto à frequência de aplicação e o tipo de vogal epentética, a partir da Tabela 1, referente à produção da epêntese nos contextos ‘p.t, p.n, t.n’, foi possível verificar que há vogal epentética em contextos de plosiva em posição de coda medial, no PE, que ocorre para satisfazer uma estrutura que é imprópria na língua. Entretanto, para estes contextos verificou-se a ocorrência de vogal desvozeada. Conforme já mencionado, tais vogais vêm sendo observadas na literatura, normalmente, em contextos em que a consoante precedente é surda; sendo assim, trata-se de um resultado que não representa surpresa, já que as sequências estudadas são iniciadas por uma consoante surda.

Entretanto, cabe destacar que a presente análise formal, que concebe a possibilidade da existência da epêntese surda, foi determinante para que se defendesse que o PE também recorre à epêntese, tal como o PB. Ainda se pôde perceber que as consoantes plosivas em coda parecem respeitar uma escala de marcação que fez com que os contextos com labiais (/p.t/ = 39,58% e /p.n/ = 33,33%) sofressem mais epêntese do que com a coronal (/t.n/ = 0).

No que diz respeito à percepção da vogal epentética nos contextos estudados, se é condizente com o padrão silábico dos estímulos fornecidos no experimento, dada a gramática fonológica do português. Cabe salientar que a percepção é uma etapa essencial na comunicação linguística; neste trabalho, tal fenômeno foi considerado como a tarefa de extração, a partir de um sinal contínuo, de categorias discretas, como os fonemas e morfemas. Boersma (2007) e Boersma e Hamann (2009), nesse sentido, acrescentam que a percepção não é puramente fonética, pois envolve conhecimento fonológico. Os autores argumentam que a percepção da fala é controlada pela gramática específica da língua. Dessa forma, as restrições usadas para a produção devem ser as mesmas para a percepção.

Na percepção, destaca-se que os dados com epêntese surda foram considerados como com núcleo silábico após a plosiva em coda, na maior parte das respostas, quando a consoante em coda era uma plosiva labial (p.t - 36/48 = 75% e p.n - 33/48 = 69%). Em outras palavras, parece que os sujeitos consideram, como instâncias de um mesmo padrão silábico, a inserção vocálica vozeada e uma soltura longa do (p) com uma coarticulação vocálica, em um padrão que acontece de forma variável na língua7. Na percepção de palavras formadas pela sequência heterossilábica /t.n/ com epêntese surda, obteve-se o menor número das respostas marcadas como se os estímulos tivessem vogal (15/48 = 31%). A sequência /t.n/ não apresentou ocorrência nem de epêntese surda, nem vozeada, fato que talvez explicasse os resultados no teste de percepção dessa sequência; além disso, /t/ é a coda com ponto de articulação menos marcado e está aliada ao fato de esta sequência estar constituída por consoantes homorgânicas.

Logo, parece que, ao tratar-se de sequências consonantais, o segmento coronal parece resultar em outputs com contraste “mais perceptível”. Nesse sentido, os dados de percepção coletados foram fundamentais para a formalização do Reconhecimento Fonológico, na Compreensão, pois só assim seria possível identificar os inputs possíveis na passagem entre a /Forma Fonológica de Superfície/ em direção à |Forma Subjacente|.

Com relação às restrições relevantes para representar o fenômeno da epêntese no português em codas mediais e a hierarquia de restrições capaz de caracterizar a produção e a percepção linguísticas dos sujeitos da pesquisa, o BiPhon permitiu, por meio das Restrições de Fidelidade e de Estrutura propostas, atribuir o mesmo status à epêntese vocálica vozeada e à epêntese surda, e possibilitou tratá-las, no plano fonológico, como um só fenômeno. Além disso, ofereceu suporte para a visão e a formalização do processo de Reconhecimento Fonológico e de Produção Fonológica como resultantes de uma única gramática. Para a representação dos níveis fonológicos (/Forma Fonológica de Superfície/ e |Forma Subjacente|) na Compreensão e na Produção, as Restrições de Estrutura e Fidelidade, que já integram as análises desde a OT Clássica (Prince e Smolensky 1993), foram suficientes.

A abordagem do fenômeno da epêntese com base no BiPhon permitiu não apenas a expressão de que no português a plosiva em coda constitui uma estrutura imprópria, mas que também é relevante o contato silábico, quando se trata de uma sequência heterossilábica, formada de plosiva, em posição de coda medial. A representação da gramática por restrições Dist (distância de sonoridade), Restrições de Ponto e de Alinhamento Harmônico, somadas às restrições de fidelidade, Dep e Max, foram fundamentais para a formalização do português em análise. Nesse sentido, a manutenção da restrição Max bem acima no ranking, com um valor central superior a 10 pontos das demais restrições, e o jogo entre a Restrição de Fidelidade Dep e as Restrições de Estrutura, possibilitado pela proximidade no valor central das restrições, foram fundamentais para permitir a variação que há nos outputs de superfície fonológica: ora com epêntese, ora sem epêntese.

Entretanto, o que se percebeu a partir dos dados é que a relação de distância de sonoridade entre as sequências formadas de labiais, /p.t/ e /p.n/, não obedece à dominância prevista /p.n/>>/p.t/, na qual a sequência mais marcada é aquela com maior distância entre a coda e o onset da sílaba seguinte. Uma proposta para resolver a relação de dominância entre ‘pt’ e ‘pn’, que ocorre na produção e na percepção do PE, poderia estar no Mecanismo de Conjunção Local, proposto por Smolensky (1995), que tem por objetivo permitir que restrições que se encontram baixas no ranking voltem a ter seus efeitos de oposição sentidos como se estivessem altas na hierarquia em questão. É o caso da restrição de contato silábico referente ao platô (distância de sonoridade = 0), que sempre estará mais baixa no ranking universal (seja ele estabelecido por dominância fixa ou condição de estringência), com relação à restrição de contato silábico, referente à /p.n/ (distância de sonoridade +1).

Entretanto, é preciso fazer com que a distância menos marcada (Dist{0}) se sobreponha à distância mais marcada (Dist{+1}), sem ferir uma relação universal referente ao contato silábico, tal como a proposta por Murray e Vennemann (1983).

A solução foi encontrada em uma restrição que envolve contato silábico e concordância de ponto, como DIST0{coda e onset seguinte}&AgreePonto{coda e onset seguinte}, que preserva a hierarquia de marcação e que pode entrar em conflito com a Restrição de Fidelidade Dep, na disputa do candidato a output ótimo, sobrepondo-se à restrição referente à distância de sonoridade +1. Apesar da redundância da restrição proposta, o argumento que se apresenta a favor das restrições conjuntas é o de que, mesmo redundantes, são soluções para desfazer os efeitos das escalas primitivas.

O desafio que se evidencia tem relação com o maior número de epêntese que ocorre na sequência /p.t/ em relação à sequência /p.n/, no PE. Em se considerando a epêntese surda, a sequência /p.t/ tem número maior de epêntese do que a sequência /p.n/. A questão é se as restrições de Alinhamento Harmônico estão dando conta apenas da epêntese sonora ou se, também, explicam a epêntese surda. A questão é pertinente, dado que as análises de Alves (2008) e Quintanilha-Azevedo (2011), utilizadas como suporte, lidavam apenas com epênteses sonoras. Tal constatação poderia corroborar um status diferente para as epênteses surdas, talvez lhes atribuindo um status mais fonético do que fonológico. Nesse sentido, apenas as epênteses sonoras estariam formalizadas no nível fonológico. Esta seria outra linha de raciocínio que poderá ser perseguida em um trabalho futuro.

Referências bibliográficas

Alves, Ubiratã K. 2004. O papel da instrução explícita na aquisição fonológica do inglês como L2: evidências fornecidas pela Teoria da Otimidade. Tese de Mestrado, Universidade Católica de Pelotas, Pelotas. Inédita. [ Links ]

Alves, Ubiratã K. 2008. A Aquisição das Sequências Finais de Obstruintes do Inglês (L2) por Falantes do Sul do Brasil: Análise via Teoria da Otimidade. Tese de Doutoramento - Pontificia Universidade Catolica do Rio Grande do Sul, Porto Alegre. Inédita. [ Links ]

Alves, Ubiratã K. 2017. Teoria da Otimidade Estocástica e Algoritmo de Aprendizagem Gradual: princípios de funcionamento e tutorial para simulação computacional, ReVEL, 15, 28. (em linha) Disponível em http://www.revel.inf.brLinks ]

Alves, Ubiratã K. e Tatiana Keller. 2010. Sílaba, em L. Bisol e Luiz C. Schwindt (orgs.), Teoria da Otimidade: fonologia, São Paulo, Pontes: 57-92. [ Links ]

Boersma, Paul. 1998. Functional Phonology. Tese de doutoramento, University of Amsterdam, Amsterdam. Inédita. [ Links ]

Boersma, Paul. 2006. Prototypicality judgments as inverted perception, em Caroline Féry Gisbert Fanselow, Matthias Schlesewsky e Ralf Vogel (eds.), Gradience in Grammar, Oxford, Oxford University Press: 167-184. [ Links ]

Boersma, Paul. 2007. Cue constraints and their interactions in phonological perception and production. Rutgers Optimality Archive, n° 944. [ Links ]

Boersma, Paul. 2008. Emergent ranking of faithfulness explains markedness and licensing by cue. Rutgers Optimality Archive, n° 954. [ Links ]

Boersma, Paul. 2010. Modelling phonological category learning, em A. C. Cohn, C. Fougeron e M. K. Huffman (eds.), Handbook of Laboratory Phonology, Oxford, Oxford University Press: 207-218. [ Links ]

Boersma, Paul. 2011. A programme for bidirectional phonology and phonetics and their acquisition and evolution, em A. Benz e J. Mattausch (eds.). Bidirectional Optimality Theory, Amsterdam, John Benjamins: 33-72. [ Links ]

Boersma, Paul e Silke Hamann. 2009. Introduction: models of phonology in perception, em P. Boersma, Paul e Silke Hamann. (eds), Phonology in Perception, Berlin, Mouton de Gruyter: 1-24. [ Links ]

Boersma, Paul e Bruce Hayes. 2001. Empirical Tests of the Gradual Learning Algorithm, Linguistic Inquiry, 32: 45-86. [ Links ]

Boersma, Paul e David Weenink. 2013. PRAAT: doing phonetics by computer (em linha) Disponivel em http://www.praat.org/Links ]

Cagliari, Luiz Carlos. 1981. Elementos de fonética do Português Brasileiro. Tese de Doutoramento, Universidade Federal de Santa Catarina, Florianópolis. Inédita. [ Links ]

Chomsky, Noam. 1965. Aspects of the Theory of Syntax. Cambridge, MA, MIT Press. [ Links ]

Collischonn, Gisela. 1996. Um estudo da epêntese à luz da teoria da sílaba de Junko Ito (1986), Letras de Hoje, 31, 2: 149-158. [ Links ]

Crystal, David. 1988. Dicionário de Linguística e Fonética, Rio de Janeiro, Jorge Zahar. [ Links ]

Dicionário Aurélio Eletrônico (AE). 1999. Século XXI, versão 3.0. [ Links ]

Fant, G. 1970. Acoustic theory of speech production, 2ª ed., Paris, Mouton. [ Links ]

Gouskova, Maria. 2004. Relational Hierarchies in Optimality Theory: The case of Syllable Contact, Phonology, 21, 2: 201-250. [ Links ]

Hume, Elizabeth e Keith Johnson. 2001. A model for the interplay of speech perception and phonology, em E. Hume e K. Johnson (eds.),The Role of Speech Perception inPhonology , New York, Academic Press: 3-26 [ Links ]

Lee, Seung-Hwa. 1993. Epêntese no Português. Estudos Linguísticos. XXII: 847-854. [ Links ]

Legendre, Géraldine, Yoshiro Miyata e Paul Smolensky. 1990. Can connectionism contribute to syntax? Harmonic Grammar, with an application, em Michael Ziolkowski, Manuela Noske e Karen Deaton (eds.), Proceedings of the 26th Regional Meeting of the Chicago Linguistic Society, Chicago, Chicago Linguistic Society: 237-252. [ Links ]

Liljencrants, Johan e Bjorn Lindblom. 1972. Numerical simulation of vowel quality systems: the role of perceptual contrast, Language, 48: 839-862. [ Links ]

Lindblom, Björn. 1986. Phonetic universals in vowel systems, em John J. Ohala and J. J. Jaeger (eds.), Experimental Phonology , London, Academic Press. [ Links ]

McCarthy, John J. 2008. Doing Optimality Theory, Malden, MA, Blackwell. [ Links ]

McCarthy, John J. e Alan Prince. 1995. Faithfulness and Reduplicative Identity, em J. Beckman, L. W. Dickey e S. Urbanczyk (eds.), University of Massachusetts Occasional Papers in Linguistics, 18. (em linha) Disponível em http://roa.rutgers.edu/files/60-0000/60-0000-MCCARTHY-0-0.PDFLinks ]

Meneses, Francisco de Oliveira. 2012. As vogais desvozeadas no Português Brasileiro: investigação acústico-articulatória. Tese de Mestrado. Universidade Estadual de Campinas, Campinas. Inédita. [ Links ]

Murray, Robert e Theo Vennemann. 1983. Sound Change and Syllable Structure in Germanic Phonology , Language, 59: 514-528. [ Links ]

Ohala, John J. 1981. The listener as a source of sound change, em C. S. Masek, R. A. Hendrick e M. F. Miller (eds.),Papers from the Parasession on Language and Behavior, Chicago, Chicago Linguistic Society: 178-203. [ Links ]

Ohala, John J. 1990a. Alternatives to the sonority hierarchy for explaining segmental sequential constraints, Papers from the Annual Regional Meeting, 26, 2: 319-338. [ Links ]

Ohala, John J. 1990b. There is no interface between phonology and phonetics: A personal view, Journal of Phonetics, 18: 153-171. [ Links ]

Ohala, John J. 1993. Sound change as nature's speech perception experiment,Speech Communication, 13: 155-161. [ Links ]

Pater, Joe. 2004. Bridging the gap between receptive and productive development with minimally violable constraints, em R. Kager, J. Pater e W. Zonneveld (eds.), Constraints in phonological acquisition, Cambridge, Cambridge University Press: 219-244. [ Links ]

Prince, Alan e Paul Smolensky. 1993. Optimality Theory: constraint interaction in Generative Grammar,Rutgers University and University of Colorado-Boulder(en línea). Disponible enhttp://roa.rutgers.edu/files/537-0802/537-0802-PRINCE-0-0.PDFLinks ]

Prince, Alan e Paul Smolensky . 2004. Optimality Theory: Constraint Interaction in Generative Grammar. Technical Report. Rutgers (em linha) Disponível em http://roa.rutgers.edu/files/537-0802/537-0802-PRINCE-0-0.PDFLinks ]

Quintanilha-Azevedo, Roberta. 2011. A Epêntese no Português Brasileiro (L2), em Segmentos Plosivos em Codas Mediais, por Falantes Nativos do Espanhol Colombiano (L1): Uma Análise via Teoria da Otimidade Estocástica e Gramática Harmônica. Tese de Mestrado, Universidade Católica de Pelotas, Pelotas. (em linha) Disponível em https://wp.ufpel.edu.br/ppgl/files/2018/10/A-Epentese-no-Portugues-Brasileiro-em-Segmentos-Plosivos-em-Codas-Mediais-por-Faltantes-Nativos-do-Espanhol-Colombiano-Roberta-Quintanilha-Azevedo.pdfLinks ]

Quintanilha-Azevedo, Roberta. 2016. Formalização Fonético-Fonológica da Interação de Restrições na Produção e na Percepção da Epêntese no Português Brasileiro e no Português Europeu. Tese de Doutoramento Universidade Católica de Pelotas, Pelotas. (em linha) Disponível em https://wp.ufpel.edu.br/ppgl/files/2018/10/Formaliza%C3%A7%C3%A3o-Fon%C3%A9tico-Fonol%C3%B3gica-da-Intera%C3%A7%C3%A3o-de-Restri%C3%A7%C3%B5es-na-Produ%C3%A7%C3%A3o-e-na-Percep%C3%A7%C3%A3o-da-Ep%C3%AAntese-no-Portugu%C3%AAs-Brasileiro-e-no-Portugu%C3%AAs-Europeu-Rob.pdfLinks ]

Rauber, Andréia S., Anabela Rato, Giane R. dos Santos, Denise C. Kluge e Marcos Figueiredo. 2009. TP: perception tests and perceptual training with immediate feedback, versão 3.1. Worken. (em linha) Disponível em http://www.worken.com.br/tp_regfree.phpLinks ]

Ryalls, John H. e Philip Lieberman. 1982. Fundamental frequency and vowel perception. Journal of the Acoustical Society of America, 72: 1-4. [ Links ]

Schmitt, Bruna K. e Ubiratã K. Alves. 2014. A aquisição das codas mediais /p/ e /k/ do Inglês (L2) por aprendizes do sul do Brasil (L1): Uma análise gestual na Teoria da Otimidade Estocástica. Revista Letrônica, 7, 2: 765-794. [ Links ]

Smolensky, Paul. 1995. On the internal structure of the constraint component Con of UG. (em linha) Disponível em http://roa.rutgers.edu/files/86-0000/86-0000-SMOLENSKY-0-0.PDF Links ]

Smolensky, Paul e Géraldine Legendre. 2006. The Harmonic Mind: From Neural Computation to Optimality-Theoretic Grammar, Cambridge, MIT Press. [ Links ]

Steriade, Donca. 1995. Markedness and Underspecification, em John Goldsmith (ed.), The handbook of phonological theory, Oxford, Blackwell: 114-175. [ Links ]

Steriade, Donca. 2001. Directional Asymmetries in Place Assimilation: A Perceptual Account, em E. Hume e K. Johnson (eds.), The Role of Speech Perception in Phonology , New York, Academic Press: 219-250. [ Links ]

Tesar, Bruce. 1997. An iterative strategy for learning metrical stress in Optimality Theory, em Elizabeth Hughes, Mary Hughes e Annabel Greenhill (eds.), Proceedings of the 21 st Annual Boston University Conference on Language Development, Somerville, Mass.: Cascadilla: 615-626. [ Links ]

Tesar, Bruce. 1998. An iterative strategy for language learning, Lingua, 104: 131-145. [ Links ]

Tesar, Bruce. 1999. Robust interpretive parsing in metrical stress theory, em Kimary Shahin, Susan Blake and Eun-Sook Kim (eds.), Proceedings of the 17 th West Coast Conference on Formal Linguistics, Stanford, CSLI: 625-639. [ Links ]

Tesar, Bruce. 2000. On the roles of optimality and strict domination in language learning, em Joost Dekkers, Frank Van der Leeuw e Jeroen Van de Weijer (eds.), Optimality Theory: Phonology , Syntax, and Acquisition, New York, Oxford University Press: 592-620. [ Links ]

Tesar, Bruce ePaul Smolensky . 1998. Learnability in Optimality Theory, Linguistic Inquiry , 29: 229-268. [ Links ]

Tesar, Bruce ePaul Smolensky . 2000. Learnability in Optimality Theory, Cambridge, Mass, MIT Press. [ Links ]

Wright, Richard. 2001. Perceptual cues in contrast maintenance, em Elizabeth Hume e Keith Johnson (eds.), The Role of Speech Perception in Phonology , San Diego, Academic Press: 251-277. [ Links ]

1 É tarefa de um algoritmo de aprendizagem dar conta da movimentação das restrições em direção às possíveis hierarquias assumidas na representação da produção da fala e da percepção. O modelo de algoritmo utilizado é o Algoritmo de Aprendizagem Gradual (GLA), de Boersma e Hayes (2001), cuja operacionalização tem fundamento na curva da distribuição normal. Assim, dois valores ou pesos numéricos são concedidos às restrições, o ranking value e o disharmony, e vão representar, respectivamente, a média da distribuição normal e um ponto de seleção em um desvio padrão (momento de produção linguística). É por meio dos valores fornecidos às restrições que o GLA representa outputs variáveis ou categóricos. Valores centrais de restrições com distância superior a 10 pontos representam o resultado categórico, pois, em diferentes momentos de produção linguística, não há cruzamento na faixa de valores destas Restrições. Porém, quando os valores centrais das Restrições se apresentam com uma distância inferior a 10 pontos, há a possibilidade potencial a cruzamento da faixa de valores, o que poderia alterar o ordenamento das restrições e, consequentemente, alterar o candidato ótimo, caracterizando a variação nos outputs. Para maiores esclarecimentos acerca dos fundamentos que regem o algoritmo, bem como sobre os passos fundamentais para a simulação computacional com o GLA, veja-se o tutorial elaborado por Alves (2017).

2As letras maiúsculas indicam a vogal da sílaba tônica.

3O software é gratuito e encontra-se disponível em http://www.worken.com.br/tp_regfree.php último acesso em 28-02-14.

4A relação de estringência mostrou-se plenamente pertinente na análise de Alves (2008). Segundo McCarthy (2008, p. 65-66), “A restrição R1 é mais estringente do que a restrição R2 se toda a violação de R2 implicar também a violação de R1, sendo que algumas violações de R1 não implicam violação de R2”. Para maiores explicações sobre sistemas de estringência, veja-se Alves e Keller (2010).

6De acordo com Quintanilha-Azevedo (2016), no PE, a ocorrência de epêntese sonora existe em contextos em que os dois segmentos da sequência heterossilábica são vozeados (‘admissão’, ‘magma’, ‘advogado’, ‘magno’); essa epêntese vozeada, no entanto, não é frequente.

7Um argumento em oposição à abordagem de um núcleo vazio apresenta-se nos próprios dados coletados. Palavras como ‘corrupto’ e ‘convicto’ foram, de forma variável, produzidas sem a soltura da consoante plosiva. Em termos de estrutura de superfície, esta é uma evidência de que esta plosiva está, efetivamente, em coda, uma vez que um segmento obstruinte em onset não pode ser produzido sem soltura (Alves 2004, 2008; Schmitt e Alves 2014).

5As Restrições de Estrutura, de acordo com McCarthy (2008), são negativas, de modo que a leitura deve prever “atribua uma marca de violação toda vez que...”. No entanto, para fins explicativos da análise, optou-se não por descrever a restrição, mas explicar seu papel na análise.

NOTA: A participação dos autores do artigo foi a seguinte: Roberta Quintanilha Azevedo (60%), Carmen Lúcia Barreto Matzenauer (20%) e Ubiratã Kickhöfel Alves (20%)

Nota de aceptación: Este texto ha sido aceptado para publicación por el único Director-Editor de la revista, Adolfo Elizaincin, quien ha actuado de acuerdo a lo establecido en la “Declaración de comportamiento ético de la revista Lingüística (https://www.mundoalfal.org/sites/default/files/revista/Declaración_comp_etico.pdf), primer párrafo del capítulo “Obligaciones del Director-Editor. A esta declaración deben adherir, explícitamente, el Director-Editor, los árbitros y los autores.

Recebido: 02 de Janeiro de 2018; Aceito: 15 de Junho de 2018

Creative Commons License Este é um artigo publicado em acesso aberto sob uma licença Creative Commons