E-mail de contato
fariap@unicamp.br
Descrição
Duas tarefas essenciais à aquisição lexical são objeto desta proposta de pesquisa: mapear palavras a sentidos e categorizar as palavras. Quanto à primeira, um dos principais obstáculos (para a criança) é o “problema gavagai” que diz respeito à indeterminação referencial dos enunciados, isto é, à dificuldade de vinculá-los a sentidos de modo consistente. Entre outras estratégias, a aprendizagem trans-situacional parece ter aí um papel importante. Ademais, é preciso aprender as categorias das palavras, pois sabe-se através de pesquisa experimental que as categorias sintáticas emergem e tem papel na aquisição da linguagem, inclusive para alavancar a aquisição de palavras, o que torna importante compreender como este conhecimento se estabelece na criança. A presente proposta de pesquisa tem assim, como objetivo geral, investigar teórica e computacionalmente estas duas tarefas envolvidas na aquisição lexical do português brasileiro. Complementar aos métodos mais tradicionais (estudos de corpora e experimentais), a abordagem computacional almeja produzir modelos que incorporem o que já se sabe sobre a aquisição, sobre a linguagem e sobre a cognição humana, se configurando assim como simulações psicologicamente plausíveis que podem iluminar aspectos de difícil observação empírica em estágios muito precoces da criança. Além de reproduzir estudos proeminentes encontrados na literatura, esta pesquisa tem como um dos objetivos específicos compilar (a partir de corpora já existentes) e disponibilizar uma grande base de dados de aquisição do português brasileiro, com algo entre um milhão e 2,5 milhões de palavras, e anotá-la com informações de lematização e categorias morfossintáticas. Tal base de dados ainda não existe e abriria muitas oportunidades de investigação futura. Para isso, a pesquisa prevê um grande esforço formador, especialmente na graduação, através da participação de bolsistas técnicos e de iniciação científica, além dos estudantes de pós-graduação. Em função dos temas de investigação, esta pesquisa visa ainda estabelecer relações inter-institucionais nacionais e internacionais e contribuir para a internacionalização da instituição.
-
- Finaciamento FAPESP 2018/18655-7
Informações
Sigla/Apelido
Tipo
Projeto de Pesquisa
Data de Criação
01/08/2019
Líder do projeto
Pablo Picasso Feliciano de Faria
Departamento do líder
Departamento de Linguística
Vigência
31/07/2021
Área de Pesquisa
Forma e Funcionamento das Línguas Naturais
Participantes internos
Participantes externos
Rafael L. BERALDO (Mestrado)
Igor L. SOUZA (Mestrado)
Maria Paula Orfanelli (IC, TCC)
Lorena de la Torre (IC)
Marcus Zanchetta (IC)