Resumo

Versão para impressão
Treinamento linguístico de software na pós-edição de transcrição e tradução automática em cursos de educação a distância

Luana Moro

Orientador(a): Rodrigo Esteves de Lima Lopes

Co-orientador(a): Daniel Yokoyama Sonoda

Mestrado em Linguística Aplicada - 2019

Nro. chamada: TESE DIGITAL - M828t


Resumo:
Esta pesquisa tem por objetivo elaborar modelos de treinamento de software para o software de transcrição e tradução automática, Skylar, tendo como embasamento teórico a linguística de corpus (LC) (BERBER SARDINHA, 2004) e do processamento de linguagem natural (PLN) (LIDDY, 2001). A ferramenta de inteligência artificial (IA) se estabelece no contexto da educação a distância (EAD) e tem por objetivo analisar as legendas geradas em uma videoaula. Ferramentas que buscam a automatização com o PLN podem contar erros na geração de seus conteúdos (OTHERO, 2006), o que causa um problema no entendimento do consumidor dessas legendas. Para tanto, este treinamento se fez necessário pelo uso da Skylar na transcrição e tradução de videoaulas, pois estes equívocos podem prejudicar o entendimento do aluno que irá assistir a aula com o conteúdo legendado. Para a execução do processo de metodológico, foi selecionada uma videoaula aula de MBA no tema de Agronegócios para análise da transcrição que, como apresentado anteriormente, é o ponto central de análise desta pesquisa. A metodologia é quanti-qualitativa, sendo dividida em três partes: 1) análise quantitativa – aplicação de dois cálculos estatísticos, WER – Word Error Rate (KLAKOW; PETERS, 2002) e LD – Levensthein distance (LEVENSTHEIN, 1966), para se obter o índice de erros e a distância entre as letras certas e erradas, respectivamente; 2) análise qualitativa – os dados obtidos nos cálculos serão analisados com o filtro de melhores e piores segmentos, levantando hipóteses e insumos para o desenvolvimento da interpretação utilizando técnicas de linguística do corpus; e 3) apuração dos conteúdos em modelos padronizados para o treinamento do software, chegando ao objetivo desta pesquisa. Além dos processos citados, durante a aplicação da análise qualitativa, serão isolados termos mais frequentes para análise de contexto, de forma a fornecer ao software as áreas de concentração em que a aula pertence. Foram analisados 406 segmentos de legenda (31 minutos de vídeo), observou-se que o software obteve um resultado positivo através da análise quantitativa, porém ao se aplicar as classificações de erros e na elaboração da análise qualitativa, observou-se a necessidade de um treinamento que voltasse para a apuração de contexto.

Palavras-chave: Linguística de corpus; Processamento eletrônico de dados; Inteligência artificial; Educação a distância.

. Rua Sérgio Buarque de Holanda, no 571
Campinas - SP - Brasil
CEP 13083-859

...

IEL - Based on Education theme - Drupal Theme
Original Design by WeebPal.