O projecto de “wordnet” para português, do investigador Hugo Gonçalo Oliveira, acaba de vencer o prémio de melhor tese de doutoramento da 11ª International Conference on Computational Processing of Portuguese (Propor 2014). O especialista da Universidade de Coimbra (UC) desenvolveu um tipo de dicionário próprio para ser utilizado por computadores, permite que os computadores entendam mais de português.
Na prática, o trabalho premiado pela Propor 2014, o principal evento internacional na área do processamento computacional da língua portuguesa, permite que os computadores entendam mais de português. “Para os computadores perceberem a língua dos humanos, são necessárias várias ferramentas complexas que os ‘ensinem’”, diz um comunicado. Uma dessas ferramentas é precisamente a “wordnet” a qual constitui “uma base de dados lexical que organiza as palavras de acordo com os seus possíveis sentidos e que estão para as máquinas como os dicionários estão para os seres humanos”, explica Hugo Gonçalo Oliveira. Serve para o computador compreender o que está escrito, acrescenta.
As bases existentes para português têm limitações de disponibilidade, método de construção e cobertura, diz um comunicado. “O Onto.PT (nome atribuído à ferramenta) procurou ultrapassar essas limitações através da criação gratuita, de grandes dimensões e gerada de forma automática, para assim ultrapassar o tempo necessário para uma construção manual”, afirma Oliveira.
Recorrendo a esta ferramenta e a outras já desenvolvidas no âmbito do projecto orientado pelo investigador Paulo Gomes, os computadores “poderão compreender melhor a língua portuguesa, o que poderá ter impacto no desenvolvimento de melhores sistemas de pesquisa inteligente, de ajuda à escrita, ou de tradução automática, entre outros”, sublinha este docente do Departamento de Engenharia Informática da faculdade de Ciências e Tecnologia da Universidade de Coimbra (FCTUC).
A Propor 2014 decorre na Universidade de São Carlos, São Paulo, Brasil, entre os dias 6 e 8 do próximo mês de Outubro.