16 de maio de 2013

Sobre repetições e correspondências (matches) – Para iniciantes

O Jorge Davidson é um tradutor de espanhol, nascido na Argentina, e escreveu o texto que reproduzimos abaixo na íntegra, tamanho o caráter didático, técnico e esclarecedor. Assim, inauguramos o primeiro texto sobre CAT tools.



CAT Tools: sobre repetições e correspondências (matches) – Para iniciantes 

Este post é absolutamente óbvio para uma grande parte dos integrantes da lista que trabalham com ferramentas CAT (Wordfast, MemoQ, SDL Trados Studio, OmegaT, etc.), mas observei que os termos “repetição” e “match” podem gerar confusão entre alguns colegas menos experientes. Especificamente para eles, segue um brevíssimo resumo de alguns conceitos básicos relacionados (sem entrar em considerações sobre valores nem descontos). Desculpem qualquer erro de português que, definitivamente, não é a minha praia. 

1) As ferramentas CAT dividem os textos em segmentos (geralmente no nível de frases), também chamados unidades de tradução (translation units ou TU), e oferecem a informação estatística de análise em segmentos e palavras. Consideramos a contagem de palavras porque cobramos por palavra, e não por segmento, mas devemos lembrar que a informação sobre repetições e correspondência com a memória (% de match) nunca se refere a palavras soltas, mas a palavras que formam um segmento. 

2) Repetições são aquelas palavras (sempre formando parte de um segmento, desculpem a reiteração) que aparecem mais de uma vez no arquivo que estamos traduzindo. Por exemplo, um manual pode conter a frase: “Desconecte o aparelho da tomada” (lembrem que eu traduzo para espanhol!) (5 palavras) antes de explicar cada um dos procedimentos de manutenção. Isso aparecerá na contagem como repetição para todas as ocorrências depois da primeira (que deveremos traduzir). Ou seja, caso a frase apareça 10 vezes no arquivo (50 palavras no total), na primeira ocorrência as (5) palavras serão classificadas como “novas” (no match) e no resto (45 palavras [50 - 5]) como repetição. 

3) Correspondência (match) se refere à relação de similaridade entre os segmentos do texto que estamos traduzindo e os que fazem parte da memória de tradução. Os percentuais, que vão de 100% match (correspondência total ou segmento exatamente igual) até No match (sem nenhuma correspondência), indicam o grau de similaridade (em %) que tem o segmento do arquivo que estamos traduzindo com o segmento que está na memoria. Ou seja, um match de 95 a 99% implica que o segmento é muito similar a outro que existe na memória; um percentual de match menor indica que o segmento é menos parecido ao que existe na memória. Retomando o exemplo anterior, se na nossa memória já estiver o segmento “Desconecte o aparelho da tomada” e no arquivo que estamos traduzindo ele aparecer 10 vezes, teremos 50 palavras (10x5) como 100% match. Caso o segmento da memória não seja exatamente igual, mas similar, isso se refletirá com um % de match X (menor).



Maio/2013