Mudanças entre as edições de "Construção de Tesauro"
Linha 15: | Linha 15: | ||
− | CONSTRUÇÃO DE TESAUROS: LINGUAGENS DOCUMENTÁRIAS | + | CONSTRUÇÃO DE TESAUROS: LINGUAGENS DOCUMENTÁRIAS* |
Linha 165: | Linha 165: | ||
Relação partitiva — entre termos que são: um à o todo ------ outro à a parte; expressa pela abreviatura TGP/TEP; | Relação partitiva — entre termos que são: um à o todo ------ outro à a parte; expressa pela abreviatura TGP/TEP; | ||
+ | |||
+ | |||
+ | |||
+ | Trabalho em desenvolviemnto, com possibilidades de alterações. |
Edição das 07h49min de 27 de novembro de 2007
UNIVERSIDADE DE SÃO PAULO FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE RIBEIRÃO PRETO CIÊNCIAS DA INFORMAÇÃO E DA DOCUMENTAÇÃO
BRUNO CESAR RODRIGUES – N. USP 5482540
CONSTRUÇÃO DE TESAUROS: LINGUAGENS DOCUMENTÁRIAS*
Trabalho apresentado como requisito de aprovação na disciplina Construção de Tesauros, ministrada no segundo semestre de 2007, no curso de Ciências da Informação e da Documentação.
Docente: Profª Drª Maria Cristiane Barbosa Galvão
Ribeirão Preto 2007 BRUNO CESAR RODRIGUES – N. USP 5482540
CONSTRUÇÃO DE TESAUROS: LINGUAGENS DOCUMENTÁRIAS
Trabalho apresentado como requisito de aprovação na disciplina Construção de Tesauros, ministrada no segundo semestre de 2007, no curso de Ciências da Informação e da Documentação.
Docente: Profª Drª Maria Cristiane Barbosa Galvão
Ribeirão Preto 2007
SUMÁRIO
INTRODUÇÃO
SISTEMA PARA INDEXAÇÃO E RECUPERAÇÃO DE INFORMAÇÃO
TESAURO: ORIGEM E DEFINIÇÃO
ESTRUTURA DO TESAURO
QUANTO A UTILIDADE DOS TESAUROS
INTRODUÇÃO
Segundo a Declaração de Princípios sobre a Liberdade de Expressão: Toda pessoa tem o direito a buscar, receber e divulgar livremente informações e opiniões em conformidade com o que estipula o artigo 13 da Convenção Americana sobre Direitos Humanos. Todas as pessoas devem ter igualdade de oportunidades para receber, buscar e divulgar informação por qualquer meio de comunicação sem discriminação, por nenhum motivo, inclusive os de raça, cor, religião, sexo, idioma, opiniões políticas ou de qualquer outra natureza, origem nacional ou social, posição econômica, nascimento ou qualquer outra condição social. Juntando-se a isso o constante desenvolvimento das tecnologias de informação e comunicação, percebe-se que o volume de informações tem aumentado de forma exponencial, além de ser cada vez mais rápido, tornando mais difícil a tomada de decisão quanto às informações que se tem acesso.
Em outras palavras, na atualidade, a quantidade de informação que se produz, além da velocidade de produção, alcançou grandes proporções, onde se torna cada vez mais imprescindível a utilização de ferramentas que facilitem a busca e o acesso àquilo que é importante, principalmente às pesquisas, e de forma mais rápida.
Mesmo com a sofisticação das tecnologias de informação e comunicação, que possibilitam o acesso de forma mais rápida a um número imenso de informações de forma rápida, sabe-se que não é fácil a extração de informações confiáveis, eficazes e em instantânea. O que se consegue, na maioria das vezes, é destacar uma ou outra informação, em uma ou outra base de dados, que seja a que se necessita.
O problema que se encontra neste grande fluxo informacional é a falta de uniformidade na organização destas informações, prejudicando a acessibilidade e a compreensão das informações disponibilizadas. Ou seja, mesmo com a facilidade de acesso às informações, conquistados pelas tecnologias de informação e comunicação, o acesso cognitivo àquelas continua prejudicado devido a falta de tratamento uniforme das informações. Há uma imensa competitividade pela disponibilização das informações, porém, pouco ou quase nada se pensa em relação às normas e padrões de tratamento da informação, ocasionando em perda de eficácia e eficiência na recuperação destas informações.
Para que se tenha uniformidade e transparência na disponibilização de informação, as estratégias adequadas não devem se fixar somente às técnicas de informática, mas sim no desenvolvimento de um sistema de tratamento e recuperação da informação. Tal sistema também deve levar em consideração que há diversidades no que diz respeito a necessidades de informação por parte dos usuários.
Sistema para indexação e recuperação de informação
Sendo assim e com o crescimento da produção de documentos científicos e técnicos, desde as décadas de 40 e 50, passou a exigir um instrumento de representação do conteúdo mais elaborado e eficaz que os tão utilizados cabeçalhos de assunto. Deste momento começam a surgir os primeiros Tesauros.
Segundo o Dicionário Aurélio, Tesauro é um "vocabulário controlado e dinâmico de descritores relacionados semântica e genericamente, que cobre de forma extensiva um ramo específico de conhecimento" (FERREIRA, VER DATA e Página).
Ainda na década de 50, alguns estudiosos da classificação criaram o Classification Research Group – CRG, na Inglaterra, objetivando não só estudar, mas também aperfeiçoar as teorias da classificação. Como resultado deste trabalho, foi apresentado o Thesaurofacet. Este foi considerado um marco no desenvolvimento das linguagens documentárias pela integração da tabela de classificação com o Tesauro.
A utilidade dos Tesauros ultrapassa os limites do âmbito dos indexadores, especialistas em recuperação, cientistas da informação, e outros especialistas da organização do conhecimento, podendo também ser úteis a especialistas em elaboração de normas, tradutores, epistemólogos, engenheiros, engenheiros do conhecimento, psicólogos, lingüistas e terminólogos.
Sob a perspectiva apresentada, o presente trabalho tem como objetivo o desenvolvimento e apresentação de um Tesauro, visando não só o público especializado no assunto, como também o público leigo. A temática abordada por este está delimitada a Linguagens Documentárias.
No seguimento deste, encontrar-se-á melhor definido o termo Tesauro, além da metodologia de construção de um Tesauro, explicações quanto ao uso desta ferramenta, bibliografias empregadas na construção do mesmo e, por fim, a lista dos termos nas divisões Hierárquicas e Alfabéticas, tendo como apêndice as fichas utilizadas na construção das relações.
Tesauro: origem e definição
O termo "Tesauro" tem suas origens provenientes do grego e do latim, cujo significado vem a ser "tesouro". A popularização do termo se deu através da publicação do dicionário analógico de Peter Mark Roget, em Londres, 1852, intitulado "Thesaurus of English words and phrases". Este dicionário levou cerca de 50 anos para ser finalizado.
Por também significar vocabulário, dicionário ou léxico, Roget decidiu nomear seu dicionário de palavras "thesaurus". O dicionário de Roget era um vocabulário que se organizava conforme o significado dos termos e não segundo a ordem alfabética, tornando-o diferenciado aos demais. Mesmo possuindo o mérito de estabelecer a denominação para vocabulários que relacionam seus termos por meio de algum tipo de relação de significado, o Tesauro de Roget e alguns Tesauros atuais possuem pouca semelhança entre si (MOREIRA, ver data).
Alguns teóricos apresentaram estudos definitórios para Tesauro. Entre eles podem se destacar Vickery, Howerton, Alan Gilchrist, Currás e até mesmo a Unesco, além de outros. O que pode se observar destes estudos é que, desde as primeiras iniciativas com Mark Roget até os dias atuais, as definições em relação a Tesauro tem sofrido evoluções, além de "construções teóricas e metodológicas, pela introdução de novos modelos cognitivos e abordagem centrada no usuário" (MOREIRA, ver data, p. 23)
Uma resultante desta evolução é a definição mais atual de Curras (1995), citado por Moreira, ver data, p. 24, onde Tesauro se define por "uma linguagem especializada, normalizada, pós-coordenada, usada com fins documentários, onde os elementos lingüísticos que a compõem – termos, simples ou compostos – encontram-se relacionados entre si sintática e semanticamente".
Explicitando melhor, segundo palavras de Moreira, por linguagem especializada entende-se aquela que atua em um domínio restrito; por normalizada, compreende-se uma linguagem controlada; as unidades lingüísticas são termos e, finalmente, por pós-coordenada deseja-se indicar que os termos são combinados no momento de seu uso, em oposição às linguagens pré-coordenadas cujos termos que designam assuntos complexos se coordenam previamente à sua utilização (lista de cabeçalhos de assunto, por exemplo) (MOREIRA, ver data, p. 24).
A National Information Standards Organization (ANSI/NISO), também define Tesauro, neste caso, como sendo um "vocabulário controlado organizado em uma ordem conhecida na qual as relações de equivalência, hierárquicas e associativas entre os termos são claramente exibidas e identificadas por meio de indicadores de relação padrão" (ANSI/NISO Z39-19-1993, apud MOREIRA, ver data, p. 25).
O Tesauro como ferramenta permite a uniformidade dos termos de indexação e recuperação da informação em um Sistema de Recuperação de Informação – SRI , considerando o princípio da contextualização (garantia literária e garantia de uso). O Tesauro é utilizado na indexação das informações, ou entrada de dados em uma base, e na recuperação da informação, ou saída de dados de uma base. A entrada é realizada pelo profissional da informação/indexador e a saída se refere à utilização da base pelo usuário, quando da realização de buscas.
Estrutura do Tesauro
A composição de um tesauro se faz através de termos, relações entre termos e de notas explicativas. Termos devem ser padronizados quanto a sua forma e significado, constituindo-se de palavras ou grupos de palavras. Aos termos de grafia igual, que possuem diferentes significados, são sempre acrescidos de um qualificador, delimitando seu escopo semântico, representado entre parênteses. Por exemplo, ver algo que pode servir de exemplo nas fichas Há três tipos de relações neste tesauro, sendo: Relação de equivalência — Quando o mesmo conceito pode ser expresso por dois ou mais termos, seleciona-se um deles como sendo o "preferido", passando o escolhido a ser o descritor. A relação entre termos preferidos e não preferidos é denominada relação de equivalência. Nesta, cada termo é considerado como se referindo ao mesmo conceito, sendo feita uma referência cruzada entre os termos e os descritores indicando a reciprocidade.
A reciprocidade da relação de equivalência é expressa pelas seguintes convenções: U ou USE – que leva de um termo não preferido (entrada) ao descritor. UP ou USADO PARA, o recíproco que registra termos de entrada levando ao descritor. Ver exemplos das fichas
Essa relação cobre três tipos de termos: sinônimos (significados são considerados como o mesmo ou quase o mesmo em uma larga escala de contextos), variantes lexicais (palavras diferentes para a mesma expressão); e quase-sinônimos (termos cujos significados são geralmente considerados tão diferentes, mas que são tratados como equivalentes para as finalidades de um tesauro).
Relação hierárquica — característica básica que distingue um tesauro sistemático de uma lista de termos não-estruturada, tal como um glossário. É baseado em graus ou níveis do superordenação e subordinação, onde o descritor do superordenado representa uma classe ou um todo, e os descritores subordinados se referem a seus membros ou partes. A reciprocidade pode ser expressa pelos seguintes indicadores de relacionamento: TME (termo mais extenso), um rótulo para o descritor superordenado. TMR (termo mais restrito), um rótulo para o descritor subordinado Ver exemplo nas fichas
As relações hierárquicas também podem ser indicadas por representações sistemáticas como estrutura de árvore e essas relações cobre três situações logicamente diferentes e exclusivas: relação genérica (identifica uma ligação entre uma classe e seus membros ou espécies – TGG = Termo Geral Genérico TEG = Termo Específico Genérico); relação parte-todo (se refere às situações em que cada conceito é inerentemente incluso a outro, sem importar o contexto, tanto que os descritores podem ser organizados em hierarquias lógicas, com o “todo” tratado como termo geral – TGP = Termo Geral (partitivo) TEP = Termo específico (partitivo)); relação de instância (identifica a ligação entre uma categoria geral de coisas ou eventos, expressados por um nome comum, e um caso individual de categoria, geralmente um nome próprio – TGI = Termo geral (instância) TEI = Termo específico (instância)).
Relação associativa — abrange associações entre descritores que não são equivalentes nem hierárquicos. Entre termos com proximidade de significado (Causa/Efeito; Material/Objeto; Material/Propriedade; Processo/Produto; Processo/Instrumento; Objeto (conteúdo)/Continente; Atividade/Lugar); expressa pela abreviatura TR.
Relação partitiva — entre termos que são: um à o todo ------ outro à a parte; expressa pela abreviatura TGP/TEP;
Trabalho em desenvolviemnto, com possibilidades de alterações.