Archive for January, 2007

Entenda o que é a Web Semântica e quais seus benefícios

Monday, January 8th, 2007

Vocês conhecem o mundo das entidades ideais? Bem, eu poderia dizer que a Web Semântica faz parte deste mundo se lá tiver Internet :)

Deixando a viagem de lado, para entender o que é Web Semântica vamos primeiro estudar o significado da palavra semântica. A definição do dicionário Aurélio que nos interessa é: estudo das mudanças ou translações sofridas, no tempo e no espaço, pela significação das palavras.

Além desta, temos algumas outras boas definições, entre elas gostei bastante desta que achei no site do Henrique C. Pereira: semântica é uma palavra de origem grega (semantiké) que traduzida seria “a arte da significação”. É o estudo do significado das palavras e de sua relação de significação nos signos lingüísticos. Entendido o significado, vamos ver qual a relação que isso tem com a Internet.

A Internet cresceu absurdamente, talvez mais do que seus criadores e todos que estavam diretamente envolvidos no seu início imaginaram. Como quase tudo que cresce muito rápido, a Web cresceu desordenadamente e hoje, uma das grandes dificuldades é organizar a bagunça quando nos referimos ao conteúdo nela publicado.

A Web Semântica tem tudo a ver com essa organização. Seu principal objetivo é fornecer padrões e meios para que tudo que está publicado esteja organizado e classificado e que todo esse conteúdo possa ser entendido por humanos e tudo mais que acessá-lo. Isso só é viável através de padrões, ou seja, conteúdos marcados com tags consistentes e inteligíveis e tudo muito bem estruturado, preferencialmente seguindo o padrão mais usado referente ao tipo do seu conteúdo.

Não se espante se até o parágrafo anterior você achava que apenas humanos acessavam à Internet, isso é o que a maioria pensa e na verdade é uma grande falácia. Além de humanos, o conteúdo disponível é cada vez mais acessado por computadores, aplicativos e diversos outros tipos de dispositivos que estão sedentos por muita informação.

Vamos pegar a busca do Yahoo como exemplo. Para a busca funcionar, ou seja, para que ela encontre com precisão o que você está procurando, o Yahoo cria em sua estrutra tecnológica grandes índices que tem praticamente tudo o que tem na Web, claro, dividido de forma inteligente. Isso só é possível porque, assim como a maioria dos mecanismos de busca, eles desenvolveram um programa - ou robô (bot) - que fica navegando na Internet e colhendo informações para alimentar esse índice.

Agora é possível você enxergar que o site da sua empresa, seu blog ou e site pessoal não são acessados apenas por gente, existem máquinas visitando seu conteúdo e acredite, elas visitam mais do que você imagina. Esse é um dos lugares que a Web Semântica entra. Se seu site foi mal desenvolvido, ou seja, conteúdo misturado com layout e um código grande e sujo, você está dificultando o trabalho dos robôs e provavelmente será difícil chegar até ele através dos mecanismos de busca.

Para citar uma outra aplicação em que a Web Semântica se encaixa bem didaticamente falando, pegue o mesmo site, que tem o código-fonte bagunçado e peça para um deficiente visual - que usa ferramentas que lêem esse código - para visitar seu site. O programa de leitura certamente ficará lendo um monte de coisa até chegar no conteúdo que realmente é o que interessa.

E o que fazer para melhorar seu site e deixá-lo bom para humanos e para máquinas? Bem, um bom começo é separar conteúdo de formatação visual investindo em XHTML, XML, CSS e RSS e ainda, ficar de olho nos microformats e tudo o que se referir a padrões na Web.