Como passo inicial na pesquisa, foi estudado como os documentos são hoje publicados na web. O orgão que regulamenta muitos dos padrões de publicação hoje presentes, inclusive o famoso HTML é o W3C[2]. Nesta fase indentificou-se que a demarcação feita com o uso do HTML enfatiza a estrutura e apresentação do documento ao se utilizar um renderizador apropriado (um browser por exemplo), ao invés de destacar a semântica de cada parte. Segue abaixo um exemplo de código fonte HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 3.2//EN"> <html> <head> <meta name="generator" content="HTML Tidy, see www.w3.org"> <meta name="author" content="Fabio Braga de Oliveira"> <meta name="title" content="Catalogo de Produtos"> <title>Catalogo de Produtos</title> </head> <body> <h1>Catalogo de Produtos</h1> <table border="1" width="100%"> <tr> <td width="70%"><b>Nome do produto</b></td> <td><b>Preco</b></td> </tr> <tr> <td>Arvore Rubro-Negra</td> <td>20,00</td> </tr> <tr> <td>Arvore Binaria</td> <td>5,00</td> </tr> <tr> <td>Arvore B</td> <td>25,00</td> </tr> <tr> <td>Grafo</td> <td>15,00</td> </tr> <tr> <td>Grafo Dirigido</td> <td>20,00</td> </tr> </table> </body> </html>
O código HTML anterior gera a visualização da figura 1 num browser.
Como pode-se notar, os rótulos no HTML auxiliam no posicionamento do texto.
Mas não determinam o significado do seu conteúdo, como pode ser visto no uso repetido do rótulo <td></td>. Na especificação da W3C existe apenas um rótulo com função de descrição de atributos do documento, os rótulos <meta...>, conhecidos como rótulos meta-tags. Estes representam dados simples sobre o documento, como qual o autor, qual aplicativo gerou o documento, o título. Mas não existe uma convenção para seu uso, ou mesmo obrigatoriedade, sendo hoje quase que completamente ignorados.
Fabio Braga de Oliveira 2004-12-09