Introdução
Se você está lendo isso, é provável que já tenha percebido um erro conhecido como erro de codificação. Isso é especialmente comum entre pessoas que não têm um web designer ou programador à disposição para ajudá-las. É comum encontrar mensagens como: “Meus textos estão cheios de caracteres estranhos.” Por exemplo, o nome “São Paulo” pode aparecer como “São Paulo” ou até “S?o Paulo”. Essa confusão decorre do uso inadequado de um conjunto de caracteres nos arquivos, banco de dados e programação do site.
Todos os idiomas utilizam conjuntos específicos de caracteres para formar as palavras. O inglês, que se tornou padrão em muitos softwares, não inclui caracteres acentuados, ao contrário do português e de outras línguas latinas. A falta de uma codificação única e apropriada para arquivos, bancos de dados e a programação do seu site pode resultar em problemas ao exibir palavras com acentos e caracteres especiais, como “ç” ou o til (~).
Além disso, esse problema não se limita apenas às línguas latinas; ele pode ocorrer com outros sistemas de escrita, como o cirílico, utilizado no grego e no russo. Para solucionar isso, o padrão UTF-8 foi criado. Este padrão binário de oito bits é capaz de representar qualquer caractere do Unicode, o que abrange mais de 107.000 caracteres de diferentes idiomas. Ao optar pelo UTF-8 como codificação padrão, a probabilidade de erros de codificação se reduz significativamente.
Pré-requisitos
Para corrigir os problemas de codificação, é essencial cumprir os requisitos a seguir:
- Acesso ao banco de dados do site;
- Um editor de texto que permita salvar arquivos no formato UTF-8;
- Acesso aos arquivos que compõem o site, tais como os arquivos PHP e HTML.
Passos para corrigir a codificação
É necessário garantir que tanto os arquivos quanto o banco de dados e a programação sejam alterados corretamente.
Alterando a codificação do banco de dados MySQL
- Acesse cada tabela que contém conteúdo no phpMyAdmin;
- Vá até a aba de operações;
- Localize a seção “opções da tabela”;
- Selecione “utf8mb4_unicode_ci” no campo de seleção “Agrupamento (Collation)”;
- Clique no botão “executar”.
Alterando a codificação dos arquivos PHP e HTML
- Abra o arquivo em um editor como Sublime, Notepad++, Eclipse, ou Netbeans;
- No menu, escolha a opção “salvar como”;
- Dependendo de qual editor você estiver usando, a opção de codificação pode aparecer de maneira diferente, mas geralmente está localizada próximo ao campo onde você define o nome do arquivo. Escolha “UTF-8”.
Alterando a codificação da programação
Esse procedimento deve ser seguido durante o salvamento dos arquivos HTML e PHP já abertos como UTF-8.
- Nos arquivos HTML, adicione esta linha entre as tags <head>:
- <meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
- Nos arquivos PHP, adicione esta linha antes do conteúdo HTML correspondente ao <body>:
- header(‘Content-Type: text/html; charset=utf-8’);
Conclusão
A codificação de um site é definida pelos atributos dos arquivos PHP e HTML, pelo banco de dados e sua estrutura, bem como na programação do site. Para evitar erros e garantir que os caracteres especiais sejam exibidos corretamente, é crucial utilizar a codificação adequada, que deve ser a mesma em todos os aspectos do conteúdo textual do site.