Essa é uma revisão anterior do documento!
Codificação de caracteres
Em português brasileiro os sistemas operacionais utilizam tipocamente uma das seguintes codificações de caracteres: ISO-8859-1
ou UTF-8
. O Windows e alguns Linux, especialmente os mais antigos utilizam ISO-8859-1
enquanto os Linux mais recentes por defaut costumam instalar a UTF-8
. Estas diferentes codificações podem ter efeitos sobre documentos com caracteres especiais escritos em um sistema e visualizados em outro.
Para converter um arquivo de um formato para outro na linha de comando do Linux pode-se usar o comando iconv
. Vejamos alguns exemplos.
- Voce tem um arquivo
exemplo1.tex
digitado em um sistemaISO-8859-1
e quer converter paraUTF-8
gerando o arquivo com nomeexemplo1a.tex
(vamos preservar o original por segurança, se vc quiser depois renomeie o arquivo)
$ iconv -f ISO-8859-1 -t UTF-8 -o exemplo1a.tex exemplo1.tex
- Voce tem um arquivo
exemplo2.tex
digitado em um sistemaUTF-8
e quer converter paraISO-8859-1
gerando o arquivo com nomeexemplo2a.tex
(vamos preservar o original por segurança, se vc quiser depois renomeie o arquivo)
$ iconv -f UTF-8 -t ISO-8859-1 -o exemplo2a.tex exemplo2.tex
Para saber qual a codificação de caracteres está sendo usada no sistema Linux que voce está usando digite:
$ locale
- Se voce ver na saída
pt.BR
é porque o sistema éISO-8859-1
- Se voce ver na saída
pt.BR.UTF-8
é porque o sistema éUTF-8
Uso no : o preâmbulo de seu documento deve ter:
- para
ISO-8859-1
:\usepackage[latin1]{inputenc}
- para
UTF-8
:\usepackage[utf-8]{inputenc}