segunda-feira, 27 de outubro de 2014

Codificação de caracteres

O que são padrões de codificação de caracteres?

O que é apresentado como texto no ecrã, é na realidade armazenado como valores numéricos no ficheiro de texto. O computador converte estes valores em caracteres visíveis, sendo realizado através de um padrão de codificação.

                     

É um esquema de numeração que atribui cada carácter de texto num conjunto de caracteres, que pode incluir caracteres alfabéticos, números ou outros símbolos, a um valor numérico. Normalmente, os diferentes idiomas são compostos por conjuntos de caracteres diferentes, pelo que existem vários padrões de codificação diferentes para representar os conjuntos de caracteres que são utilizados em diferentes idiomas.


Tabela ASCII

Os números são a linguagem dos computadores, e para comunicar com os programas e com outros computadores, este converte caracteres e símbolos nas respectivas representações numéricas.
Nos anos 60, a necessidade de estandardização conduziu ao American Standard Code for Information Interchange (ASCII) (pronunciado ask-kee). A tabela ASCII contém 128 números atribuídos a caracteres correspondentes. A ASCII permite aos computadores armazenarem e partilharem dados com outros computadores e programas. 


Código ASCII


Caracter
Código ASCII
Caracter
Código ASCII
M
77
P
80
a
97
e
101
r
114
d
100
í
237
r
114
l
108
o
111
i
105

a
97


Tabela 1: Codificação dos nomes Marília e Pedro em ASCII, onde cada carácter é associado a um número do código ASCII. 


Fonte: acrobatic

  o__ __o                        o                          
 <|     v\                      <|>                         
 / \     <\                     < \                         
 \o/     o/   o__  __o     o__ __o/  \o__ __o     o__ __o   
  |__  _<|/  /v      |>   /v     |    |     |>   /v     v\  
  |         />      //   />     / \  / \   < >  />       <\ 
 <o>        \o    o/     \      \o/  \o/        \         / 
  |          v\  /v __o   o      |    |          o       o  
 / \          <\/> __/>   <\__  / \  / \         <\__ __/>  

Fonte: threepoint

|\/| _  _.|. _ 
|  |(_|| |||(_|

































                       
Unicode 

Um padrão de codificação para vários alfabetos.


Para evitar problemas na codificação e descodificação de ficheiros de texto, os ficheiros podem ser guardados na codificação Unicode. A codificação Unicode inclui a maior parte dos conjuntos de caracteres dos idiomas que são normalmente utilizados pelos utilizadores de computadores actuais.O Word é baseado em Unicode, isto é, guarda automaticamente os ficheiros codificados como Unicode. Os ficheiros codificados em Unicode num sistema com o idioma Português, podem ser abertos e lidos independentemente do idioma do texto.


Fontes de pesquisa: http://office.microsoft.com/pt-pt/help/escolher-a-codificacao-de-texto-quando-abre-e-guarda-ficheiros-HA010121249.aspx; http://office.microsoft.com/pt-pt/support/tabela-de-caracteres-ascii-HA010167539.aspx?CTT=1
                        
                                     
                           

Sem comentários:

Enviar um comentário