O CONJUNTO DE CARACTERES
Por: gilgiltec • 28/9/2015 • Dissertação • 989 Palavras (4 Páginas) • 243 Visualizações
FACULDADE UNIP[pic 1]
GESTAÕ DA TECNOLOGIA DA INFORMAÇAO
GILVAN DE OLIVEIRA
CONJUNTO DE CARACTERES
BOA VISTA-RR
2015
GILVAN DE OLIVEIRA
CONJUNTO DE CARACTERES
Trabalho interdisciplinar apresentado ao curso Gestão de TI da Faculdade UNIP, oferecida no 1º semestre, sala 7, da disciplina: Organização de computadores, sob orientação do Prof. Marcelo Simol.
BOA VISTA- RR
2015
SUMÁRIO[pic 2]
1 REFERENCIAL TEÓRICO3
1.1 CONCEITO DE CONJUNTO DE CARACTERES 3
1.2 BLA BLA4
1.3 BLA BLA 4
1.4 BLA BLA4
2 CONSIDERAÇÕES FINAIS6
3 REFERÊNCIAS 13
1 CONCEITO
Os caracteres utilizados na formação de palavras, frases ou textos, são agrupados em conjuntos de caracteres (também conhecidos como charsets ou repertório de caracteres).
Para cada caractere, é atribuído um número único, denominado codepoint, cuja função é possibilitar o armazenamento, manipulação e processamento de textos pelos computadores, onde são representados por um ou mais bytes.
Os caracteres, para o usuário de computação, podem ser representados graficamente de diferentes formas, de acordo com as definições de fonte, que determinam a aparência visual do texto. As fontes abrangem um conjunto simples de caracteres (um conjunto bem limitado, se comparado a um charset como o Unicode, por exemplo). Elas são compostas por um conjunto de glifos, que são definições usadas para exibir caracteres. Caso uma fonte não tenha um glifo para representar um caractere particular, poderá ser procurado um “substituto” em outras fontes do sistema.
É certo que os computadores têm que lidar com todo tipo de informações, e não apenas números, mas, o computador só consegue de fato lidar com valores binários. A solução para permitir que os computadores consigam lidar com informações não numéricas é a criação de tabelas de conversão. Essas tabelas são chamadas de CONJUNTO DE CARACTERES.
Portanto , faz-se necessário destacar com base nas informações acima alguns modelos de tabela de conversão (conjunto de caracteres).
- ASCII
Um dos padrões mais conhecidos é o ASCII (Código Padrão Americano para Intercâmbio de Informações).
E um repertório de caracteres de 7 bits para representar o alfabeto inglês. A representação dos códigos é feita em 8 bits (um byte), sendo que um deles é um bit de paridade, para detecção de erros. São definidos ao todo 128 caracteres, sendo que 33 são de controle (não imprimíveis),utilizados no processamento de texto. Mas esse padrão é bastante limitado contendo apenas caracteres da língua inglesa, alem de não conter os acentos necessários para a língua portuguesa. Como os fabricantes de computador desejam que seus produtos sejam usados em todo o mundo o ASCII não pode mais ser considerado como um padrão aceitável. tudo que o computador sabe fazer é executar cálculos com números. Ele é incapaz de entender o texto, o código ASCII define, com precisão, a correspondência entre símbolos e números até o número 127. Entretanto, Alguns códigos (os inferiores a 32) são códigos de controle (eles não são feitos para serem exibidos). Por exemplo, o código 10 pula a linha, o código 7 emite um sinal sonoro no computador, etc. não há nenhum caractere acentuado! Nós e outros países, Muitas vezes usamos os códigos de 128 a 255 para os acentos, mas os códigos são diferentes de um país para outro! Nada prático para trocar documentos. Assim, é preciso encontrar um código mais prático.
- UNICODE
Ao contrario do ASCII O UNICODE usa 16 bits para descrever cada caractere, o que permite até 65.536 caracteres diferentes. Em vez de representar apenas códigos entre 0 e 127, como o padrão ASCII, o UNICODE é capaz de utilizar códigos de valores muito maiores. Sua tabela contém caracteres de diversos alfabetos, permitindo a representação de acentos, para línguas latinas e símbolos utilizados por idiomas mais peculiares, como hebraico, chinês e vários outros. No padrão Unicode, cada diferente letra ou símbolo de cada alfabeto utilizado no mundo é mapeado para um diferente code point. O code point é um código no formato U + número em hexadecimal. As letras maiúsculas possuem code point diferentes das letras minúsculas. Por exemplo: o code point da letra “A” é U+0041, enquanto o da letra “a” é U+0061, o code point de “Ç” é U+00C7 e o de “ç” é U+00E7. Vale também destacar que os primeiros 127 code point são compatíveis com a tabela ASCII.
...