Professional Documents
Culture Documents
[CONJUNTO DE
CARACTERES]
ndice
Introduo...........................................................................3
ASCII.................................................................................... 4
Definio........................................................................... 4
Histria.............................................................................5
Unicode...............................................................................6
Definio........................................................................... 6
Histria.............................................................................7
Sistemas de escrita suportados.........................................8
Funcionamento.................................................................9
Aplicaes.......................................................................10
Sistemas operativos....................................................10
Correio Electrnico......................................................10
World Wide Web..........................................................11
EBCDIC..............................................................................13
Concluso.......................................................................... 13
Bibliografia........................................................................14
Introduo
Este trabalho foi realizado por Jorge Barreto da turma de
Cincias e Tecnologias n.1 do 11 Ano no mbito da
disciplina de Aplicaes Informtica B.
Neste trabalho falarei sobre os conjuntos de caracteres na
rea de formatao de texto.
Falarei mais precisamente sobre o ASCII, Unicode e EBCDIC
que foram os principais padres que existiram. Sobre cada
padro ter informao como funciona, em, que utilizado
e em que ano foi criado
Com isto espero redigir um trabalho claro e que tenha todas
as informaes necessrias para tal.
ASCII
Definio
American
Standard Code
for Information
Interchange
(ASCII) uma
codificao de
caracteres
para
tornar
mais simples a
comunicao
entre
os
computadores
e
troca
de
dados.
Foi
especialmente
baseado
na
lngua inglesa,
pois foi criado
nos E.U.A. E
que por sua
vez os caracteres so representados em nmeros.
Para tal usada uma tabela ASCII onde guardado a
correspondncia de cada letra. Ento esta tabela usa
conjuntos de 7 bits para a representao de 128 caracteres
que mais tarde foi alargada para 8 bits, pela ISO 646
4
Histria
O American National Standards Institute desenvolveu ASCII
baseado no sistema de codificao anterior, telex. Em
1956, Ivan Idelson, no Reino Unido, tinha proposto a CluffFoster-Idelson codificao de caracteres em 7 faixas papel
fita para um British Standards comisso. Esta foi umas
principais e pioneira influncia da criao do ASCII.
ASCII teve o primeiro uso comercial em 1963 com uma
capacidade de sete bits
Unicode
Definio
Unicode tambm um padro que permite aos
computadores representar e manipular texto com um
sistema de escrita existente como o Word, Open Office
Publicado no livro The Unicode Standard, o padro suporta
cerca de 100 000 caracteres, um conjunto de diagramas de
cdigos para referncia visual, uma metodologia para
codificao, um conjunto de codificaes padres de
caracteres, um conjunto de arquivos de computador com
dados de referncia, alm de regras para normalizao,
decomposio, ordenao alfabtica.
Actualmente esta tecnologia de codificao est a cargo e
desenvolvido pela Unicode Consortium, uma organizao
sem fins lucrativos que coordena o sistema Unicode, e que
tem como objectivo de substituir esquemas de codificao.
No entanto, o seu desenvolvimento feito em conjunto com
a Organizao Internacional para Padronizao. Ambos
funcionam como codificadores de caracteres, mas o padro
Unicode fornece muito mais informao, como a
organizao alfabtica.
Nos dias de hoje este padro usado por tecnologias
recentes, como o XML, Java e Sistemas Operativos
(Windows, Linux)
Histria
O Unicode nasceu entre 1986 e 1987, teve origem na
Xerox com objectivo de construir um banco de dados para
relacionar o relacionamento entre caracteres idnticos do
alfabeto
japons,
chins tradicional e
chins simplificado,
a fim de construir
uma
fonte
tipogrfica para caracteres chineses estendidos, que outros
sistemas de codificao no suportavam.
Os tcnicos envolvidos nisto incluam Huan-mei Liao,
Nelson Ng, Dave Opstad e Lee Collins.
At esta poca os utilizadores da Xerox usavam o sistema
JIS para estender o conjunto original de caracteres
chineses.
Ao mesmo tempo, a empresa Apple deu a proposta da
existncia de um conjunto universal de caracteres.
O grupo da Xerox comea uma discusso sobre questes
multilingues com Mark Davis, da Apple. E J em Dezembro
de 1987 declarado a existncia e uso do Unicode.
A partir de 1988 comeam as discusses sobre uma largura
fixa de bytes para os cdigos, e uma das primeiras
propostas o sistema de Mark Davis com uma largura fixa
de 16 bits com o nome "High Text", em oposio a "Low
Text" para o padro ASCII.
Em Abril, os primeiros prottipos comearam a ser
construdos na Apple, decidindo-se incorporar suporte ao
7
Janeiro de
1989
Setembro de
1989
Outubro de
1989
Janeiro 1990
Alfabeto birmans
Alfabeto
armnio
Alfabeto fontico
internacional (AFI)
Alfabeto bengali
Alfabeto hebraico
Alfabeto cirlico
Alfabeto latino
Alfabeto
georgiano
8
Caracteres
Alfabeto
siraco
Alfabeto
tailands
Alfabeto
tibetano
Braille
chineses
Funcionamento
O armazenamento dos cdigos Unicode baseado no
processamento de texto. Infelizmente apresenta um
problema que a maioria dos programas de computador
escritos no mundo ocidental utilizar somente codificaes
de 8 bits (como o padro ASCII), j que o suporte ao
Unicode comeou somente nos ltimos anos.
A lgica interna de muitos programas permite somente 8
bits para cada carcter, tornando impossvel o uso de mais
de 256 cdigo] sem um processamento especial.
Programas de 16-bit suportam somente dezenas de
milhares de caracteres. Por outro lado, o Unicode j definiu
mais de cem mil caracteres codificados.
Investigadores deste sistema j sugeriram diversos
mecanismos para implementar o Unicode, a escolha de
cada um depende do espao de armazenamento disponvel,
compatibilidade de cdigo fonte e compatibilidade com
outros S.O
O Unicode define dois mtodos de organizao, UTF
(Formato de Transformao Unicode, do ingls Unicode
Transformation Format) e UCS (Conjunto Universal de
Caracteres, do ingls Universal Character Set).
9
Aplicaes
Sistemas operativos
Correio Electrnico
Um email em chins
EBCDIC
Extended Binary Coded Decimal Interchange Code foi
desenvolvido pela iBM, tambm de 8 bits utilizado
obviamente no processamento de texto, mas este padro
surgiu com o propsito de controlar impressoras e
comunicaes. Este cdigo surgiu com a IBM 360 em 1963
e ainda usado por esta empresa, mas para computadores
de mdio porte.
Concluso
Com este trabalho fiquei a perceber como funcionavam
estes conjuntos de caracteres e a sua histria. No qual
gostei mais do Unicode.
As principais dificuldades que me surgiram foram
particularmente na pesquisa de informao principalmente
no EBCDIC, pois a informao existente muito pouca.
13
Bibliografia
Fonseca, D., Pacheco, D., Marques, F., & Soares, R. (2006).
Aplicaes Informtcas B. Porto: Porto Editora.
http://en.wikipedia.org/wiki/ASCII#History
http://www.webopedia.com/TERM/A/ASCII.html
http://pt.wikipedia.org/wiki/Unicode
http://en.wikipedia.org/wiki/EBCDIC
http://unicode.org/standard/WhatIsUnicode.html
http://en.wikipedia.org/wiki/EBCDIC
http://en.wikipedia.org/wiki/Ascii
14