Baza kodów pocztowych

Zaloguj się do baz wiedzy
 
Portal Internetowy Serwery WWW
 

Kodowanie znaków



Większość komputerów używa fontów (zestawu znaków ANSI) zawierających maksimum 256 znaków. Pierwsze 128 znaków (znaki ASCII) to znaki interpunkcji, liczby oraz wielkie i małe litery, wśród nich znajdują się także znaki kontrolne (znaki od 1 do 32). W USA, Kanadzie, Wielkiej Brytanii oraz innych anglojęzycznych krajach pozostałe 128 znaków (znaki ekranowe) to dodatkowe znaki interpunkcji, symbole oraz duża liczba akcentów (á, ç, e, n, ô, ü...). W krajach w których alfabet zawiera dodatkowe znaki (Polska, Grecja, Rosja, i wiele innych), grupa pozostałych 128 znaków jest inna niż znaki stosowane w krajach anglojęzycznych i odpowiada znakom używanym w danym kraju.

ISO-8859-1 także znane jako Latin-1 jest standardem definiującym 8-bitowy zestaw - 256 znaków, który rozszerza kody ASCII i jest prawdopodobnie najczęściej używanym zestawem znaków na świecie. Z powodu tej popularności, pierwsze 256 znaków z systemu Unicode odpowiada dokładnie znakom z Latin-1. Pierwsze 128 znaków z Latin-1 odpowiada znakom ASCII, z czego znaki od 1 do 32 to znaki kontrolne. Należą do nich także znaki od 0x80=128 do 0x9f=159.

Problem ze znakami charakterystycznymi dla danego kraju pojawia się przy przesyłaniu tekstu, załączników, przy wyświetlaniu stron internetowych, itp. Podobne problemy stwarza przenoszenie dokumentów pomiędzy różnymi systemami operacyjnymi jak: DOS, Windows, Mac OS i UNIX.

Rozwiązaniem tego problemu jest zastąpienie 8-bitowego systemu fontów z ich limitem 256 znaków, gdzie ten sam numer znaku może oznaczać inny znak w różnych alfabetach, i przejście do systemu, który przydziela unikatowy numer dla każdego znaku we wszystkich podstawowych językach świata. System taki został nazwany Unicode. W zamierzeniu ma on być używany we wszystkich systemach operacyjnych, nie tylko Windowsach. Zawiera on m.in. Chińskie, Japońskie i Koreańskie znaki alfabetu. Unicode jest obsługiwany przez Windows, począwszy od jego wersji 95, przez system Mac OS od Mac OS 8.5. Unicode jest często nazywany jako 16-bitowy system, który pozwala na użycie 65.536 znaków jednak jego rozszerzenie o kolejne 16-bitów pozwoliłoby potencjalnie na użycie ponad miliona unikalnych znaków.

Aktualna wersja Unicode (3.1) przydziela unikatowy numer dla 94.140 znaków. Poprzednia wersja (3.0) zawierała 49,194 znaków i została uznana jako rekomendowana dla standardu HTML 4.0.

 

Doświadczenie



Mamy już 10 lat doświadczenia w prowadzeniu marketingowych baz danych


Profesjonalizm



Najbardziej kompleksowa, rozbudowana i aktualna baza miejscowości w Polsce. Źródło danych słownikowych gotowe do wykorzystania w systemach informatycznych

Zaufanie



Dotychczas nasze produkty wybrało ponad 1000 firm i instytucji, takie zaufanie zobowiązuje
 
Wszelkie prawa zastrzeżone - WASKO S.A. 1988-2012