Rašmenų koduotės

LST ISO/IEC 10646-1 (Unikodas)

Lietuvos standartas LST ISO/IEC 10646-1. Universalus keliais baitais koduotų ženklų rinkinys. 1 dalis. Sandara ir pagrindinė daugiakalbė lentelė.

Standartas ISO/IEC 10646 apibrėžia ženklų kodavimą 32 bitais (4 baitais). Jis yra Unikodo, apibrėžiančio ženklų kodavimą 16 bitų (2 baitais), viršaibis.

Unikodą kuria „Unicode“ konsorciumas, kuris nepriklauso Tarptautinei standartų organizacijai. Todėl Unikodas nelaikomas tarptautiniu standartu. Tačiau abi organizacijos glaudžiai bendradarbiauja. Dėl to ženklų kodavimas standarte ISO/IEC 10646 ir Unikode yra suderintas. Visi Unikodo ženklai yra standarte ISO/IEC 10646, visų jų kodų pirmieji 16 bitų lygūs nuliui, o kitų 16 bitų Unikodo kodai sutampa su ISO/IEC 10646 kodais. Todėl nėra esminių skirtumų tarp šių dviejų kodavimų.

Lietuvoje yra priimtas standartas ISO/IEC 10646-1 viršelio būdu ir jam suteiktas žymuo LST ISO/IEC 10646-1.

Standarte LST ISO/IEC 10646 yra visos pagrindinės ir 33 kirčiuotos lietuviškos abėcėlės raidės. Likusias 35 kirčiuotas raides galima išreikšti kompozicinėmis sekomis.

8 bitų koduotės

Iki atsirandant ir įsigalint Unikodui, kompiuteriuose buvo vartojama daugybė tarpusavyje nesuderinamų ženklų kodavimo standartų. Žemiau rasite lietuvių kalbai naudotų (ar standartizuotų naudoti) 8 bitų koduočių sąrašą.

Atkreipkite dėmesį, jog šiandien šios koduotės aktualios tik atvirkštinio suderinamumo tikslais – kai reikia galimybės dirbti su jomis užkoduotais duomenimis. Visose naujose sistemose kaip pagrindinę koduotę derėtų naudoti tik Unikodą.

LST ISO/IEC 8859-13

Lietuvos standartas LST ISO/IEC 8859-13. Informacijos technologija. 8 bitais koduotų ženklų rinkiniai. 13 dalis. Lotynų 7-oji abėcėlė (tapatus ISO/IEC 8859-13:1998).

Rašto ženklų kodavimą 8 bitais apibrėžia tarptautinis standartas ISO/IEC 8859. Jį sudaro atskiros dalys, kurių kiekviena dalis apibrėžia kodų lentelę, pritaikytą tam tikros kalbų grupės rašto ženklams koduoti. Standartas yra atviras, t.y. gali būti papildomas naujomis dalimis. Šiuo metu jį sudaro 15 dalių.

Standarto 13-oji dalis ISO/IEC 8859-13 apibrėžia lotynų 7-osios abėcėlės ženklų rinkinį, turintį lietuviškus rašto ženklus. Ji išversta į lietuvių kalbą ir priimta Lietuvos standartu, kuriam suteiktas žymuo LST ISO/IEC 8859-13:2000. Šio standarto apibrėžta kodų lentelė kompiuteriuose žymima trumpiau – ISO-8859-13. Tai pagrindinis Lietuvos rašto ženklų kodavimo 8 bitais standartas, naudotinas kaip pagrindas kuriant kitus 8 bitų kodavimo standartus.

Standartas LST ISO/IEC 8859-13 nuo 2000 m. pakeitė iki tol galiojusį standartą LST 1282. Tačiau iš tikrųjų pasikeitė tik aprašymo pavidalas, o visų ženklų kodai išliko tie patys.

LST 1282 standarto koduotė dar buvo žinoma „Baltic Rim“ vardu.

LST 1564

Lietuvos standartas LST 1564. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių rinkinys

Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė papildyta kirčiuotomis raidėmis. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir visų kitų ženklų, išskyrus kirčiuotas raides, kodai sutampa su standarto LST ISO/IEC 8859-13 kodais.

Šis standartas buvo pagrindinis 8 bitais koduojamų kirčiuotų raidžių standartas. Remiantis šiuo standartu buvo sudaromi kirčiuotų raidžių kodavimo standartai atskiroms operacinėms sistemoms.

LST 1590

Lietuvos standartas LST 1590. Informacijos technologija. Ženklų kodavimas 8 bitais

Šis standartas apibrėžia ženklų rinkinius, turinčius lietuviškus rašto ženklus, ir jų kodavimą atskirose operacinėse sistemose. Jį sudaro atskiros dalys, kurių kiekviena dalis apibrėžia kodų lentelę, skirtą tam tikros genties operacinėms sistemoms, o taip pat atskiras dalis pagrindinei lietuvių kalbos abėcėlei ir lietuvių kalbos abėcėlei, papildytai kirčiuotomis raidėmis. Standartas yra atviras, t.y. gali būti papildomas naujomis dalimis. Šiuo metu yra keturios jo dalys:

  • LST 1590-1. Informacijos technologija. Ženklų kodavimas 8 bitais. Grafinių ženklų rinkinys DOS terpei.
    Standartas apibrėžia lotynų 7-osios abėcėlės (Latin 7) ženklų rinkinį (tą patį, kurį apibrėžia pagrindinis standartas LST ISO/IEC 8859-13), papildytą operacinei sistemai DOS būdingais pseudografikos ženklais. Šio standarto apibrėžiamas kodavimas žinomas kodų lentelės 775 vardu.
  • LST 1590-2. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių ir fonetinių ženklų rinkinys DOS terpei.
    Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė papildyta kirčiuotomis raidėmis bei fonetiniais ženklais. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir kitų ženklų kodai sutampa su standarto LST 1590-1 kodais. Ši kodų lentelė taip pat buvo žinoma 778 vardu.
  • LST 1590-3. Informacijos technologija. Ženklų kodavimas 8 bitais. Grafinių ženklų rinkinys „Windows“ terpei.
    Standartas apibrėžia lietuviškų raidžių kodavimą „Windows“ genties operacinėse sistemose (Windows 95, Windows 98, Windows 2000, Windows NT). Jo apibrėžiama kodų lentelė kitaip žinoma 1257 vardu. Šioje lentelėje visų lietuviškos abėcėlės raidžių kodai sutampa su standarto LST ISO/IEC 8859-13 apibrėžiamais kodais. Skiriasi tik 4 skyrybos ženklų (kabučių ir apostrofo) kodavimas, atsiradęs dėl korporacijos „Microsoft“ savitų kodavimo principų.
  • LST 1590-4. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių ir fonetinių ženklų rinkinys „Windows“ terpei.
    Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė apildyta kirčiuotomis raidėmis bei fonetiniais ženklais. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir visų kitų ženklų, išskyrus kirčiuotas raides ir fonetinius ženklus, kodai sutampa su standarto LST 1590-3 kodais.

Senesnės 8 bitų koduotės

Aukščiau išvardintos 8 bitų koduotės Lietuvoje standartizuotos 2000 metais. Žemiau išvardintos dar senesnės 8 bitų koduotės, iki 2000 m. naudotos kai kuriose terpėse.

Informacija apie daugumą šių lentelių paimta iš UAB „Fotonija“ svetainės archyvinių kopijų.

ISO/IEC 8859-4

ISO/IEC 8859 standartų šeimoje lietuvių kalbai iš pradžių buvo numatyta ISO/IEC 8859-4 koduotė, skirta Šiaurės Europos ir Baltijos šalims. Deja, dėl didelio raidžių skaičiaus joje neliko vietos kai kuriems skyrybos ženklams, tokiems, kaip figūrinės kabutės ar brūkšnys, tad lietuviškiems tekstams ji buvo tinkama tik su išlygomis. Panašu, jog oficialiai ši koduotė Lietuvoje nebuvo standartizuota.

DOS 770 (LST 1095)

LST 1095-89 Informacijos apdorojimo sistema. Personalinių kompiuterių ženklų rinkinys su lietuviškomis raidėmis. Aštuonių bitų kodai.

Ankstesnis standarto žymuo – RST 1095-89.

DOS 770 (Baltic) kodų lentelė, kadaise plačiai naudota leidyboje.

DOS 771 (KBL)

Seniausiai DOS terpėje Lietuvoje naudota kodų lentelė, apimanti lietuvių ir rusų kalbų rašmenis (išskyrus rusišką raidę Ёё).

DOS 772 (LST 1284)

LST 1284:1993 Informacijos technologija. 8 bitų lotyniškos abėcėlės koduotų ženklų rinkinys, papildytas lietuviškos ir rusiškos abėcėlių raidėmis, skirtas naudoti MS DOS aplinkoje. 772 kodų lentelė.

Lietuviškų raidžių vietos šioje kodų lentelėje sutampa su 775 kodų lentele (LST 1590-1). Ši koduotė taip pat kartais vadinama 1119 numeriu. Šis standartas nuo 2000 m. panaikintas.

DOS 773

Lietuviškų raidžių išdėstymas šioje kodų lentelėje atitinka KBL išdėstymą, tačiau rusiškų raidžių joje nėra, nes ženklų aibė sutampa su 775 kodų lentele.

DOS 774 (LST 1283)

LST 1283:1993 Informacijos technologija. 8 bitų lotyniškos abėcėlės koduotų ženklų rinkinys, papildytas lietuviškos abėcėlės raidėmis, skirtas naudoti MS DOS aplinkoje. 774 kodų lentelė.

Šis standartas nuo 2000 m. panaikintas.

DOS 776

Kodų lentelė, sudaryta papildant 770 lentelę lietuviškomis kirčiuotomis raidėmis ir žodynuose naudojamais ženklais.

DOS 777

Kodų lentelė, sudaryta papildant 771 lentelę lietuviškomis kirčiuotomis raidėmis ir ženklais naudojamais žodynų sudarymui

10029 (MacCE)

Vidurio Europos ir Baltijos šalims skirta klasikinės „Mac OS” operacinės sistemos 10029 kodų lentelė.

Spectrum

Pirmoji plačiau naudota lietuviška kodų lentelė „Windows“ terpei.