Jump to content

Enkonduko en la aŭtomatan daten-prilaboradon/Kiel eblas kodi datenojn?

From Wikiversity

Kiel eblas kodi datenojn en prilabora sistemo?

[edit]

Informoj, kiujn prilaboru komputilo, ofte ne troviĝas en formo komputil-taŭga. Por komputila prilaboro necesas kodi datenojn, tio estas, transformi ili al komputil-taŭga formo. Tia formo nomiĝas ankaŭ reprezentaĵo de la datenoj.

La uzo de taŭga kodo (= kod-maniero) estas tre grava por la prilaborado kaj precipe por la interŝanĝo de datenoj. Du komputiloj aŭ komputil-sistemoj povas komuniki nur, se ili havas komunan kodon, kiun ambaŭ komprenas.

Necesas klare distingi inter la nocioj "kodi" kaj "ĉifri". Ĉifrado havas la celon kaŝi (sekretigi) informojn. Kodado estas nur transformado al taŭga reprezento-maniero.

Manieroj de kodado

[edit]

Kodado de informoj ekzistas ankaŭ ekster komputiloj. Ĝenerale oni distingas inter du bazaj manieroj de kodado:

  1. Analoga kodado
    Fizika grando sensalte (kontinue) ŝanĝiĝas proporcie al la reprezentata grando. Ekzemploj :
    • aŭtomobila rapidometro kun cirkla skalo kaj montrilo: ju pli rapide la aŭto veturas, des pli la montrilo foriras de la 0-pozicio.
    • klasika sonbendo: magneteco
    • telefono (ankoraŭ parte; la analogan telefonon pli kaj pli anstataŭas la cifereca ISDN-sistemo): elektraj tensio kaj kurento
    • televidilo (ankoraŭ parte, ekzistas cifereca televido): la elektron-radio frapanta la vandon de la katodradia tubo estas kontinue modulata de la krada tensio; ankaŭ la transsendo de la sendilo al la ricevilo estas analoga (frekvenc-variado de elektromagnetaj ondoj).
    • analoga horloĝo: angulo al la "norda" direkto
  2. Cifereca kodado (foje nomata "diĝita" kodado)
    Ekzistas aro da signoj, konsistanta el finia nombro da signoj, per kiuj eblas unike reprezenti la informon. La signoj estas skribataj unu post la alia sur difinitajn poziciojn. La ordo de la signoj estas grava. Ekzemploj:
    • cifereca horloĝo (signaro: la ciferoj 0 ĝis 9)
    • senstruktura teksto (signaro: majuskloj, minuskloj, ciferoj, interpunkcioj, spaceto)
    • morsa alfabeto (signaro: punkto, streko, spaco)


Kiel montras la ekzemploj, eblas kodi la samajn valorojn analoge aŭ ciferece. Unuavide la cifereca kodado havas malavantaĝon: Ĝia precizeco estas strikte limigita. Se oni ekzemple havas ciferecan horloĝon kun kvar ciferoj (du por la horoj, du por la minutoj), tute ne eblas distingi la sekundojn, sed sur analoga horloĝo sen sekunda montrilo tamen eblas distingi duonajn, eble eĉ trionajn minutojn. La precizeco de analoga reprezentaĵo dependas de la mezura precizeco ĉe la legado.

Sed cifereca kodado havas la grandan avantaĝon, ke ĝi legado ne bezonas precizan mezuradon (kiu ofte estas tre kosta). Se ekzemple la minuta montrilo de analoga horloĝo estas kurbigita, la horloĝo montras malĝustan tempon. Se unu ciferon de cifereca horloĝo oni iom ŝanĝas, la tempo estas tamen tute precize legebla. Oni diras, ke ĉe cifereca kodado eblas korekti erarojn.

Jena ekzemplo montras, ke ŝanĝo en analoga reprezento perdigas precizecon: Se la montrilo iom kurbiĝas, ĝi montras al alia valoro (24 anstataŭ 23).

Ekzemplo de cifereca kodado, kiu ne eblas korekti erarojn.
Ekzemplo de cifereca kodado, kiu ne eblas korekti erarojn.

Kontraŭe, malgranda ŝanĝo en cifereca valoro estas korektebla: Se ciferoj iom kurbiĝas, ili tamen estas bone rekoneblaj.

Ekzemplo de cifereca kodado, kiu eblas korekti erarojn.
Ekzemplo de cifereca kodado, kiu eblas korekti erarojn.

Tiu avantaĝo estas tre bone montrebla ĉe la kopiado de muziko: Se tradician muzik-kasedon (magnetbendan kasedon) oni cent-foje kopias de unu kasedo al alia, la kvalito de la muziko konsiderinde malboniĝas. Se oni centfoje kopias de unu kodisko (kompakta disko, KD) al alia, la kvalito restas senŝanĝa.

La kontinueco de analoga kodado signifas, ke la kodoj de similaj valoroj estas similaj, ekzemple la kodo de la mezumo de du valoroj estas inter la du kodoj. Por analoga horloĝo tio signifas, ke ekzemple je la oka horo la mallonga montrilo estas inter la pozicioj por la 7-a horo kaj la 9-a horo. Kontraŭe ĉe cifereca kodado la kodoj de similaj valoroj povas esti tute malsamaj: Kvankam la cifero "1" iom similas al la cifero "7", sed ĝia valoro tute ne estas proksima al ĝi. Same la nombroj "9999" kaj "9099" aspektas pli similaj ol "9999" kaj "10000", sed la diferenco de la unua paro estas 900, tiu de la dua nur 1.

Duuma kodado

[edit]

Pri la tiukunteksta termo "alfabeto"

Alfabeto estas ordigita signaro; oni ordigas tiel, ke "1 > 0".

Antaŭ kelkaj jardekoj ankoraŭ ekzistis analogaj kaj hibridaj komputiloj, ĉi-lastaj kun analogaj kaj ciferecaj partoj. La nunaj komputilo ĉiuj enmemorigas informojn en cifereca formo. Ili preskaŭ ekskluzive uzas signaron el du signoj, nomataj plej ofte 0 kaj 1 – temas do pri duuma alfabeto, kelkfoje ankaŭ nomita binara alfabeto. En maloftaj okazoj oni uzas triuman (tri-signan) alfabeton, ekzemple ĉe la informtranssendo per ISDN.


Duuma informaci-unuo, povanta preni ĉenitajn valoron el du eroj, nomiĝas duumobito, laŭ la Angla paŭso el bit, mallongigo por binary digit. Krome bit memorigas pri la Angla a bit, tio estas "malmulte", "iom".

Multaj komputiloj grupigas po 8 duumoj al okopo, ankaŭ nomita bajto, paŭso el la Angla byte, aŭ ankaŭ bitoko.

La kapaciton de komputilaj memoroj oni indikas per:

Valoromapigo de memoraj unuoj
KB, kilobajtoj 210 = 1.024 103 milo
MB, megabajtoj 220 = 1.048.576 106 miliono
GB, gigabajtoj 230 = 1.073.741.824 109 miliardo
TB, terabajtoj 240 = 1.099.511.627.776 1012 biliono, duiliono
PB, petabajtoj 250 = 1.125.899.906.842.624 1015 biliardo, duiliardo


Atentu ke la "K" de "KB" estas majuskla por distingi ĝin de "k", kiu signifas precize "1000". Ĉe la pli altaj faktoroj tiu distingo kutime mankas; por esti tute preciza oni anstataŭigas la duan parton de la dekuma prefikso per "bi", dirante "kibibajto", "mebibajto" ktp. Skribe oni esprimas tiun diferencon per minuskla "i": "KiB", "MiB", "GiB" usw. Sed tiu diferenco estas malmulte aplikata.

Dum la 1960-aj jaroj la tiamaj komputilegoj havis centran memoron de kelke da KB; nuntempe jam mezumaj personaj komputiloj (PK) posedas centran memoron de pluraj cent MB aŭ eĉ kelkaj GB. Ĉirkaŭ la jaro 1990 la inform-kvanto de tera-bajto estis preskaŭ neimagebla; nun ĝi estas kodebla en iom pli ol cent DVD-diskoj, teneblaj en ne tro granda skatolo.

Ekzemplo de trukarto

De la komencaj tempoj de maŝina komputado ĝis la 80-aj jaroj trubendoj kaj trukartoj servis por enigi kaj stori datenojn. Sur ili la reprezento de informoj per bitoj estas senpere videbla: Estas diskretaj pozicioj, kiuj povas esti truitaj (bito = 1) aŭ sentruaj (bito = 0). La bitoj de unu kolumno (12 ĉe trukarto, 5 aŭ 8 ĉe trubendo) kodas po unu signon; ĉe trukarto la signo ofte estas presita supre en legebla formo. Tiu teksto estas destinita nur por homoj; por la komputilo ĝi estas sensignifa.

La evoluon de la memor-tekniko ilustras jena kalkulo: Klasika trukarto povis memori 80 signojn, moderna kompakt-disko ĉirkaŭ 700.000.000 signojn. Por unu disko oni do bezonus plurajn milionojn da kartoj; ĉar tia karto kostis proksimume 1 €-cendon, la kostoj estus dekoj da miloj da eŭroj. Kompreneble oni neniam uzis trukartojn por tiom granda inform-kvanto, ĉar jam en la trukarta epoko ekzistis magnet-bendoj.

Specimenaj demandoj

1 Kio estas analoga kodado de datenoj?

Aro da signoj, el finia nombro da signoj, kiuj unike reprezentas la informon
Fizika grando kiu sensalte ŝanĝiĝas proporcie al la reprezentata grando.
Nomo de la kodado uzita per ĉiuj horloĝoj

2 Kio estas cifereca kodado de datenoj?

Aro da signoj, el finia nombro da signoj, kiuj unike reprezentas la informon
Fizika grando kiu sensalte ŝanĝiĝas proporcie al la reprezentata grando.
Nomo de la kodado uzita per ĉiuj horloĝoj

3 Ĉu personaj komputiloj uzas analogan aŭ ciferecan kodadon?

Analogan
Ciferecan
Ambaŭ kodado

4 Per kiuj unuoj oni mezuras ciferecan memor-kapaciton?

duumo
bikso
kilo
okopo
nombro da malsama signo
trajto

5 Kiom da okopoj (proksimume) estas unu KB?

dek
cent
milo
miliono
miliardo

6 Kiom da bajtoj (proksimume) estas unu MB?

dek
cent
milo
miliono
miliardo

7 Kiom da bajtoj (proksimume) estas unu GB?

dek
cent
milo
miliono
miliardo