Duomenų konvertavimo iš vienos formos į kitą procesas yra žinomas kaip kodavimas. Jis naudojamas duomenims transformuoti, kad duomenis galėtų palaikyti ir naudoti įvairios sistemos. Kodavimas veikia panašiai kaip temperatūros konvertavimas iš Celsijaus į Farenheitą, nes jis tiesiog konvertuojamas į kitą formą, tačiau pradinė vertė visada išlieka ta pati. Kodavimas daugiausia naudojamas dviejose srityse:
Pastaba: kodavimas skiriasi nuo šifravimo, nes jo pagrindinis tikslas yra ne paslėpti duomenis, o konvertuoti juos į formatą, kad būtų galima tinkamai juos naudoti.
Šioje temoje aptarsime įvairius skaičiavime naudojamus kodavimo metodus.
Kodavimo technikos tipas
Simbolių kodavimas
Simbolių kodavimas koduoja simbolius į baitus . Jis informuoja kompiuterius, kaip nulius ir vienetus paversti realiais simboliais, skaičiais ir simboliais. Kompiuteris supranta tik dvejetainius duomenis; todėl šiuos simbolius reikia konvertuoti į skaitmeninius kodus. Norint tai pasiekti, kiekvienas simbolis konvertuojamas į dvejetainį kodą, o tam tekstiniai dokumentai išsaugomi su kodavimo tipais. Tai galima padaryti suporuojant skaičius su simboliais. Jei netaikysime simbolių kodavimo, mūsų svetainė nerodys simbolių ir teksto tinkamu formatu. Dėl to sumažės skaitomumas, o aparatas negalės tinkamai apdoroti duomenų. Be to, simbolių kodavimas užtikrina, kad kiekvienas simbolis būtų tinkamai pavaizduotas kompiuterio arba dvejetainiu formatu.
Yra įvairių tipų simbolių kodavimo metodų, kurie pateikiami toliau:
HTML kodavimas
HTML kodavimas naudojamas HTML puslapiui rodyti tinkamu formatu. Naudodama kodavimą, žiniatinklio naršyklė sužino, kurį simbolių rinkinį naudoti.
HTML HTML žymėjime naudojami įvairūs simboliai, pvz., . Norėdami užkoduoti šiuos simbolius kaip turinį, turime naudoti kodavimą.
URL kodavimas
URL (Uniform Resource locator) Kodavimas naudojamas konvertuoti simbolius tokiu formatu, kad juos būtų galima perduoti internetu . Jis taip pat žinomas kaip procentinis kodavimas. URL kodavimas atliekamas norint siųsti URL į internetą naudojant ASCII simbolių rinkinį. Ne ASCII simboliai pakeičiami %, po kurių rašomi šešioliktainiai skaitmenys.
UNICODE kodavimas
Unikodas yra universalaus simbolių rinkinio kodavimo standartas. Tai leidžia koduoti, pavaizduoti ir tvarkyti tekstą, pateiktą daugeliu kalbų ar rašymo sistemų, kurios yra prieinamos visame pasaulyje. Jame pateikiamas kodo taškas arba skaičius kiekvienam simboliui visomis palaikomomis kalbomis. Jis gali reikšti maždaug visus galimus simbolius visomis kalbomis. Tam tikra bitų seka yra žinoma kaip kodavimo vienetas.
UNICODE standartas gali naudoti 8, 16 arba 32 bitus simboliams pavaizduoti.
„Unicode“ standartas apibrėžia „Unicode Transformation Format“ (UTF) kodo taškams koduoti.
UNICODE kodavimo standartas turi šias UTF schemas:
UTF8 apibrėžiamas UNICODE standartas, kuris yra kintamo pločio simbolių kodavimas, naudojamas elektroninėje komunikacijoje. UTF-8 gali užkoduoti visus 1 112 064 galiojančius simbolių kodo taškus Unikode, naudojant nuo vieno iki keturių vieno baito (8 bitų) kodo vienetų.
UTF16 kodavimas reiškia simbolio kodo taškus, naudojant vieną iš dviejų 16 bitų sveikųjų skaičių.
UTF32 kodavimas reiškia kiekvieną kodo tašką kaip 32 bitų sveikuosius skaičius.
„Base64“ kodavimas
„Base64 Encoding“ naudojama dvejetainiams duomenims koduoti į lygiaverčius ASCII simbolius. „Mail“ sistemoje naudojama „Base64“ koduotė, nes pašto sistemos, tokios kaip SMTP, negali dirbti su dvejetainiais duomenimis, nes priima tik ASCII tekstinius duomenis. Jis taip pat naudojamas paprastam HTTP autentifikavimui, kad būtų koduojami kredencialai. Be to, jis taip pat naudojamas dvejetainiams duomenims perkelti į slapukus ir kitus parametrus, kad duomenys būtų neįskaitomi, kad būtų išvengta klastojimo. Jei vaizdas ar kitas failas perkeliamas be „Base64“ kodavimo, jis bus sugadintas, nes pašto sistema nepajėgs apdoroti dvejetainių duomenų.
Base64 vaizduoja duomenis į 3 baitų blokus, kur kiekviename baite yra 8 bitai; taigi jis reiškia 24 bitus. Šie 24 bitai yra suskirstyti į keturias grupes po 6 bitus. Kiekviena iš šių grupių arba dalių konvertuojama į lygiavertę Base64 reikšmę.
ASCII kodavimas
Amerikos standartinis informacijos mainų kodas (ASCII) yra simbolių kodavimo tipas. Tai buvo pirmasis simbolių kodavimo standartas, išleistas 1963 m.
ASCII kodas naudojamas angliškus simbolius vaizduoti kaip skaičius, kur kiekviena raidė priskiriama skaičiui iš nuo 0 iki 127. Dauguma šiuolaikinių simbolių kodavimo schemų yra pagrįstos ASCII, nors jos palaiko daug papildomų simbolių. Tai yra vieno baito kodavimas, naudojant tik apatinius 7 bitus. ASCII faile kiekvienas abėcėlinis, skaitinis arba specialus simbolis vaizduojamas 7 bitų dvejetainiu skaičiumi. Kiekvienas klaviatūros simbolis turi lygiavertę ASCII reikšmę.
Vaizdo ir garso bei vaizdo kodavimas
Vaizdo ir garso bei vaizdo kodavimas atliekamas siekiant sutaupyti vietos saugykloje. Medijos failas, pvz., vaizdas, garsas ir vaizdo įrašas, yra užkoduotas, kad būtų išsaugotas efektyvesniu ir suspaustu formatu.
Šiuose užkoduotuose failuose yra tas pats turinys, paprastai panašios kokybės, tačiau suspausto dydžio, kad juos būtų galima išsaugoti mažiau vietos, juos būtų galima lengvai perkelti paštu arba atsisiųsti iš sistemos.
Mes galime tai suprasti kaip . WAV garso failas konvertuojamas į .MP3 failą, kad dydis būtų sumažintas 1/10thiki pradinio dydžio.