യൂണികോഡ്
ലോകത്തിലെ എല്ലാ ഭാഷകള്ക്കും പര്യാപ്തമായ അക്ഷരങ്ങളുടെ കൂട്ടം
... മലയാളത്തിനും
കമ്പ്യൂട്ടറിന്റെ ഭാഷ
- 1 , 0 എന്നീ അക്കങ്ങള് മാത്രമുള്ളതാണു് കമ്പ്യൂട്ടറിന്റെ ഭാഷ.
- ഇതു് മാത്രം ഉപയോഗിച്ചു് എങ്ങനെ സാധാരണയായുള്ള വിവരങ്ങള് കൈകാര്യം
ചെയ്യും?
- അക്ഷരങ്ങള്ക്കു് ഒരു സംഖ്യ കൊടുക്കുന്നു. (സംഖ്യകള്ക്കും :-))
- ഉദാഹരണത്തിനു് ഇംഗ്ലീഷ് ചെറിയക്ഷരം 'a' എന്നതിനു് ആസ്കി
പട്ടികയില് നല്കിയ സ്ഥാനം 61 ആണു്
- അറബി അക്കമായ '1 'എന്നതിനു് ആസ്കി പട്ടികയില് നല്കിയ സ്ഥാനം 31
ആണു്
- 7 ബിറ്റുകളുപയോഗിച്ചായിരുന്നു ഇതു് ആദ്യകാലങ്ങളില് ചെയ്തിരുന്നതു്
- ഇതുപയോഗിച്ചു് 128 അക്ഷരങ്ങളെ മാത്രമേ പ്രതിനിധാനം ചെയാനാകൂ
ആസ്കി (ASCII)
- പിന്നീടു് ഓരോ അക്ഷരത്തിനും ഒരു ബൈറ്റ് (8 ബിറ്റ് ) ഉപയോഗിച്ചു്
തുടങ്ങി
- അപ്പോള് 256 അക്ഷരങ്ങള് പട്ടികയില് ചേര്ക്കാം
- ഉദാഹരണം a=65 or 0011 1101
- ലാറ്റിന് ലിപി മാത്രമേ പരിഗണിച്ചിരുന്നുള്ളൂ
- മറ്റു് ഭാഷകളൊന്നും ഇതു കൊണ്ട് പ്രതിനിധാനം ചെയാന് പറ്റില്ല
- ഇതിനു് നാം ഉപയോഗിച്ച കുറുക്കു വഴി ഫോണ്ട് എന്കോഡിങ്ങ് എന്ന
സൂത്രമാണു്
- അക്ഷരങ്ങള് ശേഖരിക്കുന്നതു് ഇംഗ്ലീഷിലും പ്രദര്ശിപ്പിക്കുമ്പോള്
മലയാളത്തിലും...
- ഫോണ്ടില് ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സ്ഥാനത്ത് മലയാളം അക്ഷരങ്ങള്
വച്ചു
- പല പത്രങ്ങളും അവരുടെ വൈബ്സൈറ്റുകള്ക്കു് ഈ രീതിയാണു് ഇപ്പോളും
പിന്തുടരുന്നതു്
ആസ്കി മലയാളം നേരിടുന്ന പ്രശ്നങ്ങള്
- 900 ത്തിലധികമുള്ള കൂട്ടക്ഷരങ്ങളുള്ള മലയാളം ഒരു ഫോണ്ടിലൊതുങ്ങില്ല
- രചന 6 ആസ്കി ഫോണ്ടുകളുപയോഗിച്ചാണു് എല്ലാ കൂട്ടക്ഷരങ്ങളും കാണിച്ചതു്
- ഫോണ്ടുകളില് ഈ മാപ്പിങ്ങിനു് ഐക്യ രൂപമില്ല
- മാതൃഭൂമിയുടെ ഫോണ്ട് ഉപയോഗിച്ചു് മലയാള മനോരമയുടെ സൈറ്റ്
കാണാന് പറ്റില്ല
- വിവരങ്ങള്ക്കൊപ്പം ഫോണ്ടും കൂടി കൈമാറേണ്ട അവസ്ഥ
- തെരയാനും തരം തിരിക്കാനും ഏകീകൃത രീതിയില്ല
- കമ്പ്യൂട്ടറിനു് അറിയില്ല ഇതു് മലയാളമാണെന്നു്
- ഇംഗ്ലീഷും മലയാളവും ഒരു ഫയലില് പറ്റില്ല
യൂണികോഡ്
- 65536 അക്ഷരങ്ങള് ഉള്ക്കൊള്ളാവുന്ന പട്ടിക
- ഇതു് ലോകത്തിലെ എല്ലാ ഭാഷകളും ഉള്ക്കൊള്ളാന് പര്യാപ്തമാണു്
- ഓരോ ഭാഷയ്ക്കും അതിന്റേതായ സ്ഥാനം
- ആദ്യത്തെ 256 അക്ഷരങ്ങള് ആസ്കിയുടെ തന്നെ
- 0D00 - 0D7F (3328- 3455) മലയാളത്തിനു് വേണ്ടി
യൂണികോഡിന്റെ മെച്ചങ്ങള്
- മലയാളം മലയാളമായിത്തന്നെ കമ്പ്യൂട്ടര് മനസ്സിലാക്കുന്നു
- ഏതെങ്കിലുമൊരു യൂണികോഡ് ഫോണ്ടുണ്ടായാല് മതി
- വെട്ടിച്ചുരുക്കിയ ലിപിയും മലയാളത്തിന്റെ സ്വതസിദ്ധമായ ലിപിയും
തമ്മിലുള്ള വ്യത്യാസം ഇല്ലാതായി
- ഏതു് ഫോണ്ടാണോ സിസ്റ്റത്തിലുള്ളതു് ആ ലിപിയില് കാണാം
- ഒന്നിലധികം ഭാഷകള് ഒരേ ഫയലില് സൂക്ഷിയ്ക്കാം
- പക്ഷേ 3328 - 3455 വരെയുള്ള സ്ഥാനത്ത് 900 ത്തിലധികമുള്ള
കൂട്ടക്ഷരങ്ങളെങ്ങനെ
കാണിയ്ക്കും?
ഓപ്പണ്ടൈപ്പ് ഫോണ്ട് സാങ്കേതികവിദ്യ
- യൂണികോഡിനൊപ്പം ഇതു കൂടിച്ചേര്ന്നപ്പോള് മുഴുവന്
കൂട്ടക്ഷരങ്ങളേയും കാണിയ്ക്കാമെന്നു് വന്നു
- അക്ഷരങ്ങളുടെ ശ്രേണിയ്ക്കു പകരമായി ഒറ്റ കൂട്ടക്ഷരം മാറ്റി
വയ്ക്കാമെന്നായി
- പ + ചന്ദ്രക്കല + ര എന്നതിനു് പകരം പ്ര എന്നു് കാണിയ്ക്കുന്നു
- ജനകീയമായ യൂണികോഡ് ഫോണ്ടുകളാണ് രചന, അഞ്ജലി, മീര തുടങ്ങിയവ
- മലയാളം വിക്കിപ്പീഡിയ, മാതൃഭൂമി, മംഗളം എന്നീ പത്രങ്ങളുടെ ഓണ്ലൈന്
പതിപ്പുകള് എന്നിവ യൂണികോഡുപയോഗിയ്ക്കുന്ന ചില വെബ്സൈറ്റുകളാണു്
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്
ശുഭം