অসমীয়া   বাংলা   बोड़ो   डोगरी   ગુજરાતી   ಕನ್ನಡ   كأشُر   कोंकणी   संथाली   মনিপুরি   नेपाली   ଓରିୟା   ਪੰਜਾਬੀ   संस्कृत   தமிழ்  తెలుగు   ردو

ইউনিকʼডত অসমীয়াৰ স্থান

asm_unicode

ইউনিকʼড নামেৰে পৰিচিত কম্পিউটাৰ আৰু ইণ্টাৰনেটৰ ভাষা জড়িত মানক গঢ়া আন্তঃৰাষ্ট্ৰীয় অনুস্থানটিৰ বিষয়ে খবৰ কাগজত আৰু আন ঠাইত কিছু আলোচনা হৈ থকা দেখা যায় । ইয়াৰ পৰা বুজিব পাৰি যে এই অনুস্থানটিৰ মানক বিলাকত অসমীয়া ভাষাটোক যোগ্য স্থান দিয়া হোৱা নাই বুলি মানুহৰ এটা ধাৰণাৰ জন্ম হৈছে। অৱশ্যে যোগ্য স্থান নিদিয়াৰ ধাৰণাটো অশুদ্ধ আৰু কেইটামান ভুল বুজাবুজিৰ বাবে হৈছে বুলি ভবাৰ থল আছে। ভাঙি-পাতি কিছু অধ্যয়ন কৰাৰ পাছত বুজিব পৰা গৈছে যে  বাংলা ভাষাৰ পৰা সুকীয়া ৰূপে ইউনিকʼডে অসমীয়া ভাষাক স্পষ্টভাৱে নিজৰ স্থান দিছে। বৰ্ত্তমান ইউনিকʼডৰ মানক কাকতবোৰ অধ্যয়ন কৰাৰ পাছত এই মন্তব্যটোলৈ আহিলোঁ। এই কামত, সহায়ক ভিত্তিৰে, আগতে শিকা কিছু কথা আৰু বহু বছৰ আগতে আদায় কৰা ভাৰতীয় লিপিৰ কম্পিউটাৰ প্ৰক্ৰিয়াৰ বিষয়ে অভিজ্ঞতা [১] খিনিয়েও অলপ সহায় কৰিছে। ইউনিকʼডত লিপিৰ নামটোৰ ক্ষেত্ৰত নিশ্চয় কিছু আশংকা আছে। ইয়াৰ বিষয়ে বহুজনে আগতে উল্লেখ কৰিছে । কিন্তু ইয়াৰ পাছৰ ব্যাখ্যাৰ পৰা বুজা যায় যে এই আশংকাখিনি কম্পিউটাৰত আৰু ইণ্টাৰনেটত অসমীয়া ভাষাৰ প্ৰচাৰৰ বাবে তুলনাত্মকভাবে বেছি গুৰুত্বপূৰ্ণ নহয়। প্ৰৱন্ধটিৰ বাকী অংশত এই নিৰ্ধাৰণসমূহ বহলাই বুজোৱাৰ এটি চেষ্টা কৰা হৈছে ।

ইউনিকʼডত লিপিৰ অৱলম্বন

ইণ্টাৰনেটত অসমীয়া ভাষাৰ অৱলম্বনৰ বিষয়ে, আৰম্ভণিতে উক্ত আলোচনাবোৰত “লিপি” আৰু “ভাষা”ৰ পাৰ্থক্যৰ বিষয়ে বহুখিনি বিভ্ৰান্তি দেখা পোৱা যায় । যদিও পাৰ্থক্যবোৰ সূক্ষ্ম, ইউনিকʼড যিহেতু কম্পিউটাৰ সম্বন্ধি মানক, সেয়ে এই পাৰ্থক্যবোৰ স্পষ্টভাৱে বৰ্ণনা কৰিবলৈ বাধ্য।

উদাহৰণ স্বৰূপে, পৰৱৰ্তী বাক্যটো ৰোমান লিপিত মই ইংৰাজী ভাষাত লিখিলোঁ। I speak a little English. (মই অলপ ইংৰাজী কʼব পাৰোঁ।) এতিয়া, একেই ৰোমান লিপিত মই ফৰাচী ভাষাৰ বাক্য এটাও লিখিলোঁ । je parleunpeu de francais. (মই অলপ ফৰাচী কʼব পাৰোঁ।) ইয়াৰপৰা দেখা যায় যে দুটি ভাষায়ে (ইংৰাজী আৰু ফৰাচী) একেই লিপি (ৰোমান) ব্যৱহাৰ কৰে।

লিপি আৰু ভাষাৰ এই পাৰ্থক্যটো ইউনিকʼডে মানকত স্পষ্টকৈ এনেধৰণে কৰিছে। লিপিৰ কাৰণে “কʼড চাৰ্ট” (code chart) আৰু ভাষাৰ কাৰণে বেলেগে “লোকাল” (locale) ইউনিকʼডত পৰিভাষিত কৰা হৈছে। কʼড চাৰ্ট এখনত একো একোটা আখৰৰ কাৰণে ইউনিকʼডে একো একোটা ক্ৰমাংক নিৰ্ধাৰণ কৰি দিয়ে । এই ক্ৰমাংকবোৰক “কʼড” (code) বুলি কোৱা হয়। সেয়ে, “লেটিন” নামৰ কʼড চাৰ্ট এখন দিয়া হৈছে (আমি যাক ৰোমান লিপি বুলি কওঁ, তাৰে এটি বিস্তাৰিত ৰূপক বৰ্ণনা কৰাৰ বাবে) আৰু তাৰ পাছত ইংৰাজী, ফৰাচী ইত্যাদি ভাষাৰ কাৰণে একো একোটা লোকাল দিয়া হৈছে যিবোৰে এই কʼড চাৰ্ট খন ব্যৱহাৰ কৰে।
এইখিনিতে এটি প্ৰশ্ন উত্থাপন কৰিব পাৰি যে ইউনিকʼডে এই ভাষাবোৰৰ কাৰণে একেখন কʼড চাৰ্ট কিয় নিৰ্ধাৰণ কৰিলে ?  ইয়াৰ কাৰণ হʼল যে ইংৰাজী, ফৰাচী, ডাত্চ, জাৰ্মান আৰু আন সম্পৰ্কীয় ভাষাবোৰৰ ৯০% লিখিত লিপি একেই। এই কথাটো লক্ষ্য কৰি, ইউনিকʼডে লেটিন নামেৰে কʼড চাৰ্ট এখন বনাই এই ভাষাবোৰত ব্যৱহাৰ হোৱা গোটেইবোৰ আখৰক তাতে সুমুৱাই দিলে । এইদৰে, কম সংখ্যা কʼড যাপন কৰি সম্পৰ্কীয় ভাষা কেইটিত ব্যৱহাৰ হোৱা গোটেইবোৰ আখৰক ইউনিকʼডে সামৰি লʼব পাৰিলে। এই ব্যৱস্থা এনেকৈ কৰা হʼল কাৰণ কম্পিউটাৰত ক্ৰমাংকলৈ ৰূপান্তৰ কৰা পদ্ধতি সাজোঁতে এটি স্বাভাৱিক মিতব্যয়িতাৰ প্ৰযত্ন সদায় থাকে । সেই অনুচৰে, ইউনিকʼডে এই নীতিক দিহা-বুদ্ধি হিচাবে ভাষা মানকৰ সকলো কামতে ব্যৱহাৰ কৰে।
গতিকে অসমীয়া আৰু বাংলা ভাষাৰ ক্ষেত্ৰতো ইউনিকʼডে এই দিহা-বুদ্ধিটো ব্যৱহাৰ কৰাত আচৰিত হʼব নালাগে। অসমীয়া আৰু বাংলা লিপিৰ মাজত কিছু পাৰ্থক্য আছে, কিন্তু ৯০% আখৰ দুয়ো লিপিতে একেই । ইয়াৰপৰা বুজিব পৰা যায় যে ইউনিকʼডে বনোৱা অসমীয়া নতুবা বাংলা ভাষাত ব্যৱহাৰ কৰা সকলো আখৰ সম্বলিত এখন যুটীয়া কʼড চাৰ্টৰ ব্যৱহাৰোপযোগিতাৰ কথা ।

কিন্তু অসমীয়া আৰু বাংলা লিপিৰ কʼড চাৰ্টখন বনাওতে ইউনিকʼডে গোটেইখিনি কাম শুদ্ধকৈ কৰিব পাৰিলে নে ? নোৱাৰিলে; ইউনিকʼডে কʼড চাৰ্টখনৰ নামাকৰণৰ কামত কিছু ভুল কৰিলে। নামটো “বেঙ্গলী” (Bengali) কʼড চাৰ্ট বুলি দি, ইউনিকʼডে অসমীয়া জনসাধাৰণৰ অনুভূতিত আঘাত সানিলে যাৰ মূলতে হʼল ভাষা দুটিৰ সম্বন্ধৰ বুৰঞ্জীৰ কিছু কথা, যাক এই কাৰিকৰি আলোচনাত মই সুমুৱাব বিচৰা নাই । এইখিনি কʼলেই যথেষ্ট যে, নামৰ এই আশংকাটোৰ বিষয়ে বহু জনৰ প্ৰচেষ্টাৰ ফলত, ইউনিকʼডে তেওঁলোকৰ যোগাযোগত কিছু সলনি আনিব ধৰিছে যে যদিও নামটো “বেঙ্গলী” কʼড চাৰ্ট, সেই কʼড চাৰ্টত অসমীয়া আখৰো আছে। তেওঁলোকৰ ৱেব-চাইটত এতিয়া কʼড চাৰ্টখনক “বেঙ্গলী এণ্ড এচেমীজ” (“Bengali and Assamese”) বুলি উল্লেখ কৰে http://www.unicode.org/charts/

কিন্তু আচল মানক খনত কʼড চাৰ্টখনৰ নামৰ বিষয়ে এতিয়াও কিছু আশংকা থাকি যায় । মানক কাকতখনত এতিয়াও ইয়াক “বেঙ্গলী” কʼড চাৰ্ট বুলি কোৱা হয়, যদিও ৱেব-চাইটতত ইয়াক “বেঙ্গলী এণ্ড এচেমীজ” কʼড চাৰ্ট বুলি উল্লেখ কৰে । প্ৰশ্ন হয়, মানক কাকতত দিয়া কʼড চাৰ্টৰ আচল নামটোৱে যাতে দুয়ো ভাষাকে অন্তৰ্গত কৰি লʼব পাৰে সেইবিষয়ে ইউনিকʼডে আৰু কিবা কৰিব পৰাৰ থল আছে নেকি ?

নিশ্চয় আছে, কিন্তু তেনে নাম সলনিৰ ফলস্বৰূপে সকলো ছফ্টৱেৰ প্লেটফৰ্মত বহু কাম ওলাব য’ত ইতিমধ্যে ইউনিকʼড মানক খনক ৰূপায়ণ কৰা হৈছে। তেনে প্লেটফৰ্মৰ মাজত হʼল মাইক্ৰʼচফ্ট ৱিন্ডʼজ আৰু ইউনিক্চৰ সকলো ভিন ভিন ৰূপ (ফ্ৰী-বি-এচ-ডি, লিনাক্চ, মেক-ও-এচ, চোলাৰিচ, এন্ড্ৰʼইড ও-এচ, আই-ও-এচ, মাত্ৰ কেইটামানৰ নাম ল’বলৈ)। ইউনিকʼড মানকত থকা কʼড চাৰ্ট সমূহৰ (লেটিন, আৰবী, বেঙ্গলী ইত্যাদি) অৱলম্বনৰ বাবে এই সকলো প্লেটফৰ্মতেই ভিন ভিনকৈ চফ্টৱেৰ ইতিপূৰ্বে লিখা হৈছে। মানকৰ কোনো কʼড চাৰ্টৰ নামত হোৱা তেনে সলনিৰ পৰিণামত এয়ে হʼব যে সকলোবোৰ প্লেটফৰ্মৰৰ বাবে লিখা ছফ্টৱেৰৰ মৌলিক ৰূপত (source code) কিছু সলনি কৰিব লাগিব। এই কামটোৰ ভাৰটো পৰিব এনে লোকৰ হাতত যিয়ে প্লেটফৰ্মবোৰৰ কাৰণে চফ্টৱেৰ লিখে। সাল-সলনিখিনি কৰাৰ পাছত, একো একোটা প্লেটফৰ্মৰ কাৰণে ছফ্টৱেৰৰ একো একোটা সংস্কৰণ বিতৰণ কৰিব লাগিব যাৰ প্ৰভাৱ হাজাৰ হাজাৰ নিযুত কম্পিউটাৰ, টেব্লেট, স্মাৰ্ট-ফোন ইত্যাদি সংগণক সৰঞ্জামত বিশ্বব্যাপিভাৱে হʼব।

সেই কাৰণে, তেনে নাম সলনিৰ পৰা অসমীয়া ভাষাৰ নিবেশ, সংসাধন, বা প্ৰদৰ্শনত কি লাভ হʼব, তাৰ বিষয়ে ইউনিকʼডে সাৱধানে ভাৱি-চিন্তি লোৱাতো উচিত। দেখা গʼল যে তেনে নাম সলনিৰ পৰা অসমীয়াৰ কাৰণে কোনো লাভ নহয়। ইয়াৰ দুটা কাৰণ:

(১) বৰ্ত্তমানৰ কʼড চাৰ্টখনত অসমীয়া লিপিৰ নিবেশ, সংসাধন, বা প্ৰদৰ্শনৰ বাবে সকলো প্ৰয়োজনীয় আখৰৰ কʼড এতিয়াই বিদ্যমান আৰু

(২) ভাষাৰ আন গুণ যিবোৰ ভাষা বিশিষ্ট, যেনে বৰ্ণমালা-ক্ৰমান্বয়, ইউনিকʼডে লিপিৰ বাহিৰত আন উপযুক্ত মানকত অসমীয়াৰ কাৰণে পৰিভাষিত কৰিছে। পৰবৰ্তী খণ্ডত ভাষা বিশিষ্ট গুণবোৰৰ বিষয়ে আলোচনা কৰিম, কিন্তু এইখিনিতে বুজাতো আৱশ্যক যে আলোচনা কৰা কথাখিনিৰ কাৰণেই ইউনিকʼড অনুষ্ঠানে কʼড চাৰ্টৰ নামটো সলনি কৰা নাই আৰু ৱেব-চাইটত “বেঙ্গলী এণ্ড এচেমীজ” বুলি উল্লেখ কৰাৰ পৰ্যায়তে ৰʼলে।

ইউনিকʼডত অসমীয়া ভাষাৰ অবলম্বন

মন কৰিব যে বৰ্ণমালা-ক্ৰমান্বয়ৰ নিচিনা বিশিষ্ট গুণবোৰ আন সম্পৰ্কীয় ভাষাৰ বাবেও বেলেগ; সেয়ে ইউনিকʼডে ইয়াক এটা নতুন সমস্যা বুলি নাভাৱে। চ্বীডিছ ভাষাৰ বৰ্ণমালাৰ শেষত তিনিতা অতিৰিক্ত স্বৰবৰ্ণ ৰখা হৈছে (…, X, Y, Z, Å, Ä, Ö), দেনিছ আৰু নৰ্ৱেগিয়ান ভাষাৰ নিচিনাকৈ, কিন্তু লিখা ৰূপবোৰ আৰু বৰ্ণমালা-ক্ৰমান্বয়তো বেলেগ। চ্বীডিছ, দেনিছ, নৰ্ৱেগিয়ান ভাষাকেইটিৰ কাৰণে, ইউনিকʼডে এই পাৰ্থক্যবোৰ পৰিভাষিত কৰিছে লেটিন কʼড চাৰ্টৰ বাহিৰত ;সেই ভাষা কেইটিৰ লোকালত। ঠিক তেনেকৈ, অসমীয়া আৰু বাংলা ভাষাৰ বেলেগ বৰ্ণমালা-ক্ৰমান্বয় দুটা সেই একে বিধিৰে পৰিভাষিত হৈছে; ভাষা দুটিৰ লোকালত।

এতিয়া প্ৰশ্ন হʼল – ইউনিকʼডে অসমীয়া ভাষাক ঠিক কেনেধৰে অৱলম্বন কৰে? লোকালবোৰৰ বিৱৰণ ইউনিকʼডে ইয়াতে ৰাখে ঃ- Unicode Common Locale Data Repository (CLDR) http://cldr.unicode.org/, যাক আমি ʼইউনিকʼড লোকাল কোষʼ বুলি কʼব পাৰো।

এই কোষত অসমীয়া ভাষাক ʼএচেমীজʼ লোকাল হিচাপে পূৰ্ণৰূপে পৰিভাষিত কৰা আছে ভাষাৰ বহুতো গুণৰ বিৱৰণৰ মাজেৰে, যেনে:

  • লোকালটোৰ নাম; চুটি ইংগিত হʼল ʼas’ (মন কৰিব যে বাংলা ভাষাৰ লোকালটো বেলেগ: চুটি ইংগিত ‘bn’)
  • লিপিৰ কাৰণে কʼড চাৰ্ট খনৰ নাম
  • কʼড চাৰ্টত ক্ৰমান্বয় নিৰ্ধাৰণ কৰা নিয়ম (ইয়াৰ মাধ্যমেৰে ভাষাৰ বৰ্ণমালা-ক্ৰমান্বয় ৰূপায়ণ কৰা হয়। মন কৰিব যে বাংলা আৰু অসমীয়া বৰ্ণমালা-ক্ৰমান্বয় ৰূপায়ণ কৰোতে কʼড চাৰ্টৰ আখৰৰ ক্ৰমাঙ্কবোৰ অলপ বেলেগকৈ ধৰি লʼব লগা হয়, কিয়নো অসমীয়া ভাষাত ব্যৱহাৰ হোৱা কʼড চাৰ্টৰ ʼৰʼ আৰু ʼৱʼ কʼড দুটা বাংলা ভাষাত ব্যৱহাৰ নহয়। তাৰ উপৰিও বাংলা ভাষাৰ ক্ৰমান্বয়ত অসমীয়া ʼৰʼ-কʼডৰ স্থানত সেই ভাষাৰ ʼরʼ কʼডে স্থান পাই।)
  • তাৰিখ/সময়ৰ প্ৰতিৰূপ ইত্যাদি

এই বিৱৰণসমূহ CLDR-ত core.zip নামৰ ফাইল এটাত দিয়া আছে যাক আগতে দিয়া কোষৰ লিংকৰ পৰা আনি লʼব পাৰি। core.zip ফাইলটো খুলিলে, তাৰ ভিতৰত থকা এই ফাইলকেইটাৰে এচেমীজ লোকালটো বৰ্ণনা কৰা হৈছে:
./common/casing/as.xml
./common/collation/as.xml
./common/main/as.xml

পৰবৰ্তী প্ৰবন্ধত, ফাইলসমূহৰ ভিতৰত থকা কথাখিনিৰ বিষয়ে বহলাই লিখিম যাতে বুজিব পৰা যায় সেইবোৰে অসমীয়া ভাষাৰ সকলো গুণক কেনেকৈ প্ৰতিৰূপিত কৰে।

সাৰাংশ

সাৰাংশত এইটোৱে কʼব পাৰি যে ইউনিকʼডে ইতিপূৰ্বে প্ৰতিষ্ঠা কৰা কʼড চাৰ্টখন (যদিও ইয়াৰ নামটো বেয়াকৈ দিয়া হৈছে) আৰু ʼএচেমীজʼ (‘as’) লোকালখন দুয়োকে লৈ, অসমীয়া ভাষাত পঢ়া আৰু লিখাৰ বাবে ইণ্টাৰনেটতত প্ৰয়োজনীয় সকলো বস্তু আগবঢ়াইছে [২]। এই কথাৰ প্ৰমাণ হিচাবে আমি এই কথা ক’ব পাৰোঁ যে এই প্ৰৱন্ধটি মই ইউনিকʼডৰ জৰিয়তে নিবেশ কৰি, বহুটো কম্পিউটাৰত সংসাধন হৈ, আপোনোৰ কম্পিউটাৰত প্ৰদৰ্শিত হৈছে যাতে আমি অসমীয়া ভাষাত এই আলোচনাটি লিখিতভাৱে কৰিব পাৰিছোঁ ।

তথ্য সুত্ৰ

[১] এই বিষয়ত ১৯৮০ চনৰ ওচৰে-পাজৰে কম্পিউটাৰত ভাৰতীয় ভাষাৰ লেখনৰ সংসাধনৰ ওপৰত কাম কৰি মই কিছু অৱগতি পাইছোঁ । সহকৰ্মীৰ সৈতে লিখা সমকক্ষ-পৰ্য্যালোচিত আৰু প্ৰকাশিত ইংৰাজী লেখনি এখনৰ লিংকটো ইয়াতে দিলো: https://docs.google.com/open?id=0B7lCYS3yYAjhdEpsclFmVWlLQk0
[২] ইণ্টাৰনেটত নিৰ্ভৰযোগ্যভাৱে অসমীয়া ভাষাৰ তথ্য সন্ধান কৰাত বাধা এটা আছে কিন্তু তাক আঁতৰোৱাৰ বাবে ইউনিকʼডৰ পৰা একো নালাগে । শুধৰণিখিনি অনুসন্ধানৰ বাবে বনুৱা গুগল আৰু বিংৰ নিচিনা সেৱাবোৰতহে লাগে। বাধাটো, তাৰ সমাধানটো আৰু এতিয়াৰ কাৰণে বাধাটো নেওচি যাবলৈ এটা কিটিপৰ বৰ্ণনাৰে লেখনি এখনৰ লিংকটো ইয়াতে দিলো: https://docs.google.com/document/d/1gcgX1hua22rpvFFtgG50PVJILq64fr3MwWoJU6o7VD0/edit
[৩] অসমীয়া ভাষাৰ তথ্য সন্ধান কৰাত বাধাটো নেওচি যোৱাৰ কিটিপটো ৰূপায়ণ কৰা এটা ফায়াৰফক্চ প্লাগ-ইন ইয়াত আছে: http://mycroft.mozdev.org/search-engines.html?name=Google+%28as%29+Assamese+%28Adds+ৰ%29

লেখক: শ্ৰী সত্যজিৎ নাথ

শেহতীয়া উন্নীতকৰণ: : 4/27/2020



© C–DAC.All content appearing on the vikaspedia portal is through collaborative effort of vikaspedia and its partners.We encourage you to use and share the content in a respectful and fair manner. Please leave all source links intact and adhere to applicable copyright and intellectual property guidelines and laws.
English to Hindi Transliterate