কনটেন্টটি শেষ হাল-নাগাদ করা হয়েছে: বুধবার, ১৫ এপ্রিল, ২০২৬ এ ০৩:৩৩ PM

প্রকল্প পরিচিতি

কন্টেন্ট: পাতা

বাংলাদেশ কম্পিউটার কাউন্সিল দ্বারা পরিচালিত ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ (EBLICT) প্রকল্প একটি কৃত্রিম বুদ্ধিমত্তা, ডেটা সায়েন্স ও বাংলা ভাষার সফটওয়্যার তৈরির জাতীয় উদ্যোগ। বর্তমানে এই প্রকল্পটি বাংলাদেশের হোম গ্রোন AI-এর হাব হিসেবে কাজ করছে। এই প্রকল্পের প্রধান কার্যপরিধি ও অর্জনসমূহ নিচে দেওয়া হলো:


১. এআই-নির্ভর প্রধান অ্যাপ্লিকেশনসমূহ

Kagoj.ai (কাগজ এআই):
এটি একটি ইন্টিগ্রেটেড AI প্ল্যাটফর্ম যা সরকারি ও বেসরকারি ডকুমেন্ট তৈরি, প্রক্রিয়াকরণ, গবেষণা এবং কন্টেন্ট ক্রিয়েশনে সহায়তা করে। এতে বাংলা OCR, STT, TTS এবং স্পেল চেকার যুক্ত আছে।

সঠিক:
একটি AI-ড্রিভেন বানান ও ব্যাকরণ পরীক্ষক টুল যা বাংলা একাডেমি স্ট্যান্ডার্ড অনুসরণ করে।

বর্ণ ওসিআর:
এটি ছবি, পিডিএফ এবং হাতে লেখা ডকুমেন্টকে এডিটযোগ্য টেক্সটে রূপান্তর করে। এটি কম্পিউটার-কম্পোজড, টাইপরাইটার এবং লেটারপ্রেস ডকুমেন্ট সাপোর্ট করে।

কথা:
একটি স্পিচ-টু-টেক্সট (STT) সিস্টেম যা মুখে বলা বাংলাকে টেক্সটে রূপান্তর করে।

উচ্চারণ:
একটি টেক্সট-টু-স্পিচ (TTS) ইঞ্জিন যা মানুষের মতো স্বাভাবিক স্বরে লিখিত টেক্সট পড়ে শোনায়।

Jiggasha.ai (জিজ্ঞাসা এআই):
একটি বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্ট্যান্ট, যা ৫০টিরও বেশি সরকারি অফিস সার্ভিসের সাথে যুক্ত।

উল্লেখ্য, এটুআই এর D-nothi (ডি-নথি) অ্যাপ্লিকেশনে স্পেল, ওসিআর এবং এসটিটি সার্ভিসগুলো এই প্ল্যাটফর্ম থেকে প্রদান করা হয়।


২. ডিজেবিলিটি, অ্যাক্সেসিবিলিটি এবং ইনক্লুশন

প্রতিবন্ধী এবং পিছিয়ে পড়া জনগোষ্ঠীর জন্য বিশেষ সফটওয়্যার তৈরি করা হয়েছে।

বাংলা স্ক্রিন রিডার “আলো”:
দৃষ্টিপ্রতিবন্ধীদের কম্পিউটার পরিচালনায় সাহায্য করে।

সাইন ল্যাংগুয়েজ রিকগনিশন সিস্টেম:
ইশারা ভাষাকে লিখিত টেক্সটে রূপান্তর করে।

টেক্সট-টু-সাইন পাপেট:
লিখিত টেক্সটকে অ্যানিমেটেড ইশারা ভাষায় রূপান্তর করে।

ব্রেইল কনভার্টার:
বাংলা টেক্সট এবং গাণিতিক চিহ্নকে ব্রেইল ফরম্যাটে রূপান্তর করে।


৩. নৃ-গোষ্ঠী ভাষা সংরক্ষণ

বিলুপ্তপ্রায় নৃ-গোষ্ঠী ভাষা সংরক্ষণের জন্য একটি প্ল্যাটফর্ম তৈরি করা হয়েছে।

multiling.cloud (মাল্টিলিংগুয়াল ক্লাউড):
বাংলাদেশের ৪০টিরও বেশি আদিবাসী ভাষার ডিজিটাল ভাণ্ডার। এতে ১৪টি বিপন্ন ভাষার (যেমন: রেংমিটচা এবং কোডা) ডাটা এবং ১২,০০০ মিনিটেরও বেশি অডিও সংরক্ষণ করা হয়েছে।


৪. ভাষাগত / লিংগুইস্টিক রিসোর্স অ্যান্ড রিসার্চ

বাংলা এআই-এর জন্য প্রয়োজনীয় বিগ ডাটা তৈরি করা হয়েছে।

বাংলাদেশ ন্যাশনাল করপাস (BDNC):
৩০০ কোটিরও বেশি শব্দ এবং ২০ হাজার ডিজিটাইজড বইয়ের সংগ্রহ, যা LLM ট্রেনিংয়ে ব্যবহৃত হবে।

ব্যানব্রেইন:
একটি ল্যাংগুয়েজ মডেল যা পরবর্তী শব্দ সাজেস্ট করা এবং প্যারাফ্রেজ শনাক্ত করতে সক্ষম।

ডিজিটাল লেক্সিকন:
প্রথম প্রযুক্তি-নির্ভর বাংলা অভিধান।

ইউনিভার্সাল কিবোর্ড – ইউবোর্ড:
কাস্টম লেআউট তৈরির প্ল্যাটফর্ম যা চাকমা, মারমা এবং ম্রো-এর মতো ক্ষুদ্র নৃ-গোষ্ঠীর ভাষা সমর্থন করে।

পূর্ণ এবং জুলাই ফন্ট:
অফিসিয়াল ব্যবহারের জন্য প্রফেশনাল ইউনিকোড ফন্ট।

আইপিএ কনভার্টার – ধ্বনি:
বাংলা টেক্সটকে ইন্টারন্যাশনাল ফোনেটিক অ্যালফাবেট (IPA)-এ রূপান্তর করে।

ইউনিকোড ও সিএলডিআর সমন্বয়:
বাংলা ভাষা ও স্থানীয় সংস্কৃতি যেমন বাংলা তারিখ, সময়, পরিমাপ এবং বর্ণমালা সঠিকভাবে প্রদর্শনের জন্য আন্তর্জাতিক স্ট্যান্ডার্ডের সাথে নিয়মিত সমন্বয় করা হয়।


এই সকল রিসোর্স বর্তমানে bangla.gov.bd এবং বিভিন্ন অ্যাপ স্টোর (যেমন: গুগল প্লেস্টোর, ক্রোম স্টোর) এবং Huggingface অ্যাকাউন্টে পাওয়া যাচ্ছে।

প্রযোজ্য সেবাগুলোর মাধ্যমে সাধারণ ব্যবহারকারীদের জন্য B2C মডেলে নিজেদের তৈরি অ্যাপ বিনামূল্যে ব্যবহার করা যায় এবং প্রতিষ্ঠানগুলোর জন্য B2B চ্যানেলের API এর মাধ্যমে মনিটাইজেশনের সুযোগ রয়েছে।

গবেষক, বিশ্ববিদ্যালয় এবং স্টার্টআপ প্রতিষ্ঠানগুলো কোলাবোরেশনের মাধ্যমে জিপিইউ ব্যবহার করে গবেষণা কার্যক্রম পরিচালনা করতে পারে।

এক্সেসিবিলিটি

স্ক্রিন রিডার ডাউনলোড করুন