ডেটা বা ডাটা কি?
এইযে আপনি সারাদিন কি কি করলেন। একটু ভাবুন তো! সকালে ঘুম থেকে উঠলেন, তারপর ফ্রেস হইলেন, তারপর সকালের নাস্তা খাইলেন। তারপর আরো কত কি করলেন। ফেসবুক, ইউটিউব. গুগল, ফোনকল ইত্যাদি আরো কত কি। আর এইগুলো সবই হলো ডেটা বা ডাটা। কোনটা আপনার মস্তিষ্কে সংরক্ষিত হয় আবার কোনটা মেমোরিতে সংরক্ষিত হয়। পার্থক্য শুধু এটাই।
তাহলে কি বুঝলেন – ডাটা হলো এক ধরনের উপাত্ত। যার অর্থ ইংরেজীতে বুঝায় (Value).
সুতরাং ডাটা কি – এমন কিছু এক ধরনের উপাত্ত যা প্রসেস করে কম্পিউটার প্রোগ্রাম। এবং এই প্রসেসের ফলাফল হিসেবে আপনাকে কিছু তথ্য বা ইনফরমেশন দিবে।
সহজ ভাষায় আমরা আসলে যা বুঝি তা হলো – কোন ফাইল, যেমন সেটা অডিও, ভিডিও, টেক্সটস, কিংবা অন্য কোন প্রকার উপাত্তকে। সতরাং বলা যায় কম্পিউটার, সফটওয়্যার বা হার্ডওয়্যার – আমরা যা কিছুই ব্যবহার করি না কেনো সব কিছুই মুলত কিছু ডাটার সমন্বয়।
এর আগের পোষ্টে আমরা ডাটাবেজ ম্যানেজমেন্ট সিস্টেম বই pdf শেয়ার করেছিলাম। দেখে নিতে পারেন।
এবার আসেন আলোচনা করি ডাটা কয় ধরনের হয়।
ডাটার ধরন মোট ৩টি হতে পারে।
- ১. নিউনিউমেরিক ডাটা (Numeric Data)
- ২. বুলিয়ান ডাটা (Boolean Data)
- ৩. নন-নিউমেরিক ডাটা (Non-Numeric Data)
৩টি ধরন সম্পর্কে আলোচনা করা যাক।
১. নিউমেরিক ডাটা কি
নিউমেরিক ডাটা হচ্ছে সেকল ডাটা যা শুধু মাত্র সংখ্যা দিয়ে প্রকাশ করা হয়। যেমনঃ ১, ৪০০, ২৫, ৫০০ ইত্যাদি। কোন প্রোগ্রাম লিখতে গিয়ে যখন আপনি কোন সংখ্যা ইনপুট করেন, তখন সেটা হয় নিউমেরিক ডাটা।
২। বুলিয়ান ডাটা কি
বুলিয়ান ডাটা টাইপকে অনেক ক্ষেত্রে বলা হয় লজিক্যাল ডাটা টাইপ। কারণ এই ডাটা সাধারণত True কিংবা False এই দুইটা ফর্মে থাকে।
৩। নন-নিউমেরিক ডাটা কি
নন-নিউমেরিক ডাটা হচ্ছে সেসব ডাটা যাদের আমরা চাইলে ও কোন সংখ্যা দিয়ে প্রকাশ করতে পারবো না। আমরা যখন কোন জিনিসের পরিমান, সংখ্যা ইত্যাদি প্রকাশ করি তখন আমরা নিউমেরিক ডাটা ব্যবহার করি। আবার কিন্তু যখন কোন বস্তুর কোয়ালিটি, দোষ, গুন, ভাবভঙ্গিমা কিংবা অভিব্যক্তি প্রকাশ করতে হয় তখন সেটা করা হয় শুধু মাত্র নন-নিউমেরিক ডাটা ব্যবহার করেই সম্ভব।
তাহলে ডাটার ধরন ৩টি বুঝতে পারলে আশা করি আপনি কয়েক ধাপ এগিয়ে গিয়েছেন।
এবার কিছু বৈশিষ্ট নিয়ে আলোচনা করি।
১) ডাটা অনেক বিশাল পরিমাণে হতে পারে – আর তাই এসব ডাটা অ্যানালাইসিসের জন্য আমাদের ডাটাবেজ ম্যানেজমেন্ট সিস্টেম সম্পর্কে বিস্তর ধারনা রাখতে হবে।
২) হাই ডাইমেনশনালিটি – এ ধরনের ডাটা প্রকৃতপক্ষে হাজার হাজার ডাইমেনশন সম্পন্ন হয়ে থাকে।
৩) খুব জটিল প্রকৃতির – যেমন সেন্সর ডাটা, বিভিন্ন ডাটা স্ট্রিম, টাইম সিরিজ ডাটা, টেম্পরাল ডাটা, সিকোয়েন্স ডাটা ইত্যাদি ধরনের হয়ে থাকে। এবং মাল্টিমিডিয়া ডাটা, টেক্সট বা ওয়েব ডাটা ইত্যাদি ডেটা গুলো খুব জটিল প্রকৃতির হয়ে থাকে।
একটি মজার তথ্য দেই –
ইন্টারনেট যেদিন থেকে তৈরি হলো এবং সর্বপ্রথম যার দ্বারা ইন্টারনেট ধারনাটি আমাদের সকলের মাঝে বিকাশ ঘটলো, সেদিন থেকেই এই ডেটা আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে। তাছাড়া মানবজাতির সকল সংগ্রহীত ডাটার পরিমাণ কেমন হতে পারে? কল্পনা করুন তো? আমি নিশ্চিত যে হুবহু বলতে পারবেন না।
তাহলে আন্দাজ করে বলুন। যদি ২০০৩ সাল পর্যন্ত হিসেব করা হয় তাহলে আমাদের জমাকৃত ডাটার পরিমাণ হবে প্রায় ৫ বিলিয়ন গিগাবাইট। বর্তমানে ইন্টারনেট এবং বিভিন্ন সোশ্যাল মিডিয়ার বদৌলতে প্রতিদিন ডাটার পরিমাণ না হয় আর হিসেব করি। আর হিসেব করলে আপনার মাথা ঘুরে যেতে পারে।
প্রতিদিন যে কত পরিমানে ডাটা আদান-প্রদান বা আপলোড হইতেছে তা আন্দাজ করলে আগের তুলনায় কয়েকগুণ করে বৃদ্ধি পাচ্ছে।