গুগল কিভাবে কাজ করে?

গুগল কিভাবে কাজ করে

গুগলে একটি মাত্র শব্দ, কখনো বা একটি বাক্য লিখে সার্চ করি আমরা। মাত্র কয়েক ন্যানো সেকেন্ডে লক্ষ লক্ষ রেজাল্ট চলে আসে আমাদের সামনে। কি করে হয় এইসব? আপনার মনেও নিশ্চয়ই গুগল কিভাবে কাজ করে এই প্রশ্ন রয়েছে। নিশ্চয়ই জানতে চান, এত দ্রুত গুগল সকল প্রশ্নের উত্তর জানে কিভাবে!

এই কাজটি যদিও চোখের পলকে হয়ে যায়, এর পেছনের গল্পটা কিন্তু অনেক জটিল। প্রায় ৯৯ হাজার কর্মী রাত দিন কাজ করছে, আপনার আমার এত্তো এত্তো প্রশ্নের উত্তর দিতে। না না, ভয় পাবেন না। গুগল ম্যানুয়ালি কাজ করেনা। গুগলের পুরো কাজ সম্পন্ন হয় ৩টি জটিল প্রক্রিয়ার মাধ্যমে। চলুন গুগল কিভাবে কাজ করে তা জেনে আসি।

গুগল সার্চ ইঞ্জিন কিভাবে কাজ করে? – How does Google work in Bangla

সার্চ  ইঞ্জিন হিসেবে যেকোন প্রশ্নের উত্তর খুজে বের করার সাথে গুগলের তিনটি কাজ জড়িত। অর্থাৎ গুগল কিভাবে কাজ করে তা জানতে হলে প্রথমেই আমাদের যেকোন সার্চ ইঞ্জিনের তিনটি কৌশলের সাথে পরিচিত হতে হবে-

  1. ওয়েব ক্রলিং (web crawling)
  2. ওয়েব ইনডেক্সিং (web indexing) এবং
  3. পেইজ রেঙ্ক (page rank) এবং সার্চ রেজাল্ট

সার্চ ইঞ্জিন কীভাবে কাজ করেএই তিনটি বিষয় নিয়ে একটু বিস্তারিত জানা যাক।

১। ওয়েব ক্রলিং (web crawling)

ওয়েব ক্রলিং কে web spider ও বলা হয়। প্রতিদিন, প্রতি সেকেন্ডে অসংখ্য ওয়েবসাইট তৈরি হচ্ছে। নতুন নতুন অসংখ্য কন্টেন্ট পাবলিশ হচ্ছে। এতো এতো কন্টেন্ট এবং ওয়েবসাইটের মধ্যে, কোনটি আপনি সার্চ করছেন, তা কিন্তু গুগল তৎক্ষণাৎ বের করেনা।

নতুন ওয়েবসাইট তৈরি করার পর, সেটিকে গুগলের কনসোল সাইটে এন্ট্রি দিতে হয়। আপনি যদি একটি ওয়েবসাইট এর ওনার হয়ে থাকেন, আপনার সাইট টি ইউজার দের কাছে ভিজিবল হবে না। যদি না এটি গুগলের কনসোল সাইটে এন্ট্রি দেয়া হয়।

এবার আসি ক্রলিং এর ব্যাপারে। গুগলের একটি রোবট সফটওয়্যার রয়েছে, যার নাম গুগল বট। এই রোবট টি,  তার কনসোলে লিস্ট কৃত সকল ওয়েবসাইট স্ক্যান করে। বা ক্রলিং করতে থাকে।

Google Bot প্রথমে একটি ওয়েবসাইটের একটি লিঙ্কে প্রবেশ করে। এরপর সেখানে যতো link, hyperlink রয়েছে, সবগুলোতে ভিজিট করে। সাথে ক্রমাগত ক্রলিং এর কাজ চলতেই থাকে। এভাবে, ইন্টারনেটের সকল লিঙ্ক সংগ্রহ করে গুগল। এক্ষেত্রে, কিছু লিঙ্ক হয়তো রিপিট হতে থাকে। তখন রিপিট লিঙ্ক গুলোকে বাদ দিয়ে দেয়া হয়। তার মানে , একটি লিঙ্ক শুধু একবারই সংগ্রহ করে গুগল বট।

আবার, এই ক্রলিং এর কাজটি কিন্তু অনেকটা পেইজ রিফ্রেশ করার মত। অর্থ্যাৎ, একবার ক্রলিং করা শেষ হলে, কিছুক্ষন পর গুগল বট আবারো সবগুলো ওয়েবসাইটে ঘুরে আসে। নতুন কোনো কন্টেন্ট পাবলিশ হল কিনা, বা কোনো লিঙ্ক পরিবর্তন হলো কিনা, তা সবসময়ই মনিটর করা হচ্ছে।

ওয়েব ক্রলিং (web crawling) থেকে প্রাপ্ত লিঙ্ক গুলো এবার ইনডেক্সিং করার পালা।

২। ওয়েব ইনডেক্সিং (web indexing)

Index শব্দের অর্থ সূচিপত্র। অর্থ্যাৎ, ক্রলিং করে যেই লিঙ্ক গুলো সংগ্রহ করেছিলো, গুগল বট এবার সেগুলোকে সাজিয়ে রাখে। আমরা যখন কোনো কিছু সার্চ করি, গুগল তখন, এই ইনডেক্স থেকে রিলেটেড keyword খুঁজতে থাকে। এবং সেগুলোই রেজাল্ট হিসেবে শো করে। এই খুঁজে বের করাটাই হলো সার্চিং।

৩। পেইজ রেঙ্ক (page rank)

এবার আসি সবচেয়ে গুরুত্বপূর্ণ বিষয়ে। যেই অ্যালগরিদম এর মাধ্যমে, গুগল আজ সার্চ ইঞ্জিন হিসেবে এতটা সফলতা পেয়েছে, সেটি হল পেইজ রেঙ্ক (page rank).

গুগলের সার্চ বার এ কোনো শব্দ লিখে সার্চ করলে, অসংখ্য রেজাল্ট শো করে। এর মধ্যে কিছু রেজাল্ট একেবারে প্রথম পেইজে শো করে। কোনোটি আবার দ্বিতীয় বা তৃতীয় পেইজে। অনেক লিঙ্কে তো আমরা কখনো প্রবেশই করিনা। কারণ সেগুলো rank করেনা।

এই রেঙ্কিং শব্দটির সাথে তো সবারই পরিচিতি থাকার কথা। বিশেষ করে ব্লগার দের এই বিষয় নিয়ে অনেক বেশি ভাবতে হয়।

গুগল তার ইনডেক্স থেকে লিঙ্ক তো খুঁজে বের করলো। কিন্তু কোন লিঙ্কটি আপনাকে সবার আগে শো করবে? যেই লিঙ্কটি rank করবে। অর্থ্যাৎ, আমরা গুগলে তথ্য খুঁজি। এই তথ্য গুলো থাকে বিভিন্ন ওয়েবসাইটে পাবলিশ হওয়া কন্টেন্টের মধ্যে।

যেই কন্টেন্টে, আমাদের সার্চ করা ওয়ার্ডটি সম্পর্কে সবচেয়ে ভালোভাবে উত্তর দেওয়া হয়েছে, সবচেয়ে বেশি বার শেয়ার করা হয়েছে, যেটিতে ভিজিটর অনেক বেশি এবং সবচেয়ে বেশি সময় ধরে পড়া হবে, সেটির থাকবে ranking এর সবার প্রথমে। গুগল প্রায় ২০০টিরও বেশি বিষয়কে র্যাঙ্কিং ফ্যাক্টর হিসেবে ধরে থাকে।

যেমন, আমার এই কন্টেন্ট টি গুগল সম্পর্কিত। এখন, কেউ যদি, গুগল সম্পর্কে জানতে আগ্রহী হয়, তিনি নিশ্চয়ই “what is google” বা “গুগল কি“, এটি লিখেই সার্চ করবেন। এই আর্টিকেলে যদি গুগল’ শব্দটি, অন্য লিঙ্ক গুলোর তুলনায় বেশি থাকে তবে এটি rank করবে । আবার, আমার আর্টিকেল থেকে যদি অনেক মানুষ, তার প্রয়োজনীয় সকল তথ্য পেয়ে যান, তাহলে পুরো লেখাটিই তারা পড়বেন। সেক্ষেত্রে, এই লিঙ্কের view time বেশি হবে। তাহলে এই লিঙ্কটি ranking এ প্রথম পেইজে থাকবে।

কিন্তু, এই ranking এর বিষয় টি আসলে আরো জটিল। কখনো কখনো rank করার সকল শর্ত পূরণ হলেও, অনেক সাইট rank করেনা। কারণ গুগলের আসল raking algorithm কখনো প্রকাশ করা হয় না। তাই, গুগলের আরো কি কি শর্ত রয়েছে, তা আমরা জানতে পারিনা।

গুগল কিভাবে কাজ করে তা না হয় জানলাম, এখন প্রশ্ন হল, এই এত এত তথ্য রাখা হয় কোথায়? এর উত্তর আসলে খুব সহজে। গুগলের ডেটা সেন্টারে। পুরো বিশ্বজুড়ে গুগলের ৩২ টির ও বেশি ডেটা সেন্টার রয়েছে। শুধুমাত্র আমেরিকায় ই রয়েছে ১২ টি। এই প্রতিটি ডেটা সেন্টারের আবার হাজার হাজার সার্ভার রয়েছে। একেকটি ডেটা সেন্টার ৪৭০ এক্সাবাইট তথ্য সংরক্ষণ করতে পারে।

গুগল কিভাবে কাজ করে বিষয়ে শেষ কথা

আশা করি এখন গুগল কিভাবে কাজ করে তা আপনি ভালোভাবে বুঝতে পেরেছেন। সহজ ভাষায় বললে গুগল প্রথমে কোন নতুন জিনিসকে দেখার পর বিশেষজ্ঞ টিমের কাছে পাঠায়, বিশেষজ্ঞ টিম এটি পর্যবেক্ষণ করে কোন বিভাগের আওতাধীন তা ঠিক করে। এরপর নির্দিষ্ট বিভাগের কত নাম্বার পজিশনে আসবে তা ঠিক করে।

Leave a Comment

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না।

error: Content is protected !!