গুগল কিভাবে কাজ করে | How google search works

গুগল কিভাবে কাজ করে

গুগল কিভাবে কাজ করে : গুগলে একটি মাত্র শব্দ, কখনো বা একটি বাক্য লিখে সার্চ করি আমরা। মাত্র কয়েক ন্যানো সেকেন্ডে লক্ষ লক্ষ রেজাল্ট চলে আসে আমাদের সামনে। কি করে google search Result দেখায়? আপনার মনেও নিশ্চয়ই গুগল কিভাবে কাজ করে এই প্রশ্ন রয়েছে। নিশ্চয়ই জানতে চান, এত দ্রুত গুগল সকল প্রশ্নের উত্তর জানে কিভাবে!

গুগল সার্চ রেজাল্ট যদিও চোখের পলকে চলে আসে, তব পেছনের গল্পটা কিন্তু অনেক জটিল। প্রায় ৯৯ হাজার কর্মী রাত দিন উন্নত সার্চ রেজাল্ট দেওয়ার জন্য গুগলের হয়ে কাজ করছে। তবে গুগল কিন্তু ম্যানুয়ালি কাজ করেনা। গুগল সার্চ রেজাল্ট দেখাতে পুরো কাজ সম্পন্ন হয় ৩টি জটিল প্রক্রিয়ার মাধ্যমে। চলুন গুগল যেভাবে কাজ করে সেই তিনটি ধাপ সম্পর্কে জেনে আসি।

গুগল কিভাবে কাজ করে | How google search works

সার্চ  ইঞ্জিন হিসেবে যেকোন প্রশ্নের উত্তর খুজে বের করার সাথে গুগলের তিনটি কাজ জড়িত। অর্থাৎ, গুগল কিভাবে কাজ করে তা জানতে হলে প্রথমেই আমাদের যেকোন সার্চ ইঞ্জিনের তিনটি কৌশলের সাথে পরিচিত হতে হবে-

  1. ওয়েব ক্রলিং (web crawling)
  2. ওয়েব ইনডেক্সিং (web indexing) এবং
  3. পেইজ রেঙ্ক (page rank) এবং সার্চ রেজাল্ট

সার্চ ইঞ্জিন কীভাবে কাজ করেএই তিনটি বিষয় নিয়ে একটু বিস্তারিত জানা যাক।

১। ওয়েব ক্রলিং (web crawling)

ওয়েব ক্রলিং কে web spider ও বলা হয়। প্রতিদিন, প্রতি সেকেন্ডে অসংখ্য ওয়েবসাইট তৈরি হচ্ছে। নতুন নতুন অসংখ্য কন্টেন্ট পাবলিশ হচ্ছে। এতো এতো কন্টেন্ট এবং ওয়েবসাইটের মধ্যে, কোনটি আপনি সার্চ করছেন, তা কিন্তু গুগল তৎক্ষণাৎ বের করেনা।

আরো পড়ুন:  গুগলে ব্লগ র‍্যাঙ্ক করার উপায় - কার্যকরী ৬ পদ্ধতি

নতুন ওয়েবসাইট তৈরি করার পর, সেটিকে গুগলের কনসোল সাইটে এন্ট্রি দিতে হয়। আপনি যদি একটি ওয়েবসাইট এর ওনার হয়ে থাকেন, আপনার সাইট টি ইউজার দের কাছে ভিজিবল হবে না। যদি না এটি গুগলের কনসোল সাইটে এন্ট্রি দেয়া হয়।

এবার আসি ক্রলিং এর ব্যাপারে। গুগলের একটি রোবট সফটওয়্যার রয়েছে, যার নাম গুগল বট। এই রোবট টি,  তার কনসোলে লিস্ট কৃত সকল ওয়েবসাইট স্ক্যান করে। বা ক্রলিং করতে থাকে।

Google Bot প্রথমে একটি ওয়েবসাইটের একটি লিঙ্কে প্রবেশ করে। এরপর সেখানে যতো link, hyperlink রয়েছে, সবগুলোতে ভিজিট করে। সাথে ক্রমাগত ক্রলিং এর কাজ চলতেই থাকে। এভাবে, ইন্টারনেটের সকল লিঙ্ক সংগ্রহ করে গুগল। এক্ষেত্রে, কিছু লিঙ্ক হয়তো রিপিট হতে থাকে। তখন রিপিট লিঙ্ক গুলোকে বাদ দিয়ে দেয়া হয়। তার মানে , একটি লিঙ্ক শুধু একবারই সংগ্রহ করে গুগল বট।

আবার, এই ক্রলিং এর কাজটি কিন্তু অনেকটা পেইজ রিফ্রেশ করার মত। অর্থ্যাৎ, একবার ক্রলিং করা শেষ হলে, কিছুক্ষন পর গুগল বট আবারো সবগুলো ওয়েবসাইটে ঘুরে আসে। নতুন কোনো কন্টেন্ট পাবলিশ হল কিনা, বা কোনো লিঙ্ক পরিবর্তন হলো কিনা, তা সবসময়ই মনিটর করা হচ্ছে।

ওয়েব ক্রলিং (web crawling) থেকে প্রাপ্ত লিঙ্ক গুলো এবার ইনডেক্সিং করার পালা।

২। ওয়েব ইনডেক্সিং (web indexing)

Index শব্দের অর্থ সূচিপত্র। অর্থ্যাৎ, ক্রলিং করে যেই লিঙ্ক গুলো সংগ্রহ করেছিলো, গুগল বট এবার সেগুলোকে সাজিয়ে রাখে। আমরা যখন কোনো কিছু সার্চ করি, গুগল তখন, এই ইনডেক্স থেকে রিলেটেড keyword খুঁজতে থাকে। এবং সেগুলোই রেজাল্ট হিসেবে শো করে। এই খুঁজে বের করাটাই হলো সার্চিং।

৩। পেইজ রেঙ্ক (page rank)

এবার আসি সবচেয়ে গুরুত্বপূর্ণ বিষয়ে। যেই অ্যালগরিদম এর মাধ্যমে, গুগল আজ সার্চ ইঞ্জিন হিসেবে এতটা সফলতা পেয়েছে, সেটি হল পেইজ রেঙ্ক (page rank).

আরো পড়ুন:  গুগল একাউন্ট খোলার নিয়ম | How to create Google Account

গুগলের সার্চ বার এ কোনো শব্দ লিখে সার্চ করলে, অসংখ্য রেজাল্ট শো করে। এর মধ্যে কিছু রেজাল্ট একেবারে প্রথম পেইজে শো করে। কোনোটি আবার দ্বিতীয় বা তৃতীয় পেইজে। অনেক লিঙ্কে তো আমরা কখনো প্রবেশই করিনা। কারণ সেগুলো rank করেনা।

এই রেঙ্কিং শব্দটির সাথে তো সবারই পরিচিতি থাকার কথা। বিশেষ করে ব্লগার দের এই বিষয় নিয়ে অনেক বেশি ভাবতে হয়।

গুগল তার ইনডেক্স থেকে লিঙ্ক তো খুঁজে বের করলো। কিন্তু কোন লিঙ্কটি আপনাকে সবার আগে শো করবে? যেই লিঙ্কটি rank করবে। অর্থ্যাৎ, আমরা গুগলে তথ্য খুঁজি। এই তথ্য গুলো থাকে বিভিন্ন ওয়েবসাইটে পাবলিশ হওয়া কন্টেন্টের মধ্যে।

যেই কন্টেন্টে, আমাদের সার্চ করা ওয়ার্ডটি সম্পর্কে সবচেয়ে ভালোভাবে উত্তর দেওয়া হয়েছে, সবচেয়ে বেশি বার শেয়ার করা হয়েছে, যেটিতে ভিজিটর অনেক বেশি এবং সবচেয়ে বেশি সময় ধরে পড়া হবে, সেটির থাকবে ranking এর সবার প্রথমে। গুগল প্রায় ২০০টিরও বেশি বিষয়কে র্যাঙ্কিং ফ্যাক্টর হিসেবে ধরে থাকে।

যেমন, আমার এই কন্টেন্ট টি গুগল সম্পর্কিত। এখন, কেউ যদি, গুগল সম্পর্কে জানতে আগ্রহী হয়, তিনি নিশ্চয়ই “what is google” বা “গুগল কি“, এটি লিখেই সার্চ করবেন। এই আর্টিকেলে যদি গুগল’ শব্দটি, অন্য লিঙ্ক গুলোর তুলনায় বেশি থাকে তবে এটি rank করবে । আবার, আমার আর্টিকেল থেকে যদি অনেক মানুষ, তার প্রয়োজনীয় সকল তথ্য পেয়ে যান, তাহলে পুরো লেখাটিই তারা পড়বেন। সেক্ষেত্রে, এই লিঙ্কের view time বেশি হবে। তাহলে এই লিঙ্কটি ranking এ প্রথম পেইজে থাকবে।

কিন্তু, এই ranking এর বিষয় টি আসলে আরো জটিল। কখনো কখনো rank করার সকল শর্ত পূরণ হলেও, অনেক সাইট rank করেনা। কারণ গুগলের আসল raking algorithm কখনো প্রকাশ করা হয় না। তাই, গুগলের আরো কি কি শর্ত রয়েছে, তা আমরা জানতে পারিনা।

আরো পড়ুন:  সার্চ ইঞ্জিন কি? Search Engine কীভাবে কাজ করে?

গুগল কিভাবে কাজ করে তা না হয় জানলাম, এখন প্রশ্ন হল, এই এত এত তথ্য রাখা হয় কোথায়? এর উত্তর আসলে খুব সহজে। গুগলের ডেটা সেন্টারে। পুরো বিশ্বজুড়ে গুগলের ৩২ টির ও বেশি ডেটা সেন্টার রয়েছে। শুধুমাত্র আমেরিকায় ই রয়েছে ১২ টি। এই প্রতিটি ডেটা সেন্টারের আবার হাজার হাজার সার্ভার রয়েছে। একেকটি ডেটা সেন্টার ৪৭০ এক্সাবাইট তথ্য সংরক্ষণ করতে পারে।

গুগল কিভাবে কাজ করে বিষয়ে শেষ কথা

আশা করি এখন গুগল কিভাবে কাজ করে তা আপনি ভালোভাবে বুঝতে পেরেছেন। সহজ ভাষায় বললে গুগল প্রথমে কোন নতুন জিনিসকে দেখার পর (ক্রাউলিং) বিশেষজ্ঞ টিমের কাছে পাঠায়, বিশেষজ্ঞ টিম (ইনডেক্সিং) এটি পর্যবেক্ষণ করে কোন বিভাগের আওতাধীন তা ঠিক করে। এরপর নির্দিষ্ট বিভাগের কত নাম্বার পজিশনে (র‌্যাংকিং) আসবে তা ঠিক করে।

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top