গুগল কিভাবে কাজ করে | How google search works

গুগল কিভাবে কাজ করে

গুগল কিভাবে কাজ করে : গুগলে একটি মাত্র শব্দ, কখনো বা একটি বাক্য লিখে সার্চ করি আমরা। মাত্র কয়েক ন্যানো সেকেন্ডে লক্ষ লক্ষ রেজাল্ট চলে আসে আমাদের সামনে। কি করে google search Result দেখায়? আপনার মনেও নিশ্চয়ই গুগল কিভাবে কাজ করে এই প্রশ্ন রয়েছে। নিশ্চয়ই জানতে চান, এত দ্রুত গুগল সকল প্রশ্নের উত্তর জানে কিভাবে!

গুগল সার্চ রেজাল্ট যদিও চোখের পলকে চলে আসে, তব পেছনের গল্পটা কিন্তু অনেক জটিল। প্রায় ৯৯ হাজার কর্মী রাত দিন উন্নত সার্চ রেজাল্ট দেওয়ার জন্য গুগলের হয়ে কাজ করছে। তবে গুগল কিন্তু ম্যানুয়ালি কাজ করেনা। গুগল সার্চ রেজাল্ট দেখাতে পুরো কাজ সম্পন্ন হয় ৩টি জটিল প্রক্রিয়ার মাধ্যমে। চলুন গুগল যেভাবে কাজ করে সেই তিনটি ধাপ সম্পর্কে জেনে আসি।

গুগল কিভাবে কাজ করে | How google search works

সার্চ  ইঞ্জিন হিসেবে যেকোন প্রশ্নের উত্তর খুজে বের করার সাথে গুগলের তিনটি কাজ জড়িত। অর্থাৎ, গুগল কিভাবে কাজ করে তা জানতে হলে প্রথমেই আমাদের যেকোন সার্চ ইঞ্জিনের তিনটি কৌশলের সাথে পরিচিত হতে হবে-

  1. ওয়েব ক্রলিং (web crawling)
  2. ওয়েব ইনডেক্সিং (web indexing) এবং
  3. পেইজ রেঙ্ক (page rank) এবং সার্চ রেজাল্ট

সার্চ ইঞ্জিন কীভাবে কাজ করেএই তিনটি বিষয় নিয়ে একটু বিস্তারিত জানা যাক।

১। ওয়েব ক্রলিং (web crawling)

ওয়েব ক্রলিং কে web spider ও বলা হয়। প্রতিদিন, প্রতি সেকেন্ডে অসংখ্য ওয়েবসাইট তৈরি হচ্ছে। নতুন নতুন অসংখ্য কন্টেন্ট পাবলিশ হচ্ছে। এতো এতো কন্টেন্ট এবং ওয়েবসাইটের মধ্যে, কোনটি আপনি সার্চ করছেন, তা কিন্তু গুগল তৎক্ষণাৎ বের করেনা।

Related:  সার্চ ইঞ্জিন কি? Search Engine কীভাবে কাজ করে?

নতুন ওয়েবসাইট তৈরি করার পর, সেটিকে গুগলের কনসোল সাইটে এন্ট্রি দিতে হয়। আপনি যদি একটি ওয়েবসাইট এর ওনার হয়ে থাকেন, আপনার সাইট টি ইউজার দের কাছে ভিজিবল হবে না। যদি না এটি গুগলের কনসোল সাইটে এন্ট্রি দেয়া হয়।

এবার আসি ক্রলিং এর ব্যাপারে। গুগলের একটি রোবট সফটওয়্যার রয়েছে, যার নাম গুগল বট। এই রোবট টি,  তার কনসোলে লিস্ট কৃত সকল ওয়েবসাইট স্ক্যান করে। বা ক্রলিং করতে থাকে।

Google Bot প্রথমে একটি ওয়েবসাইটের একটি লিঙ্কে প্রবেশ করে। এরপর সেখানে যতো link, hyperlink রয়েছে, সবগুলোতে ভিজিট করে। সাথে ক্রমাগত ক্রলিং এর কাজ চলতেই থাকে। এভাবে, ইন্টারনেটের সকল লিঙ্ক সংগ্রহ করে গুগল। এক্ষেত্রে, কিছু লিঙ্ক হয়তো রিপিট হতে থাকে। তখন রিপিট লিঙ্ক গুলোকে বাদ দিয়ে দেয়া হয়। তার মানে , একটি লিঙ্ক শুধু একবারই সংগ্রহ করে গুগল বট।

আবার, এই ক্রলিং এর কাজটি কিন্তু অনেকটা পেইজ রিফ্রেশ করার মত। অর্থ্যাৎ, একবার ক্রলিং করা শেষ হলে, কিছুক্ষন পর গুগল বট আবারো সবগুলো ওয়েবসাইটে ঘুরে আসে। নতুন কোনো কন্টেন্ট পাবলিশ হল কিনা, বা কোনো লিঙ্ক পরিবর্তন হলো কিনা, তা সবসময়ই মনিটর করা হচ্ছে।

ওয়েব ক্রলিং (web crawling) থেকে প্রাপ্ত লিঙ্ক গুলো এবার ইনডেক্সিং করার পালা।

২। ওয়েব ইনডেক্সিং (web indexing)

Index শব্দের অর্থ সূচিপত্র। অর্থ্যাৎ, ক্রলিং করে যেই লিঙ্ক গুলো সংগ্রহ করেছিলো, গুগল বট এবার সেগুলোকে সাজিয়ে রাখে। আমরা যখন কোনো কিছু সার্চ করি, গুগল তখন, এই ইনডেক্স থেকে রিলেটেড keyword খুঁজতে থাকে। এবং সেগুলোই রেজাল্ট হিসেবে শো করে। এই খুঁজে বের করাটাই হলো সার্চিং।

৩। পেইজ রেঙ্ক (page rank)

এবার আসি সবচেয়ে গুরুত্বপূর্ণ বিষয়ে। যেই অ্যালগরিদম এর মাধ্যমে, গুগল আজ সার্চ ইঞ্জিন হিসেবে এতটা সফলতা পেয়েছে, সেটি হল পেইজ রেঙ্ক (page rank).

Related:  গুগলে ব্লগ র‍্যাঙ্ক করার উপায় - কার্যকরী ৬ পদ্ধতি

গুগলের সার্চ বার এ কোনো শব্দ লিখে সার্চ করলে, অসংখ্য রেজাল্ট শো করে। এর মধ্যে কিছু রেজাল্ট একেবারে প্রথম পেইজে শো করে। কোনোটি আবার দ্বিতীয় বা তৃতীয় পেইজে। অনেক লিঙ্কে তো আমরা কখনো প্রবেশই করিনা। কারণ সেগুলো rank করেনা।

এই রেঙ্কিং শব্দটির সাথে তো সবারই পরিচিতি থাকার কথা। বিশেষ করে ব্লগার দের এই বিষয় নিয়ে অনেক বেশি ভাবতে হয়।

গুগল তার ইনডেক্স থেকে লিঙ্ক তো খুঁজে বের করলো। কিন্তু কোন লিঙ্কটি আপনাকে সবার আগে শো করবে? যেই লিঙ্কটি rank করবে। অর্থ্যাৎ, আমরা গুগলে তথ্য খুঁজি। এই তথ্য গুলো থাকে বিভিন্ন ওয়েবসাইটে পাবলিশ হওয়া কন্টেন্টের মধ্যে।

যেই কন্টেন্টে, আমাদের সার্চ করা ওয়ার্ডটি সম্পর্কে সবচেয়ে ভালোভাবে উত্তর দেওয়া হয়েছে, সবচেয়ে বেশি বার শেয়ার করা হয়েছে, যেটিতে ভিজিটর অনেক বেশি এবং সবচেয়ে বেশি সময় ধরে পড়া হবে, সেটির থাকবে ranking এর সবার প্রথমে। গুগল প্রায় ২০০টিরও বেশি বিষয়কে র্যাঙ্কিং ফ্যাক্টর হিসেবে ধরে থাকে।

যেমন, আমার এই কন্টেন্ট টি গুগল সম্পর্কিত। এখন, কেউ যদি, গুগল সম্পর্কে জানতে আগ্রহী হয়, তিনি নিশ্চয়ই “what is google” বা “গুগল কি“, এটি লিখেই সার্চ করবেন। এই আর্টিকেলে যদি গুগল’ শব্দটি, অন্য লিঙ্ক গুলোর তুলনায় বেশি থাকে তবে এটি rank করবে । আবার, আমার আর্টিকেল থেকে যদি অনেক মানুষ, তার প্রয়োজনীয় সকল তথ্য পেয়ে যান, তাহলে পুরো লেখাটিই তারা পড়বেন। সেক্ষেত্রে, এই লিঙ্কের view time বেশি হবে। তাহলে এই লিঙ্কটি ranking এ প্রথম পেইজে থাকবে।

কিন্তু, এই ranking এর বিষয় টি আসলে আরো জটিল। কখনো কখনো rank করার সকল শর্ত পূরণ হলেও, অনেক সাইট rank করেনা। কারণ গুগলের আসল raking algorithm কখনো প্রকাশ করা হয় না। তাই, গুগলের আরো কি কি শর্ত রয়েছে, তা আমরা জানতে পারিনা।

Related:  গুগল একাউন্ট খোলার নিয়ম | How to create Google Account

গুগল কিভাবে কাজ করে তা না হয় জানলাম, এখন প্রশ্ন হল, এই এত এত তথ্য রাখা হয় কোথায়? এর উত্তর আসলে খুব সহজে। গুগলের ডেটা সেন্টারে। পুরো বিশ্বজুড়ে গুগলের ৩২ টির ও বেশি ডেটা সেন্টার রয়েছে। শুধুমাত্র আমেরিকায় ই রয়েছে ১২ টি। এই প্রতিটি ডেটা সেন্টারের আবার হাজার হাজার সার্ভার রয়েছে। একেকটি ডেটা সেন্টার ৪৭০ এক্সাবাইট তথ্য সংরক্ষণ করতে পারে।

গুগল কিভাবে কাজ করে বিষয়ে শেষ কথা

আশা করি এখন গুগল কিভাবে কাজ করে তা আপনি ভালোভাবে বুঝতে পেরেছেন। সহজ ভাষায় বললে গুগল প্রথমে কোন নতুন জিনিসকে দেখার পর (ক্রাউলিং) বিশেষজ্ঞ টিমের কাছে পাঠায়, বিশেষজ্ঞ টিম (ইনডেক্সিং) এটি পর্যবেক্ষণ করে কোন বিভাগের আওতাধীন তা ঠিক করে। এরপর নির্দিষ্ট বিভাগের কত নাম্বার পজিশনে (র‌্যাংকিং) আসবে তা ঠিক করে।

Leave a Comment

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।