Thursday, 14 March 2019

सर्च इंजन क्या है? कितने प्रकार के होते हैं? यह कैसे काम करता है?



What is search engine in Hindi

हम अपने मोबाइल से या कंप्यूटर से गूगल पर हर रोज कुछ न कुछ सर्च करते हैं। आज भी आपने कुछ न कुछ  जरुर सर्च किया होगा।

आज सर्च इंजन हमारी रोजमर्रा की जिंदगी का एक हिस्सा बन गयीं हैं। अब वो समय चला गया जब लोग सिर्फ पढाई करने के लिए गूगल पर जाते थे, आज लोग अपनी हर छोटी-बड़ी समस्याओं का समाधान सबसे पहले गूगल पर ढूंढते हैं।

आज किसी मूवी की रेटिंग देखनी हो, कोई रेसिपी बनाने की विधि देखनी हो, अपने आसपास होटल ढूँढना हो या हमें किसी भी चीज की जानकारी चाहिए हो तो हम सीधा गूगल पर टाइप कर देते हैं और सारी जानकारियाँ हमें मिल जाती हैं।

लेकिन क्या आपने कभी यह सोचा है की आखिर गूगल काम कैसे करता है? एक सर्च इंजन कैसे काम करता है?

इन्टरनेट पर अरबों की संख्या में जानकारियाँ भरी पड़ी हैं, लेकिन इन सब के बीच में से सिर्फ वही जानकारियाँ हमें दिखाई देती हैं जो हम खोज रहे होते हैं।

आखिर ये सब होता कैसे है?

इसे समझने के लिए आपको सर्च इंजन के काम करने का तरीका जानना होगा। और इसके लिए आप यह आर्टिकल शुरू से अंत तक जरुर पढ़ें।


सर्च इंजन क्या है? What is Search Engine in Hindi? Search engine एक प्रकार का प्रोग्राम है जो की वर्ल्ड वाइड वेब पर मौजूद जानकारियों को keywords के जरिये ढूँढने में users की मदद करता है।

जब भी यूजर कोई कीवर्ड या सवाल सर्च बॉक्स में enter करके submit बटन पर क्लिक करता है तो सर्च इंजन यह समझने की कोशिश करता है की यूजर क्या ढूंढना चाहता है, और वह उससे जुडी जानकारियों को खोजकर व्यवस्थित तरीके से Search Engine Result Page (SERP) पर दिखाता है।

एक वेब सर्च इंजन के पास automatic programs होते हैं जो की इन्टरनेट पर मौजूद websites और webpages पर जाकर लगातार जानकारियाँ इक्कठा करते रहते हैं।

उसके बाद उन web pages की जानकारियों को व्यवस्थित तरीके से अपने डेटाबेस में स्टोर रखता है ताकि जब जरुरत पड़े तो आसानी से ढूंढा जा सके।

अपने यूजर को सही और एकदम सटीक जानकारी देना किसी भी सर्च इंजन की पहली प्राथमिकता होती है।

सर्च इंजन कैसे काम करता है? How Search Engine Works in Hindi सर्च इंजन कई प्रकार के होते हैं और हर सर्च इंजन के काम करने का तरीका अलग-अलग होता है। हर search engine का अपना एक सीक्रेट mathematical formula होता है जिसे algorithm कहा जाता है।

यही algorithm तय करता है की सर्च करने पर कौनसी वेबसाइट सबसे पहले और बाद में आने वाली है यानि result page पर किसी वेबसाइट की रैंकिंग कितनी होगी यह अल्गोरिथम से ही तय होता है।

हालांकि गूगल, याहू जैसे सर्च इंजन द्वारा लोगों को अपनी वेबसाइट की रैंकिंग बढाने के लिए टिप्स तो दिए तो जाते हैं लेकिन उनके alogrithms के बारे में पूरी जानकारी नही दी जाती ताकि कोई उसका गलत तरीके से उपयोग न कर सके।

सर्च इंजन का मुख्य काम अलग-अलग web pages पर जाकर जानकारियों को खोजना, उन्हें organize करना और content की quality के अनुसार ranking करना होता है।

एक crawler-based search engine जैसे Google, Yahoo, Bing आदि को 3 steps follow करने होते हैं:
  1. Crawling
  2. Indexing 
  3. Ranking

Crawling:
यह सबसे पहला चरण होता है, इसमें कुछ automatic programs जिसे crawler, bot या spider कहा जाता है ये वर्ल्ड वाइड वेब पर घूम-घूम कर information collect करते रहते हैं।

ये क्रॉलर हर सेकंड में सैकड़ों website के pages को scan करता है यह पेज में उपलब्ध किसी भी लिंक के जरिये दुसरे पेज तक पहुँच जाता है और ऐसे ही यह लगातार पूरे इन्टरनेट पर घूमता रहता है। 

किसी भी वेबसाइट में घुसने पर ये crawler वहां उपलब्ध कई तरह की जानकारियों को एकत्रित करते हैं जैसे:
  • Page का title और description
  • पेज में कौन-कौन से keywords use किये गये हैं।
  • Images और videos हैं या नही।
  • Website में कितने pages हैं।
  • कौन कौन से links हैं।
  • Page को कब update किया गया है।
  • कौन-कौन से पेज को delete किया गया है आदि।
किसी पेज को दोबारा कब crawl किया जायेगा यह search engine के algorithm और rules द्वारा तय होता है।

Indexing:
Crawling केवल जानकारियों को collect करने का एक प्रोसेस था। अब इसके बाद बारी आती है indexing की।

इस step में crawl किये गये जानकारियों को सही क्रम में व्यवस्थित करके सर्च इंजन के डेटाबेस में store किया जाता है ताकि सर्च किये जाने पर जल्दी से इन information को process करके user को दिखाया जा सके।

इसे आप किसी किताब के index page से तुलना कर सकते हैं। जिस प्रकार यदि हमें किसी book के अंदर कोई specific topic ढूंढनी हो तो हम सबसे पहले index पर जा कर पता करते हैं की वह कौन से पेज पर है।

गूगल भी ठीक इसी तरह का एक इंडेक्स तैयार करता है जिसमे एक टेबल के फॉर्मेट में सभी web pages की जानकारी जैसे पेज का title, descripting, keywords, internal links, external links आदि को store करता है।

Ranking:
यह तीसरा और सबसे आखरी स्टेप है। इस स्टेप में यह decide होता है की कौन सी query या keyword search करने पर Search Engine Result Page (SERP) में कौन-कौन से और किस क्रम में pages दिखाई देंगे।

ये सारे काम search engine के ranking algorithm के द्वारा होता है जो की बहुत ही complex mathematical formula से बना होता है जिसे समझ पाना काफी कठिन है।

आखिर सर्च इंजन का ranking algorithm कैसे काम करता है? जैसा की मैंने ऊपर बताया की इसे समझना काफी मुश्किल काम है, मुश्किल इसलिए क्योंकि कोई भी सर्च इंजन अपने एल्गोरिथम के बारे में पूरी जानकारी नही देता और कई सारी चीजों को गोपनीय रखा जाता है।

Google अपने SERP में किसी वेबसाइट की रैंकिंग को निर्धारित करने के लिए 200 से भी अधिक rules का पालन करता है। लेकिन किसी को भी निश्चित तौर पर यह नही पता की वे rules क्या-क्या हैं। इसे हमेशा secret रखा जाता है।

किसी भी रैंकिंग एल्गोरिथम का मुख्य काम pages को उनकी quality content के अनुसार रैंक करना होता है। ताकि उपयोगकर्ताओं को सही और सटीक information provide किया जा सके।

सही तरीके से रैंकिंग करने के लिए गूगल को अपने algorithm को समय-समय पर update करना पड़ता है।

हर साल गूगल अपने एल्गोरिथम में 500 से 600 बार बदलाव करता है।

यही वजह है की यदि हम कुछ साल पहले की बात करें तो किसी के लिए भी अपनी वेबसाइट को रैंक कराना आसान काम होता था। लेकिन अब यह बहुत ही जटिल काम हो गया है।

अब कुछ भी सर्च करने पर सिर्फ वही websites top 10 पर आते हैं जिनके content में quality हो और जो users को सही जानकारी दे रहा हो।

खैर, चलिए वापस लौटते हैं अपने पॉइंट पर और एक मोटे तौर पर समझने की कोशिश करते हैं की search algorithm कैसे काम करता है।

गूगल के अनुसार search algorithm नीचे दिए गये कुछ steps को follow करता है:

1. सर्च किये गये शब्दों (query) को समझना: सबसे पहला और महत्वपूर्ण काम होता है आपके द्वारा search bar में enter किये गये शब्दों को समझना।

शब्द कौन सी भाषा में है और उसका क्या अर्थ है, उसके और कौन-कौन से समानार्थी शब्द हो सकते हैं यह जानना जरुरी है ताकि सही परिणाम दिखाया जा सके।

कई बार user अपनी query में speling mistakes भी करता है जिसे समझना और ठीक करने का काम भी किया जाता है।

कई बार एक ही शब्द के कई सारे meanings होते हैं, ऐसी स्थिति में sentance को समझकर उससे सम्बन्धित रिजल्ट दिखाने का काम भी एल्गोरिथम द्वारा किया जाता है।

इसके अलावा कई सारे keywords ऐसे भी होते हैं जिनके search results कुछ अलग format में दिखाए जाते हैं जैसे यदि आप "restaurant near me" search करें तो आपको आपके आसपास में उपलब्ध रेस्टोरेंट की जानकारी उनकी rating और map के साथ दिखाई जाती है।

यदि आप "40+50" सर्च करें तो इसे समझ आ जाता है की यह गणित का सवाल है और इसका सर्च रिजल्ट कुछ ऐसा दिखाई देता है:
Search query में ऐसे keywords को पहचानने और उससे जुड़े data को विशेष format में दिखाने का काम भी इसी algorithm का ही होता है।

2. Index से मिलान करना: सर्च किये गये Keywords को समझने के बाद इसे index में store किये गये data से match किया जाता है और इससे जुड़े हुए pages को खोजा जाता है।

यहाँ ध्यान रखा जाता है की आप कौनसे भाषा में सर्च कर रहे हैं और उसी भाषा में लिखे गये pages को खोजा जाता है।

किसी पेज को select करते समय यह देखा जाता है की वह शब्द उस पेज में कितनी बार और कहाँ-कहाँ उपयोग किया गया है, देखा जाता है की ये keywords page के title में लिखा गया है या headline में या body में use किया गया है। इससे यह समझने में आसानी होती है की जो information user द्वारा serach किया जा रहा है उसके बारे में जानकारी उस page में यह या नही।

3. उपयोगी web pages की ranking करना: 
इन्टरनेट पर करोड़ों websites हैं ऐसे में यह बिलकुल सम्भव है की उस query से सम्बन्धित सैकड़ों webpages हों। इस स्थिति में webpages को उनकी quality के अनुसार rank किया जाता है और SERP में सबसे बेहतर पेज के URL को पहले दिखाया जाता है।

पेज की quality तय करने के लिए कई सारे factors ध्यान में रखे जाते हैं जैसे:
  • Search की गयी कीवर्ड पेज में कितनी बार repeat हो रही है।
  • पेज की जानकारी कितनी fresh है।
  • वेबसाइट की विश्वसनीयता कितनी है।
  • User experience (UX) का ध्यान रखा गया है या नही 
  • Site की speed सही है या नही आदि।
इन सबके अलावा और भी सैकड़ों factors होते हैं जिनका पेज रैंकिंग के समय ध्यान रखा जाता है।

4. Context का ध्यान रखना:
इस स्टेज में कुछ extra information जैसे आपकी location, country, area, past search history और search settings का ध्यान में रखकर data को इस प्रकार से filter किया जाता है की दिखाई देने वाला result आपके लिए उपयुक्त हो।

5. Result show करना
अब आखिर में रिजल्ट show किया जाता है जिसमे ध्यान रखा जाता है की यूजर के सवाल का जवाब सही तरह से दिखाया जाय इसमें सिर्फ text content ही नही बल्कि images, videos जो भी उस query के बारे में बेहतर हो उसे दिखाया जाता है।

सर्च इंजन कितने प्रकार के होते हैं? Types of Search Engine in Hindi सर्च इंजन मुख्यतः चार प्रकार के होते हैं:
  1. Crawler-Based Search Engines
  2. Web Directories
  3. Hybrid Search Engines
  4. Meta Search Engines
Crawler-Based Search Engines:
इस प्रकार के सर्च इंजन में crawler या bot का उपयोग होता है crawling, indexing, और ranking जैसे steps follow किये जाते हैं जिनके बारे में हम पहले ही ऊपर बता चुके हैं।

इस तरह के सर्च इंजन के उदहारण हैं:
  • Google
  • Yahoo!
  • Bing
  • DuckDuckGo
  • Yandex
  • Ask

Web Directories:
यह एक प्रकार का डायरेक्टरी सिस्टम होता है जहाँ कई सारे websites की link और उनके बारे में जानकारी दी जाती है। इसमें websites को अलग-अलग categories के अनुसार list बना कर दिखाया जाता है।

इस डायरेक्टरी में अपनी वेबसाइट को register करने लिए website का owner अपनी साईट की category और short descripting लिखकर submit करता है।

यहाँ कोई automatic system नही होता, सबमिट किये गये साईट को editor द्वारा manually review किया जाता है और डायरेक्टरी के नियमो के अनुसार सही पाए जाने पर add कर लिया जाता है अथवा reject कर दिया जाता है।

इसपर एक search box होता है जिसके जरिये वेबसाइट को खोजा जा सकता है। सर्च किये गये शब्दों को directory में उपलब्ध sites के description से match किया जाता है और सर्च रिजल्ट के रूप में match होने वाले sites की लिस्ट दिखाई जाती है।

Web directories के कुछ उदाहरण:
  • A1WebDirectory
  • Blogarama
  • 9sites 
Hybrid Search Engines:
हाइब्रिड सर्च इंजन रिजल्ट दिखाने के लिए crawler और directories दोनों का उपयोग करते हैं। जैसे गूगल crawling method के अलावा डायरेक्ट्रीज से भी किसी वेबसाइट के बारे में जानकारियाँ जुटा सकते हैं।

पुराने समय में directories का बहुत उपयोग होता था, अगर आपकी साईट कई सारी web directories में listed है तो आप बड़ी आसानी से गूगल में रैंक कर सकते थे। क्योंकि उस समय Google वेब डायरेक्टरी को काफी प्राथमिकतायें देता था।

लेकिन अब धीरे-धीरे web directories की value कम होती जा रही है और hybrid सर्च इंजन crawler-based search engine बनते जा रहे हैं।

हाइब्रिड सर्च इंजन के उदाहरण हैं:
  • Google
  • Yahoo!
Meta Search Engines:
ऐसे सर्च इंजन जो किसी अन्य सर्च इंजन से data ला कर रिजल्ट दिखाते हैं, मेटा सर्च इंजन कहलाते हैं। जब यूजर कोई query enter करता है तो यह उस query को अलग-अलग कई सारे अन्य search engines पर ले जाकर सर्च करता है और सभी के results को ला कर उसपर खुद का algorithm apply करता है और उसे filter करके यूजर को दिखाता है।

मेटा सर्च इंजन के examples:
  • Dogpile
  • Metacrawler
कुछ अन्य प्रकार के search engines:
आपको इन्टरनेट पर कुछ ऐसे सर्च इंजन भी मिलेंगे जो की किसी विशेष category पर सर्च करने के लिए बनाये गये हैं। इनके कुछ examples नीचे दिए गये हैं:

Shopping के लिए:
  • Google Shopping 
  • Yahoo Shopping
  • PriceGrabber 
News खोजने के लिए:
  • Google News
  • Yahoo News
Image search engines:
  • Google Image
  • Bing Image
  • Yahoo! Image
Reverse Image Search Engines:
  • TinyEye
  • Pinterest
  • Google Reverse Image search
गाने और म्यूजिक खोजने के लिए:
  • Allmusic
  • Last FM
  • Sound Click
  • BeeMP3
इस तरह के कई प्रकार के सर्च इंजन हैं जिनका उपयोग आप अलग-अलग काम के लिए कर सकते हैं।

दुनिया के 10 सबसे बेस्ट सर्च इंजन कौन से हैं? Top 10 Best Search Engines
चलिए अब जानते हैं की इन्टरनेट पर मौजूद सबसे बेहतर search engines कौन-कौन से हैं। 10 सबसे बेस्ट सर्च इंजन के नाम उनकी लोकप्रियता आधार पर कुछ इस प्रकार हैं:

  1. Google
  2. Bing
  3. Baidu
  4. Yahoo!
  5. Yandex
  6. Ask
  7. AOL
  8. DuckDuckGo
  9. WolframAlpha
  10. Dogpile
इस लिस्ट में सबसे ऊपर गूगल है जो दुनिया no. 1 सर्च इंजन है। Netmarketshare के report (फरवरी 2019) के अनुसार पूरे वर्ल्ड में 70% searches गूगल पर हुए हैं। 

इस पोस्ट में हमने आपको बताया की सर्च इंजन क्या है? यह कैसे काम करता है? और कितने प्रकार के होते हैं।हमें उम्मीद है आपको सर्च इंजन के बारे में ये जानकारियाँ पसंद आई होंगी। इस बारे में आप अपनी राय नीचे कमेंट बॉक्स में जरुर शेयर करें। धन्यवाद!

नमस्कार, मैं विवेक, WebInHindi का founder हूँ। इस ब्लॉग से आप वेब डिजाईन, वेब डेवलपमेंट से जुड़े जानकारियां और tutorials प्राप्त कर सकते हैं। अगर आपको हमारा यह ब्लॉग पसंद आये तो आप हमें social media पर follow कर हमारा सहयोग कर सकते हैं|

This Is The Newest Post

इस Post से सम्बंधित किसी भी तरह का प्रश्न पूछने या सुझाव देने के लिए नीचे comment कीजिये.
EmoticonEmoticon