موتورهای جستجو چطور کار میکنند؟
یه زمانی وقتی برامون سؤالی پیش میومد
باید میرفتیم کتابخونه ی محل و از
در و همسایه سؤال می کردیم و
بعد از مدت ها تحقیق و تفحص
بالاخره شاید می تونستیم جوابمونو پیدا کنیم.
اما این روزا موتورهای جستجویی مثل گوگل
کارمونو خیلی راحت کردن
الآن دیگه می تونیم جواب
سخت ترین سؤالامونو توی کمتر از یک ثانیه پیدا کنیم.
اما این موتورهای جستجو چطوری می تونن وقتی ازشون سؤالی رو می پرسیم
همه ی اینترنت رو بگردن و جوابمون رو لقمه شده برامون حاضر کنن؟
خوب، بیاین یه سؤال ساده بپرسیم:
سفر به مشتری چقدر طول می کشه؟
این نتایج از کجا اومدن؟
و چرا این یکی بالاتر از اون یکیه؟
بیاین ببینیم موتور جستجو چطور یه جستجو رو به نتیجه می رسونه.
اولین چیزی که لازمه بدونیم اینه که
وقتی یه جستجو انجام می شه، موتور جستجو
همون موقع همه ی سایت ها رو برای پیدا کردن نتیجه نمی گرده
چون که تعداد وبسایت های موجود روی اینترنت
خیلی خیلی زیاده و هر دقیقه
صدها وبسایت به اینترنت اضافه می شه.
پس اگه موتور جستجو قرار بود همچین کاری بکنه
هر جستجو یه قرن طول می کشید.
به همین دلیل موتورای جستجو
اینترنت رو جلوجلو و به صورت دائم مورد بررسی قرار میدن
تا اطلاعاتی که بعدا ممکنه ازشون بپرسیم رو حاضر اومده داشته باشن.
پس اگه ما سرچ کنیم «سفر به مشتری»،
موتور جستجو قبلا همه ی نتایج رو روی سرورهاش
به صورت ذخیره داره.
اینترنت مجموعه ای از صفحات وب هست
که با استفاده از لینک ها به هم پیوند داده می شن.
موتورهای جستجو برنامه ای دارن به نام «عنکبوت»
که متن این صفحه ها رو می خونه
و اطلاعاتشون رو ذخیره می کنه و
بعد از اتمام کار می ره سراغ لینک های روی اون صفحه
و دونه دونه اون ها رو هم بازرسی می کنه
و اطلاعاتشون رو ذخیره می کنه.
این کار بدون توقف ادامه داره تا جایی که همه ی اینترنت رو پوشش بده.
بنابراین اگر هیچ کس به سایت شما لینک نداده باشه
احتمال این که موتور جستجو اصلا نفهمه سایت شما وجود داره زیاده.
برنامه ی عنکبوت اطلاعات صفحات اینترنتی رو
روی پایگاه داده ای که اسمش سرچ ایندکس
یا مدخل جستجو هست ذخیره می کنه.
حالا بیاین برگردیم به جستجوی اولیه ی خودمون
تا ببینیم موتور جستجو چجوری
جواب سؤال ما رو پیدا می کنه.
وقتی ما می پرسیم سفر به مشتری چقدر طول می کشه،
موتور جستجو یه
لیستی از همه ی صفحاتی که شامل تک تک کلمات مورد جستجوی ما هستن تهیه می کنه
ممکنه
میلیون ها صفحه روی اینترنت وجود داشته باشه که
حاوی کلمات جستجو شده ی شما باشه
برای همین موتور جستجو مجبوره بهترین نتایج رو به شما نشون بده.
هر موتور جستجو، الگوریتم ها
و الگوهای خاص خودشو برای فهمیدن سؤال
و پیدا کردن جواب های واقعا مرتبط داره.
جزئیات این الگوریتم ها معمولا به دلیل رقابتی
که بین شرکت هایی مثل گوگل و یاهو وجود داره
سری هستن و هیچ کس نمی دونه اونا دقیقا چطوری کار می کنن.
اما تا جایی که می دونیم،
همه ی این الگوریتم ها اول چک می کنن ببینن
عبارتی که ما سرچ کردیم توی تیتر
صفحه اومده یا نه و این که
ترتیب کلمات توی تیتر صفحه
آیا دقیقا به همون شکلی که ما جستجو کردیم هست یا نه.
کلمات کلیدی روی صفحات وب هم نقش زیادی
روی اعتباری که موتور جستجو به اون صفحه می ده دارن.
مثلا گوگل بر اساس این که چند تا صفحه ی دیگه
به یک صفحه ی خاص لینک دادن اون رو توی نتایج بالاتر از بقیه نشون می ده.
پس هرچه بیشتر به یه صفحه لینک داده بشه
اهمیت اون صفحه برای گوگل بیشتر می شه.
فلسفه ی این کار هم اینه که اگه سایت های زیادی فکر کنن
محتوای یه صفحه بااهمیته،
پس احتمال این که اون صفحه چیزی باشه که ما به دنبالش
می گردیم بیشتر می شه. این الگوریتم که
مختص گوگل هست، اسمش پیج رنک هست ولی
نه به این دلیل که به صفحه های اینترنتی ربط داره
بلکه به این دلیل که مخترع این الگوریتم
لری پیج، یکی از بنیان گذاران گوگل بوده.
خیلی از سایت ها از طریق
بازدیدکننده هاشون کسب درآمد می کنن.
برای همین خیلی ها سعی می کنن با کلک زدن به گوگل
سایتشون رو توی نتایج جستجو بالاتر از بقیه نمایش بدن.
برای همین موتورای جستجو هرازگاهی
الگوریتم هاشون رو طوری بروز می کنن
که سایتای جعلی و حقه باز از نتایج جستجو حذف بشن
یا به جایی برگردن که بهش تعلق دارن.
در عوض خود گوگل به عنوان حقه باز ترین
از ملت پول می گیره تا سایتشون رو بالای صفحه نشون بده.
اما در نهایت این وظیفه ی خود ما هست که
بدونیم روی چی باید کلیک کنیم و
چه سایت هایی برامون منبع معتبر محسوب می شن.
این روزها موتورهای جستجو قوی ترین نرم افزارهای
هوش مصنوعی رو دارن
و حتی از اطلاعاتی که ما اصلن در اختیارشون قرار ندادیم استفاده می کنن.
مثل موقعیت جغرافیایی ما، سن ما،
سیستم کامپیوتر ما و ... چیزای دیگه.
یا مثلا
موتورای جستجو باید معنی چیزی رو که ما ازشون می پرسیم
دقیق بدونند. توی مثال ما
گوگل می دونه که مشتری ای که ما دنبالش می گردیم
احتمالا یه سیاره است و
و منظور ما مشتریِ خریدار نبوده
و این کار رو از طریق هوش مصنوعی انجام می ده.
گوگل هیچ وقت به صورت دقیق تعداد سرورهاش
و حتی موقعیت جغرافیایی دقیق سرورهاش رو
به عموم اعلام نمی کنه اما
بعضی ها تخمین می زنن که گوگل حداقل ۹۰۰۰۰۰ تا سرور
تو جاهای مختلف دنیا داره.
فقط یکی از انواع سرورهای گوگل، وب سرورهاش
هر جستجویی رو که ما انجام می دیم براش این کارها رو انجام می دن:
عبارت جستجو شده رو می گیره و به گوگل می فرسته.
نتایج رو بررسی می کنه و رنک ویا جایگاه هر صفحه رو
روی صفحه ی نتایج تعیین می کنه.
بررسی می کنه که ما
روی کدوم لینک کلیک کردیم و اونا رو ذخیره می کنه.
پیشنهادهای املایی رو از سرور ملانقطی
گوگل دریافت می کنه و در نهایت یه لیست
از تبلیغات مرتبط رو از سرور حاوی تبلیغات
گوگل گرفته و نمایش می ده
استفاده از موتورهای جستجو هر روز کلی از کارای ما رو جلو میندازن
اما خطراتی هم دارن، از جمله این که
اطلاعات روی اینترنت همیشه موثق نیستن
و احتمال این که
نتایج جستجوی ما خیلی دقیق نباشه زیاده.
دیگه این که اگه عادت کنیم هر چیزی رو
از گوگل بپرسیم کم کم دیگه
خودمون یادمون می ره چجوری باید فکر کنیم و به نتیجه برسیم.
پس می شه به گوگل به چشم یه ابزار مفید نگاه
کرد به شرطی که بدونیم چطوری و کی باید ازش استفاده کنیم.
اگه از این ویدئو خوشتون اومده اونو با دوستاتون به اشتراک بذارین.
مرسی از منبع عظیم انرژیتون و این که اونو به اشتراک می ذارید!