×

Nous utilisons des cookies pour rendre LingQ meilleur. En visitant le site vous acceptez nos Politique des cookies.

image

Chronos Videos | Science, موتورهای جستجو چطور کار می‌کنند؟

موتورهای جستجو چطور کار می‌کنند؟

یه زمانی وقتی برامون سؤالی پیش میومد

باید میرفتیم کتابخونه ی محل و از

در و همسایه سؤال می کردیم و

بعد از مدت ها تحقیق و تفحص

بالاخره شاید می تونستیم جوابمونو پیدا کنیم.

اما این روزا موتورهای جستجویی مثل گوگل

کارمونو خیلی راحت کردن

الآن دیگه می تونیم جواب

سخت ترین سؤالامونو توی کمتر از یک ثانیه پیدا کنیم.

اما این موتورهای جستجو چطوری می تونن وقتی ازشون سؤالی رو می پرسیم

همه ی اینترنت رو بگردن و جوابمون رو لقمه شده برامون حاضر کنن؟

خوب، بیاین یه سؤال ساده بپرسیم:

سفر به مشتری چقدر طول می کشه؟

این نتایج از کجا اومدن؟

و چرا این یکی بالاتر از اون یکیه؟

بیاین ببینیم موتور جستجو چطور یه جستجو رو به نتیجه می رسونه.

اولین چیزی که لازمه بدونیم اینه که

وقتی یه جستجو انجام می شه، موتور جستجو

همون موقع همه ی سایت ها رو برای پیدا کردن نتیجه نمی گرده

چون که تعداد وبسایت های موجود روی اینترنت

خیلی خیلی زیاده و هر دقیقه

صدها وبسایت به اینترنت اضافه می شه.

پس اگه موتور جستجو قرار بود همچین کاری بکنه

هر جستجو یه قرن طول می کشید.

به همین دلیل موتورای جستجو

اینترنت رو جلوجلو و به صورت دائم مورد بررسی قرار میدن

تا اطلاعاتی که بعدا ممکنه ازشون بپرسیم رو حاضر اومده داشته باشن.

پس اگه ما سرچ کنیم «سفر به مشتری»،

موتور جستجو قبلا همه ی نتایج رو روی سرورهاش

به صورت ذخیره داره.

اینترنت مجموعه ای از صفحات وب هست

که با استفاده از لینک ها به هم پیوند داده می شن.

موتورهای جستجو برنامه ای دارن به نام «عنکبوت»

که متن این صفحه ها رو می خونه

و اطلاعاتشون رو ذخیره می کنه و

بعد از اتمام کار می ره سراغ لینک های روی اون صفحه

و دونه دونه اون ها رو هم بازرسی می کنه

و اطلاعاتشون رو ذخیره می کنه.

این کار بدون توقف ادامه داره تا جایی که همه ی اینترنت رو پوشش بده.

بنابراین اگر هیچ کس به سایت شما لینک نداده باشه

احتمال این که موتور جستجو اصلا نفهمه سایت شما وجود داره زیاده.

برنامه ی عنکبوت اطلاعات صفحات اینترنتی رو

روی پایگاه داده ای که اسمش سرچ ایندکس

یا مدخل جستجو هست ذخیره می کنه.

حالا بیاین برگردیم به جستجوی اولیه ی خودمون

تا ببینیم موتور جستجو چجوری

جواب سؤال ما رو پیدا می کنه.

وقتی ما می پرسیم سفر به مشتری چقدر طول می کشه،

موتور جستجو یه

لیستی از همه ی صفحاتی که شامل تک تک کلمات مورد جستجوی ما هستن تهیه می کنه

ممکنه

میلیون ها صفحه روی اینترنت وجود داشته باشه که

حاوی کلمات جستجو شده ی شما باشه

برای همین موتور جستجو مجبوره بهترین نتایج رو به شما نشون بده.

هر موتور جستجو، الگوریتم ها

و الگوهای خاص خودشو برای فهمیدن سؤال

و پیدا کردن جواب های واقعا مرتبط داره.

جزئیات این الگوریتم ها معمولا به دلیل رقابتی

که بین شرکت هایی مثل گوگل و یاهو وجود داره

سری هستن و هیچ کس نمی دونه اونا دقیقا چطوری کار می کنن.

اما تا جایی که می دونیم،

همه ی این الگوریتم ها اول چک می کنن ببینن

عبارتی که ما سرچ کردیم توی تیتر

صفحه اومده یا نه و این که

ترتیب کلمات توی تیتر صفحه

آیا دقیقا به همون شکلی که ما جستجو کردیم هست یا نه.

کلمات کلیدی روی صفحات وب هم نقش زیادی

روی اعتباری که موتور جستجو به اون صفحه می ده دارن.

مثلا گوگل بر اساس این که چند تا صفحه ی دیگه

به یک صفحه ی خاص لینک دادن اون رو توی نتایج بالاتر از بقیه نشون می ده.

پس هرچه بیشتر به یه صفحه لینک داده بشه

اهمیت اون صفحه برای گوگل بیشتر می شه.

فلسفه ی این کار هم اینه که اگه سایت های زیادی فکر کنن

محتوای یه صفحه بااهمیته،

پس احتمال این که اون صفحه چیزی باشه که ما به دنبالش

می گردیم بیشتر می شه. این الگوریتم که

مختص گوگل هست، اسمش پیج رنک هست ولی

نه به این دلیل که به صفحه های اینترنتی ربط داره

بلکه به این دلیل که مخترع این الگوریتم

لری پیج، یکی از بنیان گذاران گوگل بوده.

خیلی از سایت ها از طریق

بازدیدکننده هاشون کسب درآمد می کنن.

برای همین خیلی ها سعی می کنن با کلک زدن به گوگل

سایتشون رو توی نتایج جستجو بالاتر از بقیه نمایش بدن.

برای همین موتورای جستجو هرازگاهی

الگوریتم هاشون رو طوری بروز می کنن

که سایتای جعلی و حقه باز از نتایج جستجو حذف بشن

یا به جایی برگردن که بهش تعلق دارن.

در عوض خود گوگل به عنوان حقه باز ترین

از ملت پول می گیره تا سایتشون رو بالای صفحه نشون بده.

اما در نهایت این وظیفه ی خود ما هست که

بدونیم روی چی باید کلیک کنیم و

چه سایت هایی برامون منبع معتبر محسوب می شن.

این روزها موتورهای جستجو قوی ترین نرم افزارهای

هوش مصنوعی رو دارن

و حتی از اطلاعاتی که ما اصلن در اختیارشون قرار ندادیم استفاده می کنن.

مثل موقعیت جغرافیایی ما، سن ما،

سیستم کامپیوتر ما و ... چیزای دیگه.

یا مثلا

موتورای جستجو باید معنی چیزی رو که ما ازشون می پرسیم

دقیق بدونند. توی مثال ما

گوگل می دونه که مشتری ای که ما دنبالش می گردیم

احتمالا یه سیاره است و

و منظور ما مشتریِ خریدار نبوده

و این کار رو از طریق هوش مصنوعی انجام می ده.

گوگل هیچ وقت به صورت دقیق تعداد سرورهاش

و حتی موقعیت جغرافیایی دقیق سرورهاش رو

به عموم اعلام نمی کنه اما

بعضی ها تخمین می زنن که گوگل حداقل ۹۰۰۰۰۰ تا سرور

تو جاهای مختلف دنیا داره.

فقط یکی از انواع سرورهای گوگل، وب سرورهاش

هر جستجویی رو که ما انجام می دیم براش این کارها رو انجام می دن:

عبارت جستجو شده رو می گیره و به گوگل می فرسته.

نتایج رو بررسی می کنه و رنک ویا جایگاه هر صفحه رو

روی صفحه ی نتایج تعیین می کنه.

بررسی می کنه که ما

روی کدوم لینک کلیک کردیم و اونا رو ذخیره می کنه.

پیشنهادهای املایی رو از سرور ملانقطی

گوگل دریافت می کنه و در نهایت یه لیست

از تبلیغات مرتبط رو از سرور حاوی تبلیغات

گوگل گرفته و نمایش می ده

استفاده از موتورهای جستجو هر روز کلی از کارای ما رو جلو میندازن

اما خطراتی هم دارن، از جمله این که

اطلاعات روی اینترنت همیشه موثق نیستن

و احتمال این که

نتایج جستجوی ما خیلی دقیق نباشه زیاده.

دیگه این که اگه عادت کنیم هر چیزی رو

از گوگل بپرسیم کم کم دیگه

خودمون یادمون می ره چجوری باید فکر کنیم و به نتیجه برسیم.

پس می شه به گوگل به چشم یه ابزار مفید نگاه

کرد به شرطی که بدونیم چطوری و کی باید ازش استفاده کنیم.

اگه از این ویدئو خوشتون اومده اونو با دوستاتون به اشتراک بذارین.

مرسی از منبع عظیم انرژیتون و این که اونو به اشتراک می ذارید!

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

موتورهای جستجو چطور کار می‌کنند؟ Search engines||||| Wie funktionieren Suchmaschinen? How do search engines work? ¿Cómo funcionan los motores de búsqueda? Comment fonctionnent les moteurs de recherche ?

یه زمانی وقتی برامون سؤالی پیش میومد ||||a question||would come up Parfois, quand nous avons une question

باید میرفتیم کتابخونه ی محل و از |We had to go|local library|||| Nous avons dû aller à la bibliothèque locale

در و همسایه سؤال می کردیم و Nous avons demandé à la porte et au voisin

بعد از مدت ها تحقیق و تفحص ||||||investigation Après une longue période de recherche et d'enquête

بالاخره شاید می تونستیم جوابمونو پیدا کنیم. |||could we|our answer|| Enfin, nous pourrions peut-être trouver notre réponse.

اما این روزا موتورهای جستجویی مثل گوگل ||||search engines||Google

کارمونو خیلی راحت کردن our work|||

الآن دیگه می تونیم جواب Maintenant nous pouvons répondre

سخت ترین سؤالامونو توی کمتر از یک ثانیه پیدا کنیم. ||our hardest questions|||||second|| Trouvez nos questions les plus difficiles en moins d’une seconde.

اما این موتورهای جستجو چطوری می تونن وقتی ازشون سؤالی رو می پرسیم ||||||||||||we ask Mais comment font ces moteurs de recherche quand on leur pose une question

همه ی اینترنت رو بگردن و جوابمون رو لقمه شده برامون حاضر کنن؟ ||||search through||our answer|||||| Rechercher sur Internet et nous présenter notre réponse en un seul morceau ?

خوب، بیاین یه سؤال ساده بپرسیم: |||||let's ask

سفر به مشتری چقدر طول می کشه؟ How long does the journey to the customer take? Combien de temps dure le parcours vers le client ?

این نتایج از کجا اومدن؟ D’où viennent ces résultats ?

و چرا این یکی بالاتر از اون یکیه؟ |||||||"one" Et pourquoi celui-ci est-il plus haut que celui-là ?

بیاین ببینیم موتور جستجو چطور یه جستجو رو به نتیجه می رسونه. |||||||||||delivers Let's see how the search engine results in a search. Voyons comment le moteur de recherche aboutit à une recherche.

اولین چیزی که لازمه بدونیم اینه که La première chose que nous devons savoir, c'est que

وقتی یه جستجو انجام می شه، موتور جستجو Lorsqu'une recherche est effectuée, le moteur de recherche

همون موقع همه ی سایت ها رو برای پیدا کردن نتیجه نمی گرده ||||||||||||searches At the same time, it is not possible to find all the sites En même temps, il n'est pas possible de retrouver tous les sites

چون که تعداد وبسایت های موجود روی اینترنت |||websites|||| Because the number of websites on the Internet Parce que le nombre de sites Web sur Internet

خیلی خیلی زیاده و هر دقیقه Très très beaucoup et chaque minute

صدها وبسایت به اینترنت اضافه می شه. Des centaines de sites Web sont ajoutés à Internet.

پس اگه موتور جستجو قرار بود همچین کاری بکنه Donc si le moteur de recherche était censé faire quelque chose comme ça

هر جستجو یه قرن طول می کشید. Each search would take a century.

به همین دلیل موتورای جستجو |||search engines|

اینترنت رو جلوجلو و به صورت دائم مورد بررسی قرار میدن ||continuously||||constantly|||| The internet is constantly being checked

تا اطلاعاتی که بعدا ممکنه ازشون بپرسیم رو حاضر اومده داشته باشن.

پس اگه ما سرچ کنیم «سفر به مشتری»، |||search for||||

موتور جستجو قبلا همه ی نتایج رو روی سرورهاش ||||||||its servers

به صورت ذخیره داره.

اینترنت مجموعه ای از صفحات وب هست ||||web pages|web pages|

که با استفاده از لینک ها به هم پیوند داده می شن.

موتورهای جستجو برنامه ای دارن به نام «عنکبوت» |||||||Web crawler

که متن این صفحه ها رو می خونه |text||||||

و اطلاعاتشون رو ذخیره می کنه و |their information|||||

بعد از اتمام کار می ره سراغ لینک های روی اون صفحه ||completion|||||||||

و دونه دونه اون ها رو هم بازرسی می کنه |||||||inspects||

و اطلاعاتشون رو ذخیره می کنه.

این کار بدون توقف ادامه داره تا جایی که همه ی اینترنت رو پوشش بده.

بنابراین اگر هیچ کس به سایت شما لینک نداده باشه

احتمال این که موتور جستجو اصلا نفهمه سایت شما وجود داره زیاده. ||||||"does not understand"|||||

برنامه ی عنکبوت اطلاعات صفحات اینترنتی رو

روی پایگاه داده ای که اسمش سرچ ایندکس |database||||||search index

یا مدخل جستجو هست ذخیره می کنه. |search entry|||||

حالا بیاین برگردیم به جستجوی اولیه ی خودمون ||||search|||

تا ببینیم موتور جستجو چجوری

جواب سؤال ما رو پیدا می کنه.

وقتی ما می پرسیم سفر به مشتری چقدر طول می کشه،

موتور جستجو یه

لیستی از همه ی صفحاتی که شامل تک تک کلمات مورد جستجوی ما هستن تهیه می کنه ||||pages||||||||||"prepares"||

ممکنه

میلیون ها صفحه روی اینترنت وجود داشته باشه که

حاوی کلمات جستجو شده ی شما باشه

برای همین موتور جستجو مجبوره بهترین نتایج رو به شما نشون بده. ||||is forced|||||||

هر موتور جستجو، الگوریتم ها |||search engine algorithms|

و الگوهای خاص خودشو برای فهمیدن سؤال

و پیدا کردن جواب های واقعا مرتبط داره.

جزئیات این الگوریتم ها معمولا به دلیل رقابتی |||||||competitive reasons

که بین شرکت هایی مثل گوگل و یاهو وجود داره |||||||Yahoo||

سری هستن و هیچ کس نمی دونه اونا دقیقا چطوری کار می کنن. |||||||||how they work|||

اما تا جایی که می دونیم،

همه ی این الگوریتم ها اول چک می کنن ببینن |||||||||"to see"

عبارتی که ما سرچ کردیم توی تیتر ||||||search term

صفحه اومده یا نه و این که

ترتیب کلمات توی تیتر صفحه

آیا دقیقا به همون شکلی که ما جستجو کردیم هست یا نه.

کلمات کلیدی روی صفحات وب هم نقش زیادی |Keywords||||||

روی اعتباری که موتور جستجو به اون صفحه می ده دارن.

مثلا گوگل بر اساس این که چند تا صفحه ی دیگه

به یک صفحه ی خاص لینک دادن اون رو توی نتایج بالاتر از بقیه نشون می ده.

پس هرچه بیشتر به یه صفحه لینک داده بشه

اهمیت اون صفحه برای گوگل بیشتر می شه.

فلسفه ی این کار هم اینه که اگه سایت های زیادی فکر کنن

محتوای یه صفحه بااهمیته، the content of|||important

پس احتمال این که اون صفحه چیزی باشه که ما به دنبالش

می گردیم بیشتر می شه. این الگوریتم که

مختص گوگل هست، اسمش پیج رنک هست ولی ||||Page|PageRank||

نه به این دلیل که به صفحه های اینترنتی ربط داره

بلکه به این دلیل که مخترع این الگوریتم |||||Inventor||

لری پیج، یکی از بنیان گذاران گوگل بوده. Larry Page|||||founders||

خیلی از سایت ها از طریق

بازدیدکننده هاشون کسب درآمد می کنن. Their visitors|||||

برای همین خیلی ها سعی می کنن با کلک زدن به گوگل

سایتشون رو توی نتایج جستجو بالاتر از بقیه نمایش بدن. their website|||||||||

برای همین موتورای جستجو هرازگاهی ||||from time to time

الگوریتم هاشون رو طوری بروز می کنن |their algorithms|||||

که سایتای جعلی و حقه باز از نتایج جستجو حذف بشن |fake sites|fake||trick|||||removed|

یا به جایی برگردن که بهش تعلق دارن. |||"return"|||belong to|

در عوض خود گوگل به عنوان حقه باز ترین

از ملت پول می گیره تا سایتشون رو بالای صفحه نشون بده. |the public||||||||||

اما در نهایت این وظیفه ی خود ما هست که ||||duty|||||

بدونیم روی چی باید کلیک کنیم و

چه سایت هایی برامون منبع معتبر محسوب می شن. |||||reliable source|||

این روزها موتورهای جستجو قوی ترین نرم افزارهای |||||||software programs

هوش مصنوعی رو دارن |artificial||

و حتی از اطلاعاتی که ما اصلن در اختیارشون قرار ندادیم استفاده می کنن. ||||||||"their disposal"||"did not give"|||

مثل موقعیت جغرافیایی ما، سن ما، ||Geographical|||

سیستم کامپیوتر ما و ... چیزای دیگه. Computer system|||||

یا مثلا

موتورای جستجو باید معنی چیزی رو که ما ازشون می پرسیم

دقیق بدونند. توی مثال ما |"to know"|||

گوگل می دونه که مشتری ای که ما دنبالش می گردیم

احتمالا یه سیاره است و

و منظور ما مشتریِ خریدار نبوده |||customer|buyer|

و این کار رو از طریق هوش مصنوعی انجام می ده.

گوگل هیچ وقت به صورت دقیق تعداد سرورهاش

و حتی موقعیت جغرافیایی دقیق سرورهاش رو

به عموم اعلام نمی کنه اما

بعضی ها تخمین می زنن که گوگل حداقل ۹۰۰۰۰۰ تا سرور ||estimate|||||||servers

تو جاهای مختلف دنیا داره.

فقط یکی از انواع سرورهای گوگل، وب سرورهاش ||||servers|||

هر جستجویی رو که ما انجام می دیم براش این کارها رو انجام می دن: |||||||we do|||||||

عبارت جستجو شده رو می گیره و به گوگل می فرسته. ||||||||||"sends"

نتایج رو بررسی می کنه و رنک ویا جایگاه هر صفحه رو

روی صفحه ی نتایج تعیین می کنه.

بررسی می کنه که ما

روی کدوم لینک کلیک کردیم و اونا رو ذخیره می کنه.

پیشنهادهای املایی رو از سرور ملانقطی Spelling suggestions|spelling suggestions||||pedantic stickler

گوگل دریافت می کنه و در نهایت یه لیست

از تبلیغات مرتبط رو از سرور حاوی تبلیغات |advertising content||||||

گوگل گرفته و نمایش می ده

استفاده از موتورهای جستجو هر روز کلی از کارای ما رو جلو میندازن ||||||||||||move forward

اما خطراتی هم دارن، از جمله این که |dangers||||||

اطلاعات روی اینترنت همیشه موثق نیستن ||||reliable|

و احتمال این که

نتایج جستجوی ما خیلی دقیق نباشه زیاده.

دیگه این که اگه عادت کنیم هر چیزی رو

از گوگل بپرسیم کم کم دیگه

خودمون یادمون می ره چجوری باید فکر کنیم و به نتیجه برسیم. |we forget||||||||||

پس می شه به گوگل به چشم یه ابزار مفید نگاه

کرد به شرطی که بدونیم چطوری و کی باید ازش استفاده کنیم. ||conditional|||||||||

اگه از این ویدئو خوشتون اومده اونو با دوستاتون به اشتراک بذارین.

مرسی از منبع عظیم انرژیتون و این که اونو به اشتراک می ذارید!