В края на октомври 2015-та година от Google заявиха, че използват самообучаваща се система, която да подпомогне сортирането на резултатите в търсачката. В следващите редове ще синтезираме всичко, което знаем до момента за тази нова система, носеща името RankBrain.
Та, какво е RankBrain?
RankBrain е името на новия помощник на Google – самообучаваща се система, използваща изкуствен интелект, която да спомогне за още по-качествено извеждане на резултати в търсачката.
Какво е самообучаваща се система?
При самообучаващата се система, вместо да чака изрични човешки команди, компютърът сам учи себе си какво да прави в дадена ситуация.
Какво е изкуствен интелект?
За изкуствен интелект говорим, когато компютър може да придобива нови знания както от човек, така и самостоятелно на базата на това, което вече знае.
Важно е да отбележим, че в случая с RankBrain самообучаващата се система и изкуствения интелект се използват синонимно.
RankBrain ли е новият начин, по който Google подрежда резултатите от търсачката?
Не съвсем. RankBrain е само част от целия алгоритъм за търсене на Google – програма, която преглежда и подбира измежду милиарди страници най-релевантните материали за дадена заявка.
Тогава как е името на алгоритъма за търсене на Google?
Колибри. Още през 2013 Google най-сетне дадоха официално име на своя алгоритъм за търсене, след като в продължение на години такова липсваше.
Значи RankBrain е част от Колибри?
Така го разбираме към момента ние. Колибри е събирателното наименование, точно както под капака на колата се намира двигателят, който се състои от маслен филтър, горивна помпа, радиатор и други части, но обобщено си го наричаме двигател. По подобен начин и RankBrain е само част от целия алгоритъм.
Ако сте мислели, че алгоритъмът на Google се казва PageRank…
PageRank е част от целия алгоритъм, който по специфичен начин награждава с доверие даден сайт на базата на връзките, сочещи към него.
PageRank е първата част от целия алгоритъм, на която Google дава име още през 1998г.
А какви са тези „сигнали“, които Google използва с цел класиране на резултатите?
Сигналите са компоненти, които Google използва, за да определи как да класира резултатите. Думите на страниците, например, са сигнали. Ако тези думи са удебелени(bold), това също е сигнал, както и PageRank–ът и дали страницата е удобна за навигиране през мобилни устройства.
Всички тези сигнали биват разглеждани от различните части на Колибри алгоритъма, за да може търсачката да определи кои са най-качествените и релевантни на търсенето резултати.
Колко сигнала използва Google?
Самите Google твърдят, че търсачката разглежда над 200 сигнала, които от своя страна пък имат повече от 10 000 разновидности на подсигнали.
RankBrain ли е третият най-важен сигнал?
Точно така. Сякаш отникъде се появи тази нова система и Google твърди, че тя е третият най-важен фактор за класиране на уеб страниците.
Кои са тогава първият и вторият най-важни сигнали?
Въпреки многократно отправяните към Google въпроси, търсачката гигант не разкрива в прав текст кои са двата най-важни сигнала. Би било много полезно, ако някой ден Google обясни кои са те .
Все пак най-вероятно линковете все още остават най-сериозният фактор. Може би на второ място са „думите“, под които разбираме всички думи, които са на дадена страница и как Google интерпретира вписваните като заявки за търсене думи.
Какво точно прави RankBrain?
RankBrain бива използван основно като метод за интерпретиране на заявките, които хората подават, за да намери страници, които може да нямат точно въведените думи.
Но Google нямаше ли вече начин за намиране на сходни по смисъл с въведените думи резултати?
Да, Google отдавна знае как да извежда подобен тип резултати. Преди доста години при търсене за „обувка“ Google изкарваше само и единствено резултати, съдържащи „обувка“, но не и „обувки“. Сега вече търсачката знае, че едното е вариация на другото, също така знае, че маратонки може да е синоним на спортни обувки, умее да прави разлика между технологичната компания „Apple“ и плода „apple”(ябълка).
Какво да кажем за Графиката на знанието (The Knowledge Graph)?
Въведена през 2012г., Графиката на знанието доказа, че Google се е превърнала в много умна търсачка що се отнася до връзките между думите. При въвеждане на търсене за „президентът на САЩ“ Google знае, че вероятно става дума за Барак Обама и съответно изкарва резултати за него, дори без да е въведено името му в полето за търсене. Графиката на знанието е база данни от факти за различните неща по света и техните взаимни връзки.
Как RankBrain помага за оптимизиране на резултатите от заявките?
Начините, които Google вече използва за усъвършенстване на извежданите резултати все опират до ръчните действия на някой служител. Дали ще съставя листи от синонимни и аналогични думи или ще създава връзки между различни обекти, и колкото и автоматизирани процеси да има, по-голямата част от качествената работа зависи от човешкия труд.
Проблемът идва от факта, че Google обработва 3 милиарда възможни заявки на ден! През 2007г. от компанията разкриха, че около 20-25% от тези заявки никога не са били подавани в полето за търсене. През 2013г. намалиха числото до 15%, но все пак това са цели 450 милиона заявки, които никога не са били потърсени от когото и да било по света.
RankBrain идва на помощ на интерпретирането на заявки от 3 или повече думи (long-tail queries). Той има за цел да провери тези заявки и ефективно да ги преведе, така че да изведе на потребителя най-добрите резултати.
От Google казват, че RankBrain разглежда пътеки между привидно несвързаните комплексни търсения, за да определи как всъщност могат да се комбинират. Асимилирайки тази зависимост, той ще може по-добре да разбира бъдещите сложни търсения и дали са свързани с някаква тема. Най-важното е, че впоследствие ще може да асоциира тези групи от търсения с резултатите, които мисли, че биха допаднали най-много на потребителите.
С помощта на RankBrain Google ще може по-качествено да свързва нетипично дългите и понякога странни заявки с по-често срещаните и стегнати такива. Резултатът ще е извеждане на всичко, което търсачката знае за по-често срещаните търсения и няма да се стига до объркване на потребителя.
Дали Bing разполага с аналог в лицето на RankNet?
Още през 2005г. Microsoft започнаха използването на своя самообучаваща се система, която днес е част от Bing – RankNet. Интересното е, че през годините Microsoft почти не са споменавали и дума за него. Вероятно след появата на RankBrain ще започнем да попадаме по-често на сравнения между двете системи.
Помага ли наистина RankBrain?
Вземайки предвид факта, че по принцип Google действа строго консервативно по отношение на своя алгоритъм за търсене, можем да подходим с нужното внимание към RankBrain. От компанията постоянно правят малки тестчета кое, как и дали да променят, и щом сега сами хвърлят тази информация под прожекторите, то по всяка вероятност промяната няма да е малка. Самото твърдение, че RankBrain е третият най-важен сигнал за класирането е напълно достатъчно.
Откога е пуснат в действие RankBrain?
От Google казват, че RankBrain е стартиран в началото на 2015г. и вече от няколко месеца работи на пълни обороти и засяга „много голяма част“ от всички заявки.
Постоянно ли се самообучава RankBrain?
Цялото самообучение се осъществява само офлайн. На базата на историята от всякакви търсения системата се учи да предвижда бъдещи такива. Прогнозите се проверяват и в случай, че преминат тестовете се включват в резултатите, които някой потребител би потърсил. После процесът се повтаря отново и отново.
Само филтриране на резултатите ли прави RankBrain?
От Google не дават яснота по този въпрос, така че можем само да предполагаме дали RankBrain не е повече от система за филтриране на страниците. По принцип самото филтриране на резултатите, било то подбор на производни думи, синоними или сега вече с RankBrain, никога не е било считано за сигнал за класиране. Така, че дали Google наистина има предвид сигнал за класирането? Може би… Но как точно? Дали системата не е способна да оценява и качеството на страниците? Може би RankBrain ще може да се справя с подбора на качествени страници по-добре отколкото другите системи на Google до момента? Рано е да се каже, но бъдещето ще покаже.
Изключително полезно четиво! А какво се случва с темата около ъпдейта на PageRank-а? Поне в последните 2 години няма такъв май, което води само до спекулации – ще го бъде ли, няма ли да го бъде…
Няма да има повече такива ъпдейти. Поне не и публични. Самия PageRank е динамичен и няма как да бъде отразен в статична цифра 😉