Бърз чеклист с 8 точки срещу подмолното дублирано съдържание

Бърз чеклист с 8 точки срещу подмолното дублирано съдържание

Понякога колкото и да се стараем да предотвратим появата на дублирано съдържание, твърде често се случва усилията ни да са били напразни.

 

Всички от време на време чуваме това-онова за дублираното съдържание и като едни разумни уебмастъри никога не сме си позволявали да публикуваме едно и също съдържание два пъти. Или пък не?…

 

Дублираното съдържание наподобява малко банковата услуга “овърдрафт”, при която ако искаш да теглиш повече пари отколкото имаш в сметката – си плащаш впоследствие…с лихвите. А лихвите в случая означават по-малко обхождани страници от Вашия сайт.    

 

Проявявайки се в няколко различни форми, дублираното съдържание е един от най-трудно изяснимите проблеми, който може да навреди на сайта Ви. В много ситуации се дължи на информационната архитектура на сайта или ограниченията на CMS системата.

 

За съжаление, в конзолата (Google Search Console) няма лесна проверка , с която бързо и точно да се види подобен проблем. Дори най-подробните професионални инструменти не успяват винаги да свършат добра работа с намирането на дублирано съдържание – особено когато говорим за вътрешен източник.

 

2016-09-26_15h33_20

 

Сега ще разгледаме 8 потенциални източника на дублирано съдържание, които може би вредят на сайта Ви:

 

1. HTTP и HTTPS URL адреси

 

Един от най-бързите начини да проверите дали сайта Ви има 2 версии, които се индексират от търсачките, е да пробвате дали се зарежда с HTTP и HTTPS протоколи. Ако виждате и двете, не бързайте да се плашите – има вероятност Вашия девелопър да е превключил сайта към HTTPS и да е изпълнил 301 редирект.

 

Преди Google да препоръча на уебмастърите да имплементират криптирана връзка на целия сайт, за много сайтове бе достатъчно да сложат SSL сертификат само на най-нуждаещите се страници, като Register и Checkout. В този смисъл, ако девелопърът е избрал да използва относителна линк структура, то при всяко попадане на Googlebot на защитена страница, ботът насила ще прехвърля HTTPS протоколът на останалите URL-и – създавайки по този начин две версии на уебсайта.

 

Подобно на горното, уверете се, че сайтът Ви няма както www, така и non-www версия. В случай на проблем от този тип, имплементирайте 301 редирект и конкретизирайте предпочитания от Вас домейн в Google Search Console.

 

2. Крадливи, копиращи информацията сайтове (скрейпъри)

 

Сайтове-скрейпъри

 

Тъй като няма интернет полиция, на която да се оплачете, че са Ви откраднали съдържанието, трябва сами да вземете мери, доколкото можете. Кодирайте сайта си по начин, който ще затрудни плагиаторите да си присвоят публикациите Ви. Както стана дума малко по-горе – винаги използвайте абсолютни, вместо относителни URL пътища:

 

  • Абсолютен URL: https://www.bestrecipes.com/chocolate-cakes
  • Относителен URL: /chocolate-cakes

 

Защо е важно това? Защото, когато използвате относителни адреси браузърът решава, че линкът сочи към страница, която е на същия браузър, на който се намирате в момента. Както се досещате, почти никога не е добра идея да оставяте Google да решава вместо Вас, особено в подобен случай. Много девелопъри обичат относителните пътища, понеже “така е по-лесно”.

 

Ако на девелопъра Ви не му се пренаписват всички промени, може да имплементирате canonical тагове, които да сочат към същата страница (сама към себе си). В повечето случаи, когато някой скрейпър копира информацията, в кода ще се съдържа каноничния адрес, който ще указва, че Вашият сайт е първоизточник.
Нелоши безплатни инструменти, показващи дали са Ви копирали, са Siteliner и Copyscape.

 

3. Отдавна изоставени поддомейни

 

Изоставили сте поддомейна си и сте решили да действате с поддиректория вече? Или пък направо сте си направили изцяло нов сайт? Което и от двете да се е случило, изоставеното Ви съдържание си е там още и ще Ви преследва докрай. За да се преборите с този проблем, пренасочете поддомейна си с 301 редирект към новия сайт. Тази стъпка е двойно по-задължителна в случай, че старото съдържание е понатрупало солидно количество връзки.

 

4. “Тайното” създаване на нов дизайн на сайта

 

Google ще обходи съдържанието Ви, ако изрично не му забраните.

 

Програмистите спокойно си бачкат по новия дизай на сайта, а Вие се подготвяте се за голямата промяна? Ако не сте забранили на ботовете да обхождат това, което градите в момента, Google може да е решил да надникне.

 

Широко разпространено е мнението, че щом никой не би написал pravim-nov-sait.com, той не може да бъде открит. И всеки, който си го мисли е в голяма грешка! Google непрестанно обхожда и индексира и е въпрос на време да попадне на Вашата “чернова”. Ако това се случи има опасност от размиване на резултатите и заблуда на потребителите.

 

От една страна, тази ситуация може да навреди на неприкосновеността и сигурността на сайта, а от друга ще ви лиши от доброто първо впечатление пред Google, който впоследствие може да прецени да не обхожда често и много страници от този сайт. Затова действайте просто: поставете noindex таг на целия девелопърски домейн, като допълнително го блокирате за достъп през robots.txt. Никакво надникване!
Много е важно да не забравите да премахнете тези забранителни директиви, когато стане време да пуснете готовия сайт в действие.

 

5. Динамично генерирани параметри

 

Те най-често биват генерирани от допълнителните филтри, които наблюдаваме, когато искаме да конкретизираме параметрите на даден продукт – например ако търсим маратонки, можем да сведем резултатите само до дадена марка, цена, размер, цвят и т.н.

 

Навигация с параметри

 

Тези параметри могат да объркат структурата на сайта Ви. Ето и как изглеждат, реално:

 

URLs с динамично генерирани параметри

Това са прости примери, във Вашия случай CMS системата може да добавя и още параметри и да се получи ненужно дълъг URL, който да не говори почти нищо на Google.

 

Освен това ботовете на търсачката може да решат да обходят всички възможни варианти между различните параметри, с което да загубят ресурс в излишното обхождане на URL адреси, които никой потребител не би потърсил.

 

Решението в случая е да зададете canonical таг на предпочитания URL и да нагласите настройките за параметрите в Google Search Console. Допълнително действие е и блокирането на достъпа до определени URL-и в robots.txt чрез използването на символа( * ), с който забранявате индексирането на каквото и да е след него. Например:

 

Disallow: /chocolate-recipes/cake/*

 

6. Огледални поддиректории

 

Развивате ли бизнеса си в повече от една страна? Някои компании предпочитат да имат една универсална Начална страница, от която потребителите да избират сами версията, която искат да ползват. Например:

 

  • URL 1: www.wonderfullywhisked.com/fr
  • URL 2: www.wonderfullywhisked.com/de

 

Това може да изглежда логично, но все пак трябва да прецените дали наистина имате нужда от подобна настройка. Докато Вие таргетирате различни аудитории, двете поддиректории си делят еднакви продукти и съдържание и границите между версиите започват да се размиват. Превантивна мярка срещу подобен проблем е да зададете в Google Search Console location targeting.

 

7. Синдикирано съдържание

 

Синдикирано съдържание

 

 

Синдикираното съдържание може да бъде от голяма полза, когато търсите разширяване на аудиторията. Все пак, трябва да се вземат някои предпазни мерки, за да няма главоболия впоследствие.

 

В общия случай, ще поискате от този, който ще публикува Вашето съдържание на неговия сайт, да сложи в кода rel=”canonical”, който да показва, че оригиналното съдържание си е Ваше. Също така, може да се зададе noindex.
И накрая, прието е сайтът, който ще публикува Ваши неща, да включи линк към уебсайта Ви, в знак на уважение.

 

8. Подобно съдържание

Подобно съдържание

 

Когато говорим за наистина дублирано съдържание, подобното може би е най-малкият Ви проблем. Въпреки това, дефиницията за дублирано съдържание на Google включва съдържание, което е “значително подобно”.

 

Може два текста да са с различен синтаксис, но ако и от двата извличаме една и съща информация, значи няма реална нужда от наличието и на двата варианта в сайта Ви. Ако разпознавате подобен проблем при Вас – добрият стар canonical е първият помощник, за който се сещаме. Другата възможност е да обедините текстовете в един.

 

Финални думи

 

Защо е важно да се обърне внимание на гореспоменатите евентуални проблеми? Ами, поради простата причина, че наличието на такива ще се отрази на качественото обхождане и индексиране на съдържанието Ви. Както виждате, като цяло методите за справяне са canonical таг, 301 редирект, noindex/nofollow тагове и контрол над параметрите. Ако периодично прилагате този чеклист за сайта си и изпълнявате споменатите бързи действия, ще си спестите доста излишни нерви.

Оригиналът на тази статия може да намерите тук.

 

 

Post author

Inbound сертифициран маркетингов експерт. С интерес към белите SEO практики, маркетинга чрез съдържание, както и рекламите в Google и социалните медии.