Тест на определение уникальности контента

Разговор пойдет о сео тесте и проблеме встречи повторяющегося контента, проведен на движке Wordpress но подходит для любой другой CMS или страницы любого сайта.
Итак, были созданы три страницы с абсолютно одинаковым контентом и почти одинаковым адресом.

ibb.ro/wordpress/continut-duplicat-in-wordpress-noindexfollow/
ibb.ro/optimizare-site/continut-duplicat-in-wordpress-noindexfollow/
ibb.ro/optimizare-seo/continut-duplicat-in-wordpress-noindexfollow/

Интересно узнать реакцию Google так как он противится копированию конткнта и в итоге страница с дублированным контентом не сможет занять приличную позицию.

Итак, на какие вопросы мы хотим найти ответ:
- Выберет ли поисковик страницу с уникальным конткнтом и разместит выдаче только эту страницу?
- Будут ли в выдаче все страницы одна за другой?
- Будут ли находиться страницы в выдаче по разным запросам?
- Как различны будут результаты в дата-центрах Google?

Небольшие несоответствия
Конечная часть адреса страниц одинаковая но начальная категория для первой страницы содержит /wordpress/ что несомненно добавит ей позиций при поисковом запросе который содержит слово wordpress. В остальных двух адресах начальные части адреса более идентичны (/optimizare-site/ и /optimizare-seo/) что позволит провести между ними более удачную параллель.

Страница с категории /wordpress/ имеет ещё один плюс, она была создана ранее и имеет одну внешнюю ссылку с чужого блога которая была проставлена на 2 месяца раньше.

Что можно добавить:
Что покажет поиск по запросам “noindexfollow” “noindex follow” “noindex-follow”? Интересно тем что конец ссылки написан на английском хотя вся страница имеет румынский контент.

Что выдает Google по запросу "continut-duplicat-in-wordpress-noindexfollow" можем увидеть тут:



Заметьте что они расположены одна за другой, то есть на местах 1, 2, а третья прячется под суплименталом .
Прошли пару удачных дней и Google выставляет 2 страницы в выдачу, в КЭШе может появится еще 1 страница, которая появилась еще с прошлого раза…. Это говорит многое о том как Google индексирует страницы… Об этом надо задуматься… timestamp активирован, во всех датацентрах, но страницы могут быть старее чем там пишут, или могут быть новее.

Когда были индексированны

По очереди:
25 Mar 2007 06:20:14 GMT
24 Mar 2007 08:34:51 GMT
24 Mar 2007 14:58:43 GMT

По: http://209.85.129.104/

http://209.85.135.104/ также показывает главную страницу в КЭШе с датой: 27 Mar 2007 10:31:21 GMT
Хотим чтобы все страницы привлекли внимания с той же мерой, и с одинаковой популярностью ссылок, кроме той из категории /wordpress/, которая будет иметь маленькое преимущество в течении 2 месяцев за счет ссылки в блоге.

Спасибо Тео и Флорин за помощь. Есть сайты на английском с большим приоритетом (pagerank respectiv trafic).
Вы могли бы сказать что много схожести в ранжировании тех трех страниц (они еще и одинаковые) и не могли бы сделать вывод. После стабилизации результатов дадим страницам boost которые являются последними в ранге Google, чтоб симулировать ситуацию копирования с контекста некого сайта. Как быстро поменяется классификация?

Есть но что посмотреть… много того о чем я еще не задумался .




Перевод с румынского языка оригинала статьи
Перевод почти дословный и немного непонятный.