дублированный контент

Тема в разделе "Общие вопросы оптимизации", создана пользователем sm_seo, 27 окт 2013.

Статус темы:
Закрыта.
  1. sm_seo

    sm_seo На форуме с: 27 окт 2013 Сообщения: 5

    Не могу разобраться вот в каком вопросе.
    Пусть дана страница, на которой
    - есть контент
    - и есть ссылка, позволяющая сохранить этот контент пользователю через download.

    Схематически:
    page-html:
    href = download-CONTENT (в виде файла PDF)
    CONTENT (просто текст)

    CONTENT один и тот же, разница лишь в представлении, верхний CONTENT в виде PDF,
    а нижний - просто текст.

    Что проиндексирует bot?
    Как я понимаю он отправит в результат поиска сам CONTENT-text и файл-PDF (где тот же самый контент,
    но только в формате PDF).

    Но контент один и тот же!
    Будет ли поисковая машина считать этот CONTENT дублированным?
  2. Сержа

    Сержа На форуме с: 20 дек 2011 Сообщения: 1.374

    У меня много таких тестов. Пессимизации не замечал.
  3. sm_seo

    sm_seo На форуме с: 27 окт 2013 Сообщения: 5

    Сержа,
    спасибо, что ответил.

    Я - новичок.
    Совсем недавно стал серьезно интересоваться SEO.
    Что значит "тестов"?
    И что значит "пессимизации"?

    Я все делаю правильно? И не нужно опасаться, что bot поймет, что контент дублированный?
  4. Сержа

    Сержа На форуме с: 20 дек 2011 Сообщения: 1.374

    Тестов - это абшипка, надо ТЕКСТОВ.
    Пессимизация -= это когда ПС понижает сайт в выдаче, но не выбрасывает из индекса.
    Чтобы отвечать предметно, надо взглянуть на сайт. Любая критика или ругань - польза. Будьте толстокожим.
  5. GreenT

    GreenT На форуме с: 20 сен 2013 Сообщения: 103

    Сталкивался по работе, с большим количеством подобных вещей на одном сайте (официальное представитель производителя зарубежных грузовых автомобилей в россии). В один прекрасный день, pdf и word файлы перебили в индексе сами страницы, так что я бы порекомендовал поставить теги noindex nofollow на ссылку на pdf и вокруг самого pdf
  6. sm_seo

    sm_seo На форуме с: 27 окт 2013 Сообщения: 5

    Сержа,
    я пока не готов показывать "сырой" сайт :a12:
    --- добавлено: 28 окт 2013 в 20:17 ---
    GreenT,
    покажи, пожалуйста, как можно на ссылку на PDF поставить 'noindex, nofollow'...
    Я знаю, что можно такое сделать на целую страницу...
    Неужели можно сделать и "на ссылку на PDF"?
    И пока не понимаю как это "вокруг PDF"?

    Вот, посмотрите, пожалуйста, что мне непонятно.

    Есть страница, на ней отображается некоторая PDF-ка - уникальная научная статья.
    И на этой же странице, выше визуального отображения этой статьи есть ссылка на download этой статьи.

    Бот попадает на эту страницу и видит, что download дублирует контент.
    В SERP попадает страница, на которой визуально можно видеть сразу же статью.
    А файл, который бот скачал по download он отправляет в дублированный контент.

    Как сделать так, чтобы страница не попала в результаты индексирования, а попал бы только сам PDF-файл,
    который скачивается по ссылке download?

    Не могу понять, как на такое действие настроить паука...
  7. GreenT

    GreenT На форуме с: 20 сен 2013 Сообщения: 103

    бот скорее всего склеит контент и файл

    закрываете контент тегом <noindex> content </noindex> который не нужно индексировать. соответственно проиндексируется только пдф файл. в этом случае если вам нужен пдф файл в выдаче не какими тегами закрывать его не надо

    и справочная информация

    http://ru.wikipedia.org/wiki/Noindex
    http://ru.wikipedia.org/wiki/Nofollow
  8. sm_seo

    sm_seo На форуме с: 27 окт 2013 Сообщения: 5

    Что значит "склеит"?
    В результат индексирования войдет только визуальная страница, но сам PDF-файл нет?



    Надо чтобы понимал не только Yandex, но и Google.
  9. GreenT

    GreenT На форуме с: 20 сен 2013 Сообщения: 103

    если закроете контентную часть на сайте то в выдачу войдет именно пдф файл.

    склеит значит сочтет идентичными и равнозначными.


    для гугла в роботс можно попробывать закрыть, а так атрибут nofollow для ссылки как раз для гугла.

    моё личное мнение что стоит больше внимания уделять яндексу чем гуглу, так как 60-70% поискового трафика в нашей стране идет именно через эту ПС. Так же у мейла схожие алгоритмы, что даст вам еще трафика и с мейла. ОПтимизация под гугл вот это уж точно пляски с бубном, определенные закономерности есть, но вывести их куда сложнее чем с ПС яндекс.

    Успехов!
  10. Chilintano

    Chilintano На форуме с: 26 янв 2014 Сообщения: 19

    • еще одна такая вставка на 3к символов и устным предупреждением не отделаетесь.
    Здравствуйте, решил спросить здесь, чтобы не создавать лишней темы. Узнал, что страницу с скопированным текстом надо прятать от индексации, хотел спросить куда именно надо вставлять тэг noindex в тексте ниже?
    <p class="MsoNormal"><img class="alignleft size-medium wp-image-338" title="dh-dhdhdhdhdh-dhdhu-dhndhdh-ndhndhdhdhdhdh-dh-dhdhdhdhdhunndhdh" src="http://localhost/localblog/wp-conte...hndhdhdhdhdh-dh-dhdhdhdhdhunndhdh-193x300.jpg" alt="dh-dhdhdhdhdh-dhdhu-dhndhdh-ndhndhdhdhdhdh-dh-dhdhdhdhdhunndhdh" width="193" height="300" />В экономике Империи Инков [... и далее очень много текста]

    2. Я вырезал этот текст из HTML редактора вордпресса, и заметил здесь что абзац открывается тэгом параграфа <p> а закрывается тэгом переноса <br> это плохо скажется на индексации и прочих неприятностей? Из за чего так?

    Спасибо за внимание.

    // edit by leshii
  11. leshii

    leshii Модератор На форуме с: 4 сен 2011 Сообщения: 2.539 Команда форума

    куда хотите. Зависит от того, что нужно закрыть. http://help.yandex.ru/webmaster/controlling-robot/html.xml#noindex

    Это никак не скажется ни на индексации, ни на прочих неприятностях.
    Из-за того, что так работает ваш редактор.
Similar Threads
  1. pachka
    Ответов:
    10
    Просмотров:
    1.149
  2. Kimiganozomueien
    Ответов:
    14
    Просмотров:
    1.390
  3. Maxim
    Ответов:
    6
    Просмотров:
    1.137
  4. Maxer2013
    Ответов:
    13
    Просмотров:
    549
  5. Анна
    Ответов:
    10
    Просмотров:
    631
Загрузка...
Статус темы:
Закрыта.