Проверка уникальности текстов в онлайн сервисах антиплагиата и с помощью программ, помогающих найти сайты плагиаторов
На вопрос «что такое плагиат» лучше всего, наверное, ответит Википедия (читайте про Вики-энциклопедию и ее устройство). В нашем же понимании, плагиат является довольно общим термином и применим к различным областям жизнедеятельности человека.
По большому счету, это присвоение чужой интеллектуальной собственности (находящейся априори под защитой авторских прав), выдавая ее либо за свою, либо делая это без разрешения автора. В этой статье я хочу поговорить про копирование текстов в интернете и способах борьбы с этим злом (антиплагиат).
В связи с ростом популярности интернета проблема уникальности текстов встает очень остро. Всегда возникает соблазн скопировать (это называется copypast) чужой материал и выдать его за свой. Так могут поступать студенты при работе над рефератом, курсовым или дипломным проектом.
Так могут поступать и вебмастера при наполнения своего сайта текстовым контентом, а также копирайтеры, не желающие особо заморачиваться над написанием уникальных статей (возможен не чистый копипаст, а так называемый рерайт, т.е. переложение).
Но на всякое действие найдется и противодействие. В сети существует ряд отечественных и буржуйский онлайн сервисов, позволяющих проверить текст на уникальность, а также имеется целый набор программ, которые могут проверить целый сайт на уникальность размещенных на нем материалов. Конечно же, все эти методы будут обладать какими-то недостатками, но по большей части со своей задачей отлова плагиата они справляются.
Кто проверяет тексты на уникальность (плагиат)
Кому могут понадобиться подобные сервисы? Ну, например, студентам, которые покупают (или сами переделывают до неузнаваемости) реферат, диплом или курсовую работу по сходной цене и не хотят спалиться на плагиате. Ведь преподаватели тоже стали ушлыми и прекрасно понимают откуда берутся все эти фундаментальные труды.
Для этих целей специально заточен онлайн сервис Антиплагиат, который может проверить на уникальность текстовые фрагменты размером до пяти тысяч символов. Ищет он по собственной накопленной базе, а также постоянно пополняет ее из интернета. Любой преподаватель или студент может узнать процент уникальности своего текста и источники, откуда он предположительно мог быть скопирован.
Вторая основная группа клиентов подобных сервисов и программ — это вебмастера. Тут возможно несколько причин, по которым этим труженикам веба может понадобиться проверка текстов на плагиат:
Лично мне в первую очередь интересна именно проверка моих статей на уникальность, ибо есть вероятность, что это является одним из факторов ранжирования в поисковых системах, пускай и не слишком весомым.
Если вы когда-нибудь присутствовали или смотрели в записи SEO конференции (семинары или коучинги), то несомненно встречали там популярное среди SEO-профи мнение о том, что если материалы ваших продающих страниц стали не уникальными (их скопировали плагиаторы), то это однозначно приведет к понижению позиций в выдаче, по крайней мере в поисковой машине Яндекса.
Единственным выходом будет переписывание этих самых текстов для придания им уникальности. Почему-то раньше я не обращал внимание на этот очевидный факт, считая, что мой ресурс не является продающим, а значит фактор плагиата можно попросту игнорировать. Да и идея с переписыванием выглядит не реально — только успею переписать пару статей, как они опять же будут растиражированы. Сизифов труд получается.
Раз проблема не имела однозначного решения, то я решил отложить борьбу с плагиатом на потом (в долгий ящик). Однако, в последнее время я наблюдаю снижение позиций моего блога в обоих поисковиках (Яндексе и Гугле) и связано это, скорее всего, с одним из внешних факторов ранжирования (либо отвалились какие-то шикарные обратные ссылки, либо сказывается влияние плагиата, который, несомненно, имеет место быть), либо с изменением алгоритма и изменением веса тех или иных факторов в поисковиках.
В общем, утопающий хватается за соломинку и я решил начать с борьбы с воровством контента. Задача состоит из двух этапов:
В этой статье мы в основном поговорим про решение первой проблемы (поиск плагиаторов), ну, а вторая проблема решается далеко не всегда однозначно, если вообще решается. При неудачном стечении обстоятельств вы так и не сможете вернуть уникальность своим текстам и удалить плагиат или даже весь сайт нехорошего человека. Но попытаться стоит, ибо чем меньше будет копий, тем лучше.
По идее поисковые машины, обладающие чудовищными вычислительными и информационными ресурсами, сами могли бы взять на себя роль цензоров (антиплагиата) и удалять из индекса появляющиеся там дубли уже ранее проиндексированных документов (оригиналов). В общем-то, какие-то шаги в этом направлении ведутся, и Яндекс добавил в свою панель вебмастера опцию «Оригинальные тексты», а Гугл дал возможность показать авторство с помощью привязки сайта к своем аккаунту в социальной сети Google+.
Но обольщаться не стоит, ибо все это еще не работает, а если и работает, то не в интересах вебмастера. Поисковики по большому счету не заинтересованы в борьбе с копипастом материально и оставляют вебмастеров одних разбираться со своими проблемами. Спасение утопающих по-прежнему является делом рук самих утопающих. Однако, использовать инструменты Яндекса и Гугла по закреплению авторства все равно стоит, хотя бы в расчете на будущее.
Яндексу, например, интересны случаи, когда плагиат встает в поисковой выдаче выше оригинала и просит сообщать о таких казусах. Доказательством вашего авторства может как раз являться более раннее добавление статьи и «Оригинальные тексты» панели вебмастера.
Писать можно через Яндекс вебмастер по ссылке «Задать вопрос о сайте службе поддержки». Правда, если в выдаче плагиатор стоит ниже вас, то ответ вы получите формальный (что, мол, это зеркало рунета, который за отражающиеся в нем предметы никакой ответственности не несет).
Однако, бытует устойчивое мнение, что на самом деле, при доносе Яндексу на сайт с копипастом, действия по его удалению из индекса Платонами предпринимаются и справедливость наступает несколько раньше, чем до такого редиски добирается неминуемый АГС (фильтр Яндекса против ГС).
Лично я занимаюсь этим грязным делом (антиплагиатом) уже чуть более месяца и за это время удалось добиться удаления моих статей с пяти или шести ресурсов. Один из них был удален хостером (контактов на сайте не было). В остальных случаях получилось урегулировать вопрос благодаря переписке с владельцами.
Иногда приходилось довольно долго разъяснять ситуацию, а иногда статьи удалялись по первому требованию. В общем, не так страшен черт, как его малюют. Главное, как мне кажется, общаться вежливо, но напористо, показывая свою решимость идти до конца.
Удивительно, что среди плагиаторов были довольно трастовые (с Тиц и Пр) и посещаемые ресурсы (несколько сотен в день), а это особенно опасно для молодых проектов, индексация Яндексом которых обычно оставляет желать лучшего (у меня, во всяком случае, так было по началу).
Например, если же я захочу скопировать новую статью с только что появившегося ресурса и автор не добавит ее перед публикацией в Я.В., то авторство закрепится, скорее всего, за мной (проиндексируется у меня быстрее) и доказать плагиат будет сложно.
Антиплагиат, Copyscape и Istio и другие онлайн сервисы
Итак, давайте рассмотрим те средства, которые имеются у нас в арсенале для выявления плагиата наших же уникальных текстов. Делать это можно непосредственно в поисковых системах или же при посредничестве онлайн сервисов, а так же с десктопных программ. Каждый из способов имеет право на жизнь, а для получения наибольшего эффекта можно использовать сразу несколько вариантов.
Самый очевидный способ поиска плагиаторов любой из ваших статей (или купленного курсового проекта) заключается в использовании «оператора кавычки» при поисковой строке (читайте подробнее как ищут в Яндексе и как искать в Google).
Копируете предложение средних размеров из своего текста, вставляете его в поисковую строку, окружив кавычками. Поисковик будет вынужден вести поиск по точному соответствию данной фразе (принципы работы операторов поиска описаны в приведенных чуть выше статьях) и в выдаче вы увидите все те сайты, где встречается это предложение.
Для полноты картины нужно будет нажать на ссылку «Показать все без исключения». Потом поочередно переходите на указанные в выдаче ресурсы и решаете для себя, является ли данное заимствование плагиатом и будете ли вы с этим бороться. Например, у меня, в силу того, что в RSS ленту отдается только начало статьи, находится множество анонсов моих публикаций, на которые я попросту не обращаю внимания.
Интересной особенностью является то, что при таком способе поиска нарушителей авторского права, у меня довольно часто находится онлайн сервис Мегаиндекса по проведению аудита сайта на предмет ошибок. Он разбирает публикации на пассажи (фрагменты, заключенные между точкой и идущей за ней заглавной буквой), которые с успехом находят поисковые системы. Хорошо ли это?
То же самое можно будет проделать и в Гугле. Там может найтись то, что не нашлось в Яндексе и, соответственно, наоборот. Ограничение на длину вводимого в поисковую строку фрагмента в несколько десятков слов делает этот способ не идеальным решением для поиска плагиата.
Многие из рассмотренных ниже онлайн сервисов и программ умеют проверять на заимствование большие фрагменты. Они просто разбивают их на кусочки и зачастую потом сообщают еще и процент уникальности.
Антиплагиат — уже упомянутый мною ранее онлайн сервис. Ориентирован всецело на клиентов из учебных заведений. В своем базовом функционале бесплатен (имеются тарифы для поиска по расширенным базам) и позволяет проверить на уникальность текст, скопированный из буфера обмена размером до 3000 символов, можно будет даже без регистрации. После регистрации вы получите возможность загружать файлы различных популярных форматов (HTML, TXT, DOC, RTF, DJVU и PDF), а не пользоваться клипбордом.
Несмотря на утверждение, что данный онлайн сервис ищет заимствования (или цитаты) по открытым в интернете источникам, бытует мнение, что Антиплагиат использует свою собственную собранную базу научных и не очень работ. Для поиска плагиаторов этот сервис не подходит, во всяком случае, скопированный с моего блога текст оказался абсолютно уникальным и нигде в интернете не засвеченным, включая и мой блог. Чудеса.
Разработчики также предлагают внедрять их программное обеспечение в компьютерную систему вузов для повышения простоты поиска плагиата среди сданных студентами работ.
Copyscape — самый известный и популярный в мире онлайн сервис, позволяющий проверить тексты страниц вашего сайта на уникальность. Его отличительной особенностью является невозможность проверки фрагмента текста, скопированного через буфер обмена — можно только указать URL вебстраницы.
Copyscape разбивает часть указанной вебстраницы на кусочки, которые прогоняет через поисковую систему Гугл по аналогии с описанным в первом пункте. Если вы не захотите заплатить разработчикам, то вам разрешат проверить лишь десяток страниц за день. Хотите больше? Придется платить. Но кроме снятия ограничений на проверку уникальности вы получите еще и некоторую автоматизацию.
При выборе одного из платных тарифов вы получаете довольно интересную возможность — защиту вашего сайта от плагиата. Нет, конечно же, Copyscape с «редисками» воевать за вас не будет, но зато он будет периодически (в зависимости от выбранного вами тарифа — раз в день или в неделю) проверять тексты вашего сайта на уникальность и выявлять новых плагиаторов.
Правда опять же присутствуют ограничения на количество суточных проверок (до 100) и размер страниц. Я пока покупать ничего не стал, а просто пользуюсь этим сервисом время от времени для поиска того, чего не удалось найти другими способами.
Text.ru — отечественный бесплатный ресурс, позволяющий проверить уникальность скопированных из буфера обмена текстовых фрагментов онлайн. Работает довольно быстро, результаты исчерпывающие (список сайтов нарушителей и процент заимствования). FAQ у них еще не доделан, поэтому ничего не могу сказать про ограничение на размеры проверяемых текстов.
Вводимый фрагмент можно будет так же проверить и на ошибки (как-то я уже писал обзор онлайн сервисов по проверке грамматики).
Istio — давно использую этот сервис для анализа текста своих статей на предмет процентного вхождения ключевых слов. Но он умеет еще и проверять на уникальность с указанием ресурсов нарушителей.
Можно вводить текст как из буфера обмена, так и просто указать Url адрес страницы своего сайта. При поиске плагиата сервис использует данные поисковых машин Яндекс и Яхоо.
Проверка на плагиат с помощью программ
Плагиата.НЕТ — довольно функциональная программа по поиску нарушителей ваших авторских прав. Можно будет ввести фрагмент текста или же указать список URL адресов вебстраниц, на которых требуется проверить уникальность:
Если захотите проверить тексты всех страниц своего ресурса, то добавьте его на вкладке «Инструменты» — «Мои сайты». После чего перейдите на вкладку «Инструменты» — «Проверить весь сайт» и запустите мастер поиска URL адресов страниц. Для этого задайте глубину проверки и нажмите кнопку «Получить»:
Когда парсинг страниц закончится, то нажмите на кнопку «Добавить адреса». Откроется уже знакомое окно поиска плагиата, где вам останется только нажать на кнопку «Проверить». Если страниц будет много, то и процесс затянется:
В общем, программа во многом неповторима, поэтому пробуйте и экспериментируйте. Если вы рерайтите чью-то статью, то эта софтина тоже может быть вам полезна, ибо она умеет определять степень уникальности прямо налету (по мере правки текста в ее окне).
Какие меры воздействия имеются на плагиаторов
Как я уже упоминал, вопрос борьбы с плагиаторами является самым сложным и неоднозначным. Нет такого рецепта, который бы подошел всем и срабатывал в ста процентах случаях. Во многом все зависит от сознательности владельцев сайтов, где вы обнаружили копии когда-то только ваших текстов и от сознательности владельцев хостинга, где размещаются данные ресурсы.
Влияет, конечно же, и ваше умение убеждать, но бывают непробиваемые товарищи и абузоустойчивые хостинги. Но по любому стоит попробовать все имеющиеся возможности воздействия, а именно:
Если переписка с нарушителем ваших авторских прав не приведет к желаемому результату, то можно будет написать владельцу или представителю хостинга, где это «чудо» обитает. Как узнать название и E-mail хостера? Ну, как правило, это сделать не сложно с помощь информации, заключенной в Whois домена плагиатчика (читайте мою статью про то, что такое домены и DNS сервера).
А так же может помочь бесплатный сервис анализа сайтов SEObuilding.RU, который указывает не только название хостера, но и почтовые адреса, по которым с ним можно будет связаться (иногда даже и контакные телефоны).
Лично мне нравится этот Whois сервис. Он выдает массу информации о хостере и регистраторе данного доменного имени, и зачастую там можно будет сразу же найти E-mail, куда и нужно отправлять свою абузу (жалобу, стук, донос). Но по любому вы, скорее всего, извлечете из этого многообразия информации название хостинга, после чего найти контактный ящик на его ресурсе будет делом пары минут.
Поисковые системы я поставил на последнее место, ибо в Гугле и Яндексе вы, скорее всего, получите формальную отписку. Однако, Яндекс по мнению многих специалистов все равно отреагирует и ускорит и так неминуемую смерть ГС или сплога, который тащит у вас контент и подлежит жестокой экзекуции за плагиат.
Стучать можно сюда:
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
Источник: ktonanovenkogo.ru