Такой, знаете, спонтанный пост. На днях нас позабавил один заказчик.

Написали для него текст на околостроительную тематику. Высылаем на проверку.

Клиент возвращает нам статью с комментарием вроде:
нужна 100%-я уникальность, а я проверил и увидел, что уникальность всего 93%...

Ну, во-первых, с точки зрения здравого смысла (который не всегда легко до заказчика донести) вполне себе приличный результат для такой темы. По крайней мере, отторжения вызвать не должен — приживется в любом случае :) Да и, положа руку на сердце, 100% — это скорее миф, подробнее об этом — в статье Уникальность текста: вся правда.

С учетом того, что тексту еще предстоит пройти вычитку и правку, уникальность может заметно измениться — как в лучшую, так и в худшую сторону... То есть проверять ее по большому счету имеет смысл после вычитки и правки. Ну да ладно, клиент иногда всегда прав.

Идем проверять привычными инструментами и все они — в результате нескольких проверок — чуть ли не в один голос заявляют: Уникальность текста 99-100%!

Мистика? Не-а...

Разбираемся дальше. Мы проверяли с помощью:

  • miratools.ru
  • Etxt Антиплагиат
  • Advego Plagiatus
  • text.ru

То есть были использованы два онлайн-сервиса + две программы для проверки. Как правило, одновременное использование нескольких инструментов дает более достоверный результат. Причем, даже сомнительный text.ru, который, судя по всему, использует бессовестную длину шингла, равную 3, — и тот показал 100%!

Я немного отвлекусь, секретный совет вам дам: постарайтесь никогда-никогда не проверять специализированные или технические тексты (а лучше вообще никакие) с длиной шингла 3. Иначе безобидные фразы вроде «деревянные лестницы бывают» могут стать реальным камнем преткновения.

Идем далее. Спрашиваем у заказчика, каким инструментом пользовался он. Выясняется: www.content-watch.ru/text. Ладно, спасибо за подсказку — теперь знаем еще один полезный инструмент, будем тестировать.

Проверяем текст указанным сервисом 5 раз — получаем уникальность: 100%. Какие фразы править, что уникализировать, чтобы заказчик был счастлив?

В общем, при дальнейшей переписке выясняется, что заказчик взял фрагмент текста в виде небольшого абзаца и проверил его...

Как вам кажется, это корректная проверка? Вот и нам тоже показалось, что результат для отдельно взятого абзаца очень даже может не совпасть с результатом проверки всего текста. Особенно при маленьком шингле. Особенно, если неуникальная фраза как раз и содержится в проверяемом фрагменте.

Вот так бывает с этой уникальностью. Поэтому если вас обвиняют в плагиате, не забудьте уточнить:

  • каким инструментом пользовался клиент;
  • какой шингл использовал (не факт, правда, что любой заказчик ответит на этот вопрос);
  • весь ли текст проверялся, или же по частям.

Да, кстати, о проверке по частям. Онлайн-сервисы проверки уникальности, как правило, имеют ограничение по объему текстов, поэтому иногда приходится проверять свои творения кусками. Как получить наиболее достоверный результат в данном случае? Я делаю так.

  1. Независимо от допустимого объема разбиваю текст на приблизительно равные части.
  2. Проверяю каждую часть отдельно.
  3. Для получения итоговой уникальности беру среднее арифметическое от результатов: суммирую полученные проценты и делю на количество фрагментов.

Чуть не забыл. Как бы к вам ни придирались, чего бы ни требовали, как бы ни обвиняли в плагиате, в глубине души знайте: если вам удалось добиться даже 90%-95% уникальности, значит, вы написали уникальный (по крайней мере, технически) текст. На фоне стремительного развития Интернета и ежедневного появления на его просторах все новых текстов, это высказывание становится все более справедливым.

О технической и фактической уникальности вы можете узнать все из той же статьи Уникальность текста: вся правда.

 

Еще посты по теме: