Такой, знаете, спонтанный пост. На днях нас позабавил один заказчик.
Написали для него текст на околостроительную тематику. Высылаем на проверку.
Клиент возвращает нам статью с комментарием вроде:
нужна 100%-я уникальность, а я проверил и увидел, что уникальность всего 93%...
Ну, во-первых, с точки зрения здравого смысла (который не всегда легко до заказчика донести) вполне себе приличный результат для такой темы. По крайней мере, отторжения вызвать не должен — приживется в любом случае Да и, положа руку на сердце, 100% — это скорее миф, подробнее об этом — в статье Уникальность текста: вся правда.
С учетом того, что тексту еще предстоит пройти вычитку и правку, уникальность может заметно измениться — как в лучшую, так и в худшую сторону... То есть проверять ее по большому счету имеет смысл после вычитки и правки. Ну да ладно, клиент иногда всегда прав.
Идем проверять привычными инструментами и все они — в результате нескольких проверок — чуть ли не в один голос заявляют: Уникальность текста 99-100%!
Мистика? Не-а...
Разбираемся дальше. Мы проверяли с помощью:
- miratools.ru
- Etxt Антиплагиат
- Advego Plagiatus
- text.ru
То есть были использованы два онлайн-сервиса + две программы для проверки. Как правило, одновременное использование нескольких инструментов дает более достоверный результат. Причем, даже сомнительный text.ru, который, судя по всему, использует бессовестную длину шингла, равную 3, — и тот показал 100%!
Я немного отвлекусь, секретный совет вам дам: постарайтесь никогда-никогда не проверять специализированные или технические тексты (а лучше вообще никакие) с длиной шингла 3. Иначе безобидные фразы вроде «деревянные лестницы бывают» могут стать реальным камнем преткновения.
Идем далее. Спрашиваем у заказчика, каким инструментом пользовался он. Выясняется: www.content-watch.ru/text. Ладно, спасибо за подсказку — теперь знаем еще один полезный инструмент, будем тестировать.
Проверяем текст указанным сервисом 5 раз — получаем уникальность: 100%. Какие фразы править, что уникализировать, чтобы заказчик был счастлив?
В общем, при дальнейшей переписке выясняется, что заказчик взял фрагмент текста в виде небольшого абзаца и проверил его...
Как вам кажется, это корректная проверка? Вот и нам тоже показалось, что результат для отдельно взятого абзаца очень даже может не совпасть с результатом проверки всего текста. Особенно при маленьком шингле. Особенно, если неуникальная фраза как раз и содержится в проверяемом фрагменте.
Вот так бывает с этой уникальностью. Поэтому если вас обвиняют в плагиате, не забудьте уточнить:
- каким инструментом пользовался клиент;
- какой шингл использовал (не факт, правда, что любой заказчик ответит на этот вопрос);
- весь ли текст проверялся, или же по частям.
Да, кстати, о проверке по частям. Онлайн-сервисы проверки уникальности, как правило, имеют ограничение по объему текстов, поэтому иногда приходится проверять свои творения кусками. Как получить наиболее достоверный результат в данном случае? Я делаю так.
- Независимо от допустимого объема разбиваю текст на приблизительно равные части.
- Проверяю каждую часть отдельно.
- Для получения итоговой уникальности беру среднее арифметическое от результатов: суммирую полученные проценты и делю на количество фрагментов.
Чуть не забыл. Как бы к вам ни придирались, чего бы ни требовали, как бы ни обвиняли в плагиате, в глубине души знайте: если вам удалось добиться даже 90%-95% уникальности, значит, вы написали уникальный (по крайней мере, технически) текст. На фоне стремительного развития Интернета и ежедневного появления на его просторах все новых текстов, это высказывание становится все более справедливым.
О технической и фактической уникальности вы можете узнать все из той же статьи Уникальность текста: вся правда.