Подробный отчет о глубоком анализе кода с учетом семантики языков.
Детальная проверка
CodeСhecker находит сходство в логических схемах и уникальном стиле кода. Изменение переменных, пробельных символов, имен функций, комментариев и другие косметические особенности не скроют сходство от системы.
CodeСhecker сравнивает код c предоставленными компанией внутренними репозиториями, а также за их пределами. Сначала материалы тщательно сравниваются друг с другом, а затем с миллионами источников из GitHub.
В систему загружается репозиторий в виде zip-архива или ссылки на GitHub
Система определяет языки исходного кода и выбрасывает лишние файлы (бинарные данные, тесты, внешние библиотеки и пр.)
2
1
Оставшиеся файлы система токенизирует с учетом обфускаций и строит наборы хэшей шинглов.
По индексу шинглов система находит похожие репозитории и делает попарные сверки.
4
3
Система формирует отчёт в json-формате и возвращает данные через API
5
100%
клиентов в России и за рубежом
> 1200
патентов в области информационного поиска
> 30
CodeСhecker — это продукт компании Антиплагиат
источников в индексе
> 1
млрд
Компания Антиплагиат — разработчик первой системы поиска заимствований в русскоязычных текстах. Система входит в реестр отечественного программного обеспечения.
документов в сутки
> 300
тыс.
на рынке IT-продуктов
2005
с
г.
Наши партнеры
НИУ Высшая школа экономики
Белорусский национальный технический университет
Таджикский национальный университет
Российский университет дружбы народов
Центр исследования экстремальных ситуаций
Высшая Аттестационная Комиссия Кыргызстана
ВНИИГМИ-МЦД
Издательский дом «Финансы и кредит»
Казахский национальный университет им. аль-Фараби
Часто задаваемые вопросы
CodeСhecker — это продукт компании Антиплагиат, которая дорожит репутацией и с 2005 года присутствует на российском и зарубежном рынке. Мы гарантируем полную защиту от утечек. Также существует возможность установки локальной версии системы на оборудовании заказчика. В этом случае все репозитории обрабатываются и хранятся на оборудовании клиента.
Поиск происходит через сопоставление хэшей шинглов по заранее подготовленному индексу. Это гарантирует нам обнаружение всех похожих последовательностей исходного кода с учетом различных комбинаций замен, вставок, удалений, а также более глубоких обфускаций. Применимость алгоритма как с точки зрения качества результата, так и производительности, полностью оправдала себя на примере решения задачи поиска заимствований в тексте в продукте «Антиплагиат».
Переносы строк, переименование переменных, переставление блоков кода местами и между файлами, а также компиляцию репозитория из множества источников. CodeChecker обнаружит эти маскировки и выделит фрагмент кода как потенциально заимствованные.
Проверка одного типичного репозитория занимает секунды. Проверки можно осуществлять параллельно.
В отчете будут ссылки на репозитории, из который нашлись заимствования, а также конкретный исходный код, который был скопирован.
В этом случае будут найдены все проиндексированные источники, из которых был собран проверяемых репозиторий.
Поисковая система использует современные подходы для горизонтального масштабирования и позволяет автоматически подстраиваться под любые нагрузки.
Заполните форму и мы свяжемся с вами в ближайшее время.