Словарь терминов¶
Объяснение технических терминов и понятий, используемых в BotSafe.
A¶
ASN (Autonomous System Number)¶
Автономная система (Autonomous System, AS) — группа IP-адресов и сетевых маршрутов, управляемых одной организацией, интернет-провайдером или оператором связи. Каждая автономная система имеет уникальный номер (ASN), присваиваемый региональными интернет-регистраторами (RIR). ASN используется для маршрутизации трафика в интернете и для определения провайдера интернета по IP-адресу посетителя.
Технические детали: - ASN — это 16-битное (до 65535) или 32-битное (расширенное) число - Автономные системы обмениваются маршрутной информацией через протокол BGP (Border Gateway Protocol) - Одна организация может управлять несколькими ASN - ASN позволяет определить тип провайдера (ISP, дата-центр, хостинг и т.д.)
Ссылки: - Wikipedia: Autonomous System - Wikipedia: Autonomous System Number
Используется в: - Как работает BotSafe — проверка ASN по IP-адресу - Настройки системы — настройка проверки ASN
B¶
Bot (Бот)¶
Бот (от англ. robot) — автоматизированная программа или скрипт, которая имитирует действия реального пользователя в браузере или взаимодействует с веб-сайтами без участия человека. Боты могут быть как полезными (поисковые роботы, мониторинг), так и вредоносными (накрутка трафика, сбор данных, мошенничество, DDoS-атаки).
Типы ботов: - Поисковые боты — индексируют контент для поисковых систем (Googlebot, YandexBot) - Мониторинговые боты — проверяют доступность и работоспособность сайтов - Злонамеренные боты — накрутка просмотров, кликов, регистраций, сбор данных - Парсеры и скраперы — автоматический сбор данных с сайтов - Боты социальных сетей — автоматизация действий в социальных сетях
Ссылки: - Wikipedia: Internet Bot - Wikipedia: Веб-бот
Используется в: - Как работает BotSafe — детекция ботов - Настройки системы — настройка детекции ботов - Примеры использования — защита от ботов
BotD¶
BotD — специализированная библиотека от компании FingerprintJS для определения ботов и автоматизированных браузеров. Библиотека использует продвинутые алгоритмы машинного обучения и анализирует множество сигналов браузера для выявления автоматизированного трафика. Используется в BotSafe для комплексной детекции ботов на серверах в России.
Возможности BotD: - Анализ свойств браузера и окружения - Обнаружение признаков автоматизации (WebDriver, headless-режим) - Анализ поведения браузера при выполнении JavaScript - Выявление аномалий в работе браузерных API - Определение инструментов автоматизации (Selenium, Puppeteer и др.)
Ссылки: - Официальный сайт BotD - Документация BotD - FingerprintJS
Используется в: - Как работает BotSafe — использование BotD для детекции - Расширенная детекция — настройка BotD
Browser Fingerprint (Отпечаток браузера)¶
Browser Fingerprint (отпечаток браузера, цифровой отпечаток) — уникальный идентификатор, создаваемый на основе множества параметров браузера и устройства пользователя. Fingerprint формируется из комбинации таких параметров, как версия браузера, разрешение экрана, установленные плагины, шрифты, часовой пояс, язык, Canvas fingerprint, WebGL fingerprint и множество других характеристик.
Принцип работы: - Каждый браузер имеет уникальную комбинацию параметров - На основе этих параметров создаётся хеш (fingerprint hash) - Fingerprint позволяет идентифицировать посетителя даже при использовании приватного режима или очистке cookies - Используется для отслеживания пользователей и детекции ботов
Типы fingerprint: - Canvas fingerprint — уникальный отпечаток на основе рендеринга Canvas - WebGL fingerprint — отпечаток на основе WebGL-рендеринга - AudioContext fingerprint — отпечаток на основе аудио-контекста - Font fingerprint — отпечаток на основе доступных шрифтов
Ссылки: - Wikipedia: Device Fingerprint - Wikipedia: Browser Fingerprint - FingerprintJS
Используется в: - Как работает BotSafe — создание и анализ отпечатков - Лимиты — ограничение количества fingerprint - Параметры визита — передача fingerprint в Яндекс.Метрику
C¶
Confidence (Уверенность)¶
Confidence (уверенность, достоверность) — числовое значение от 0.0 до 1.0, показывающее, насколько система BotSafe уверена в том, что посетитель является ботом. Значение рассчитывается на основе результатов всех выполненных проверок (frontend и backend) с учётом весов каждой проверки.
Как рассчитывается: - Каждая проверка имеет свой вес (от 0.0 до 1.0) - Результаты всех проверок объединяются с учётом весов - Итоговое значение confidence показывает общую уверенность системы - Если confidence превышает установленный порог (threshold), посетитель помечается как бот
Интерпретация значений: - 0.0-0.3 — низкая уверенность, скорее всего реальный пользователь - 0.3-0.5 — средняя уверенность, возможно бот - 0.5-0.7 — высокая уверенность, вероятно бот - 0.7-1.0 — очень высокая уверенность, точно бот
Используется в: - Основные параметры — настройка порога уверенности - Как работает BotSafe — расчёт уверенности - Параметры визита — передача уверенности в Яндекс.Метрику
Cookies¶
Cookies (куки) — небольшие текстовые файлы, которые веб-сайты сохраняют в браузере пользователя. Cookies используются для хранения информации о сессии пользователя, настройках сайта, предпочтениях, данных авторизации и другой информации, необходимой для работы сайта.
Типы cookies: - Session cookies — временные cookies, удаляемые при закрытии браузера - Persistent cookies — постоянные cookies с установленным сроком действия - First-party cookies — cookies, устанавливаемые доменом сайта - Third-party cookies — cookies, устанавливаемые сторонними доменами (реклама, аналитика)
Использование в BotSafe: - BotSafe проверяет, поддерживает ли браузер cookies и могут ли они быть сохранены - Отключенные cookies могут указывать на использование приватного режима или бота - Cookies используются для отслеживания посетителей между визитами
Ссылки: - Wikipedia: HTTP Cookie - Wikipedia: Cookie
F¶
Fingerprint¶
См. Browser Fingerprint.
Fraud (Фрод)¶
Фрод — мошенничество, обман. В контексте веб-трафика фрод означает мошеннический или некачественный трафик (боты, накрутка, поддельные заявки и т.д.), который не приносит реальной пользы бизнесу.
См. также: Fraud Traffic
Используется в: - Как работает BotSafe — описание антифрод-системы - Настройки системы — настройка детекции фрод-трафика - Примеры использования — борьба с фродом
Frontend¶
Фронтенд — часть системы, которая работает в браузере пользователя. В BotSafe фронтенд-проверки выполняются непосредственно в браузере посетителя.
H¶
Headless Browser (Headless-браузер)¶
Headless Browser (безголовый браузер) — браузер без графического пользовательского интерфейса (GUI), который управляется программно через API. Headless-браузеры выполняют все функции обычного браузера (рендеринг HTML, выполнение JavaScript, обработка CSS), но без отображения интерфейса, что делает их идеальными для автоматизации, тестирования и работы ботов.
Популярные headless-браузеры: - Chrome Headless — headless-режим Google Chrome - Firefox Headless — headless-режим Mozilla Firefox - Puppeteer — инструмент для управления headless Chrome - PhantomJS — устаревший headless-браузер (не поддерживается с 2018 года)
Использование ботами: - Автоматизация действий на веб-сайтах - Парсинг и скрапинг данных - Накрутка просмотров и кликов - Автоматическое тестирование веб-приложений
Ссылки: - Wikipedia: Headless Browser - Chrome Headless
Используется в: - Как работает BotSafe — детекция headless-браузеров - Автоматизированные инструменты — настройка проверки headless
I¶
IP-адрес¶
IP-адрес (Internet Protocol address) — уникальный числовой идентификатор устройства в сети интернет, используемый для идентификации и маршрутизации данных. IP-адрес позволяет определить местоположение устройства (геолокацию), интернет-провайдера, тип подключения и другую информацию о сетевом соединении.
Типы IP-адресов: - IPv4 — 32-битный адрес в формате xxx.xxx.xxx.xxx (например, 192.168.1.1) - IPv6 — 128-битный адрес в формате xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx - Публичный IP — адрес, видимый в интернете - Приватный IP — адрес в локальной сети (не виден в интернете)
Использование в BotSafe: - Определение местоположения посетителя - Проверка IP по базам данных (Firehol, StopForumSpam, IP2Proxy) - Определение провайдера через ASN - Выявление прокси, VPN и других методов скрытия IP
Ссылки: - Wikipedia: IP-адрес - Wikipedia: Internet Protocol
Incognito Mode (Режим инкогнито)¶
Incognito Mode (режим инкогнито, приватный режим, режим приватного просмотра) — специальный режим браузера, при котором не сохраняется история посещений, cookies, данные форм и другая информация о сессии. В режиме инкогнито браузер не сохраняет данные локально, но сайты и интернет-провайдер всё ещё могут отслеживать активность.
Особенности режима инкогнито: - История посещений не сохраняется - Cookies удаляются после закрытия окна - Данные форм не сохраняются - Загрузки и закладки могут сохраняться (зависит от браузера) - IP-адрес и другие данные всё ещё видны сайтам
Использование ботами: - Боты могут использовать инкогнито для скрытия следов автоматизации - Отсутствие cookies может быть признаком бота - В сочетании с другими признаками инкогнито может указывать на подозрительную активность
Ссылки: - Wikipedia: Private Browsing
M¶
Micro Conversion (Микроконверсия)¶
Micro Conversion (микроконверсия) — промежуточное действие пользователя на сайте, которое показывает его вовлечённость и интерес, но ещё не является основной конверсией (покупка, регистрация, заявка). Микроконверсии помогают оценить качество трафика и эффективность рекламных кампаний.
Примеры микроконверсий: - Просмотр нескольких страниц сайта - Длительное время на сайте (более определённого времени) - Прокрутка страницы на определённую глубину - Клики по ссылкам или кнопкам - Взаимодействие с элементами страницы - Просмотр видео или прослушивание аудио
Использование в BotSafe: - Отслеживание микроконверсий помогает определить качество трафика - Низкий уровень микроконверсий может указывать на ботов - Микроконверсии используются для анализа поведения пользователей
Ссылки: - Wikipedia: Conversion Marketing
P¶
Puppeteer¶
Puppeteer — инструмент для автоматизации браузеров на основе Chromium, разработанный командой Google Chrome. Puppeteer предоставляет высокоуровневый API для управления браузером через Chrome DevTools Protocol, позволяя программно управлять страницами, выполнять действия пользователя, делать скриншоты, генерировать PDF и многое другое.
Возможности Puppeteer: - Управление браузером через JavaScript API - Автоматизация действий пользователя (клики, ввод текста, навигация) - Генерация скриншотов и PDF - Парсинг и скрапинг веб-страниц - Тестирование веб-приложений
Использование ботами: - Автоматизация действий на веб-сайтах - Парсинг данных - Накрутка просмотров и кликов - Автоматическое тестирование
Ссылки: - Официальный сайт Puppeteer - GitHub Puppeteer - Документация Puppeteer
Используется в: - Как работает BotSafe — детекция Puppeteer - Автоматизированные инструменты — настройка проверки Puppeteer
Proxy (Прокси)¶
Proxy Server (прокси-сервер) — промежуточный сервер между пользователем и интернетом, который выступает в качестве посредника при передаче данных. Прокси-сервер получает запросы от клиента, перенаправляет их в интернет и возвращает ответы клиенту, скрывая реальный IP-адрес пользователя.
Типы прокси: - HTTP прокси — для HTTP/HTTPS трафика - SOCKS прокси — универсальный прокси-протокол - Публичный прокси — открытые прокси-серверы - Приватный прокси — платные прокси с авторизацией - Прозрачный прокси — прокси без уведомления клиента
Использование: - Скрытие реального IP-адреса - Обход географических ограничений - Ускорение доступа к контенту (кэширование) - Фильтрация и мониторинг трафика
Использование ботами: - Боты часто используют прокси для скрытия своей активности - Ротация IP-адресов для обхода блокировок - Имитация трафика из разных регионов
Ссылки: - Wikipedia: Proxy Server - Wikipedia: Proxy Server
Используется в: - Как работает BotSafe — детекция прокси через IP2Proxy - Прокси и сеть — настройка проверок прокси - Параметры визита — передача информации о прокси
S¶
Segment (Сегмент)¶
Segment (сегмент) — группа посетителей в Яндекс.Метрике, объединённых по определённым критериям (параметры визита, поведение, характеристики устройства и т.д.). Сегменты используются для анализа данных, фильтрации отчётов, создания аудиторий и оптимизации рекламных кампаний.
Типы сегментов: - Сегменты посетителей — группы пользователей по характеристикам - Сегменты сессий — группы сессий по параметрам - Сегменты визитов — группы визитов по критериям
Использование в BotSafe: - Создание сегментов ботов и реальных пользователей - Анализ качества трафика - Корректировка ставок в Яндекс.Директе - Фильтрация данных в отчётах
Ссылки: - Яндекс.Метрика: Сегменты - Яндекс.Метрика
Используется в: - Создание сегментов — как создать сегменты - Корректировка ставок в Яндекс.Директе — использование сегментов для оптимизации
Selenium¶
Selenium — популярный открытый фреймворк для автоматизации веб-браузеров, разработанный для автоматизированного тестирования веб-приложений. Selenium позволяет программно управлять браузером, выполнять действия пользователя (клики, ввод текста, навигация), извлекать данные со страниц и многое другое.
Компоненты Selenium: - Selenium WebDriver — API для управления браузером - Selenium IDE — расширение браузера для записи и воспроизведения действий - Selenium Grid — распределённое тестирование на нескольких машинах
Использование: - Автоматизированное тестирование веб-приложений - Парсинг и скрапинг данных - Автоматизация рутинных задач в браузере
Использование ботами: - Боты широко используют Selenium для автоматизации действий - Имитация поведения реального пользователя - Накрутка просмотров, кликов, регистраций
Ссылки: - Официальный сайт Selenium - Selenium WebDriver Documentation - GitHub Selenium - Wikipedia: Selenium (software)
Используется в: - Как работает BotSafe — детекция Selenium - Автоматизированные инструменты — настройка проверки Selenium
U¶
User-Agent¶
User-Agent (UA) — строка, которую браузер или другое клиентское приложение отправляет серверу в HTTP-запросе. User-Agent содержит информацию о браузере, операционной системе, устройстве и других характеристиках клиента. Используется серверами для определения типа устройства и браузера, адаптации контента и статистики.
Формат User-Agent:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36
Использование: - Определение типа браузера и версии - Определение операционной системы - Определение типа устройства (десктоп, мобильный, планшет) - Адаптация контента под устройство - Статистика использования браузеров
Использование в BotSafe:
- Проверка User-Agent через библиотеку isbot для определения известных ботов
- Выявление поддельных или нестандартных User-Agent
- Определение инструментов автоматизации (Selenium, Puppeteer и др.)
Ссылки: - Wikipedia: User Agent - Wikipedia: User-Agent
V¶
VPN (Virtual Private Network)¶
VPN (Virtual Private Network, виртуальная частная сеть) — технология создания зашифрованного соединения между устройством пользователя и удалённым сервером через интернет. VPN создаёт защищённый туннель для передачи данных, скрывая реальный IP-адрес и местоположение пользователя, а также шифруя весь трафик.
Принцип работы: - Устройство подключается к VPN-серверу - Весь трафик проходит через VPN-сервер - Реальный IP-адрес пользователя скрывается - Трафик шифруется для защиты от перехвата
Типы VPN: - Коммерческие VPN — платные сервисы для приватности - Корпоративные VPN — для удалённого доступа к корпоративной сети - Бесплатные VPN — ограниченные бесплатные сервисы
Использование: - Защита приватности в интернете - Обход географических ограничений - Защита данных в публичных Wi-Fi сетях - Доступ к заблокированным ресурсам
Использование ботами: - Боты используют VPN для скрытия реального IP-адреса - Ротация IP-адресов для обхода блокировок - Имитация трафика из разных регионов
Ссылки: - Wikipedia: VPN - Wikipedia: Virtual Private Network
Используется в: - Как работает BotSafe — детекция VPN через IP2Proxy - Прокси и сеть — настройка проверки VPN - Параметры визита — передача информации о VPN
Visit Parameters (Параметры визита)¶
Параметры визита — дополнительные данные, которые передаются в Яндекс.Метрику вместе с информацией о визите. В BotSafe используются для передачи данных о ботах.
W¶
WebDriver¶
WebDriver — стандартный протокол и API для автоматизации веб-браузеров, разработанный консорциумом W3C. WebDriver предоставляет унифицированный интерфейс для управления браузером программно, независимо от типа браузера (Chrome, Firefox, Safari, Edge и др.).
Принцип работы: - WebDriver использует JSON-over-HTTP протокол для коммуникации - Каждый браузер имеет свою реализацию WebDriver (ChromeDriver, GeckoDriver и т.д.) - Инструменты автоматизации (Selenium, Puppeteer) используют WebDriver для управления браузером
Использование: - Автоматизированное тестирование веб-приложений - Парсинг и скрапинг данных - Автоматизация рутинных задач
Использование ботами: - Боты используют WebDriver для автоматизации действий в браузере - Имитация поведения реального пользователя - Накрутка просмотров, кликов, регистраций
Ссылки: - W3C WebDriver Specification - Selenium WebDriver Documentation - Wikipedia: Selenium (software)
Используется в: - Как работает BotSafe — детекция WebDriver - Автоматизированные инструменты — настройка проверки WebDriver
WebRTC¶
WebRTC (Web Real-Time Communication) — открытый стандарт и технология для передачи аудио, видео и данных в реальном времени через браузер без установки дополнительных плагинов. WebRTC позволяет устанавливать прямые соединения между браузерами (peer-to-peer) для видеозвонков, видеоконференций, файлообмена и других приложений реального времени.
Возможности WebRTC: - Видео и аудио звонки через браузер - Видеоконференции - Файлообмен между браузерами - Игры в реальном времени - Стриминг данных
Использование в BotSafe: - WebRTC может раскрывать реальный IP-адрес пользователя даже при использовании прокси или VPN - Проверка WebRTC позволяет определить несоответствие между видимым IP (через прокси) и реальным IP - Выявление использования прокси и VPN
Ссылки: - Wikipedia: WebRTC - Wikipedia: WebRTC - WebRTC Specification - WebRTC API Documentation
Y¶
YandexClientID¶
YandexClientID — уникальный идентификатор клиента в Яндекс.Метрике. Используется для отслеживания посетителей между визитами.
Яндекс.Метрика¶
Яндекс.Метрика — бесплатный сервис веб-аналитики от компании Яндекс, предназначенный для сбора и анализа данных о посетителях веб-сайтов. Яндекс.Метрика предоставляет подробную статистику о трафике, поведении пользователей, конверсиях и других метриках.
Возможности Яндекс.Метрики: - Сбор статистики о посетителях сайта - Анализ поведения пользователей - Отслеживание конверсий и целей - Создание сегментов посетителей - Интеграция с Яндекс.Директом - Вебвизор (запись действий пользователей) - Карта кликов и карта скроллинга
Интеграция с BotSafe: - BotSafe передаёт данные о ботах в Яндекс.Метрику через параметры визита - Данные используются для создания сегментов ботов и реальных пользователей - Сегменты используются для корректировки ставок в Яндекс.Директе
Ссылки: - Официальный сайт Яндекс.Метрики - Справка Яндекс.Метрики - Wikipedia: Яндекс.Метрика
Яндекс.Директ¶
Яндекс.Директ — рекламная платформа от компании Яндекс для размещения контекстной рекламы в поисковой выдаче Яндекса, на сайтах-партнёрах и в других рекламных сетях. Яндекс.Директ позволяет создавать и управлять рекламными кампаниями, настраивать таргетинг, управлять ставками и оптимизировать рекламный бюджет.
Возможности Яндекс.Директа: - Размещение контекстной рекламы в поиске Яндекса - Реклама на сайтах-партнёрах (РСЯ) - Таргетинг по ключевым словам, географии, времени и другим параметрам - Управление ставками и бюджетом - Корректировка ставок для сегментов посетителей - Интеграция с Яндекс.Метрикой
Интеграция с BotSafe: - Данные BotSafe передаются в Яндекс.Метрику - Сегменты ботов используются для корректировки ставок в Яндекс.Директе - Снижение ставок для ботов и повышение для качественного трафика - Оптимизация рекламного бюджета
Ссылки: - Официальный сайт Яндекс.Директа - Справка Яндекс.Директа - Wikipedia: Яндекс.Директ
Дополнительные термины¶
Backend¶
Бэкенд — часть системы, которая работает на сервере. В BotSafe бэкенд-проверки выполняются на сервере BotSafe.
Behavior Analysis (Анализ поведения)¶
Анализ поведения — метод детекции ботов, основанный на анализе паттернов взаимодействия пользователя со страницей (движения мыши, прокрутка, клики и т.д.).
Используется в: - Как работает BotSafe — принципы анализа поведения - Расширенная детекция — настройка анализа поведения - Лимиты — настройка лимитов для анализа поведения
Bid Adjustment (Корректировка ставки)¶
Корректировка ставки — изменение ставки в Яндекс.Директе для определённых сегментов посетителей. Позволяет оптимизировать рекламный бюджет.
Fraud Traffic (Фрод-трафик)¶
Фрод-трафик — мошеннический или некачественный трафик, который не приносит реальной пользы (боты, накрутка и т.д.).
См. также: Fraud
Используется в: - Как работает BotSafe — детекция фрод-трафика - Настройки системы — настройка фильтрации фрод-трафика - Примеры использования — защита от фрод-трафика
Threshold (Порог)¶
Порог — значение, при превышении которого посетитель считается ботом. В BotSafe используется порог уверенности (confidence threshold).
Используется в: - Основные параметры — настройка порога уверенности - Как работает BotSafe — применение порога
📚 Дополнительная информация¶
- Как работает BotSafe — принципы работы системы
- Настройки системы — описание параметров конфигурации
- Параметры визита — какие данные передаются в Яндекс.Метрику