Методология
Как мы собираем данные
Эта страница объясняет, как AFF.TOP строит каталог: из каких источников берутся сигналы, как они нормализуются, что считается подтверждённым и как проходит цикл исправлений.
Пайплайн
1
Собираем сигналы из открытых источников
Берём публичные ссылки, открытые Telegram-источники, карточки компаний и иные открытые материалы. Закрытые базы и утечки не используем как норму.
2
Нормализуем сущности
Чистим дубли, связываем имена, username, бренды, компании, домены и роли так, чтобы одна и та же сущность не распадалась на десятки карточек.
3
Фиксируем временной контекст
Храним дату публикации, дату обновления и контекст свежести. Для динамических страниц важен не только факт, но и момент, когда он был зафиксирован.
4
Проверяем на конфликты и пустоты
Сравниваем данные между несколькими сигналами, отмечаем спорные места и не считаем неподтверждённые гипотезы окончательной истиной.
5
Принимаем правки и фидбек
Ошибки, уточнения и новые факты приходят через feedback, claim и предложения на карточках. Это часть цикла обновления, а не разовая форма.
Типы источников
Публичные цифровые следы
- — Telegram-каналы и чаты, если они доступны публично.
- — Публичные сайты, страницы программ, вакансии, списки контактов.
- — Открытые упоминания в материалах и интервью.
Собственная нормализация и связки
- — Связи между людьми, компаниями, программами, GEO и Telegram-поверхностями.
- — Агрегации по постам, активности и базовым метрикам Telegram.
- — Отдельный слой редакторской проверки там, где нужна ручная валидация.
Что не считаем подтверждением само по себе
- — Одинокий шумный пост без дополнительного контекста.
- — Непроверенные слухи, приватные утечки и закрытые базы.
- — Автогенерацию без привязки к источнику и дате.
Критерии доверия
Что считается подтверждённым
Подтверждённым считаем то, что опирается на явный открытый источник, не конфликтует с другими сильными сигналами и связано с конкретной сущностью.
Что считается спорным
Спорным считаем факты без достаточной опоры: неполные карточки, единичные упоминания без контекста, несогласованные данные и устаревшие ссылки.
Как быстро обновляется проект
Часть страниц обновляется автоматически, часть — после ручной проверки. Поэтому разные поверхности могут иметь разную свежесть и разную глубину заполнения.
Как подойдём к рейтингам и отзывам
Рейтинги, отзывы и официальные представители будут запускаться только вместе с прозрачной методологией, модерацией и понятным разделением между редакторским сигналом, пользовательским мнением и официальным ответом.