Задача 1. Поиск ботов в Youtube
Поиск ботов в Youtube. Боты — это неаутентичные аккаунты (управляемые людьми на зарплате или алгоритмами), которые используются для политической пропаганды и коммерческой рекламы. Для многих популярных соцсетей уже есть проекты, которые их мониторят (например, для ВК, Телеграма и Х). При этом для ютуба нет проектов, которые бы систематически и эффективно занимались таким мониторингом, хотя ботов там часто заметно даже невооруженным взглядом. Предлагается разработать алгоритм для выявления ботов в комментариях ютуба, на основе которого в дальнейшем можно было бы опубликовать исследование о поведении ботов на этой площадке и сделать инструмент, который бы занимался их систематическим мониторингом.
Автор задачи: организатор (партнёр) хакатона
Эта задача участвует в общем конкурсе хакатона на один из главных призов.
Задача 2. Архив пропаганды
Архив пропаганды. В прошлом году у “Новой-Европа” вышел спецпроект совместно с изданием “Декодер” – о нарративах главного информационного агентства Кремля “РИА Новости”. Чтобы узнать, как работает пропаганда, мы скачали все публикации медиа с 2001 года. Для таких проектов исследователям и журналистам было бы полезно иметь доступ к базе данных со всеми публикациями и расшифровками телепередач государственных медиа. Похожий архив уже существует — там собраны публикации независимых медиа с 2000 года.
В руках у пропаганды множество каналов для трансляции своих нарративов — федеральное и региональное телевидение, десятки подконтрольных СМИ с аккаунтами в соцсетях, а также медиа на иностранных языках. Предлагается написать скраперы для государственных медиа (телевидение, соцсети и сайты) с целью агрегации контента в единую базу данных с удобным интерфейсом для поиска по ключевым словам.
Автор задачи: организатор (партнёр) хакатона
Эта задача участвует в общем конкурсе хакатона на один из главных призов.
Задача 3. Цифровой след
Цифровой след проекта — инструмент для автоматического поиска всех соцсетей и информации об организации/проекте по одному известному аккаунту или сайту.
Цель: разработка инструмента с веб-интерфейсом, который по одному известному аккаунту в соцсети или сайту находит по открытым источникам (например через google поиск) и по данным из профиля/описания все остальные аккаунты проекта/организации и собирает информацию о его деятельности.
При необходимости организаторы могут предоставить примеры таких организаций и их профилей.
Входные данные:
— Ссылка на любой аккаунт проекта/организации (Instagram, Telegram, Facebook, VK и др.) или на сайт
Выходные данные (если есть в открытых источниках или сама организация предоставляет):
— Название организации/проекта
— Описание деятельности
— Сфера работы
— Сайт организации
— Список найденных аккаунтов в соцсетях: Instagram, Telegram, Facebook, VK, Одноклассники, Дзен, X/Twitter, YouTube, RuTube, TikTok, LinkedIn
- к каждому полю источник данных (профиль организации, поиск и т.п.)
Технические требования:
— Скрипт на Python
— Сохранение результатов в JSON/CSV
— Документация по установке и запуску
Критерии проверки и приемки работы:
- Успешное тестирование на 10 случайных профилях разных организаций
- Отсутствие ложных срабатываний (все найденные аккаунты действительно принадлежат искомой организации)
Приз за успешное решение: 400USD
Автор задачи: организатор (партнёр) хакатона
Как выбрать задачу (челлендж)
Эти задачи и идеи предложены одним из партнёров хакатона или зарегистрировавшимися участниками хакатона . Если вы хотите взять в качестве задачи на хакатон один из предложенных челленджей, укажите его название в заявке при регистрации или после регистрации в чате с организаторами. Вы можете выбрать челлендж в любое время до хакатона.
Обратите внимание, что список постоянно дополняется. Не все задачи будут опубликованы на лендинге по соображениям безопасности, но они будут доступны только зарегистрировавшимся участникам.