Трек 1. Дезинформация и пропаганда

Задача 1. Сбор, обогащение, объединение и систематизация источников, продвигающих пропаганду и дезинформацию

  • Объединить уже имеющиеся датасеты, содержащие и/или продвигающие пропаганду и дезинформацию; 
  • Создать или дополнить датасет т.н. «Патриотических источников» для подробного анализа;  
  • Провести дигитализацию учебников средней школы для анализа на предмет анализа уровня государственной пропаганды.  

Задача 2. Автоматическое распознавание пропаганды и дезинформации

  • Разработать систему, определяющую российскую государственную пропаганду, например, по следующим темам: война в Украине, оппозиция, Запад и автоматически выделяющую новые темы. Для работы на хакатоне авторы задачи могут предоставить рабочую модель определения манипуляций в медиа, включающую не только манипуляции пропаганды, но и общие методы манипуляции;
  • Обучить модель, например, на основе датасета «Новой газеты Европа»;
  • Создать и/или развить методологию по определению дипфейков в видео и аудио;
  • Исследовать примеры автоматизированного анализа видео и аудио на предмет содержания пропаганды.  

Задача 3. Продуктовые решения, на основе автоматического распознавания пропаганды и дезинформации

  • Разработать приложение или бот, которые с элементами геймификации учат распознавать пропаганду. Инструмент развития критического мышления;
  • Создание интересных и юзабильных клиентов для CSRL Sentiment  (доступ предоставляется под запрос);
  • Обучить LLM (большая языковая модель) с чат-ботом, в которую загружены материалы пропагандистских СМИ, чтобы “разговаривать” с ней и находить способы переубеждать.

Задача 4. Исследования пропаганды и дезинформации 

  • Анализ Топ-10 (или Топ-100) tgstat и анализ на предмет содержания государственной пропаганды; 
  • Провести исследование о распространении российской пропаганды:1) в западных странах или 2) в странах exUSSR или 3) в отдельных странах (оплот помогает Белградскому центру политики безопасности). Какие медиа повторяют пропаганду, может откуда получают финансирование;
  • Создать базу знаний случаев успешного противостояния пропаганде.

Задача 5. Инструмент для поиска первоисточника изображений

Разработать алгоритм для проверки фотографий на фейки, и продукт на основе алгоритма в виде расширения для браузера или бота в Telegram.

Инструмент должен уметь находить первоисточник для любого изображения и подсказывать пользователю, что на самом деле там изображено. 

Пример: отправляем боту фотографию разрушенных зданий, взятую из пропагандистского издания, которое утверждает, что на снимке — результат работы украинских «нацистов». Инструмент же определяет, что впервые этот снимок был опубликован в 2001 году в связи с войной в Чечне.

Задача 6. Инструмент для рекомендаций по написанию таргетированных постов для разных аудиторий

Разработать инструмент для адаптации стиля и контента публикаций независимых медиа под целевые аудитории внутри России на основе данных о медиапотреблении этих аудиторий (данные будут предоставлены). 

Для каждой целевой аудитории есть паблики во «ВКонтакте», содержащие большое количество информации о том, какой контент потребляет ЦА и что ей интересно. 

Пример реализации: есть тема публикации, которую мы хотим переупаковать для конкретной ЦА. Инструмент должен уметь составлять промт для ChatGPT, чтобы нейросеть предложила, как изменить публикацию под запросы целевой группы и подготовила драфт поста на основе исходного текста.

Задача 7. Оценка «фейковости» новостей

Разработка и внедрение модели искусственного интеллекта, способной анализировать текстовые новостные сообщения для определения степени достоверности и выявления потенциальной пропаганды. 

Модель будет использовать методы обработки естественного языка и алгоритмы машинного обучения для анализа новостных текстов, выявляя признаки наличия фейков путем сравнения с фактами из надежных источников. Основываясь на расширенном анализе языковых особенностей и эмоциональной окраски текста, модель будет предоставлять вероятностные оценки достоверности каждой новости (желательно в процентах).

Как выбрать челлендж

Эти задачи и идеи предложены одним из партнёров хакатона. Если вы хотите взять в качестве задачи на хакатон один из предложенных челленджей, укажите его название в заявке при регистрации или после регистрации в чате с организаторами. Вы можете выбрать челлендж в любое время до хакатона.

ПРИГЛАШАЕМ ДАТА-АНАЛИТИКОВ, ИССЛЕДОВАТЕЛЕЙ, ЖУРНАЛИСТОВ, ПРОГРАММИСТОВ, ДИЗАЙНЕРОВ

Включайтесь в работу команд или соберите свою под задачи хакатона