Задача 1. Сбор, обогащение, объединение и систематизация источников, продвигающих пропаганду и дезинформацию
- Объединить уже имеющиеся датасеты, содержащие и/или продвигающие пропаганду и дезинформацию;
- Создать или дополнить датасет т.н. «Патриотических источников» для подробного анализа;
- Провести дигитализацию учебников средней школы для анализа на предмет анализа уровня государственной пропаганды.
Задача 2. Автоматическое распознавание пропаганды и дезинформации
- Разработать систему, определяющую российскую государственную пропаганду, например, по следующим темам: война в Украине, оппозиция, Запад и автоматически выделяющую новые темы. Для работы на хакатоне авторы задачи могут предоставить рабочую модель определения манипуляций в медиа, включающую не только манипуляции пропаганды, но и общие методы манипуляции;
- Обучить модель, например, на основе датасета «Новой газеты Европа»;
- Создать и/или развить методологию по определению дипфейков в видео и аудио;
- Исследовать примеры автоматизированного анализа видео и аудио на предмет содержания пропаганды.
Задача 3. Продуктовые решения, на основе автоматического распознавания пропаганды и дезинформации
- Разработать приложение или бот, которые с элементами геймификации учат распознавать пропаганду. Инструмент развития критического мышления;
- Создание интересных и юзабильных клиентов для CSRL Sentiment (доступ предоставляется под запрос);
- Обучить LLM (большая языковая модель) с чат-ботом, в которую загружены материалы пропагандистских СМИ, чтобы “разговаривать” с ней и находить способы переубеждать.
Задача 4. Исследования пропаганды и дезинформации
- Анализ Топ-10 (или Топ-100) tgstat и анализ на предмет содержания государственной пропаганды;
- Провести исследование о распространении российской пропаганды:1) в западных странах или 2) в странах exUSSR или 3) в отдельных странах (оплот помогает Белградскому центру политики безопасности). Какие медиа повторяют пропаганду, может откуда получают финансирование;
- Создать базу знаний случаев успешного противостояния пропаганде.
Задача 5. Инструмент для поиска первоисточника изображений
Разработать алгоритм для проверки фотографий на фейки, и продукт на основе алгоритма в виде расширения для браузера или бота в Telegram.
Инструмент должен уметь находить первоисточник для любого изображения и подсказывать пользователю, что на самом деле там изображено.
Пример: отправляем боту фотографию разрушенных зданий, взятую из пропагандистского издания, которое утверждает, что на снимке — результат работы украинских «нацистов». Инструмент же определяет, что впервые этот снимок был опубликован в 2001 году в связи с войной в Чечне.
Задача 6. Инструмент для рекомендаций по написанию таргетированных постов для разных аудиторий
Разработать инструмент для адаптации стиля и контента публикаций независимых медиа под целевые аудитории внутри России на основе данных о медиапотреблении этих аудиторий (данные будут предоставлены).
Для каждой целевой аудитории есть паблики во «ВКонтакте», содержащие большое количество информации о том, какой контент потребляет ЦА и что ей интересно.
Пример реализации: есть тема публикации, которую мы хотим переупаковать для конкретной ЦА. Инструмент должен уметь составлять промт для ChatGPT, чтобы нейросеть предложила, как изменить публикацию под запросы целевой группы и подготовила драфт поста на основе исходного текста.
Задача 7. Оценка «фейковости» новостей
Разработка и внедрение модели искусственного интеллекта, способной анализировать текстовые новостные сообщения для определения степени достоверности и выявления потенциальной пропаганды.
Модель будет использовать методы обработки естественного языка и алгоритмы машинного обучения для анализа новостных текстов, выявляя признаки наличия фейков путем сравнения с фактами из надежных источников. Основываясь на расширенном анализе языковых особенностей и эмоциональной окраски текста, модель будет предоставлять вероятностные оценки достоверности каждой новости (желательно в процентах).
Как выбрать челлендж
Эти задачи и идеи предложены одним из партнёров хакатона. Если вы хотите взять в качестве задачи на хакатон один из предложенных челленджей, укажите его название в заявке при регистрации или после регистрации в чате с организаторами. Вы можете выбрать челлендж в любое время до хакатона.