Будьте в курсе

Экономьте время, читая только главное.

Квебек создаёт ИИ-банkу данных своей культуры

Квебек создаёт ИИ-банkу данных своей культуры

Представьте себе: мощнейшие искусственные интеллекты планеты практически ничего не знают о Квебеке. Его культура, история и языки коренных народов растворяются в море чужих данных. Теперь Национальная библиотека и архивы Квебека (Bibliothèque et Archives nationales du Québec, BAnQ) решили это исправить.

Инициатива BAnQ

BAnQ запустила экспериментальную фазу амбициозного проекта по созданию банка данных правительственного и культурного контента на французском языке и языках коренных народов. Цель — «накормить» системы ИИ квебекскими знаниями, чтобы они перестали давать неточные ответы о провинции. Проект стартовал после завершения исследования осуществимости в начале 2026 года.

Почему ИИ плохо знает Квебек

Проблема известна давно: ещё в 2024 году Совет по инновациям Квебека указал на острую нехватку квебекского контента в наборах данных для обучения ИИ, что ведёт к искажениям и культурным предубеждениям.

Квебекская культура остаётся недопредставленной в корпусах, которые сейчас циркулируют в мире ИИ, а при учёте коренных народов риск продвижения предубеждений только возрастает, — отмечает профессор Университета Квебека в Монреале Дести Тшеуали.

По его мнению, будущая база станет «стратегической инфраструктурой» для учёта, каталогизации и отслеживания местного контента в современных ИИ-системах.

Как будет работать платформа

Сейчас на столе рассматриваются все сценарии. У нас много идей, и мы хотим проверить возможности вместе с культурными стейкхолдерами и поставщиками данных, — говорит руководитель исследования осуществимости Валери Д’Амур.

BAnQ подчёркивает, что платформа не будет публичным каналом распространения контента: доступ к данным будет строго контролироваться, а их использование — лицензироваться.

Это означает наличие квебекских ссылок, будь то в небольших или больших моделях, независимо от их происхождения — из исследовательской среды или из бизнес-сообщества, — добавляет президент и генеральный директор BAnQ Мари Грегоир.

Ограничения доступа и защита авторских прав

При разработке базы данных встали вопросы авторских прав. По словам Грегоир, сейчас процесс сбора данных напоминает «дикий запад»: материалы часто используются без компенсации.

База может выступить в роли централизованного шлюза, который упростит учёт и выплату вознаграждений авторам, — говорит Грегоир.

Однако некоторые художники опасаются, что внесение их работ в ИИ-корпуса может снизить спрос на оригинальные произведения. По словам постдока Национального института научных исследований Максима Харви, даже если авторам платят, они всё равно «подкармливают зверя», который со временем может заменить их контракты.

Сроки и бюджет проекта

По результатам исследования платформа может заработать к 2029 году, хотя сроки будут пересмотрены после завершения экспериментальной фазы.

Оценочный бюджет на пять лет до 2030 года составляет около 10,5 млн долларов США. BAnQ уже получила от правительства провинции 340 тыс. долларов на исследование и ещё 750 тыс. долларов на год экспериментов.


Источник: The Canadian Press

Прокрутить вверх