Будьте в курсе

Экономьте время, читая только главное.

ИИ и квебекская культура: BAnQ запускает экспериментальную базу данных

ИИ и квебекская культура: BAnQ запускает экспериментальную базу данных

Представьте, что вы спрашиваете у системы искусственного интеллекта о квебекском кино, о местном диалекте или об истории коренных народов провинции, а получаете расплывчатый или неверный ответ. Не потому что ИИ «не умён», а потому что он просто никогда не «учился» на материалах Квебека.

Именно эту проблему намерена решить Bibliothèque et Archives nationales du Québec (BAnQ). Учреждение приступило к экспериментальной фазе проекта по созданию базы данных правительственного и культурного контента на французском и на языках коренных народов для обучения систем искусственного интеллекта.

Квебек в мире ИИ: невидимка

В 2024 году Инновационный совет Квебека в своём докладе указал, что причина плохой осведомлённости ИИ о реальности провинции — «очень малое количество данных о Квебеке» в обучающих наборах.

Квебекская культура остаётся недостаточно представленной в корпусах современных ИИ, и мы рискуем воспроизводить языковые и культурные предубеждения, а с учётом коренных народов — эти риски ещё выше, — отмечает профессор Университета Квебека в Монреале Дестини Тчеуали.

По его словам, предлагаемая база данных станет «стратегической инфраструктурой» для выработки правил идентификации, каталогизации и отслеживания местного контента в ИИ-системах.

Как будет работать платформа

Сейчас рассматриваются разные сценарии: у нас много идей, и мы хотим проверить возможности вместе с культурными стейкхолдерами, а также с владельцами и поставщиками данных, — говорит Валери Д’Амур, руководившая исследованием осуществимости проекта.

Наша цель — чтобы модели ИИ лучше отражали квебекскую действительность, будь то маленькие или крупные модели, из научного сообщества или бизнеса, — подчёркивает президент и генеральный директор BAnQ Мари Грегуар.

Похожий подход уже применяется в Швеции, где сформированы крупные собрания текстов на скандинавских языках для создания ИИ-моделей.

Права авторов и бюджет

Появляются и вопросы авторского права: по словам Мари Грегуар, платформа может предложить авторам больше защиты, чем нынешняя «дикая западня» сбора данных.

Главная критика в творческой среде: даже если авторы получат доход, они будут «кормить монстра», который в будущем может заменить контракты, утрату которых нельзя исключать, — отмечает постдок Национального института научных исследований Максим Харви.

Исследование осуществимости предусматривает вывод платформы на полную мощность к 2029 году, однако сроки могут быть пересмотрены после экспериментальной фазы. Оценочный бюджет на пять лет (до 2030 года) составляет почти 10,5 млнCAD, включая операционные и капитальные расходы. На настоящий момент BAnQ получил от правительства Квебека 340 000 CAD на исследование осуществимости и ещё 750 000 CAD на 12-месячный эксперимент.


Источник: The Canadian Press

Прокрутить вверх