Обнаружено детское порнографическое изображение в наборе данных для обучения искусственного интеллекта

Новости о мире нейросетей и ИИ
Исследователи из Интернет-обсерватории Стэнфорда обнаружили, что популярный набор данных для обучения искусственного интеллекта по генерации изображений содержит ссылки на изображения детского сексуального насилия. Набор данных LAION-5B, использованный для создания моделей генерации изображений Stable Diffusion и Imagen от Google, включал по меньшей мере 1 679 нелегальных изображений, собранных с социальных медиа и популярных сайтов для взрослых. Исследователи начали анализировать набор данных LAION в сентябре 2023 года, чтобы выяснить, содержится ли в нем материал по детскому сексуальному насилию. Они провели проверку через хеши или идентификаторы изображений с использованием платформ обнаружения материалов с детской сексуальной эстетикой, таких как PhotoDNA, и верифицировали результаты в Канадском центре по защите детей. Набор данных не содержит...