Morgaine / flickr.com

Компания IBM использовала около миллиона фотографий с разными людьми с фотохостинга Flickr для обучения своих алгоритмом распознавания лиц, а также делилась ими со сторонними исследователями. При этом в IBM не спрашивали у запечатленных на этих снимках людей разрешения на подобное использование их фотографий. Об этом сообщает NBC News.

"Никто из тех, кого я фотографировал, не предполагал, что фотографии будут использованы подобным образом", – сообщил журналистам один из пользователей Flickr.

Как уточняет The Verge, фотографии, о которых идет речь, являются частью базы из 99,2 млн изображений под названием YFCC100M. Эта база была собрана прежним владельцем Flickr компанией Yahoo. Все попавшие в нее изображения распространялись под свободными лицензиями Creative Commons, но возможность использования снимков для обучения систем распознавания лиц, включая, например, определение расы, вряд ли предусмотрена такими лицензиями.

"Мы очень серьезно относимся к приватности людей и заботимся о соблюдении принципов конфиденциальности", – заявили в IBM, уточнив, что доступ к базе имеют только проверенные исследователи, а включенные в нее изображения находятся в открытом доступе в Сети. При этом, по словам представителей компании, изображенные на снимках люди могут потребовать удаления своих фотографий из базы.

Однако сперва им необходимо узнать, есть ли в базе их портреты. Хотя в IBM заявили об ограниченном доступе к базе, журналисты NBC получили ее из некоего источника и создали сервис (встроен в публикацию), позволяющий фотографам проверить, есть ли в базе их фотографии, размещенные на Flickr. При желании пользователи могут известить о результатах проверки тех, кого они снимали.

Отметим, что IBM – далеко не единственная компания, которая занимается исследованиями в области распознавания лиц и использует фотографии обычных людей без разрешения. Например, Facebook имеет открытую для исследователей базу из снимков 800 тыс. человек.