МОСКВА, 26 окт – РИА Новости. Американские инженеры создали новую систему искусственного интеллекта, способную к самостоятельному обучению, и приспособили ее для взлома текстовых капч, используемых веб-мастерами для защиты сайтов от ботов. Инструкции по созданию этого ИИ были опубликованы в журнале Science.
"Умение учиться, используя лишь небольшой набор примеров, и умение находить общие черты в самых разных ситуациях являются отличительными чертами человека, которые пока оставались недоступными машинам. Используя опыт системной нейрофизиологии, мы создали новую модель компьютерного зрения, которая распознает капчи лучше, чем это делают глубинные нейросети, и при этом работает в 300 раз более эффективно", — заявил Дилип Джордж (Dileep George), один из основателей IT-стартапа Vicarious AI.
Главным недостатком всех существующих сегодня нейросетей и систем искусственного интеллекта является то, что они не могут самостоятельно осваивать новые навыки и умения. Инженерам в буквальном смысле приходится обучать их тому, что они должны делать, используя огромные архивы данных, вручную обработанные человеком, или при непосредственном участии людей, показывающих машине, как нужно правильно решать задачи.
Это свойство резко ограничивает применимость систем ИИ в реальной жизни, так как подобные программы в принципе не способны учиться самостоятельно, наблюдая за действиями людей или других машин, и не могут подхватывать новые навыки и знания "на лету", как человек. Кроме того, способности таких систем ИИ, по сути, ограничиваются тем, как хорошо их обучили люди, что в принципе не позволяет им выйти на "сверхчеловеческий" уровень работы.
Джордж, нейрофизиолог по образованию, и IT-предприниматель Скотт Финикс (Scott Phoenix) шесть лет назад основали проект Vicarious, нацеленный на ликвидацию этого недостатка ИИ. В 2013 году они представили первую свою разработку – так называемую "рекурсивную кортикальную сеть"(RCN), особый подвид нейросети, имитировавший то, как работает визуальная кора мозга.
Система ИИ, построенная на базе RCN, как тогда заявляли Джордж и Финикс, смогла успешно взломать примерно 90% текстовых капч, применявшихся в то время для защиты сайтов. Почти все специалисты в этой области не поверили основателям Vicarious, заявив, что они могли подтасовать данные или построить и натренировать нейросеть специально для подбора ответов на такие головоломки.
На этот раз Финикс и Джордж представили итоги своей работы в престижном научном журнале Science, создав новую версию RCN, которая может научиться распознавать буквы и цифры произвольной формы, нарисованные на капчах, самостоятельно изучив всего 260 примеров подобных головоломок.
Ключевой особенностью этой системы, как объясняет Джордж, является то, что делит воспринимаемую ей картинку на два типа объектов – поверхности и контуры. За их распознавание отвечает две раздельных нейросети, организованных примерно таким же образом, как слои нейронов в визуальной коре мозга, а результаты их работы объединяет еще одна сеть, состоящая из двух слоев.
Подобный подход, как отмечают ученые, позволяет разбивать буквы, цифры и другие объекты на наборы отдельных элементов, часть из которых является общей для многих символов, что ускоряет процесс самообучения сети и повышает точность распознавания даже самых стилизованных и неоднозначных надписей.
Как показали первые опыты с этой системой ИИ, всего трех сотен раундов пробных тестах на простых капчах хватило для того, чтобы RCN научился взламывать антиспам-системы Paypal, Yahoo, reCAPTCHA и многих других популярных систем "бот-проверок" с 66% вероятностью. Что интересно, шансы на успех не зависели от расстояния между буквами и их формы, двух главных "врагов" обычных нейросетей.
Подобный показатель, как отмечают ученые, в разы превышает точность работы всех существующих систем машинного обучения, предназначенных для подобных целей, и его можно существенно повысить, если позволить ИИ тренироваться дольше, и использовать те шрифты, которые применяются создателями подобных головоломок.
Что важно, взлом капч не является единственной целью существования RCN – эту же систему можно успешно применять и для совсем других задач, к примеру, сортировки изображений или определения того, какие предметы присутствуют на фотографиях и картинках, что она делает с рекордно высокой точностью. Как надеются ученые, их алгоритм найдет применение и при решении других научных и практических задач.