Что никогда не сможет сделать искусственный интеллект?

«Машине надо принять решение кем пожертвовать — тем, кто внутри автомобиля, или тем, кто бросился под колёса», — профессор кафедры информационных технологий СПбГУ Татьяна Гаврилова объясняет, какие алгоритмы лежат в основе искусственного интеллекта и с какими трудностями сталкиваются его разработчики. За последние пять лет вокруг искусственного интеллекта поднялась большая волна публикаций, выступлений, страхов, а также хайпа — обсуждений, шумихи и агрессивной рекламы. Это свидетельствует в первую очередь о спекуляции и профанации. Новостные порталы наперебой рассказывают, как нейронная сеть обучилась очередному потрясающему трюку. Следует понимать, что искусственная нейронная сеть — это не модель мозга. Нейрофизиологи отмечают, что механизм работы мозга до сих пор слабо изучен, а его модель далека от математической формализации. В 2013 году Европейская комиссия оценила научно-исследовательский проект The Human Brain Project и выделила на исследования грант на сумму в один миллиард долларов.

Цель этого проекта — создать полнофункциональную компьютерную модель человеческого мозга. Представить всю многосложность работы мозга: как нейроны соединяются и взаимодействуют между собой, как формируются воспоминания, и принимаются решения. В 2019 году на Европейской конференции с докладом выступил нейробиолог, директор и основатель The Human Brain Project Генри Маркрам. Он вместе с командой показывал изображения мозга, подсвеченные на томографе с разных сторон, подчёркивая, что, чем больше они забирались вглубь мозга, тем меньше становилось понятно, как он работает. Всё это время они двигались по пути миниатюризации, но, очевидно, что нужна макромодель мозга. Здесь можно провести аналогию с известной метафорой: сколько бы муравей ни ползал внутри телевизора, он всё равно не поймёт, что это за устройство.

Чат-боты говорят, но не понимают

Первую разговорную программу «Элиза» разработали ещё в 70-х. Её работа была похожа на сеанс психотерапии. Примерный диалог мог выглядеть следующим образом:

  • Здравствуйте. Как вы себя чувствуете?
  • Голова болит.
  • Как часто это происходит?
  • Каждый раз, как с матерью поговорю.
  • У вас проблемы с мамой. Расскажите об этом подробней.

Программа содержит набор заготовок. Выявляет ключевое слово в каждом предложении и создает иллюзию разговора, без какого-либо осмысления вообще. Таким образом Элиза могла умело поддерживать беседу на протяжении нескольких часов, производя на людей хорошее впечатление.

Сегодняшняя Алиса от «Яндекса» — эта та же самая Элиза, с подключённой платформой сервисов и гораздо более богатой лексикой. Вся интеллектуальность подобных чат-ботов сводится к переобучению. Если размечать для них ответы плохие, непригодные, то она будет их в дальнейшем отсеивать, а хорошие, подходящие — оставлять. Настоящая разумность программы, её способность не просто определять, что изображено на картинке или преобразовывать устную речь в текст, но понимать значение информации и мыслить, проявится только при подключении к базе знаний. Это некое понимание о мироустройстве. Вот этого пока не может никакая программа. Искусственный интеллект, работающий с базой знаний называется Symbolic AI (символический ИИ).

Сейчас активно используются два направления: искусственная нейронная сеть и машинное обучение. Их развитием занимаются не в научных лабораториях под руководством учёных, а в IT-компаниях. Программисты и разработчики искусственных нейронных сетей признают, что ничего мыслящего, кроме мозга нет. Поэтому если они хотят создать интеллектуальную систему, то вынуждены моделировать работу мозга, потому что больше нечего. Но кардинальный прорыв будет у тех, кто сумеет скрестить модели представления знаний и машинного обучения.

К слову, некоторые компании уже активно используют роботов при трудоустройстве на работу. Они особенно хороши на массовых отборах, куда поступает более 1000 резюме. Робот анализирует анкеты и оценивает кандидатов на релевантность, но окончательное решение всё равно принимает человек. Учёные Технологического института Джорджии выяснили, в каком случае люди охотно доверяют роботу. Это происходит, если им заранее сообщить, что он предназначен для выполнения определённой задачи. Такие роботы также проводят выходные интервью. Люди ведут с машиной более откровенный диалог о причинах увольнения и о том, с какими трудностями сталкивались в процессе работы. Таким образом роботы собирают очень хорошую, а главное весомую, обратную связь. Кроме того, люди боятся врать роботу. Им кажется, что у машин больше информации. Например, два главных вопроса для отбора кладовщиков были следующими: есть ли у вас судимость и употребляете ли вы алкоголь? И люди без утайки отвечали на эти вопросы роботу.

Что не так с беспилотниками

Современный беспилотный транспорт несовершенен и имеет ряд недостатков. Самый явный кроется в машинном зрении. Вопрос даже не в технической сфере, проблема машинного зрения не решена концептуально. Камеры и датчики обрабатывают с большой скоростью определённые сигналы, в результате чего в памяти компьютера образуются двоичные картины, которые надо интерпретировать. В этом и заключается основное затруднение. Если, к примеру, дорогу переходит пешеход, то любой водитель легко это считает. Не потому, что у него зрение лучше, чем у камеры беспилотника, а потому, что у водителя в сознании есть модель движущегося человека. Моделей зрения пока не существует. Неизвестно, как человек обрабатывает визуальную информацию. Сейчас проектируют моделирующие устройства, которые позволяют с некоторой степенью уверенности распознавать целый ряд объектов.

Представьте, что вы попросили человека, ничего не понимающего в автомобилях, принести поперечный рычаг. Очевидно, что он не сможет этого сделать. Потому что он не автомеханик, и у него нет в голове модели рычага. Но если сказать, что это железяка изогнутой формы — человек принесёт. Каждый знает, что такое «железяка», и понимает, как выглядит «изогнутая форма». Робот даже после пояснений не справится. Для этого его нужно обучить, закладывая понятия обо всех этих объектах под разными углами и с разной степенью доступа.

Находясь в офисе, человеку не обязательно отодвигать стул от стола, чтобы идентифицировать предмет. Достаточно взглянуть на спинку. Только потому, что у людей есть полная модель стула, и мы по одной его части, воссоздаем целое. Мы знаем, что стул — неотъемлемый атрибут офисного интерьера. Поэтому из огромного подбора объектов, которых можно воссоздать по этому фрагменту — выбираем один. Универсальных программ, которые могли бы делать подобное — нет. Никакой искусственный интеллект не содержит сейчас модели мира и знаний, позволяющих ему однозначно толковать картину, которую он видит.

Допустим, где-то за кустами спрятался человек, готовый выбежать на дорогу. Часть его тела скрыта за густой листвой. Видимой части будет недостаточно, для того чтобы машина смогла считать это как потенциальную опасность. Более того, если вы увидите спрятавшегося за кустами слона, то, вероятно, решите, что это человек в маске слона, потому что в нашем районе слоны не водятся. Уж этих знаний у машины точно нет.

Проблема интерпретаций приближается к своему разрешению, во всяком случае прогресс есть. В алгоритм машинного обучения на огромных выборках можно поместить 100 автомобилей, и ясно, что 101, даже другой марки, с большой вероятностью, программа распознает правильно. Хотя в ней не будет заложен конкретно этот автомобиль. Стоит также отметить, что для обучения программы важно соблюдать многообразие подбора. Если, например, вы будете учить программу только на седанах, а потом подъедет кабриолет, то она, наверняка, его не распознает, потому что в выборке вообще не было машин без крыши.

Вторая сложность представляет собой этическую дилемму, в которой машине предстоит сделать моральный выбор. Допустим, беспилотный транспорт везёт пассажира. Навстречу выскочил человек, и единственный способ избежать столкновения — это въехать в рядом стоящий столб. Машине надо принять решение кем пожертвовать — тем, кто внутри автомобиля, или тем, кто бросился под колёса. Это совершенно неразрешимая для неё задача. Уже имеются первые аварии и даже жертвы. В Аризоне беспилотный внедорожник, принадлежащий компании Uber, сбил насмерть пешехода. Их вина в том, что они выпустили на трассу сырой, не прошедший все тесты, алгоритм.

Проблема беспилотников — это в первую очередь нехватка базовых представлений о мире. Люди всегда принимают решения в контексте. Никакой искусственный интеллект не имеет полную картину мира, какую имеет человек к 18 годам. По этой причине водительские удостоверения выдают именно с 18 лет [в России], хотя зрение отлично сформировано уже и в 14. Не достигнув совершеннолетия, человек не может принимать взвешенные решения, в том числе этического и эмоционального характера.

Мы имеем дело с очень молодыми и незрелыми алгоритмами, которые требуют доработки. Они способны исправно работать, но исключительно под контролем человека.

Искусственный интеллект на смену полиграфа

На рынке искусственного интеллекта ведущие мировые компании активно инвестируют в сферу эмоциональных вычислений. Такая технология выявляет самые незаметные изменения в мимике. Программа выбирает определённое количество точек на лице и сравнивает с базой фотографий, на которых эмоция уже распознана.

Компания Microsoft заявила, что у них есть подобный алгоритм, но она не даст его в распоряжение правительства. Это очень опасный инструмент, который можно использовать против человека. Представьте, что вы входите в кабинет к начальнику, а он видит, что вы его ненавидите и думаете о нём плохо. Возникает серьёзная этическая проблема.

Аналогичных программ «распознавалок» будет ещё очень много. Прекрасных, замечательных в том числе. Они будут полезны, особенно в медицине. Машины уже сейчас помогают врачам диагностировать болезни. Допустим, американская программа IBM Watson ставит диагнозы по анализам лучше, чем некоторые начинающие врачи. В качестве обучающей выборки в неё было заложено шесть тысяч историй болезней. Это титанический труд и, безусловно, огромные деньги.

Умеет ли машина сочинять

Машина не в силах порождать нечто качественно новое. Оригинальные тексты песен, стихосложения, музыкальные композиции — это всё основано на принципе пермутации, или, проще говоря, перестановки. Что касается поэзии, то там алгоритм действий следующий: программа находит общие моменты и определённые сочетания. Берёт ключевые слова, добавляет к ним слова других авторов и перекручивает под нужную ритмику. Русский язык сложный, но если не заботиться о рифме, то белый стих «сочинить» можно.

С музыкой всё еще проще. Программа определяет какие аккорды наиболее характерны для того или иного исполнителя и использует их же, но в иной последовательности. В основе этого «творчества» лежит перетасовка звукоряда и отбрасывание откровенной какофонии.

Были программы, которые сочиняли народные сказки. Для этого провели анализ сценариев, использовав книгу Владимира Проппа «Морфология сказки». Оказалось, что модель развития событий включает в себя несколько очевидных элементов: в сказках всегда есть положительный и отрицательный герои. Также обязательно присутствует даритель, дорога, препятствие и в конце счастливый конец. Отличительной особенностью таких сказок была эклектика. Программа комбинировала героев и их действия, рассказывая, например, про Ивана-дурака, который борется со Змеем Горынычем. Безусловным минусом являлся бедный язык повествования. Слушателям становилось скучно. Живой сказитель всегда юмора добавит, а где-то занятных речевых оборотов. По этой же причине программа не может переводить на другие языки метафоры или фразеологизмы. Онлайн-переводчики работают с большими объёмами информации. Стоит отметить, что качество их перевода за последние годы заметно улучшилось. Теперь они не переводят каждое слово в отдельности, как делали это раньше, а ищут целое предложение где-либо в текстах. Самая большая трудность возникает с семантикой. Для этого нужна база знаний, чтобы понимать смысл выражений. К примеру: цыплята готовы к обеду. Неясно, как правильно перевести эту фразу, если не знаешь, где человек находится в этот момент — на птицеферме (Chickens are ready for dinner) или в ресторане (Chickens are prepared for lunch).

Без познаний человека никакая интеллектуальная деятельность невозможна. Знание нельзя ничем заменить. Вопрос в том, как эти умения оцифровать. Как превратить опыт в какую-то осмысленную схему, которой можно было бы делиться с машиной.

Автор:
Источник: https://habr.com/

Понравилась статья? Тогда поддержите нас, поделитесь с друзьями и заглядывайте по рекламным ссылкам!