Искусственный интеллект: эволюция и российские перспективы

Сегодня компьютерные программы начинают заменять бухгалтеров, продавцов, переводчиков и даже журналистов. Согласно докладу ООН, вскоре роботы займут 2/3 имеющихся рабочих мест в развивающихся странах. Насколько правдивы фантастические фильмы и можно ли уже сейчас говорить о полноценном развитии искусственного интеллекта? Для того, чтобы ответить на этот вопрос, отследим развитие главных функций ИИ — аналитической, коммуникативной и творческой — в России и за рубежом. Подраздел науки об искусственном интеллекте, задачей которого является «обучить» компьютер «мыслить» (а значит, анализировать данные, выявлять скрытые закономерности и решать на основе них сложные задачи) называется машинным обучением (machine learning).

Без преувеличения, эти исследования находятся на «переднем краю» науки, работы в данном направлении ведут крупнейшие и наиболее технологически развитые корпорации мира (включая Google, Microsoft и IBM). Разрабатываемые ими сервисы, такие как Google Predictions API, Microsoft Azure и IBM Watson позволяют создавать модели знаний на основе больших структурированных данных.


Рисунок 2. Эволюция информации в интернете.

Важно отметить, что алгоритмы обработки данных в подобных сервисах не запрограммированы жестко, они могут самостоятельно выявлять закономерности и делать определенные выводы. MIT Technology Review включил машинное обучение на основе полученных результатов (reinforcement learning, когда программа проводит эксперименты и «учится» на своих ошибках) в топ-10 самых прогрессивных, прорывных технологий 2017 года.

Уже сейчас IBM Watson диагностирует рак с точностью в несколько раз превышающей опытных врачей-диагностов. Экспоненциальный рост вычислительной техники (представлен на графике) демонстрирует ускоренное развитие возможностей подобных систем. Также следует отметить, что несмотря на свою технологическую сложность, эти программы имеют простой и дружелюбный интерфейс, что позволяет использовать их любому пользователю.

Рисунок 3. Экспоненциальный рост вычислительных возможностей (по Реймонду Курцвейлу).

Подобные системы развиваются и в России. Так, руководитель роботехнического центра Сколково Альберт Ефимов сообщил о разработке системы «Соцмедика», которая, по замыслу создателей, должна стать «реальным конкурентом» вышеупомянутому проекту Watson.

Другая российская разработка — платформа Brain2 компании “Когнитивные системы” — концентрируется на быстрой обработке bigdata в нейромодели знаний для систем ИИ. К примеру, нейромодель для оценки стоимости недвижимости (House Prices), обученная по 79 параметрам 1461 объектов недвижимости, способна предсказать стоимость объекта с незначительной ошибкой (RMSE=0,42), что равнозначно оценке опытного эксперта по недвижимости. При этом на обучение модели ушло всего 20 минут. Для сравнения, у опытного программиста-математика на решение подобной задачи с применением лучшей бесплатной библиотеки для машинного обучения Keras (TensorFlow) уйдет не менее 30 часов, а результат будет незначительно лучше (RMSE ≈ 0,32).

При значительной разнице в финансировании проектов, отечественные разработки не уступают, а где-то даже превосходят зарубежные аналоги. Так модель созданная в сервисе Google Prediction, для решения уже упомянутой задачи House Prices от Kaggle (сервиса для проведения конкурсов среди специалистов по машинному обучению) показывает RMSE = 7000, что в десятки тысяч раз хуже чем в Brain2.

Другие российские проекты в сфере ИИ обозначены на карте:

Рисунок 4. Карта российского ИИ.

И все же, развитие аналитической функции машин — не новость, но насколько современный ИИ способен коммуницировать с человеком? Самый известный пример такой коммуникации — помощники Siri и Google Assistant, установленные на устройствах Apple и Android соответственно. Обе эти программы значительно продвинулись в распознавании естественной речи и выполнении мелких поручений (написать сообщение, сделать заметку), но при этом не научились синтезировать собственные ответы на вопросы, поскольку и Siri, и Google Assistant могут отвечать — «зачитывая» найденные предложения. Выпущенная компанией Amazon в 2014 году Alexa работает чуть сложнее — синтезирует ответ на базе готовых шаблонов. Наконец, наиболее продвинутой технологией на данный момент обладает китайский робот Сяо Нань, известный тем, что написал статью на 300 иероглифов за 1 секунду. Примеры текста, синтезированного программой, приведены далее: «В первом квартале прогноз доходов от Apple над Уолл-стрит»; «Индекс потребительских цен августе выросли на 2% рекордно высокого уровня 12 месяцев»; «Анжу Мяньян 4,3 землетрясение произошло», «Олимпийские игры, настольный теннис женщин в одиночном четвертьфинале Дин Нин (Китай) 4: 0 легко вырезать круглый».

Безусловно, Сяо Нань пока не сможет заменить человека — журналиста: налицо проблемы со связностью текста, кроме того, Сяо Нань не умеет брать интервью и задавать дополнительные вопросы. Тем не менее, данный проект — один из немногих, где робот находит и синтезирует произвольный текст без явного шаблона.

А что же у нас? Банальное сравнение рейтинга на основе оценок десятков тысяч пользователей Google Play показывает, что созданный отечественными разработчиками голосовой помощник «Дуся» не уступает тому же Google Assistant. Ограничение «Дуси» такое же, как и у других голосовых помощников — программа выдает только готовые ответы на заданные вопросы (хотя, система Дуси позволяет создавать собственные функции с помощью написания скриптов, что принципиально не меняет функционал программы, но несколько расширяет область применения). Синтезировать же собственные ответы на вопросы умеет вышеупомянутый Brain2.

Например, разработанная на основе текста стратегии «Сбербанка» нейромодель (а точнее 7 многослойных нейробайесовых моделей со структурой FuzzyArt) способна осуществлять поиск релевантных запросу лексем и синтезировать из них ответ в виде предложения. Такая модель может быть использована в качестве «умного» чат-бота-помощника, причем точность подбора слов для ответов системы составляет 0,86, а правильность синтезирования ответа из выбранных слов достигает 0,91.

Рисунок 5. Модель Brain2Text.

В последние годы активно развиваются не только аналитическая и коммуникативная, но и творческая функция машинного разума. Самая сложная из них — это осмысленная поэзия. Из достижений можно выделить совместный проект Google и Университетов Стэнфорда и Массачусетса по обучению ИИ написанию стихотворений. Один из полученных результатов выглядит следующим образом:

there is no one else in the world.
there is no one else in sight.
they were the only ones who mattered.
they were the only ones left.
he had to be with me. she had to be with him.
i had to do this. i wanted to kill him.
i started to cry. i turned to him.

Не отстают и отечественные разработчики. Так, сотрудники «Яндекса» Алексей Тихонов и Иван Ямщиков выпустили альбом «Нейронная оборона», состоящий из песен и стихотворений, написанных роботом. Созданный ими алгоритм написал тексты в стиле Егора Летова, основателя группы «Гражданская оборона», а Тихонов и Ямщиков исполнили их. Альбом начинается со слов: «В ожидании чудес, невозможных чудес».

Другой российский проект «Пушкин» компании «Когнитивные системы» ставит своей целью научить ИИ сочинять стихотворения в стиле солнца русской поэзии (катрены 4-х стопным ямбом). Для этого разработаны модели по определению и подбору рифм, ударения в слове, ведутся работы над моделью смысловых ассоциаций по группе слов и комбинациям текста.

Рисунок 6. Проект «Пушкин».

Возможно, уже завтра мы будем жить в новом мире. В мире, где программы будут решать сложные задачи — водить машины, строить дома, проводить диагностику и хирургические операции — все это под нашим контролем при поддержании живого диалога человека и машины. Сможет ли Россия занять достойное место в этом новом мире? Время покажет. Одно можно сказать точно: стартовые позиции в «марафоне искусственного интеллекта» у нашей страны неплохие.

Ссылки:

1) Robots threaten up to two thirds of developing country jobs, but could be an opportunity too // UNCTAD.
2) 10 Breakthrough Techonlogies 2017 // MIT Technology Review.
3) Е. Кончаловская: Чьи рабочие места к 2030 году могут забрать компьютеры и роботы? // Портал TheQuestion.
4) Резидент Сколково поможет врачам не ошибаться // Полит.ру
5) Робот-журналист Сяо Нань написал дебютную статью за секунду // Портал «Вести».
6) Маленький Юг // Southern Metropolis Daily.
7) Google AI project writes poetry which could make a Vogon proud // The Guardian.
8) Нейронная оборона // Яндекс музыка.