Нейросеть и условия ее саморазвития: шесть основных тезисов

Исторически в исследованиях искусственного интеллекта было два самых крупных направления: экспертные системы и машинное обучение. Первое направление основывалось на идее, что можно взять какую-то сложную задачу — например игру в шахматы — и заложить в компьютерную программу опыт лучших шахматистов в виде стратегий, способов оценивания ситуации, правил принятия решений. Экспертные знания в принципе формализуемы, хотя это трудная математическая и программистская задача. Но довольно быстро выяснилось, что чем сложнее задача, тем труднее все учесть и предусмотреть в системе экспертных правил. Поэтому стало развиваться второе направление, основанное на машинном обучении. Забудем про знания экспертов и будем просто собирать данные о том, какое решение было правильным, а какое неправильным в той или иной ситуации. Накапливается выборка данных, по которой мы строим предсказательную модель, способную принимать решения в аналогичных ситуациях.

Картинки по запросу саморазвитие нейросети

Обучение предсказательной модели — это математическая технология, основанная на классической задаче проведения функции через заданные точки. Многие из этих методов известны еще со времен Лагранжа и Гаусса.

Конечно, современное машинное обучение оперирует гораздо более сложными функциями, да и под «точкой» теперь может пониматься весьма сложно устроенный объект. По мере того как компьютерный сбор и накопление данных стали более дешевыми, второе направление потихоньку стало вытеснять первое.

Глава 1. Обработчик сигналов

В повседневной жизни мы не задумываемся, почему нам нравится стейк или апельсин. Он жареный, сочный и мясистый, а мы голодные. Благодаря теории Дарвина ученые, к счастью, уже могут нам объяснить, почему же нам нравится стейк. Потому что в процессе естественного отбора погибли все, кто эти стейки просто напросто не любил. Выжили те, кто жарил мясо на огне, а своими огромными челюстями сумели пожертвовать в пользу большего размера мозга. Мозг оставшихся в живых тонко настроен на факт, что жареный стейк – хорошо. В мозге за поедание такого блюда выделяется ряд гормонов, активирующих центр удовольствия. Эти гормоны – дофамин и серотонин, и еще несколько, образуют коктейль определенной концентрации, на который в нашем мозге реагирует так называемый обработчик или интерпретатор сигналов. Каждый сигнал как музыка, состоящая из некоторого ряда нот. Стейк – своеобразная сумма сигналов нервной системы, в том числе зрительной, обонятельной, вкусовой. Три этих системы дают определенную неповторимую сумму, которую наш обработчик интерпретируют как «хорошо» (выработалось это в следствии естественного отбора !!!), и дальше отправляет сигнал «хорошо» в наше сознание, так мы чувствуем удовлетворение. Но что в точности мы чувствуем? Вряд ли кто-то сможет словами описать чувство счастья. Но если ощущения нельзя описать словами, по крайней мере их можно описать в математических числах.

Итак, выводы – мы не в состоянии решить за обработчик, плоха какая-то вещь или хороша. В организме человека роль этого обработчика играет небольшой орган под названием гипоталамус. Размер этого органа примерно с ноготь, а соединен он со всей нервной системой, абсолютно со всем мозгом. Именно этот орган решает за нас, что в пустыне нам хочется стакан воды, стоящий посреди стола. Его тонкая настройка сама происходит в процессе эволюции, и решает он, а не мы. Простейший пример – родилось у родителей поколение, в котором у одного детеныша обработчик интерпретирует апельсин как вкусно, а у другого детеныша обработчик интерпретирует апельсин как не вкусно. Тут нужно сделать заметку из биологии, что следующее поколение может иметь не только признаки отца и матери, но и случайные признаки из-за мутаций. В дальнейшем накопление этих случайных признаков дает преимущества некоторым потомкам через многие поколения, а другие ветви, не имеющие таких преимуществ, или умирают в борьбе, или просто вымирают без еды. Либо же сосуществуют на разных территориях далеко друг от друга. Ну так вот, про апельсины. Один из детей стал жить дольше на 20 лет из-за витаминов от апельсина, и распространил свои гены сильнее. Через 10000 лет вся популяция людей любит апельсины, потому что все кто их не любил давно вымерли. А что такое любовь к апельсину? Это ответ нейросети на мелодию сигналов нервной системы. Это ответ обработчика сигналов, преобразование суммы сигналов функцией обработчика в «хорошо» или в «плохо». Можно это эмулировать на любом современном языке программирования. Обычные нейросети умеют определять апельсин на картинке. А что если бы эта нейросеть определяла по картинке, плохо это или хорошо? Показываешь ты ей апельсин, она отвечает хорошо, показываешь змею – отвечает «плохо». Натренировать сеть можно самому, случайно меняя коэффициенты и объясняя, что апельсин хорошо, а змея это плохо, а можно дать ей развиваться самой, только нужно окружение.

Глава 2. Окружение нейросети

Что нужно нейросети для саморазвития? Нужны условия, которые заставят ее это делать, в том числе мотивация и возможности для саморазвития. Нужен естественный отбор. Создадим простейшую модель человека в пустом виртуальном пространстве. К каждой такой модели мы привяжем собственную нейросеть. Научим для начала ходить этих пока еще ботов. Нужно эмулировать около 50 мышц в теле, для начала. Эффективно управляя мышцами, нейросеть будет уметь перемещаться по пространству. За эффективное перемещение награждать, давая плюсики сети. Те же плюсики, что дает обработчик сигналов. Такое уже эмулируется на сегодняшний день, можно найти много видео Youtube, где разные смешные роботы учатся делать свои первые шаги. Но не все так просто. Наш бот будет перемещаться в пространстве тем эффективнее, чем больше параметров на входе в нейросеть мы имеем. Во-первых это конечно машинное зрение. Во вторую очередь идет машинное осязание. Мы поделим поверхность 3д модели на небольшие кусочки, что-то вроде пиксельной кожи, и каждый кусочек будет иметь параметр, задевает его что-то или нет. Так, например ступни будут условно чувствовать землю, что даст более плавное движение в конечном резуллтате после обучения. Так же нужно добавить на вход параметры от виртуального гироскопа в виртуальной голове. 3 параметра смещения по осям X Y Z, определяющих наклон головы или всего тела, а так же силу ускорения и его возможный вектор, для более точной координации в пространстве. Вся вместе эта система будет напоминать своеобразный можжечек, который имеется в организмах всех позвоночных.

А что дальше? Дальше нужно научить их размножаться. Если мы начали эмулировать людей, нужно эмулировать их полностью. К примеру мы создали виртуальных мужчину и женщину. Можно запрограммировать, что чем ближе их половые органы, тем больше плюсиков удовлетворения падает. Но как только наши ребята закончили все свои дела, плюсики переставали падать на определенное время. Пусть не только сексом занимаются, у нас же есть дела по важнее.

По этой же схеме нужно научить их употреблять пищу. Наш бот уже немного умеет управлять своим телом, попробуем эмулировать ему движения рук. Ловкие кисти рук не такая уж сложная вещь для нынешних нейросетей. Создадим рядом с ним виртуальный апельсин. И будем перемешивать веса нейросети до тех пор, пока его обработчик сигналов не решит, что апельсин – хорошо. И что есть его через рот – хорошо. После этого наше виртуальное существо будет есть ртом виртуальные апельсины, все, какие найдет в своем виртуальном пустом пространстве.

При этом модель человека будет обладать виртуальным зрением, причем получать картинку именно через глаза, и желательно в стереорежиме для 2 глаз. Ещё виртаульным слухом в определенном радиусе, например 40 дб в пределах 10 метров и чем ближе сигнал, тем он громче, чем дальше, тем он тише. Еще нужно обоняние, осязание, вкус. Все это эмулируется легко. В простой эмуляции запах может состоять из 50 разных оттенков, составляющих композицию, на которую реагирует хорошо или плохо обработчик сигналов. Каждый предмет в симуляции тоже имеет такой параметр, как запах. Предположим тухлое мясо в симуляции имеет какие то случайные коэффициенты. Для нейросети это просто числа, ей нет реального дела до того, как оно пахнет, потому что никакого запаха на самом деле там не существует, есть только набор коэффициентов. Кому-то оно нравится, кому-то нет. Те кому этот запах нравится, съедают мясо и умирают быстрее. Так в будущих поколениях закрепится, что запах тухлого мяса – это плохо. Еще раз, нет никаких запахов в объективной реальности, запах вещь сугубо субъективная, это не вещественная вещь, запах это отношение мозга или нейросети к набору молекул или коэффициентов в виртуальном мире.

Со вкусом все точно так же, с осязанием уже более сложно, но само по себе осязание не так важно в развитии организма как зрение и слух. Осязание это либо метод взаимодействия с чем-то, либо это метод для ответной реакции на что-то. Например физическую боль от удара. В этом плане осязание более важно. Для наших виртуальных ботов можно эмулировать, что при сильных ударах он не сможет использовать какие-то мышцы и движениям придется слегка переучиваться. Так же при получении урона, в виде ударов или чего-то еще по-опаснее обработчик сигналов воспринимал эти ситуации как «плохо», стараясь не повторять в будущих поколениях. Те кто любит удары, боль воспринимается как положительная эмоция. У этих существ быстро бы выходили из строя все мышцы и другие функции его виртуального организма, что в итоге ограничивало бы возможность размножения.

Глава 3. Симуляция организма

Для того, чтоб эмулировать живое существо, нужно лишить его режима бога. Сделать его очень хрупким, добавить внешних опасных факторов. Представим 3д модельку человека в простом редакторе.

Добавим к нему просчет внутреннего скелета, что кость может сломаться. Добавим простейший просчет количества крови в организме, ее движение, но без особой точности, просто как ряд параметров. К примеру будет в модельке 4 литра крови, при получении урона есть вероятность кровотечения. При большой кровопотере смерть, при малой кровопотере просто отрицательные сигналы со стороны обработчика сигналов. Можно добавить в симуляцию возможность отсекать конечности, можно этого и не делать. Глупее боты от этого не станут. Обязательно нужно добавить возможность испускать и слышать звуки разных частот и разной длительности. Пусть эти звуки влияют на окружение и на окружающих. Возбуждают в окружающих какие-то реакции. Если существа будут использовать звуки, более вероятно развитие понятного нам языка. Ведь что такое язык для нас? Что было до использования человеком языка? Логично предположить, что на заре человечества мы использовли разные звуки, словно животные, проще всего можно посмотреть на обесъян -они пользуются выкриками. Изначально был набор разных звуков в случайном порядке. Какие-то звуки пугали окружающих, какие-то привлекали, так в процессе естественного отбора возник язык, совершенно естественным путем развития в процессе взаимодействия нейросетей в наших головах. Дайте нейросетям взаимодействовть друг с другом, повысив при этом их шансы на выживание, и очень скоро они сами научатся общаться на собственном языке. Изначально заданные ограничения доступных для общения частот могут сдедать язык похожим на человеческий. Например дельфины имеют подобие языка, но он находится на ультразвуковых частотах — большая часть их звуков даже не слышна человеку. Язык это просто набор случайных звуков, выработанных эволюцией.

Кстати эмуляция дыхания может иметь место, если в ней найдется какой-то смысл. Точно так же на каждый вдох давать положительные сигналы. А те, кто не дышал — умер.

Наконец наш организм уже готов выходить куда-то и выживать, пора включать естественный отбор.

Глава 4. Причина сознания

Представьте человека, который еще с утробы был лишен поступающих в мозг сигналов. Со зрительного нерва, со слухового, осязательного, вкусового, температурного и обонятельного, никаких сигналов бы в мозг никогда не поступало. Что было бы в мозге этого существа? Врятли оно бы даже видело сны, ведь во снах мы видим вещи, обычно известные нам в той степени, что мы можем хотя бы их понять. А если ты не видел ничего? И не слышал никого, не чувствовал другого человека, мозг словно вечно дремлет. Сознание, каким мы себе его представляем, даже не зародилось бы там. Как же мы хотим его получить, без всех этих сигналов? Самым простым способом получить что-то, имеющее аналог нашей воли, будет поместить нейросеть в симуляцию, дать ей тело, и таким образом реакция мозга или нейросети на окружающую действительность по средствам сигналов нервной системы и является сознание. Сознание это реакция мозга на окружающую среду. Нет среды – нет сознания. Необязательно отвечать на трудные проблемы сознания, вроде почему красный — это красный, почему существует субъективный опыт, почему есть Я. Все эти вопросы отпадают, когда мы рассматриваем сознание со стороны как реакцию мозга или нейросети на набор поступающих сигналов от внешних факторов. Почему мы не слышим ультразвук? Потому что ухо физически не способно реагировать на столь высокие звуковые частоты. Эти частоты просто не вызывают колебаний в ухе. При этом если бы физически ухо было устроено иначе, мозг бы, возможно не сразу, но со временем, научился бы успешно интерпретировать ультразвук. Нам не должно быть интересно, что конкретно слышит человек в этот момент в своей голове. Ведь даже если мы попросим его описать, он не сможет это сделать. Мы просто должны понимать, что он успешно взаимодействует и реагирует на этот сигнал.
Еще раз повторим, сигнал, поступающий в мозг, интерпретируется им. Цвет, звук, что-либо еще. Мозг не в состоянии описать, как это интерпретировано, т.е. описать как выглядит красный нельзя никак. Значит и нет смысла пытаться эмулировать сознание как таковое. Нужно лишь запрограммировать реакции мозга на сигналы.

Глава 5. Симуляция среды

Симуляция среды даст нам сразу несколько возможностей. Во-первых нейросети будут получать постоянный поток сигналов на все возможные запрограммированные рецепторы. Даже если взять нашу реальность, и качественно эмулировать только 10% от неё – никаких атомов, простая физика Ньютона, все состоит из небольших частиц и зеждится на честном слове программиста. В этом мире может не быть химии, квантовой физики. Но должны быть возможности рвать фрукты с деревьв, ломать найденный кокос палкой. Нужно чтоб существо мерзло и придумывало себе укрытие. Нужно эмулировать каменный век. Пусть в пещеру будет тепло, пусть через много виртуальных лет эмуляции это существо однажды сделает случайные действия, запускающие скрипт костра.

В количественном смысле нам не нужно эмулировать так уж много, начнем с нескольких квадратных километров, позволим существам жить в мире, где пройдя десяток километров возвращаешься в первоначальное место. Вроде конечного ограниченного по площади мира. Или просто с забором по периметру J.

Проще всего там будет эмулировать животных и их поведение. Но если мы хотим настоящее человеческое поведение, нужно нечто большее. Как минимум надо описать для себя, что же нас отличает от обезьян. Именно на этих обезьян и будет изначально похоже поведение нейросетей. Но чем глубже проработана симуляция, чем больше возможностей будет у ее жителей, тем умнее стать они смогут. Представим, что в какой-то момент эти существа овладели палками, научились забивать ими животных и употреблять их разжигая костер из трения палки о палку. Все осуществлено с применением уже существующих на сегодняшний день скриптов и нейросетей. Но дальше мы упремся в предел развития этого племени. Там нам уже придут на помощь дополнительные компьютерные мощности, запасы которых увеличиваются с каждым годом. Можно эмулировать все большие территории, кроме того можно добавлять реальную химию в виртуальный мир. Сначала упрощенную, потом все больше похожую на ту что мы знаем. Кроме того химия не имеет общего непосредственно с эмуляцией атомов. Химия может существовать и без симуляции реальных атомов. Какой-то небольшой набор химических реакций для созданного мира будет достаточен.

Глава 6. Развитие

Жизнь неотделима от смерти. Поэтому для развития искусственного интеллекта необходимо эмулировать размножение, рождение и смерть. С каждым поколением потомки будут перенимать черты родителей и небольшой процент случайных параметров, которые будут закрепляться в поколениях. Параметров нужно задать довольно много, но не так много, как содержится в нашей ДНК. Даже 1000 доли того что есть в ДНК хватит для начала. Например рост, вес, сила – все это завязано на эмулированном нами теле. Самое главное что эти параметры не обязательно должны содержать все реакции обработчика сигналов предыдущих поколений. Достаточно представить обработчик сигналов некоторой функцией, видоизменяющейся с поколениями, и принимающей некоторые значения (хорошо, плохо, как то еще…) при применении этой функции на входящие сигналы. Таким образом не нужно запоминать ответы на все вопросы (апельсин – хорошо ?, тухлое мясо – хорошо ?), достаточно применить нашу функцию обработчика сигналов и измерить результат. Промотаем миллион лет. Смотрим результат. Наши первобытные люди все еще копают палкой песок в поисках корней? Значит эмуляция ограничивает их возможности только на этом. Благо наш мир позволяет нам намного больше, поэтому и добились мы большего. Постепенным увеличением возможностей симуляции мы увеличиваем потенциальные возможности её обитателей. Все это можно улучшать до бесконечности. А можно в какой-то момент дать такому существу управлять аватаром в нашем реальном мире, если он будет для этого достаточно готов. Но это никак не заменит эволюции в симуляции, которая идет на много порядков быстрее. Да и смысла в этом будет не очень много, ведь пока симуляция не такая точная как наш мир, то и существа скорее всего будут глупее нас. Только в условиях подобных нашим может зародиться разум, подобный нашему и никак иначе. Так что начало поставлено, пора запускать симуляцию.

Автор:
Источники: https://habr.com/, https://novayagazeta.ru/

Понравилась статья? Тогда поддержите нас, поделитесь с друзьями и заглядывайте по рекламным ссылкам!