Искусственный интеллект для контроля качества и совершенствования шампанских вин: кратко о главном

На представленном здесь изображении нами демонстрируется процесс анализа винтажных вин Bollinger с целью определения условий их производства и последующего создания продукции аналогичного качества. Вместо рассмотрения актуальных, но сложных тем, предлагается обсудить применение машинного обучения в совершенствовании производства шампанского. Французский производитель Bollinger внедряет модель машинного обучения для прогнозирования благоприятных лет для сбора урожая и смягчения негативного воздействия изменений климата. В начале 2021 года виноделы Bollinger впервые дегустировали престижное игристое вино La Grande Année 2014, выдержанное в погребах с момента его прямого купажирования. La Grande Année производится исключительно в годы, когда качество винограда признается выдающимся, а перед поступлением в продажу напиток выдерживается в бутылках под пробкой на протяжении семи лет.

В преддверии открытия урожая 2014 года сомелье и ценители сомневались, действительно ли он будет обильным. В тот год погода была переменчивой: рекордная жара в июне, за которой последовали холодные и влажные месяцы, замедлившие созревание винограда. Более того, для шампанского дома Bollinger характерна продукция пино нуар, а в 2014 явно отдавалось предпочтение шардоне.

Дениса Баннера, заместителя главного винодела (и фактически шеф-повара) Bollinger, эти вопросы не волновали. Он знал ответ ещё до того, как открыли первую бутылку. Потратив два года на изучение огромного количества данных, касающихся терруара, виноградников, климата и качества вина в течение сезонного цикла, он был убеждён, что 2014 год станет удачным.

Денис Баннер

В Шампани шеф-повара несут ответственность за создание сложных купажей, которые переходят в готовое вино, а ещё наблюдают за всем циклом производства вина, от первого ростка на виноградниках до сбора урожая, отжима, ферментации и так далее. Они хранители качества и мозги творческого процесса.

Единственные параметры, которые действительно учитываются ценителями винтажного шампанского — это аромат и вкус. По вкусовым показателям La Grande Année 2014, выпущенный на рынок по цене 659 долларов США за ящик, оказался хитом: свежий, элегантный, минеральный темперированный отход от полнотелой нормы с большим потенциалом дальнейшего старения. Один из винных критиков с сайта Vinous.com поставил ему редкую оценку 98/100, назвав «одним из лучших свежих вин, которые я когда-либо пробовал».

Но это всё было после дегустаций. А уверенность Баннера базировалась на анализе данных. Он решил отойти от традиции рассматривать созревание вина как нечто таинственное и алхимическое, и заняться наукой. Ему захотелось понять возможные последствия изменения климата для выращивания винограда и сохранения качества вина.

Банком данных, позволившим сделать это, стала винная библиотека Bollinger, уникальная коллекция, собранная из запасов, годами лежавших в дальних уголках подвалов винных домов. Десять лет назад начался проект по сбору, дегустации, оценке и восстановлению сотен покрытых пылью бутылок, которые сейчас составляют этот жидкий датасет.

62 000 бутылок La Grande Année 2014

Как развивался проект

Производителям нужно было знать больше о свои винах, чтобы анализировать собранную информацию, строить прогнозы урожая и влиять на качество сырья. Разговоры об изменении климата и его последствиях натолкнули Дениса Баннера на мысль изучить некоторые жаркие годы в прошлом и проанализировать урожай тех лет, чтобы понять, что произойдёт в будущем.

Сотрудничество с дата-сайентистами и математиками помогло руководителю Bollinger построить модель, объединяющую:

  • Исторические метеорологические данные;
  • Информацию о почве и состоянии растений для каждого сорта винограда;
  • Информацию о сроках основных сезонных событий, таких как распускание бутонов, цветение, созревание и сбор урожая;
  • Результаты лабораторных анализов (на уровень сахара и кислотность) виноградного сусла и самого вина.

Работе помогало наличие собственного жидкого архива, точных метеорологических данных с местных метеостанций, а также доступ к данным от Межпрофессионального комитета вин Шампани (CIVC).

Все собранные данные, размеченные по сорока с лишним параметрам, можно было сопоставить с оценкой того, что вышло в итоге. То есть теоретические выкладки о том, каким должно получиться шампанское, сравнивали с тем, что действительно получилось. Этому помогли дегустационные заметки Дениса Баннера о шампанском за последнее столетие из Винной библиотеки, фактически окончательное суждение о качестве каждого урожая.

Виноделы наблюдали за эволюцией лоз и сезоном созревания, сегментируя каждый этап, чтобы найти корреляцию между процессом выращивания и конечным качеством сырья и купажа. Они рассчитали, каким должен быть идеальный сценарий, и чем опасен отход от этих условий. Все данные заводились в компьютер, чтобы обучить ИИ прогнозировать качество урожая.

В итоге получилась модель, способная предсказать “силу” сезона, даже когда он только начинается. За счёт этого у виноделов появилась метрика, которую можно использовать в планировании. И она очень хорошо дополняет медленную, интуитивную оценку купажа в течение нескольких месяцев дегустаций.

Да-да, несколько месяцев. В обычных условиях после первой ферментации необходимо дегустировать около 4000 бочек, прежде чем появится чёткое представление о качестве винтажа. Да, кое-какие мысли у виноделов могут появиться во время сбора урожая, но окончательный вердикт возможен только после дегустации.

ИИ-модель Bollinger пока что не может заменить традиционный, глубокий процесс дегустации. Зато способна упростить принятие ключевых решений виноделами: объявить ли год урожая; стоит ли делать ограниченную серию; какие купажи будут; и, что особенно важно, насколько хорошо стареет винтаж.

В качестве доказательства эффективности своей математической модели руководитель Bollinger приводил лето 2021 года. Виноделы восприняли его, как катастрофу, а он утверждал, что плохая погода не сильно скажется на качестве вин. Опытная дегустация подтвердила, что все вина получились выше среднего уровня.

От теории к практике

Оценить результат — это одно. Следующим важным шагом является применение накопленных знаний и теоретических выкладок к управлению самими виноградниками и борьбе с изменением климата — той самой проблемой, которая побудила Баннера заняться наукой и машинным обучением.

Более высокие температуры приводят к более раннему сбору урожая: в период с 2015 по 2020 год урожай собирали в августе, а не в сентябре, чего не было в предыдущие 100 лет. В среднем вегетационный период сократился на 18 дней, что означает более короткий период созревания, а также более концентрированные, полнотелые фрукты и более низкую кислотность, одну из важнейших характеристик шампанского. Другими словами, потенциальное долгосрочное изменение профиля самого шампанского.

Архивы Bollinger — это не только бутылки в погребах, но и детальные записи условий выращивания

У крупных виноделов вроде Bollinger нет недостатка в инструментах, с помощью которых они могут адаптироваться под текущую ситуацию: можно снизить «дозировку» сахара, добавляемого в каждую бутылку после дегоржажа; менять сорта винограда и подвоя; даже время дня, когда собирают виноград. Смысл модели данных в том, чтобы точно определить события, которые наиболее явно влияют на качество, чтобы сделать наилучшую адаптацию. Так, датасет помог определить два элемента, которым ранее придавали мало значения.

Во-первых, оказалось, что ночная температура гораздо важнее, чем думали виноделы. Если ночью температура превышает 13 или 14 градусов по Цельсию, вторичный метаболизм лозы неэффективен, и корреляция с качеством становится заметно отрицательной», — говорит Баннер. Обилие прохладных ночей в 2014 году (несмотря на обжигающе жаркий июнь) было одним из факторов, указывающих на более сильный год.

Во-вторых, проблема водного стресса — последствия недостатка либо переизбытка воды за короткий период более серьёзны, чем предполагалось. И этот параметр будет увеличивать своё значение по мере того, как погодные условия становятся более непредсказуемыми.

Точно так же модель показала, что засушливые зимы, которые лишают почву достаточного количества воды в самом начале цикла, ещё до того, как на лозах распустятся бутоны (начало вегетационного периода), могут оказать явное влияние на качество в дальнейшем.

Лучшие условия для виноградников — это небольшой дождь каждый месяц, но не слишком сильный. Но в 2020 году, например, дождя не было два с половиной месяца. Если вы бежите марафон, и температура внезапно подскочила, вам нужно пить. Иначе у вас будет сильный стресс. Модель Bollinger показывает, что то же самое происходит и с виноградными лозами. Значит, можно внести изменения в уход за виноградниками, чтобы нивелировать вредное влияние климатических и иных параметров.

Автор: Cloud4Y
Источник: https://habr.com/