Ученые из Тель-Авивского университета разработали новый метод быстрого и точного определения энтропии сложных систем без использования каких либо дополнительных предположений. Суть метода заключается в отображении системы на одномерную цепочку, после чего вычисляется степень её сжатия без потери какой либо информации. Полученное таким образом значение интерпретируется как мера энтропии. Эффективность алгоритма была проверена на пяти модельных системах, где энтропия может быть рассчитана аналитически. Результаты показали, что погрешность предложенного метода не превышает нескольких процентов. Кроме того, авторы работы продемонстрировали возможность применения данного подхода для решения задачи фолдинга белков. Статья с подробным описанием метода опубликована в журнале Physical Review Letters. В термодинамике для полного описания состояния системы достаточно знать две функции: энтропию и энтальпию.
Энтропия характеризует степень упорядоченности элементов системы, а энтальпия — энергию, необходимую для поддержания её структуры. Определение энтальпии обычно не представляет сложности, так как основывается на знании сил взаимодействия между компонентами системы.
В то же время, для вычисления энтропии необходимо найти вероятности, с которыми реализуются все возможные микросостояния системы (например, различные способы сворачивания белка). С увеличением размера системы сложность этой задачи быстро растет, и для больших систем ее не могут решить даже современные суперкомпьютеры. Чтобы оценить свойства таких систем, ученым приходится идти на ухищрения.
В частности, один из способов оценить энтропию сложной системы основан на использовании некоторых априорных знаний и предположений — например, эмпирических данных, накопленных в экспериментах с похожими системами. Это позволяет «урезать» пространство, которое нужно смоделировать компьютеру. К сожалению, для каждой задачи способ «урезания» разный. Другие алгоритмы полагаются на методы, которые оценивают распределение работы в ходе вычисления или рассматривают отношения между различными областями фазового пространства. Впрочем, в этих методах также нельзя выделить явного лидера, и во многих случаях эффективность их работы также сильно зависит от поставленной задачи.
Группа исследователей под руководством Рой Бека (Roy Beck) разработала алгоритм, который довольно точно оценивает асимптотическую энтропию произвольной системы, но требует сравнительно мало вычислений. Для этого ученые заметили, что энтропия системы пропорциональна степени, до которой можно без потерь сжать строку символов, полностью описывающую заданную конфигурацию. Грубо говоря, чем больше энтропия системы, тем сложнее в ней выделить какие-либо закономерности; если же таких закономерностей нет, «ужать» информацию о системе без потерь невозможно. Осталось придумать, как корректно отобразить в строку систему, которая в общем случае описывается большим числом непрерывных степеней свободы.
Чтобы построить такое отображение, ученые придерживались следующей последовательности действий. Сначала исследователи выделяли релевантные степени свободы системы. Например, при вычислении конфигурационной энтропии ученые не учитывали вращения и трансляции системы. Для упрощения расчетов каждую непрерывную координату (например, угол) ученые заменяли приближенной дискретно изменяющейся координатой (так называемое крупнозернистое моделирование). Затем физики отображали многомерное пространство в одномерное с помощью кривой Гильберта. Это позволяло сохранить корреляции между частями системы.
После этого полученный одномерный массив чисел исследователи сжимали без потерь с помощью алгоритма Лемпеля — Зива — Велча, реализованного в программе 7-Zip. Если кратко, то этот алгоритм идет вдоль цепочки символов и ищет повторяющиеся короткие отрезки, а затем заменяет их указателями на места, в которых он впервые столкнулся с такими отрезками. Наконец, ученые рассчитывали степень сжатия массива и отображали ее в энтропию системы. В качестве первого приближения ученые использовали линейную функцию, в котором коэффициентом пропорциональности служит число степеней свободы, умноженное на логарифм от числа переменных, необходимых для описания каждой степени свободы по отдельности. Справедливость этого приближения ученые доказали на конкретных примерах.
Для проверки предложенного метода физики рассмотрели пять систем, для которых энтропию можно рассчитать аналитически. Во-первых, ученые нашли энтропию четырехуровневой системы при разной температуре. Во-вторых, физики рассмотрели двумерную модель Изинга на квадратной решетке, которая описывала ферромагнетик или фрустрированный антиферромагнетик. В-третьих, исследователи повторили расчеты для модели Изинга на треугольной решетке. Наконец, ученые оценили энтропию цепочки из N звеньев, конец и начало которой разнесены на фиксированное расстояние. Во всех этих случаях полученная энтропия отличалась от точного значения всего на несколько процентов (не считая постоянного сдвига).

Сравнение энтропии, рассчитанной алгоритмом для разных температур, с точной энтропией для четырехуровневой системы (a), модели Изинга на квадратной решетке (b), модели Изинга на треугольной решетке (c) и цепочки с фиксированными концами (d). Ram Avinery et al. / Physical Review Letters

Сравнение структуры белка, найденной с помощью алгоритма (красный) и известной из эксперимента (синий). Ram Avinery et al. / Physical Review Letters

Вероятность того, что белок окажется свернут, в зависимости от энтропии и энтальпии соединения. Ram Avinery et al. / Physical Review Letters