TDLR: термодинамика должна быть априорной для любой фундаментальной модели атомов или материалов.

В нашем современном научном ландшафте машинное обучение выступает маяком надежды на расшифровку сложных закономерностей и взаимосвязей. Это прекрасно иллюстрируется успехом DeepMind в прогнозировании сворачивания белков — триумфом, приписываемым моделям машинного обучения, обученным на данных о последовательности и структуре. Это достижение спровоцировало попытки внедрить аналогичные методы грубого обучения в более широкой области материаловедения. Однако более глубокое погружение показывает, что этот скачок не так прост, как может показаться, и сопряжен со своими уникальными проблемами.

От структуры к свойствам: одна точка в огромном ландшафте

Подходы грубой силы основаны на обучении моделей машинного обучения на огромных объемах данных о структуре и свойствах молекул и материалов с целью выявления основных закономерностей и взаимосвязей. Однако этот переход от структуры к свойствам сложен и упускает из виду важную деталь.

Рассмотрите структуру молекулы — расположение ее атомов и связей — как одну точку на сложной многомерной карте. Эта карта представляет все возможные состояния или конфигурации, которые молекула может принимать в различных условиях, причем каждое измерение является переменной, такой как температура или давление. Структура молекулы — это всего лишь одна из таких точек, снимок конфигурации молекулы в конкретный момент при наборе условий. Чтобы точно предсказать поведение материала, мы должны рассматривать не только эту единственную точку, но и все фазовое пространство — многомерную карту всех возможных конфигураций.

Отсутствующая информация: диаграммы поведения и состояний

Если основополагающая модель в материаловедении направлена ​​на предсказание «уравнения состояния» для любого материала, она пытается предложить математическую модель, описывающую свойства материала в различных условиях. Однако это уравнение является результатом не только структуры материала; это также включает в себя его поведение.

Здесь кроется недостаток метода грубой силы. Поведение, которое представлено диаграммами состояний, иллюстрирующими, как система переходит между различными состояниями в различных условиях, обычно не выводится только из структуры. Тем не менее, эти диаграммы часто отсутствуют в данных о структуре и свойствах, используемых в методах обучения методом грубой силы.

Диаграмма состояний, также известная как фазовая диаграмма, представляет собой тип графического представления, иллюстрирующего различные состояния или фазы, которые система может принять в различных условиях. Эти диаграммы обычно изображают переменные, такие как давление, температура, объем или концентрация, друг против друга, чтобы отображать условия, которые заставляют систему переходить из одного состояния в другое.

Одним из простейших примеров диаграммы состояний является фазовая диаграмма воды. На этой диаграмме показаны состояния воды (твердое, жидкое и газообразное) и условия, вызывающие переходы между этими состояниями. Например, на уровне моря (давление 1 атмосфера) вода переходит из твердого состояния в жидкое при 0 градусов Цельсия и из жидкого состояния в газообразное при 100 градусах Цельсия.

Эта концепция распространяется на более сложные системы, такие как паровые двигатели, в которых вода нагревается под давлением для создания пара, который расширяется и приводит в движение поршень. Диаграмма состояния воды объясняет, что повышение температуры при постоянном давлении заставляет воду переходить из жидкого состояния в газообразное, что является основным принципом работы парового двигателя.

Когда мы рассматриваем сложные материалы, такие как белки, полимеры или их смеси, диаграммы состояний становятся значительно более сложными. Эти вещества могут принимать различные конфигурации в зависимости от множества переменных, таких как температура, давление и других факторов, таких как размер молекулы, свойства растворителя и концентрация.

Например, белок или полимер могут иметь твердую и хрупкую твердую фазу при низких температурах. При повышении температуры он может переходить в гибкое и пластичное твердое тело, а при достаточно высоких температурах — в вязкую жидкость. Диаграмма состояний для этих материалов отображает эти различные состояния и условия, которые инициируют переходы между ними.

Высокая размерность этих диаграмм состояния сложных материалов обусловлена ​​множеством факторов, влияющих на их поведение. Несмотря на их сложность, эти диаграммы дают бесценную информацию о том, как эти материалы будут вести себя в различных условиях. Это понимание имеет решающее значение для использования таких сложных материалов в различных приложениях, от доставки лекарств и тканевой инженерии до создания новых пластиков и красок.

Руководство: законы термодинамики

Помимо проблемы, связанной с неполными данными, подход грубой силы игнорирует бесценный компас в мире материаловедения: законы термодинамики. Эти фундаментальные законы управляют поведением и взаимодействием материи и энергии. Любое уравнение состояния материала должно подчиняться этим законам.

Тренировать модели машинного обучения для создания уравнений состояния без учета законов термодинамики в качестве априорных значений — это все равно, что пытаться ориентироваться в запутанном лабиринте без карты. Он не только требует огромных объемов данных и вычислительных ресурсов, но также рискует создать модели, которые соответствуют обучающим данным, но противоречат этим фундаментальным законам.

Поэтому мы должны добиваться ясности при обсуждении разработки фундаментальных моделей машинного обучения атомов. Если цель состоит в том, чтобы предсказать поведение материалов и вывести их уравнения состояния, то с научной точки зрения необоснованно и непрактично игнорировать законы термодинамики.

Таким образом, в то время как подход грубой силы может блистать в определенных областях, он создает серьезные проблемы в области материаловедения. Более практичный и научно обоснованный подход предполагает использование существующих знаний, особенно законов термодинамики, для управления обучением моделей машинного обучения. Таким образом, мы можем создавать модели, которые точно предсказывают свойства материалов и согласуются с фундаментальными принципами Вселенной.