Технология разработки новых мультикристаллических материалов с помощью машинного обучения: кратко о главном

Разнообразие и значительные преимущества мультикристаллических технологий позволили их применять в качестве базиса для различных приложений от солнечной энергетики до полупроводниковой индустрии и медицины. В тоже время, работа с ними связана с весьма большими трудностями. Дело в том, что использование разных мультикристаллических материалов усложняется наличием дефектов и неоднородностей свойств кристаллов по поверхности материала, связанных с различной кристаллографической ориентацией каждых отдельных зерен. Кроме того, работа с такими материалами требует наличия дорогостоящего оборудования и использования современных методов, затрачивающих много времени и неподходящих для образцов большой площади, что является насущной проблемой.

Другими словами: материал очень востребован во многих сферах промышленности, но имеет ряд особенностей, и не имеет достаточно эффективных способов работы с ними.

В данной статье я расскажу, какое решение данной проблемы было найдено исследователями, и для сравнения опишу современные используемые методы для определения кристаллографических ориентаций в мультикристаллических материалах.

Введение

Особенность мультикристаллических материалов заключается в существовании дефектов и необходимостью работы с ними. У разных дефектов различная природа, но по большей части нас будут интересовать именно поверхностные, связанные с наличием четких границ кристаллов (зерен). В свою очередь, четкие границы в материале возникают из-за различной ориентации зерен в пространстве. При различной кристаллографической ориентации зерен поверхность будет отличаться различными свойствами (особенно при ярких дефектах, ведущих к серьезной потере прочности), что в значительной степени осложняет как саму работу с мультикристаллическим материалом, так и (в особенности) его обработку.

Таким образом, почти все трудности, связанные с работой с мультикристаллическим материалом (формирование самого материала, его обработка), будут сводится к распределению кристаллографических ориентаций каждого зерна. Возникновение дефектов, снижение твердости и прочности материала (следовательно – функциональности и долговечности), возникновение напряжений в местах дефектов – все это зависит от ориентации зерен, поэтому возможность отслеживать и влиять на ориентацию кристаллов играет важную роль в развитии промышленности.

А теперь обо всем поподробнее!

Мультикристаллические материалы – это твердые вещества, состоящие из множества  маленьких кристаллических зерен разных размеров, форм и структур. Они содержат границы, отделяющие каждое зерно от другого, что вызывает резкое изменение кристаллографической ориентации – взаимного относительного расположения их кристаллических решеток. Каждые отдельные зерна обычно имеют случайную кристаллографическую ориентацию (при их естественном обособленном или совместном росте), но при определенных условиях обработки они могут быть одинаково направлены. Большинство неорганических твердых веществ, включая металлы, сплавы и многие виды керамики, обычно являются мультикристаллическими.

Важно уточнить, что все металлы и их сплавы имеют  характерную  кристаллическую  структуру. Кристаллическое состояние прежде всего характеризуется определенным, закономерным расположением атомов в пространстве, формирующем конкретный тип решетки. В кристалле элементарные частицы сближены до соприкосновения и располагаются закономерно по разным направлениям. Для упрощения пространственное расположение частиц заменяют схемами, где центры тяжести частиц представляют точками. Точки пересечения прямых линий, в которых располагаются атомы, называются узлами кристаллической решетки.

Основные типы кристаллических структур: 1 – кубическая; 2 – тетрагональная; 3 – ромбическая; 4 – ромбоэдрическая; 5 – гексагональная; 6 – моноклинная; 7 – триклинная

Основные типы кристаллических структур: 1 – кубическая; 2 – тетрагональная; 3 – ромбическая; 4 – ромбоэдрическая; 5 – гексагональная; 6 – моноклинная; 7 – триклинная

Металлы образуют в основном три типа решеток: объемноцентрированную кубическую (R, Na, Li, Tiβ, Feα и др.), гранецентрированную кубическую (Caα, Ce, Ag, Au, Cu, Feγ, Ni и др.) и гексагональную плотноупакованную (Mg, Tiα, Zn, Caβ и др.).

а – объемноцентрированная кубическая; б – гранецентрированная кубическая; в – гексагональная плотноупакованная.

а – объемноцентрированная кубическая; б – гранецентрированная кубическая; в – гексагональная плотноупакованная.

В любом реальном кристалле всегда имеются дефекты строения, которые подразделяются по геометрическим признакам на точечные, линейные и поверхностные.

Размеры точечных дефектов не превышают несколько атомных диаметров. К точечным дефектам относятся вакансии (узлы кристаллической решетки, в которых отсутствуют атомы) и межузельные атомы (образуются в результате перехода атома из узла решетки в междоузлие). Такие дефекты вызывают местное искажение решетки.

Линейные дефекты имеют малые размеры в двух измерениях и большую протяженность в третьем измерении. К ним относятся дислокации. Краевая дислокация представляет собой лишнюю незаконченную атомную плоскость (экстраплоскость). Если экстраплоскость находится в верхней части кристалла, то краевую дислокацию считают положительной и обозначают ┴, а если в нижней части кристалла, то дислокация считается отрицательной и обозначается ┬.

а – сдвиг, создавший краевую дислокацию; б – пространственная схема краевой дислокации; в, г – схемы расположения атомов у дислокаций.

а – сдвиг, создавший краевую дислокацию; б – пространственная схема краевой дислокации; в, г – схемы расположения атомов у дислокаций.

Поверхностные дефекты являются двухмерными, т.е. они имеют малые размеры в одном измерении и большую протяженность в двух других измерениях. Такие дефекты представляют собой поверхности раздела между отдельными зернами кристаллической решетки.

Наличие дефектов в кристаллической решетке может как влиять на ее ориентацию, так и быть причиной, вызванной специфической ориентацией кристаллов! Дефекты и кристаллографическая ориентация, в нашем случае, прочно связаны друг с другом.

В мультикристаллических материалах распределение границ зерен и их кристаллографических ориентаций является одним из важных факторов, определяющих свойства материала. Высокая плотность границ (при одинаковой ориентации) повышает механическую прочность и твердость металлов, в то время как наличие полостей и зон деформации из-за четких границ зерен приводит к растрескиванию и снижению прочности материала. Это становится заметно уже на этапе формирования брусков/пластин металла и последующей поверхностной обработки (для достижения гладкости) кристаллизованного расплава.

Уплотнение зерен, снижающее четкость границ зерен, является распространенной техникой для повышения прочности, что обеспечивает широкий спектр применений. Однако, если говорить, например, про солнечные батареи, свойства которых улучшались на протяжении многих лет благодаря разнообразию составляющих мультикристаллических материалов (таких как кремний, селенид индия меди, теллурид кадмия и перовскиты), их производительность все равно ограничена высокой концентрацией дефектов и различной ориентацией зерен.

Сложная сверхъячейка перовскита, используемая в солнечных батареях.

Сложная сверхъячейка перовскита, используемая в солнечных батареях.

В данном исследовании особое внимание уделяется распределению кристаллографических ориентаций и тому, как они влияют на характеристики материалов. Ученые стремятся прояснить связь между распределением ориентаций, образованием и поведением дислокационных кластеров (то же, что и совокупностей) в мультикристаллическом кремнии. Дислокационные кластеры характеризуются высокой концентрацией до 107 см-2  и являются центрами рекомбинации для фотогенерированных носителей зарядов.

Мультикристаллический кремний в составе солнечной батареи.

Мультикристаллический кремний в составе солнечной батареи.

Рекомбинация – процесс гибели свободных электронов и других заряженных частиц в результате столкновений (процесс, приводящий к переходу электрона из зоны проводимости в валентную зону). Центры рекомбинации – это дефектная точка (связанная с включением примесей или дефектов кристаллической решетки), которая может захватывать свободные носители заряда и, соответственно, вызывать их рекомбинацию.

Обычно они образуются около границ зерен во время отливки кремниевых заготовок из-за снятия напряжения, а с ростом кристалла становятся доминирующими в кристалле на поздней стадии роста.

Кристаллографические ориентации обычно измеряются методом дифракции обратного рассеяния электронов (EBSD) или методом  Лауэ. Эти методы отличаются высокой результативностью и точностью, но уступают в скорости и площади измерений.

В EBSD получение картин дифракции отраженных электронов осуществляется с помощью растрового электронного микроскопа. Для этой цели полированный образец наклоняют под углом около 70 градусов по отношению к горизонтали. Электронный зонд направляют в интересующую точку на поверхности образца: упругое рассеяние падающего пучка вынуждает электроны отклоняться от этой точки непосредственно ниже поверхности образца и налетать на кристаллические плоскости со всех сторон. В тех случаях, когда удовлетворяется условие дифракции Брэгга для плоскостей атомов решетки кристалла, образуются по 2 конусообразных пучка дифрагированных электронов для каждого семейства кристаллических плоскостей.

Условие Вульфа–Брэгга: 2dsin=n

Условие Вульфа–Брэгга: 2dsin=n

Эти конусы электронов можно сделать видимыми, поместив на их пути фосфоресцирующий экран, а вслед за ним высокочувствительную камеру для наблюдения (цифровую CCD камеру). Обычно камера располагается горизонтально, чтобы фосфоресцирующий экран находился ближе к образцу, с широким углом захвата дифракционной картины. Там, где конусообразные пучки электронов пересекаются с фосфоресцентным экраном, они проявляются в виде тонких полос, называемых полосами Кикучи. Каждая из этих полос соответствует определенной группе кристаллических плоскостей. Результирующие картины состоят из множества полос Кикучи. С помощью специальных компьютерных программ автоматически определяется положение каждой из таких полос, производится сравнение с теоретическими данными о соответствующей кристаллической фазе и вычисляется трехмерная кристаллографическая ориентация.

В данном исследовании предлагается быстрое и точное измерение кристаллографической  ориентации с помощью оптической визуализации и машинного обучения. Сочетание эффективных описателей и системы обучения позволяет провести скрининг свойств материалов и создать базу данных для тестирования материалов-кандидатов. Способность машинного обучения обрабатывать огромные объемы сложных данных подходит для решения проблемы связи между множеством оптических характеристик и кристаллографической ориентацией, поскольку оптические характеристики могут быть недостаточно воспроизведены обычными методами подгонки.

Рассматриваемая методика реализована с помощью самодельного аппарата для получения изображений образца с высоким разрешением и модели машинного обучения для оценки кристаллографической ориентации по картинам отражения света, полученным из оптических изображений текстурированных мультикристаллических пластин. Среди различных методов машинного обучения была использована нейронная сеть с долгой краткосрочной памятью (LSTM), являющаяся разновидностью рекуррентной нейронной сети (RNN).

Рекуррентные нейронные сети (RNN) предназначены для работы с последовательными данными, такими как тексты, речь и временные ряды. Они имеют обратные связи между нейронами, что позволяет учитывать контекст и зависимости в данных. Однако классические RNN имеют проблему затухающего или взрывающегося градиента. Для решения этой проблемы были разработаны модификации, такие как LSTM (долгая краткосрочная память) и GRU (единицы с воротами).

LSTM (Long Short-Term Memory) – это вид рекуррентных нейронных сетей, специально разработанный для работы с долгосрочными зависимостями в данных. Они позволяют моделям учиться на длительных последовательностях и успешно применяются в задачах генерации текста, машинного перевода и анализа временных рядов.

Ученые считают, что LSTM эффективно сохраняет последовательные связи между ориентациями кристаллов.

В данном исследовании подробно описывается методология и результаты попыток повысить точность предсказания.

Используемые методы исследования

Использовались кремниевые пластины, вырезанные из одного слитка алмазной пилой. Сначала было проведено щелочное текстурирование поверхности пластин. Это позволяет удалить лишние частицы и оставлять главным образом плоскости {111} на поверхности, создавая структуру, напоминающую пирамиду.

Облучение этих пирамид вызывает генерацию кристаллографически ориентированных картин отражения. Для создания и регистрации этих картин отражения используется самодельный прибор, показанный на рисунке.

Аппарат состоит из фотометра (ProMetric IP-PMY29), вращающегося коллимированного светильника для освещения и сцены. При вращении света вокруг образца оптические изображения делаются через каждые 5 градусов поворота. Далее  эти 72 изображения (которые получаются после полного оборота вокруг пластины) объединяются в 72-мерную матрицу интенсивности сигнала, которую называют “профилем яркости”.

Визуально матрица интенсивности  представлена как таблица, состоящая из 72 строк и n-ного количества столбцов (зависит от размеров изображений). Каждая ячейка матрицы содержит значение интенсивности света, полученное для определенного угла поворота. Его можно изобразить числом или градацией цвета, где более яркие значения соответствуют более высокой интенсивности света, а более темные значения – более низкой интенсивности света.

Затем профили яркости нормализуются для устранения фонового эффекта от источника света. Для этого измеренная яркость делится на диффузное отражение от белой рассеивающей пластины, которое пропорционально распределению интенсивности света.

Пример обработанного профиля яркости для одного зерна, измеренного на трех разных высотах: 30°, 45° и 60°:

Угол возвышения света может быть установлен на произвольный угол в диапазоне от 15° до 60° . Угол возвышения и угол поворота определяют угол падения облучения на пластину. Выбор углов возвышения и поворота позволяет собирать несколько профилей яркости для каждого зерна. Сбор всех данных проводился в темной комнате, что сводило к минимуму влияние внешнего освещения.

Следующий шаг – обучение модели машинного обучения, чтобы предсказать ориентацию для каждого зерна. Модель представляет собой контролируемую нейронную сеть, которая состоит из нейронной сети LSTM и двух полностью связанных слоев.

LSTM состоит из 128 блоков, а каждый из двух полностью связанных слоев имеет 128 узлов. В качестве функции активации для полносвязных слоев выбран выпрямленная линейная функция (ReLU).

LSTM состоит из 128 блоков, а каждый из двух полностью связанных слоев имеет 128 узлов. В качестве функции активации для полносвязных слоев выбран выпрямленная линейная функция (ReLU).

Выпрямленная линейная функция активации или сокращенно ReLU (rectified linear activation unit) — это кусочно-линейная функция, которая выводит входные данные без изменений, если они положительные, и ноль, если входные данные отрицательные. Она стала функцией активации по умолчанию для многих типов нейронных сетей, потому что модель, использующую ее, легче обучать, и она часто достигает лучших результатов.

Для предотвращения переобучения в модель вставлены дропауты со значением 0,5.

Дропауты относятся к методу регуляризации (предотвращения переобучения) в нейронных сетях. Параметр “дропаут” определяет вероятность того, что каждый узел (нейрон) в полносвязном слое будет игнорироваться/выключаться случайным образом во время обучения. Значение 0,5 означает, что каждый узел будет иметь 50% шанс быть отключенным на каждой итерации обучения.

Входом модели является предварительно полученный профиль яркости, а выходами являются кватернионы, представляющие ориентацию.

Кватернионы – это математический объект, который представляет собой комбинацию скалярной и векторной частей и используется для описания поворотов и ориентации в трехмерном пространстве.

В качестве обучающих данных используется ориентация зерен, измеренная методом Лауэ.

Метод Лауэ – это метод получения дифракционных данных путем сканирования кристалла рентгеновским лучом. В этом методе используется движущийся детектор, который регистрирует интенсивность дифрагированного излучения при различных углах сканирования. Метод Лауэ позволяет получить информацию о структуре кристалла, включая положение атомов и их типы.

По мере обучения модели выходные данные сравниваются с правильными значениями, а веса, соединяющие узлы, корректируются таким образом, чтобы прогнозы и правильные значения хорошо совпадали. Для оценки эффективности модели использовались геодезические расстояния, представляющие собой кратчайший путь между истинной и предсказанной ориентацией, которые затем переводились в радианы для сравнения ошибок предсказания. Средняя абсолютная ошибка (MAE) была использована в качестве функции потерь, оптимизируемой программой Adam. Размер партии составлял 3838, а количество эпох – 8000.

После обучения модели она проверяется на данных с той же кремниевой пластины, а затем тестируется на другой пластине. Наборы данных для обучения, проверки и тестирования состоят из профилей яркости 3838, 960 и 6373 зерен соответственно. Они были извлечены из семи кремниевых пластин, по три для обучения и проверки и четыре для тестирования.

Анализ результатов обучения

A. Результаты обучения на простой и улучшенной моделях

На рисунке показаны результаты [(a), (c), (e) и (g)] проверки и [(b), (d), (f) и (h)] тестирования, когда прогнозирование выполнялось на различных высотах. Были выбраны следующие высоты: 30°, 45° и 60°.

На гистограмме показана ошибка предсказания и вероятность обнаружения зерен. По мере увеличения точности красные гистограммы смещаются влево и образуют острый пик. Черная линия показывает ожидаемую форму, когда предсказания были полностью случайными. Видно, что все гистограммы наклонены влево, что говорит об успешности предсказания.

Таблица I показывает квартили для каждого прогноза:

При обучении на 60° медиана ошибок составила 8,61° . Видно, что оптимальный угол возвышения составляет 45°. Точность предсказания сильно варьировалась в зависимости от угла возвышения. Исходя из полученных результатов, можно предположить, что объединение всех трех углов может привести к более качественному обучению модели. Результаты комбинированной модели показаны на рисунках (g) и (h). Примечательно, что наблюдается значительное снижение медианы ошибок до 50% в комбинированной модели по сравнению с 60°, также уменьшилось количество зерен с заметно большими ошибками. Медиана ошибок при обучении на всех трех углах возвышения составила 4,35°.

B. Результаты обучения с последующей аугментацией данных

Аугментация данных – это метод увеличения объема данных, когда считается, что имеющихся данных недостаточно для обучения сети. Во многих случаях простые трансформации, такие как поворот или отражение исходного изображения, фильтрация или обесцвечивание, становятся достаточно эффективными.

a) Исходное изображение. b) Отображение по горизонтали. c) Вращение. d) Отступ. e) Увеличение яркости и контрастности. f) Вырезание. g) Добавление шума. h) Изменение RGB каналов.

a) Исходное изображение. b) Отображение по горизонтали. c) Вращение. d) Отступ. e) Увеличение яркости и контрастности. f) Вырезание. g) Добавление шума. h) Изменение RGB каналов.

Хотя эти незначительно измененные изображения по сути являются теми же данными, нейронная сеть рассматривает их как новые данные, что способствует обобщению модели и повышению ее надежности. В частности, в нашем случае исходные профили ясности были повернуты с интервалом 5°, что увеличило объем данных в 72 раза по сравнению с исходным размером. Кватернионы были повернуты с использованием матриц поворота из SciPy.

Пример повернутых данных:

Модель была обучена и протестирована на аугментированных данных и сравнена с обучением на неаугментированных данных, как показано на следующем рисунке:

Таблица II показывает, что точность прогнозирования улучшилась на 25% – 35%.

Ориентации, измеренные для каждого зерна в образце пластины, отображены на обратной полярной диаграмме (IPF). Это отображение было создано путем обучения на всех высотах с дополнением данных. Время, необходимое для составления карты, составило 8 мин.

C. Сравнение эффективности разработанного метода с традиционными

В таблице III приведено сравнение пространственного разрешения и времени измерения данного метода с двумя традиционными методами, EBSD и методом Лауэ.

Время измерения рассчитывается для полноразмерной пластины 15 × 15 см2. EBSD имеет самое высокое пространственное разрешение, поскольку электронные лучи могут быть сконцентрированы с помощью электромагнитных линз. Несмотря на их точность, обычные методы требуют значительного времени для измерения, а рассматриваемый нами метод превосходит их, требуя общее время измерения 1,5 часа. Это включает время, необходимое для получения оптических изображений, обучения и отображения ориентации. Обучение требует максимум 7 минут и 30 секунд, а отображение – до 8 минут. Большая часть времени измерения уходит на генерацию оптических изображений, что может быть сокращено путем переработки оборудования.

Детальное рассмотрение этапов и результатов обучения

Было замечено, что ошибки предсказания различаются в зависимости от угла обучения. Обучение под углом 45° дало наилучшие результаты, в то время как обучение под углом 60° привело к низкой точности. Ориентации зерен с заметно большой ошибкой более 10° представлены на обратной полярной диаграмме относительно направления нормали, где графики указывают на индекс кристаллографической плоскости, нормальной к поверхности образца.

(слева, 30°, 45°, 60°)

(слева, 30°, 45°, 60°)

На рисунке показано, что существует значительная разница в предсказываемых ориентациях зерен. Например, при угле 30° модель не справляется с плоскостями, близкими к {111} или {101}. При угле 45° модель не справляется с плоскостью {111}, а при угле 60° – с плоскостями от {111} до {001}. Это изменение объясняется геометрической конфигурацией падающего света и структурами поверхности. Известно, что щелочное текстурирование создает пирамидальные структуры, состоящие из плоскостей {111}, на поверхности образца.

На рисунке (a) показан октаэдр, наполовину выступающий на поверхности при расположении зерна с плоскостью {100} вверх. Пример профиля яркости, создаваемого этими зернами, также показан на рисунке (d). Измеренная яркость обычно низкая, с четырьмя маленькими пиками, соответствующими зеркальному отражению. Кроме того, низкие высоты обычно создают профили низкой интенсивности по сравнению с большими высотами, но в данном случае нет существенной разницы в интенсивности между углами отклонения. Это связано с тем, что большая часть отраженного света движется в противоположном направлении от камеры.

В зернах с ориентацией близкой к плоскости {101}, октаэдр, образованный плоскостями {111}, и их профиль яркости показаны на рисунках (b) и (e). В этом случае две плоскости {111} обращены вверх и сильно отражают свет. При низких углах отклонения отражение ослаблено, а при больших углах отклонения появляются сильные пики отражения.

В зернах с ориентацией близкой к {111}, одна плоскость {111} обращена вверх, как показано на рисунке (c). Для зерен с точной ориентацией {111} изменение интенсивности отражения при повороте практически отсутствует. Однако, если зерно слегка наклонено в любую сторону, профиль резко меняется и возникает значительный пик, как показано на рисунке (f).

Эти вариации в картинах отражения сильно влияют на эффективность прогнозирования. Чем ярче выражены вершины и впадины, тем лучше модель способна правильно предсказывать ориентацию. Комбинирование нескольких углов наблюдения – хороший способ воспользоваться различными возможностями и получить лучшие результаты.

На рисунке показан график, отображающий связь ошибки между каждым углом наблюдения. Коэффициенты корреляции приведены в таблице ниже. Видно, что перекрытие предсказанных результатов различается в зависимости от угла наблюдения. 45° и 60° имеют более высокую корреляцию, чем 30° и 60°. Чем меньше корреляция, тем эффективнее комбинирование этих углов наблюдения.

В результате аугментации данных медиана ошибок составила 2,85°. Это относительно хороший результат, учитывая, что входные изображения были получены через каждые 5° поворота. Комбинируя эти два метода: изменение высоты и аугментацию данных, можно адекватно измерить ориентацию.

Исследователи разработали быстрый и точный метод измерения кристаллографических ориентаций с помощью оптических изображений и серии аналитических техник на основе науки о данных. Эта методика позволит проанализировать весь слиток и его кристаллические характеристики, что поможет получить целостное представление о росте кристаллов. Исследователи считают, что эта работа будет способствовать управлению структурой материала с помощью более совершенных процессов изготовления и, следовательно, улучшению его свойств.

Вывод

Важность этого исследования неоспорима,  но все равно легко объяснима на практике: вернемся к тем же солнечным батареям и рассматриваемому нами мультикристаллическому крмению.

В полупроводниковой индустрии кроме мультикристаллического кремния также используется монокристаллический. Монокристаллический кремний значительно уступает своему “брату” в вопросе продолжительности и финансирования его производства (если мультикристаллический просто выплавляется из переработанного кремнезема, то формирование монокристаллического кремния требует выращивание цельного крупного и при этом качественного кристалла на готовой затравке (из готового кристаллического зародыша)). При этом, монокристаллический кремний выигрывает в эффективности. Его упорядоченная структура обеспечивает более высокую эффективность преобразования солнечной энергии. В мультикристаллического кремнии, как мы уже выяснили, главная проблема – дефекты и неоднородности.

Таким образом, возможность прогнозирования кристаллографических ориентаций действительно поможет оптимизировать производство и использование мультикристаллического кремния, который сэкономит время и бюджет без потери эффективности. Это, соответственно, относится и к другим таким материалам и сферам промышленности!

Автор: Катя @Lithium_vn
Источник: https://habr.com/