Сыктывкар, Республика Коми, Россия
В работе рассмотрено применение технологий машинного обучения и «компьютерного зрения» для решения задачи оценки содержания обломочной компоненты в карбонатах по шлифам. Обучающая коллекция представлена 122 монохромными микроизображениями шлифов (фрагменты размером 0.6 x 0.6 мм) слабоизмененных карбонатных пород, разделена на два класса — без литокластов (литокласты отсутствуют или занимают менее 10 % площади изображения) и с литокластами (литокласты занимают более 30 % площади изображения). При обучении модели классификации изображений достигнута точность более 90 %. Приложение модели к изображениям шлифов реализовано через консольные программы с использованием фрейворка Core ML. Программы позволяют оценить вариации «плотности распределения» литокластов по профилю через изображение шлифа и построить «карту» распределения участков с литокластами на изображении. Получаемые в результате работы модели данных можно использовать для сопоставления с геохимической и другой численно выраженной информацией, а также для выбора на шлифе участков с наименьшим содержанием аллохтонной компоненты.
обломочные карбонаты, шлифы, машинное обучение, классификация изображений
Введение
Основанные на технологии машинного обучения системы перспективны для единообразной обработки значительных объемов информации, в том числе изображений. Технологии «компьютерного зрения» широко применяются в различных областях — от управления транспортными средствами до научных исследований. В частности, в геологии существует опыт использования таких систем для диагностики горных пород (Marmo et al., 2005; Su et al., 2020; Baraboshkin et al., 2020; Попов и др., 2020; Jia et al., 2021; Ma et al., 2021; Li et al., 2022; Wu et al., 2022; Wang et al., 2023; Журавлев, Груздев, 2024) и определения органических остатков (Babenko, Telnova, 2022; Duan, 2023; Tetard et al., 2023). Кроме ускорения процесса обработки больших объемов исходных данных, системы на базе машинного обучения обеспечивают единообразие и воспроизводимость результатов, что особенно актуально в «описательных науках», к которым до сих пор относится геология.
Одной из частных задач, в решении которой представляется перспективным применение технологий машинного обучения и «компьютерного зрения», является задача оценки содержания обломочной компоненты в карбонатах по шлифам. При всей кажущейся простоте решение этой задачи традиционным методом (человек за микроскопом) крайне трудоемко, а результат сильно зависит от субъективных факторов. Это обусловлено сходным составом обломков и матрикса, а также сложной формой обломков. Первое затрудняет диагностику и проведение границ обломков, а второе вызывает проблему стереологической реконструкции.
Результат оценки содержания обломочной компоненты в карбонатах по шлифам может использоваться при диагностике и изучении карбонатных турбидитов и других типов пород с неравномерным распределением литокластов. Важен этот параметр и для оценки пригодности карбонатной породы для анализа стабильных изотопов углерода и кислорода, а также других геохимических и микропалеонтологических исследований. Изотопно-геохимическая характеристика участка породы, на котором преобладают литокласты, будет характеризовать не столько условия формирования самих отложений, сколько условия формирования пород, слагающих литокласты. Поэтому выбор места взятия пробы на анализ может сильно влиять на результат. Предварительная оценка «плотности распределения» литокластов в образце может существенно помочь в обосновании такого выбора.
В данной работе предлагается один из возможных вариантов полуколичественной оценки содержания обломочной компоненты в карбонатах по шлифам.
Материал и методы
Для решения поставленной задачи была использована обучающая коллекция, представленная монохромными микроизображениями шлифов (фрагменты размером 0.6 ´ 0.6 мм с формальным разрешением около 0.6 мкм/пиксель) слабоизмененных карбонатных пород (рис. 1). Основу коллекции составили шлифы из нижней части карбонатных турбидитов среднефаменского возраста из разреза на р. Изъяю (Груздев и др., 2023). Путем экспертной оценки коллекция разделена на два класса: без литокластов (литокласты отсутствуют или занимают менее 10 % площади изображения) и с литокластами (литокласты занимают более 30 % площади изображения) (рис. 1). Каждый класс представлен 61 микрофотографией размером 1000 ´ 1000 пикселей. Изображения с промежуточным содержанием литокластов (10—30 % площади изображения) в обучающую коллекцию не включались.
В качестве базовой модели взята предобученная модель классификации изображений Image Feature Print V2 (Apple Inc., 2017—2023). Данная модель приводит исходное изображение к размеру 360 ´ 360 пикселей и извлекает из него 768 характеристик, которые далее используются при машинном обучении (см. Журавлев, Груздев, 2024) (рис. 2).
Обучение модели проводилось на охарактеризованной выше обучающей коллекции с использованием утилиты Create ML и фреймворка Core ML (Apple Inc., 2017—2023) (рис. 2). Фреймворк Core ML обеспечивает унифицированное представление для моделей различных типов, позволяющее использовать их в приложениях MacOS и iOS. Выбор в качестве платформы MacOS обусловлен высокой степенью ее программно-аппаратной оптимизации для решения задач машинного обучения. Также модели могут быть использованы в приложениях Windows и Linux после конвертирования утилитой WinMLTools (Microsoft Corporation).
Результаты и их обсуждение
Обучение модели было осуществлено за 11 итераций. Достигнутая точность при обучении (training accuracy) — 100 %, при проверке (validation accuracy) — 91.7 %. Тестирование полученной модели на независимой выборке из 119 изображений показало точность 98 %.
Характер обучающей коллекции накладывает ограничения на использование полученной модели. Она пригодна для анализа изображений шлифов карбонатных пород, слабо измененных вторичными процессами. Применение модели к существенно перекристаллизованным разностям будет давать недостоверный результат.
Приложение полученной модели к изображениям шлифов реализовано через консольные программы. Они позволяют оценить вариации относительного содержания литокластов по профилю через изображение шлифа и построить «карту» распределения участков с литокластами на изображении (рис. 3). Для построения профиля изображение шлифа сканируется окном 0.6 ´ 0.6 мм с шагом 0.3 мм. В каждом горизонтальном ряду вычисляется доля случаев, когда в окне сканирования диагностирован «известняк с литокластами». Эта доля, выраженная в процентах, отображается на графике (рис. 3). Для построения «карты» изображение шлифа сканируется окном 0.6 ´ 0.6 мм с шагом 0.1 мм. В зависимости от результата классификации точке в центре окна присваивается значение «известняк с литокластами» или «известняк без литокластов», которое отображается цветом на «карте» (рис. 3).
Очевидно, что применение модели к шлифам карбонатов с литокластами 0.6 мм в поперечнике и более (больше размера окна сканирования) даст недостоверные результаты. Таким образом, разработанная модель применима для тонко-, мелко- и среднезернистых обломочных карбонатов (по классификации Дмитриевой с соавторами (1968): детрит грубый (2—1 мм), крупный (1.0—0.5 мм), средний (0.5—0.25 мм), мелкий (0.25—0.10 мм), тонкий (0.10—0.05 мм)) (Журавлев, Вевель, 2021). Следует отметить, что модель ориентирована на распознавание литокластов и в общем случае игнорирует биокласты и органические остатки.
На рисунке 3 приведен пример результата работы программ по панорамному изображению ориентированного большого шлифа, сделанного из циклита карбонатного турбидита. Верх изображения отвечает верхней части турбидита. На графике и »карте» шлифа видно градационное снижение «плотности распределения» обломочной разности известняка снизу вверх по циклиту. В случае карбонатных турбидитов «плотность распределения» литокластов характеризует распределение аллохтонной компоненты в породе. Следует отметить, что значение «плотности распределения» литокластов не равно содержанию литокластов в породе, хотя и связано с этой величиной. «Плотность распределения» литокластов показывает, насколько часто на определенной части шлифа встречаются участки с содержанием литокластов более 30 %.
Изучение кальцитурбидитов с помощью разработанной модели показало отчетливую градацию не только по размеру форменных элементов, но и по «плотности распределения» литокластов. Нижняя часть циклитов преимущественно литокластическая, а верхняя — биокластическая и пелитоморфная. Такое разделение отмечено даже в маломощных (первые сантиметры по мощности) циклитах. Таким образом, материал из нижней части кальцитурбидитов любой мощности содержит значительную аллохтонную примесь и мало пригоден для геохимических и микропалеонтологических исследований.
Выводы
Разработанная модель позволяет проводить оценку «плотности распределения» обломочной компоненты в карбонатах по шлифам с достоверностью более 90 %. Получаемые в результате работы модели данные можно использовать для сопоставления с геохимической и другой численно выраженной информацией, а также для выбора на шлифе участков с наименьшим содержанием аллохтонной компоненты. Последнее целесообразно для планирования точечного геохимического или изотопного опробования и особенно актуально при изучении карбонатных турбидитов. Также этот параметр может быть полезен при оценке вероятности переотложения микрофоссилий.
Разработанная модель классификации изображений шлифов в формате Core ML и консольные приложения на ее основе доступны по запросу у авторов.
1. Груздев Д. А., Журавлев А. В., Вевель Я. А., Ерофеевский А. В., Смолева И. В. Фаменский отрицательный экскурс изотопного состава углерода в разрезе на р. Изъяю (поднятие Чернышева, Предуральский краевой прогиб) // Литосфера. 2023. № 23(2). С. 165—178. DOI: 10.24930/ 1681-9004-2023-23-2-165-178
2. Дмитриева Е. В., Ершова Г. И., Либрович В. Л., Некрасова В. И., Орешникова Е. И. Атлас текстур и структур осадочных горных пород. Ч. 2. Карбонатные породы. М.: Недра, 1968. 700 с.
3. Журавлев А. В., Вевель Я. А. Строение разреза изъяюской свиты (верхний девон — нижний карбон) в типовой местности — южной части поднятия Чернышева // Литосфера. 2021. № 21(4). C. 546—559. DOI: 10.24930/ 1681-9004-2021-21-4-546-559
4. Журавлев А. В., Груздев Д. А. Автоматизированная диагностика карбонатных пород по микрофотографиям шлифов на основе машинного обучения // Нефтегазовая геология. Теория и практика. 2024. Т. 19. № 2. https://www.ngtp.ru/rub/2024/11_2024.html EDN: YUQJXC
5. Попов Н. А., Путилов И. С., Гуляева А. А., Винокурова Е. Е. Применение технологий глубокого обучения для изучения шлифов на примере Усинского месторождения нефти // Известия Томского политехнического университета. Инжиниринг георесурсов. 2020. Т. 331. № 6. С. 100—112. DOI:https://doi.org/10.18799/24131830/2020/6/2681
6. Babenko V. V., Telnova O. P. Problems and prospects of digital identification of Devonian spores for the stratigraphy // Paleontological journal. 2022. Vol. 56. P. 1067—1073. DOI:https://doi.org/10.1134/S0031030122090040
7. Baraboshkin E. E., Ismailova L. S., Orlov D. M., Zhukovskaya E. A., Kalmykov G. A., Khotylev O. V., Baraboshkin E. Y., Koroteev D. A. Deep convolutions for indepth automated rock typing // Computers and Geosciences. 2020. №135. 104330 DOI:https://doi.org/10.1016/j.cageo.2019.104330.
8. Duan X. Automatic identification of conodont species using fine-grained convolutional neural networks // Frontiers in Earth Science. 2023. Vol. 10. No 1. DOI:https://doi.org/10.3389/feart.2022.1046327
9. Ma H., Han G. Q., Peng L., Zhu L. Y., Shu J. Rock thin sections identification based on improved squeeze-and-excitation networks model // Computers & Geosciences. 2021. Vol. 152. 104780. DOI:https://doi.org/10.1016/j.cageo.2021.104780
10. Marmo R., Amodio S., Tagliaferri R., Ferreri V., Longo G. Textural identification of carbonate rocks by image processing and neural network: methodology proposal and examples // Computers & Geosciences. 2005. Vol. 31. P. 649—659. DOI:https://doi.org/10.1016/j.cageo.2004.11.016
11. Su C., Xu S. J., Zhu K. Y., Zhang X. C. Rock classification in petrographic thin section images based on concatenated convolutional neural networks // Earth Science Informatics. 2020. Vol. 13. P. 1477—1484. DOI:https://doi.org/10.1007/s12145-020-00505-1
12. Tetard M., Carlsson V., Meunier M., Danelian T. Merging databases for CNN image recognition, increasing bias or improving results? // Marine Micropaleontology. 2023. Vol. 185. 102296. DOI:https://doi.org/10.1016/j.marmicro.2023.102296
13. Wang H., Cao W., Zhou Y., Yu P., Yang W. Multitarget intelligent recognition of petrographic thin section images based on faster RCNN // Minerals. 2023. Vol. 13. 872. DOI:https://doi.org/10.3390/min13070872
14. Wu B. K., Ji X. H., He M. Y., Yang M., Zhang Z. C., Chen Y., Wang Y. Z., Zheng X. Q. Mineral identification based on multi-label mage classification // Minerals. 2022. Vol. 12. 1338. DOI:https://doi.org/10.3390/min12111338