Syktyvkar, Syktyvkar, Russian Federation
The paper deals with the application of machine learning and computer vision technologies for solving the problem of estimating the content of clastic component in carbonates based on thin sections. The training collection is represented by 122 monochrome micro-images of thin sections (fragments of 0.6 x 0.6 mm size) of slightly altered carbonate rocks, divided into two classes — without lithoclasts (lithoclasts are absent or occupy less than 10 % of the image area), with lithoclasts (lithoclasts occupy more than 30 % of the image area). When training the model for image classification, an accuracy of more than 90 % is achieved. The application of the model to the images of thin sections is implemented through console programmes using the Core ML framework. The programmes allow estimating the variations of the “distribution density” of lithoclasts along the profile through the thin section image and to construct a “map” of the distribution of areas with lithoclasts in the image. The resulting data can be used for comparison with geochemical and other numerically expressed information, as well as for selection of areas with the lowest content of allochthonous component in the thin section for the geochemical studies. The model in Core ML format is available upon request from the authors.
lithoclastic carbonates, thin sections, machine learning, image classification
Введение
Основанные на технологии машинного обучения системы перспективны для единообразной обработки значительных объемов информации, в том числе изображений. Технологии «компьютерного зрения» широко применяются в различных областях — от управления транспортными средствами до научных исследований. В частности, в геологии существует опыт использования таких систем для диагностики горных пород (Marmo et al., 2005; Su et al., 2020; Baraboshkin et al., 2020; Попов и др., 2020; Jia et al., 2021; Ma et al., 2021; Li et al., 2022; Wu et al., 2022; Wang et al., 2023; Журавлев, Груздев, 2024) и определения органических остатков (Babenko, Telnova, 2022; Duan, 2023; Tetard et al., 2023). Кроме ускорения процесса обработки больших объемов исходных данных, системы на базе машинного обучения обеспечивают единообразие и воспроизводимость результатов, что особенно актуально в «описательных науках», к которым до сих пор относится геология.
Одной из частных задач, в решении которой представляется перспективным применение технологий машинного обучения и «компьютерного зрения», является задача оценки содержания обломочной компоненты в карбонатах по шлифам. При всей кажущейся простоте решение этой задачи традиционным методом (человек за микроскопом) крайне трудоемко, а результат сильно зависит от субъективных факторов. Это обусловлено сходным составом обломков и матрикса, а также сложной формой обломков. Первое затрудняет диагностику и проведение границ обломков, а второе вызывает проблему стереологической реконструкции.
Результат оценки содержания обломочной компоненты в карбонатах по шлифам может использоваться при диагностике и изучении карбонатных турбидитов и других типов пород с неравномерным распределением литокластов. Важен этот параметр и для оценки пригодности карбонатной породы для анализа стабильных изотопов углерода и кислорода, а также других геохимических и микропалеонтологических исследований. Изотопно-геохимическая характеристика участка породы, на котором преобладают литокласты, будет характеризовать не столько условия формирования самих отложений, сколько условия формирования пород, слагающих литокласты. Поэтому выбор места взятия пробы на анализ может сильно влиять на результат. Предварительная оценка «плотности распределения» литокластов в образце может существенно помочь в обосновании такого выбора.
В данной работе предлагается один из возможных вариантов полуколичественной оценки содержания обломочной компоненты в карбонатах по шлифам.
Материал и методы
Для решения поставленной задачи была использована обучающая коллекция, представленная монохромными микроизображениями шлифов (фрагменты размером 0.6 ´ 0.6 мм с формальным разрешением около 0.6 мкм/пиксель) слабоизмененных карбонатных пород (рис. 1). Основу коллекции составили шлифы из нижней части карбонатных турбидитов среднефаменского возраста из разреза на р. Изъяю (Груздев и др., 2023). Путем экспертной оценки коллекция разделена на два класса: без литокластов (литокласты отсутствуют или занимают менее 10 % площади изображения) и с литокластами (литокласты занимают более 30 % площади изображения) (рис. 1). Каждый класс представлен 61 микрофотографией размером 1000 ´ 1000 пикселей. Изображения с промежуточным содержанием литокластов (10—30 % площади изображения) в обучающую коллекцию не включались.
В качестве базовой модели взята предобученная модель классификации изображений Image Feature Print V2 (Apple Inc., 2017—2023). Данная модель приводит исходное изображение к размеру 360 ´ 360 пикселей и извлекает из него 768 характеристик, которые далее используются при машинном обучении (см. Журавлев, Груздев, 2024) (рис. 2).
Обучение модели проводилось на охарактеризованной выше обучающей коллекции с использованием утилиты Create ML и фреймворка Core ML (Apple Inc., 2017—2023) (рис. 2). Фреймворк Core ML обеспечивает унифицированное представление для моделей различных типов, позволяющее использовать их в приложениях MacOS и iOS. Выбор в качестве платформы MacOS обусловлен высокой степенью ее программно-аппаратной оптимизации для решения задач машинного обучения. Также модели могут быть использованы в приложениях Windows и Linux после конвертирования утилитой WinMLTools (Microsoft Corporation).
Результаты и их обсуждение
Обучение модели было осуществлено за 11 итераций. Достигнутая точность при обучении (training accuracy) — 100 %, при проверке (validation accuracy) — 91.7 %. Тестирование полученной модели на независимой выборке из 119 изображений показало точность 98 %.
Характер обучающей коллекции накладывает ограничения на использование полученной модели. Она пригодна для анализа изображений шлифов карбонатных пород, слабо измененных вторичными процессами. Применение модели к существенно перекристаллизованным разностям будет давать недостоверный результат.
Приложение полученной модели к изображениям шлифов реализовано через консольные программы. Они позволяют оценить вариации относительного содержания литокластов по профилю через изображение шлифа и построить «карту» распределения участков с литокластами на изображении (рис. 3). Для построения профиля изображение шлифа сканируется окном 0.6 ´ 0.6 мм с шагом 0.3 мм. В каждом горизонтальном ряду вычисляется доля случаев, когда в окне сканирования диагностирован «известняк с литокластами». Эта доля, выраженная в процентах, отображается на графике (рис. 3). Для построения «карты» изображение шлифа сканируется окном 0.6 ´ 0.6 мм с шагом 0.1 мм. В зависимости от результата классификации точке в центре окна присваивается значение «известняк с литокластами» или «известняк без литокластов», которое отображается цветом на «карте» (рис. 3).
Очевидно, что применение модели к шлифам карбонатов с литокластами 0.6 мм в поперечнике и более (больше размера окна сканирования) даст недостоверные результаты. Таким образом, разработанная модель применима для тонко-, мелко- и среднезернистых обломочных карбонатов (по классификации Дмитриевой с соавторами (1968): детрит грубый (2—1 мм), крупный (1.0—0.5 мм), средний (0.5—0.25 мм), мелкий (0.25—0.10 мм), тонкий (0.10—0.05 мм)) (Журавлев, Вевель, 2021). Следует отметить, что модель ориентирована на распознавание литокластов и в общем случае игнорирует биокласты и органические остатки.
На рисунке 3 приведен пример результата работы программ по панорамному изображению ориентированного большого шлифа, сделанного из циклита карбонатного турбидита. Верх изображения отвечает верхней части турбидита. На графике и »карте» шлифа видно градационное снижение «плотности распределения» обломочной разности известняка снизу вверх по циклиту. В случае карбонатных турбидитов «плотность распределения» литокластов характеризует распределение аллохтонной компоненты в породе. Следует отметить, что значение «плотности распределения» литокластов не равно содержанию литокластов в породе, хотя и связано с этой величиной. «Плотность распределения» литокластов показывает, насколько часто на определенной части шлифа встречаются участки с содержанием литокластов более 30 %.
Изучение кальцитурбидитов с помощью разработанной модели показало отчетливую градацию не только по размеру форменных элементов, но и по «плотности распределения» литокластов. Нижняя часть циклитов преимущественно литокластическая, а верхняя — биокластическая и пелитоморфная. Такое разделение отмечено даже в маломощных (первые сантиметры по мощности) циклитах. Таким образом, материал из нижней части кальцитурбидитов любой мощности содержит значительную аллохтонную примесь и мало пригоден для геохимических и микропалеонтологических исследований.
Выводы
Разработанная модель позволяет проводить оценку «плотности распределения» обломочной компоненты в карбонатах по шлифам с достоверностью более 90 %. Получаемые в результате работы модели данные можно использовать для сопоставления с геохимической и другой численно выраженной информацией, а также для выбора на шлифе участков с наименьшим содержанием аллохтонной компоненты. Последнее целесообразно для планирования точечного геохимического или изотопного опробования и особенно актуально при изучении карбонатных турбидитов. Также этот параметр может быть полезен при оценке вероятности переотложения микрофоссилий.
Разработанная модель классификации изображений шлифов в формате Core ML и консольные приложения на ее основе доступны по запросу у авторов.
1. Gruzdev D. A., Zhuravlev A. V., Vevel Ya. A., Erofeevsky A. V., Smoleva I. V. Famennian negative carbon isotope excursion in the Izyayu River section (Tchernyshev Uplift, Cis-Uralian Foredeep). Lithosphere (Russia)., No. 23(2), pp. 165—178. (in Russian) DOI:https://doi.org/10.24930/1681-9004-2023-23-2-165-178
2. Dmitrieva E. V., Ershova G. I., Librovich V. L., Nekrasova V. I., Oreshnikova E. I. Atlas of structures and textures of sedimentary rocks. Pt 2. Carbonate rocks. Moscow: Nedra, 1968, 700 p. (in Russian)
3. Zhuravlev A. V., Vevel Ya. A. Sequence composition of the Iz”yayu Formation (Upper Devonian–Lower Carboniferous) in the type area — the south of Tchernyshev Uplift. Lithosphere (Russia), 2021, 21(4), pp. 546—559. (in Russian) DOI:https://doi.org/10.24930/1681-9004-2021-21-4-546-559
4. Zhuravlev A. V., Gruzdev D. A. Automated diagnostics of carbonate rocks from microphotographs of thin sections based on machine learning. Oil and Gas geology Theory and Practice, 2024, V. 19, No. 2. Available at: https://www.ngtp.ru/rub/2024/11_2024.html EDN: https://elibrary.ru/YUQJXC (in Russian)
5. Popov N. A., Putilov I. S., Gulyaeva A. A., Vinokurova E. E. Application of deep learning technologies for studying thin sections on the example of Usinsk oil field. Proc. of Tomsk Polytechnical University, Georesouce engineering, 2020, V. 331, No. 6, pp. 100—112. DOI:https://doi.org/10.18799/24131830/2020/6/2681 (in Russian)
6. Babenko V. V., Telnova O. P. Problems and prospects of digital identification of Devonian spores for the stratigraphy // Paleontological journal. 2022. Vol. 56. P. 1067—1073. DOI:https://doi.org/10.1134/S0031030122090040
7. Baraboshkin E. E., Ismailova L. S., Orlov D. M., Zhukovskaya E. A., Kalmykov G. A., Khotylev O. V., Baraboshkin E. Y., Koroteev D. A. Deep convolutions for indepth automated rock typing // Computers and Geosciences. 2020. №135. 104330 DOI:https://doi.org/10.1016/j.cageo.2019.104330.
8. Duan X. Automatic identification of conodont species using fine-grained convolutional neural networks // Frontiers in Earth Science. 2023. Vol. 10. No 1. DOI:https://doi.org/10.3389/feart.2022.1046327
9. Ma H., Han G. Q., Peng L., Zhu L. Y., Shu J. Rock thin sections identification based on improved squeeze-and-excitation networks model // Computers & Geosciences. 2021. Vol. 152. 104780. DOI:https://doi.org/10.1016/j.cageo.2021.104780
10. Marmo R., Amodio S., Tagliaferri R., Ferreri V., Longo G. Textural identification of carbonate rocks by image processing and neural network: methodology proposal and examples // Computers & Geosciences. 2005. Vol. 31. P. 649—659. DOI:https://doi.org/10.1016/j.cageo.2004.11.016
11. Su C., Xu S. J., Zhu K. Y., Zhang X. C. Rock classification in petrographic thin section images based on concatenated convolutional neural networks // Earth Science Informatics. 2020. Vol. 13. P. 1477—1484. DOI:https://doi.org/10.1007/s12145-020-00505-1
12. Tetard M., Carlsson V., Meunier M., Danelian T. Merging databases for CNN image recognition, increasing bias or improving results? // Marine Micropaleontology. 2023. Vol. 185. 102296. DOI:https://doi.org/10.1016/j.marmicro.2023.102296
13. Wang H., Cao W., Zhou Y., Yu P., Yang W. Multitarget intelligent recognition of petrographic thin section images based on faster RCNN // Minerals. 2023. Vol. 13. 872. DOI:https://doi.org/10.3390/min13070872
14. Wu B. K., Ji X. H., He M. Y., Yang M., Zhang Z. C., Chen Y., Wang Y. Z., Zheng X. Q. Mineral identification based on multi-label mage classification // Minerals. 2022. Vol. 12. 1338. DOI:https://doi.org/10.3390/min12111338