Идентификация минералов — сложная и трудоемкая задача для геологов, на которую часто уходит от 30 минут до нескольких дней на образец. Ситуацию еще больше усложняет тот факт, что достаточная часть минералов остается недостаточно исследованной, в результате чего из 6000 идентифицированных в настоящее время минералов осталось лишь несколько сотен всесторонне охарактеризованных.
Визуальная диагностика минералов и горных пород широко распространена в геологии, поскольку она значительно дешевле и быстрее других методов, таких как спектроскопия и химический анализ. Однако он требует много времени и менее точен по сравнению с более дорогими методами. Даже опытные минералоги могут допускать ошибки при работе с редким материалом или некачественным образцом. Включение машинного интеллекта в этот процесс может помочь в выявлении ошибок и сократить время, затрачиваемое экспертами на выполнение рутинных задач.
Несмотря на продолжающиеся исследования в этой области, в научной литературе отсутствуют четкие ориентиры для анализа изображений минералов. Чтобы восполнить этот пробел, НИИ искусственного интеллекта в сотрудничестве со Сбер ИИ и МГУ имени Ломоносова создал эталонный набор данных для моделей компьютерного зрения, ориентированных на распознавание минералов .
Мы назвали набор данных MineralImage5k. Он создан на основе коллекции минералогического музея имени Ферсмана и содержит 44 тысячи образцов. Хотя MineralImage5k меньше, чем набор данных Mindat, он обеспечивает большую однородность фотоусловий и состоит из необработанных образцов, которые очень напоминают природные минералы.
Набор данных MineralImage5k разделен на три подмножества различной сложности, что бросает вызов исследователям в области классификации минералов, сегментации и оценки размеров. Самая простая задача классификации, представленная в тесте, содержит десять видов минералов, по крайней мере, по 462 экземпляра на вид. Самая сложная проблема — классифицировать минералы по классам 5 тыс., имея только одно изображение для каждого класса.
Одна из проблем, с которой может столкнуться ИИ при работе с фотографиями минерала, заключается в том, какая часть представленной породы действительно представляет интерес. Чтобы решить эту проблему, мы разделяем отдельный набор из примерно 100 изображений с дополнительными метками и задачей сегментации в дополнение к классификации. Интеграция задачи сегментации в конвейер классификации может дать дополнительную информацию в случаях, когда модель допускает ошибки, и уменьшить количество таких ситуаций.
Помимо классификации и сегментации, мы изучаем нулевую оценку размера минералов. Автоматическая оценка размера образцов может быть очень полезна при хранении образцов в музеях. Имея эти данные по всем образцам, мы можем спланировать оптимальную систему хранения и закупить или изготовить коробки нужного размера в нужном количестве. Поэтому мы предоставляем более 18 тысяч размеченных образцов для задачи регрессии в нашем тесте.
Чтобы продемонстрировать эффективность эталонного теста, мы оценили модель языка видения, предварительно обученную на данных общей предметной области. Мы обнаружили, что точная настройка модели на наборе данных для конкретной предметной области, например MineralImage5k, может значительно повысить ее точность. Мы также подчеркиваем многообещающий потенциал перекрестной оценки наборов данных для оценки моделей распознавания минералов.
Наше исследование опубликовано в журнале Computers & Geosciences. Мы рады помочь с использованием набора данных и тестов и приглашаем всех заинтересованных исследователей поделиться своими идеями о том, как сделать его более полезным для сообщества.
Теги: археологи, ИИ