Оценка массы скопления галактик с использованием алгоритмов машинного обучения
Прошло почти столетие с того момента, когда астроном Фриц Цвикки впервые рассчитал массу скопления Волос Вероники, плотного галактического скопления, содержащего почти 1000 галактик, расположенных в близлежащей части Вселенной. Однако оценка массы настолько массивного объекта, не говоря уже о его гигантских размерах и плотности, а также огромном расстоянии до него, составляющем 320 миллионов световых лет, связана с рядом трудностей – не решенных тогда и даже сейчас. Первые измерения, выполненные Цвикки, а также множество расчетов, проведенных после него, страдают от источников ошибок, вызывающих смещение полученной оценки в большую или меньшую сторону.
В новом исследовании команда физиков под руководством Мэттью Хо (Matthew Ho) из Университета Карнеги — Меллона, США, использовала инструменты машинного обучения для разработки метода глубокого обучения, позволяющего произвести точную оценку массы скопления Волос Вероники и эффективно устранить эти источники ошибок.
Для расчета массы скопления Волос Вероники команда Цвикки и последующие научные группы использовали динамическое измерение массы, основанное на изучении движения объектов, принадлежащих скоплению, а также обращающихся вокруг него, с последующим использованием современного понимания гравитации для расчета массы скопления галактик. Однако при использовании такого подхода исследователи неизбежно сталкиваются с появлением ряда ошибок. Скопления галактик существуют в форме узлов в гигантской «паутине» материала, распределенного по Вселенной, и они постоянно сталкиваются и объединяются друг с другом, в результате чего происходит искажение профилей скоростей галактик, входящих в состав скопления. И поскольку астрономы наблюдают скопление с огромного расстояния, то существует большое число других объектов, лежащих в пространстве между скоплением галактик и наблюдателем на Земле, которые могут быть ошибочно приняты за объекты скопления и оказывать влияние на результат измерения, приводя к смещению оценки в большую или меньшую сторону. Проведенные в последнее время исследования продемонстрировали большой прогресс в части количественной оценки и учета влияния таких неточностей, однако методики, основанные на машинном обучении, предлагают инновационный подход, базирующийся на данных, согласно Хо.
«Наш метод глубокого обучения выясняет, какие из реальных данных относятся к полезным результатам измерений, а какие – нет, - сказал Хо, добавив, что разработанный ими метод позволяет устранить ошибки со стороны перекрывающихся галактик (эффекты выбора) и учитывает различные формы галактик (физические эффекты). – Использование таких методов, базирующихся на данных, позволяют повысить уровень качества и автоматизации наших прогнозов».
Метод машинного обучения Хо основан на адаптации хорошо известного метода машинного обучения, называемого свёрточной нейронной сетью, который представляет собой один из типов алгоритмов глубокого обучения, используемый в распознавании графических образов. Исследователи «натренировали» свою модель, вводя в нее данные космологических симуляций Вселенной. Модель тренировали на синтетических «данных наблюдений» тысяч скоплений галактик, масса которых была заранее известна. После глубокого анализа процесса работы модели с этими синтетическими данными, Хо и его коллеги применили модель к анализу реальных данных – и получили в результате оценку массы скопления Волос Вероники, близкую к оценкам, получаемым исследователями, начиная с 1980-х гг. Согласно авторам, полученные результаты позволяют подтвердить адекватность используемой модели.
Исследование опубликовано в журнале Nature Astronomy.
(Добавил: Hot Temp)