po polsku

Obserwatorium Astronomiczne Uniwersytetu Jagiellońskiego

 

Astronomiczny Obiekt Miesiąca: Marzec 2024

< poprzedni Archiwum następny >

Klasyfikacja mergerów galaktycznych przy użyciu konwolucyjnych sieci neuronowych

W kosmologii Lambda-CDM zakłada się, że galaktyki formują się poprzez hierarchiczne łączenie się mniejszych struktur, dlatego mergery (czyli fuzje) galaktyk dostarczają astronomom kluczowych informacji na temat ewolucji galaktyk na przestrzeni czasu.

Na ilustracji: Układ Arp 87, czyli NGC 3808A i NGC 3808B: zderzające się ze sobą galaktyki sfotografowane teleskopem Hubble'a. Źródło: APOD / NASA, ESA, Harshwardhan Pathak.


Proces łączenia przebiega różnie w zależności od właściwości zderzających się galaktyk. Główne mergery (major mergers), których składniki mają stosunek mas do 1:4, jeśli zderzą się z odpowiednią prędkością i pod odpowiednim kątem, łączą swoje struktury, co prowadzi do zmiany ich morfologii. Wtedy mogą uwidocznić się cechy szczególne związane z kolizją galaktyk – mostki (bridges), podwójne jądra i inne cechy pływowe, w tym ogony i pióropusze (plumes) o różnych kształtach i rozmiarach. Oprócz tego główne mergery mogą wywoływać zjawiska gwałtownego tworzenia się nowych gwiazd oraz aktywowania jąder aktywnych galaktyk. Wpływ mergerów na te zjawiska jest jednak wciąż przedmiotem dyskusji, nie jest bowiem jednoznacznie jasne, jaką dokładnie rolę odgrywają one w porównaniu z innymi procesami fizycznymi, takimi jak gładkie akrecje gazu (smooth gas acrection).

Gdy masa jednej z galaktyk uczestniczących w zderzeniu jest znacząco większa niż masa drugiej, proces łączenia przebiega łagodniej, a mniejsza galaktyka zwykle wchłaniana jest przez większą, pozostawiając ją niemal nietkniętą. Fuzje galaktyk są istotnym czynnikiem w badaniach ewolucji Wszechświata. Szacuje się, że mergery stanowią mniej niż 10% galaktyk o niskim przesunięciu ku czerwieni, przy czym odsetek ten wzrasta do 20% dla z zakresu od 2 do 3.

Głównym wyzwaniem w badaniu zderzeń galaktyk jest wykrywanie ich z odpowiednią skutecznością i kompletnością. Ze względu na szeroki zakres cech morfologicznych zderzeń galaktyk, ich wizualna klasyfikacja jest trudna do spójnego, powtarzalnego zastosowania. Wykorzystanie parametrów morfologicznych stanowi sposób na wyznaczenie morfologii w sposób niezawodny i niezmienny. Opisują one kształty i koncentrację światła na zdjęciach. Uzyskanie tych parametrów wymaga jednak obrazów o wystarczająco wysokiej rozdzielczości. Inna metoda – tzw. bliskich par – jest bardziej bezpośrednia. Polega ona na znajdowaniu par galaktyk, które są blisko siebie na niebie i na takim samym przesunięciu ku czerwieni. Wymaga ona jednak kosztownych, długotrwałych obserwacji spektroskopowych.

Wraz z nadejściem nowych przeglądów nieba, które dostarczą astronomom dużą ilość danych, w tym Euclid i LSST, kluczowe będzie stworzenie algorytmów do automatyzacji czasochłonnych i powtarzalnych zadań, właśnie takich jak identyfikacja mergerów galaktyk. Najnowsze badania wykazały, że możliwe jest wykorzystanie konwolucyjnych sieci neuronowych (CNN) do rozwiązania problemu klasyfikacji wizualnej fuzji galaktyk.

Ostatnie badania porównawcze metod detekcji zderzeń galaktyk opartych na uczeniu maszynowym, przeprowadzone przez międzynarodowany zespół astronomów, celuje w zrozumienie względnej skuteczności różnych metod uczenia maszynowego w ramach tego samego systemu (Margalef-Bentabol 2024 i in.). Łącznie przetestowano sześć metod uczenia maszynowego, opartych na tych samych kosmologicznych, grawomagnetohydrodynamiczncych symulacjach IllustrisTNG. Pozwoliły one na wygenerowanie zdjęć naśladujących rzeczywiste dane. Wszystkie sieci, które nie były wcześniej wstępnie uczone na obrazach galaktyk, dają podobne wyniki, mimo że są zbudowane na podstawie różnych architektur. Może to wskazywać na to, że przetwarzanie wstępne danych treningowych jest ważniejszym czynnikiem niż wybór parametrów sieci neuronowych.

Ten aspekt badają obecnie także astronomowie związani z Obserwatorium Astronomicznym Uniwersytetu Jagiellońskiego, testując i porównując działanie konwolucyjnych sieci szkolonych na oryginalnych i przetworzonych danych. Dopasowują profile Sersica – zależności natężenia światła w zależności od odległości od środka galaktyki – do syntetycznych obrazów galaktyk, a następnie odejmują je od oryginalnych. Ten proces tworzy tak zwane obrazy resztkowe, na których zostaje wszystko to, co nie pasuje do dopasowanego profilu. Pozwala to uwydatnić subtelne cechy galaktycznych fuzji, takie jak struktury dyfuzyjne lub cechy pływowe. Dzięki temu możliwe jest wytrenowanie trzech różnych sieci o tej samej architekturze na trzech różnych zestawach danych – oryginalnych obrazach, dopasowanych modelach Sersica oraz obrazach resztkowych.

Wyniki pokazują, że sieć trenowana na oryginalnych danych prezentuje się najlepiej. Jej całkowita celność – ilość poprawnie sklasyfikowanych obrazów – wynosi 74%. Sieć radzi sobie lepiej z rozpoznawaniem galaktyk niezderzających się. 82% z nich jest poprawnie identyfikowane, podczas gdy dla galaktyk zderzających się ta liczba spada do 64%. Sieć trenowana na modelach Sersica ma podobne osiągi w rozpoznawaniu nie-mergerów: 80% z nich jest poprawnie klasyfikowane. Znacznie gorzej natomiast radzi sobie z identyfikacją mergerów, poprawnie przewidując jedynie 56% z nich. Inne cechy wykazuje sieć trenowana na obrazach resztkowych – poprawnie klasyfikuje 67% obrazów przedstawiających nienaruszone galaktyki i 66% obrazów galaktyk zderzających się, co czyni ją siecią najbardziej efektywną w poprawnym klasyfikowaniu mergerów. Dwie ostatnie sieci w ogólnym rozrachunku mają podobną celność – klasyfikują poprawnie około 69% wszystkich obrazów.

Dzięki zastosowaniu metod uczenia maszynowego udało się ustalić, że klasyfikacja galaktyk na mergery i nie-mergery jest możliwa zarówno za pomocą słabych dyfuzyjnych struktur obecnych na zdjęciach resztkowych, jak i informacji przestrzennych zawartych w profilach Sersica. Kolejnym krokiem będzie dostosowanie sieci wytrenowanych na syntetycznych obrazach do prawdziwych danych astronomicznych, okazuje się bowiem, że sieci trenowane na danych z symulacji radzą sobie znacznie gorzej z ewaluowaniem zdjęć realnych. Kluczowe w tym aspekcie wydają się techniki skupiające się między innymi na znajdowaniu cech wspólnych w dziedzinie obrazów wykorzystanych do treningu i ewaluacji.


Oryginalna publikacja:

w przygotowaniu.

Opisane wyniki są częścią badań prowadzonych w Zakładzie Astronomii Gwiazdowej i Pozagalaktycznej Obserwatorium Astronomicznego Uniwersytetu Jagiellońskiego w Krakowie.


Kontakt:

Dawid Chudy
Obserwatorium Astronomiczne
Uniwersytetu Jagiellońskiego
Dawid.Chudy [@] doctoral.uj.edu.pl

TKGS