NAUKA I EDUKACJA
Machine learning w klasyfikowaniu galaktyk. Sekundy zamiast miesięcy pracy
Naukowcy stworzyli oprogramowanie oparte na algorytmie komputerowego samouczenia, które w kilka sekund jest w stanie przypisać tysiące zadanych galaktyk do obowiązujących kategorii. Gdy podobne zadanie pozostawiano do ręcznego wykonania zespołowi ludzi, jego realizacja zajmowała około kilku miesięcy. Tak znaczne przyspieszenie analizy charakterystyk wielkich skupisk materii kosmicznej, nierzadko złożonych z setek miliardów gwiazd, ma niebagatelne znaczenie dla postępu dalszych badań całego Wszechświata.
Algorytmy samouczenia maszynowego zyskują konsekwentnie na znaczeniu w roli narzędzi postępu naukowo-badawczego, także w astronomii. Ostatnio potwierdzili to badacze z University of Western Australia, którzy opracowali program wykonujący w kilka sekund zadania dotychczas miesiącami realizowane przez cały sztab ludzi. W tym czasie oprogramowanie potrafi przypisać do odpowiedniej kategorii nawet do tysięcy galaktyk.
„Galaktyki mają różne kształty i rozmiary" - zwraca uwagę Mitchell Cavanagh, współautor publikacji na ten temat przedstawionej niedawno w periodyku Monthly Notices of the Royal Astronomical Society (MNRAS). "Sklasyfikowanie kształtów galaktyk to ważny krok w stronę zrozumienia ich powstawania i ewolucji. Może nawet pomóc w poznaniu natury Wszechświata” - dodaje.
Dzięki coraz bardziej dynamicznym badaniom, naukowcy gromadzą dane o galaktykach w ilości, której nie są w stanie przeanalizować. „Mówimy o kilku milionach galaktyk w ciągu kilku następnych lat. Czasami naukowcy-amatorzy pomagają w ich klasyfikacji w takich projektach jak Galaxy Zoo, ale to nadal zajmuje wiele czasu” - podkreśla badacz.
Do tego właśnie można wykorzystać konwolucyjne sieci neuronowe (CNNs - ang. convolutional neural networks). Dzisiaj stosuje się je już niemal wszędzie - tłumaczą astronomowie - w badaniach medycznych, analizie giełdy czy zachowań klientów. Obecne są także w astronomii, np. wykorzystywano je już do klasyfikacji galaktyk, ale tylko w prostym systemie - czy galaktyka jest spiralna, czy nie.
Tymczasem nowy program sprawdza, czy galaktyki mają kształt spiralny, eliptyczny, soczewkowy, czy nieregularny, a przy tym działa z większą dokładnością, niż poprzednie.
Ogromną zaletą sieci neuronowych jest prędkość ich działania. Obrazy galaktyk, których analiza ludziom zajęłaby miesiące, można sklasyfikować w ciągu minut. Korzystając z klasycznej karty graficznej możemy z łatwością przeanalizować 1400 galaktyk w czasie krótszym niż 3 sekundy.
Niekoniecznie jednak komputer będzie dokładniejszy niż człowiek - zwracają uwagę naukowcy. Przyczyna jest taka, że algorytmy uczą się na podstawie informacji opracowanych przez ludzi. Udało się im jednak osiągnąć dokładność 80 proc., a w przypadku galaktyk spiralnych i eliptycznych - 97 proc.
Naukowcy przygotowują się już do sklasyfikowania 100 mln galaktyk położonych w różnych odległościach od Ziemi i w różnych strukturach (grupach, gromadach itp.).
Opracowane narzędzie można przystosować także do innych dziedzin, które wymagają analizy potężnych ilości danych. „CNNs będą odgrywały coraz większą rolę w analizie informacji, szczególnie w takich dziedzinach jak astronomia, które muszą radzić sobie z wyzwaniami typowymi dla big data” - uważa Cavanagh.
Treść samego artykułu oraz skrócony opis jego głównych wątków są dostępne do wglądu na stronach internetowych.