تقييم محاكاة المجرات كميًا بالمقارنة مع الأرصاد الحقيقية باستخدام كشف الشذوذ

Zehao Jin1,2, Andrea V. Macciò1,2,3, Nicholas Faucher4, Mario Pasquato1,2,5,6,7, Tobias Buck8,9, Keri L. Dixon1,2, Nikhil Arora1,2,10, Marvin Blank1,2, Pavle Vulanović1,2
1New York University Abu Dhabi, PO Box 129188, Saadiyat Island, Abu Dhabi, United Arab Emirates
2Center for Astrophysics and Space Science (CASS), New York University Abu Dhabi
3Max-Planck-Institut für Astronomie, Königstuhl 17, 69117 Heidelberg, Germany
4Center for Cosmology and Particle Physics, Department of Physics, New York University, 726 Broadway, New York, New York 10003, USA
5Physics and Astronomy Department Galileo Galilei, University of Padova, Vicolo dell’Osservatorio 3, I–35122, Padova
6 Dèpartement de Physique, Universitè de Montrèal, 1375 Ave. Thérèse-Lavoie-Roux, Montréal, QC H2V 0B3, Canada
7 Mila - Quebec Artificial Intelligence Institute, 6666 Rue Saint-Urbain, Montréal, QC H2S3H1, Canada
8Universität Heidelberg, Interdisziplinäres Zentrum für Wissenschaftliches Rechnen, Im Neuenheimer Feld 205,
D-69120 Heidelberg, Germany
9Universität Heidelberg, Zentrum für Astronomie, Institut für Theoretische Astrophysik, Albert-Ueberle-Straße 2,
D-69120 Heidelberg, Germany
10Department of Physics, Engineering Physics & Astronomy, Queen’s University, Kingston, ON K7L 3N6, Canada
E-mail: zj448@nyu.edu
(قُبل في 2024 فبراير 19. استُلم في 2024 فبراير 13؛ وبصيغته الأصلية في 2023 مايو 15)
الملخص

تُعد محاكاة تشكّل المجرات في الإطار الكوني أدوات قوية لفهم العمليات المعقدة التي تحكم تشكّل المجرات وتطورها. ومع ذلك، لا يزال تقييم واقعية هذه المحاكاة تحديًا قائمًا. ويتمثل النهجان الشائعان لتقييم محاكاة المجرات إما في استخدام علاقات القياس المبنية على عدد قليل من الخواص الفيزيائية الأساسية للمجرات، وإما في استخدام مجموعة من المعاملات المورفولوجية المحددة مسبقًا بالاعتماد على صور المجرات. تقترح هذه الورقة طريقة جديدة، قائمة على الصور، لتقييم جودة محاكاة المجرات باستخدام تقنيات كشف الشذوذ بالتعلم العميق غير الخاضع للإشراف. ومن خلال مقارنة صور المجرات الكاملة، يستطيع نهجنا تحديد الفروق بين المجرات المحاكاة والمرصودة وقياسها كميًا. وكتطبيق توضيحي، نطبق هذه الطريقة على تصوير SDSS ومحاكاة NIHAO بنماذج فيزيائية ومعاملات ودقات مختلفة. كما نقارن مقياس طريقتنا بعلاقات القياس وبالمعاملات المورفولوجية. ونبيّن أن كشف الشذوذ قادر على التقاط أوجه التشابه والاختلاف بين الأجسام الحقيقية والمحاكاة التي تعجز علاقات القياس والمعاملات المورفولوجية عن تغطيتها، ومن ثم فإنه يقدّم بالفعل منظورًا جديدًا للتحقق من صحة المحاكاة الكونية ومعايرتها في ضوء البيانات المرصودة.

keywords:
المجرات: التشكّل، المجرات: التطور، الطرائق: تحليل البيانات، الطرائق: عددية، الطرائق: إحصائية، الكوازارات: الثقوب السوداء فائقة الكتلة
pubyear: 2024pagerange: تقييم محاكاة المجرات كميًا بالمقارنة مع الأرصاد الحقيقية باستخدام كشف الشذوذ16

1 المقدمة

تُعد المحاكاة الكونية إحدى أقوى الأدوات لاختبار فهمنا للكون (Vogelsberger et al., 2020). وبفضل التطور المزدهر في القدرة الحاسوبية، أصبحت المحاكاة الهيدروديناميكية عالية الدقة قادرة على نمذجة تشكّل المجرات وتطورها، مع تتبع كل من المادة المظلمة والباريونات عبر الزمن الكوني. وقد نجحت المحاكاة الحديثة إلى حد كبير في إعادة إنتاج طيف واسع من خواص المجرات، مثل الكتلة النجمية، ومنحنيات الدوران، والوفرة الكيميائية، والألوان، وعلاقات القياس (مثلًا Vogelsberger et al., 2014; Stinson et al., 2012; Dubois et al., 2016; Schaye et al., 2015; Wang et al., 2015; Tremmel et al., 2017; Dutton et al., 2017; Pillepich et al., 2018; Nelson et al., 2017; Buck, 2019).

إن فحص مدى الاتفاق بين الأرصاد الحقيقية والمحاكاة هو أفضل وسيلة لتقييم جودة المحاكاة، وهو أمر حاسم لاختبار الفيزياء الممثلة في المحاكاة وتحسينها. وبوجه عام، كانت المقارنة بين توزيع خواص المجرات المستخرجة من المحاكاة ومن الأرصاد تُستخدم أداة تشخيصية. وفي فضاء معاملات متعدد الأبعاد، يُجرى هذا التشخيص عبر علاقات قياس المجرات. ومن أمثلة ذلك علاقة Tully-Fisher (Tully & Fisher, 1977)، وعلاقة الحجم بالكتلة (Courteau et al., 2007)، وعلاقة الكتلة النجمية بكتلة الهالة (Moster et al., 2010; Moster et al., 2018)، وعلاقة الكتلة بالمعدنية (Tremonti et al., 2004; Gallazzi et al., 2005; Kirby et al., 2015)، على سبيل المثال لا الحصر. وغالبًا ما يُستخدم الاتفاق بين هذه العلاقات في المجرات الحقيقية والمجرات المحاكاة مقياسًا للحكم على ما إذا كانت المحاكاة «جيدة».

وعلى الرغم من أن علاقات القياس من أكثر الطرق شيوعًا لتقييم صلاحية المحاكاة الكونية، فإنها «تضغط» مليارات نقاط البيانات التي تولدها المحاكاة إلى مجموعة من بضعة أرقام تُقارن بالأرقام القليلة نفسها المستخلصة بدورها من كمية هائلة من بيانات الأرصاد. ولا مفر من ضياع قدر كبير من المعلومات الموجودة في المحاكاة والأرصاد معًا خلال هذه العملية. ونتيجة لذلك، قد تلائم محاكاة ما مجموعة من علاقات القياس المرصودة، بينما تنحرف في الوقت نفسه عن مجموعة أخرى من علاقات القياس. والأشد صعوبة هو تحديد أي مجموعة من علاقات القياس أكثر أهمية تحديدًا كميًا عندما تظهر تناقضات فيما بينها. ومن الطبيعي عندئذ البحث عن طرائق بديلة للمقارنة بين البيانات والنموذج، من أجل الاستفادة الكاملة من الدقة (المكانية) الكبيرة التي بلغها كل من الطرفين حديثًا.

وبالفعل، بُذلت جهود كبيرة في تحليل صور المجرات باستخدام مقاييس وإحصاءات متنوعة، منها ما هو معلمي مثل معاملات Sérsic (Sérsic, 1963)، ومنها ما هو غير معلمي مثل معامل Gini، وM20، وإحصاءات الانتفاخ (نظام Gini-M20، Lotz et al., 2004)، والتركيز، واللاتناظر، والنعومة (إحصاءات CAS، Conselice, 2003)، وتعدد الأنماط، والشدة، والانحراف (إحصاءات MID، Freeman et al., 2013). وقد بدأت المقارنة بين توزيع هذه المعاملات القائمة على الصور في الصور الصورية وبين نظيراتها في الصور الحقيقية تؤدي الآن دور إحدى الأدوات الحاسمة في معايرة المحاكاة الحديثة (Snyder et al., 2015; Bottrell et al., 2017a, b; Rodriguez-Gomez et al., 2019; Bignone et al., 2020; de Graaff et al., 2022). وعلى مر السنين، ورغم اقتراح المزيد من المعاملات المورفولوجية وتحسن فهمنا لصور المجرات، لا يزال من الصعب استغلال فضاء المعاملات بالكامل لوصف صورة مجرة بطريقة خاضعة للإشراف وموجّهة بشريًا.

كان التعرف على الصور وتوليدها من أبرز إنجازات مجال التعلم العميق، بدءًا من المحاولات المبكرة للتمييز بين القطط والكلاب، وصولًا إلى مولدات الوجوه بالذكاء الاصطناعي (AI)، وحديثًا جدًا إلى شقيق ChatGPT، وهو ذكاء اصطناعي مذهل للرسم يُسمى DALL-E. وقد حاول الفيزيائيون الفلكيون أيضًا تطبيق تقنيات التعلم الآلي لمعالجة مسائلهم العلمية، ولا سيما تلك المرتبطة بصور المجرات (مثلًا Dieleman et al., 2015; Storey-Fisher et al., 2021; Buck & Wolf, 2021; Obreja et al., 2018; Buder et al., 2021; Cheng et al., 2021; Smith et al., 2022). ويُظهر عمل حديث جدًا لـ (Tohill et al., 2023) كذلك أن التعلم غير الخاضع للإشراف المدرَّب على صور المجرات يستطيع ترميز الصور في سمات، يرتبط بعضها بمعاملات مورفولوجية معروفة مثل دليل Sérsic، واللاتناظر، والتركيز (انظر Tohill et al. 2023 الجدول 3).

وعلى وجه الخصوص، تملك خوارزميات كشف الشذوذ بالتعلم العميق إمكانية أن تكون قوية جدًا عند مقارنة صور المجرات المحاكاة والحقيقية. في مثل هذه الدراسات، تُعامل صور المجرات المرصودة الحقيقية بوصفها صورًا «طبيعية»، وتُسند شبكة عصبية «درجات شذوذ» إلى صور المجرات المحاكاة، بحيث تقيس كميًا مدى واقعية هذه الصور المحاكاة. استخدم Margalef-Bentabol et al. (2020) شبكة Wasserstein التوليدية التنافسية (WGANs) (Arjovsky et al., 2017) للعثور على القيم الشاذة في محاكاة Horizon-AGN (Dubois et al., 2014)، مع صور CANDELS في نطاق H (Grogin et al., 2011; Koekemoer et al., 2011) بوصفها «المعيار الطبيعي»، وخسارة WGAN بوصفها درجة الشذوذ. كما حسّن Zanisi et al. (2021) أداء خوارزمية كشف الشذوذ من خلال الجمع بين مخرجات شبكتين منفصلتين من PixelCNN (Oord et al., 2016) لتوليد درجة شذوذ على مستوى البكسل من دون تلوث بخلفية السماء. وفي عملهم، قورنت محاكاة Illustris (Vogelsberger et al., 2014) وIllustrisTNG (Nelson et al., 2017) بصور Sloan Digital Sky Survey (SDSS) في نطاق r، ورُصدت أوجه عدم اتفاق في التفاصيل المورفولوجية الصغيرة المقياس. وفي هذا العمل سنستخدم GANomaly (Akcay et al., 2019)، الذي يتميز ببنية مولِّد من نوع مُرمِّز-مُفكِّك-مُرمِّز وبدرجة شذوذ أفضل تعريفًا، لمقارنة محاكاة NIHAO (Numerical Investigation of Hundred Astrophysical Objects) (Wang et al., 2015) بصور مجرات SDSS RGB ثلاثية الألوان (نطاقات i-r-g). ويُعد GANomaly طريقة مباشرة وموجزة وفعالة لاشتقاق درجات شذوذ لا ترتبط إلا بسمات المجرات لا بضجيج الخلفية، مع تحديد موضع الشذوذ في الوقت نفسه11 1 النموذج متاح للعموم في https://github.com/ZehaoJin/Rate-galaxy-simulation-with-Anomaly-Detection.

تُنظم هذه الورقة كما يأتي: في القسم 2 سنعرض مجموعات مختلفة من محاكاة NIHAO التي سيقيّمها GANomaly لاحقًا. وفي القسم 3 نستعرض مجموعة التدريب المستخدمة في هذا العمل، وهي صور مجرات SDSS. ويعرض القسم 4 كيفية عمل GANomaly ودرجة الشذوذ. وتقدم الأقسام 5 و6 و7 و8 النتائج الرئيسة لهذه الورقة، والمقارنة بعلاقات القياس والمعاملات المورفولوجية، إضافة إلى نقاش وتفسير إضافيين لدرجات الشذوذ. ونختتم في القسم 9، ونستكشف فضاء السمات الكامن وراء GANomaly في الملحق A بمحاولة تفسير الفضاء الكامن باستخدام تحليل المركبات الرئيسة (PCA) وإسناد معنى فيزيائي إليه.

2 المحاكاة

نستخدم النسخة «الأساسية» من محاكاة NIHAO (ويشار إليها فيما بعد باسم ‘NIHAO NoAGN’) وتنوعاتها NIHAO AGN وNIHAO n80 وNIHAO UHD لإجراء مقارنة عبر نماذج فيزياء تشكّل المجرات ومعاملاتها ودقاتها المختلفة. ثم تُرصد هذه المجرات المحاكاة رصدًا صوريًا في هيئة صور RGB على نمط SDSS. وأخيرًا يقيّم GANomaly الصور المرصودة صوريًا من حيث درجات الشذوذ. وتُعرض أدناه تفاصيل محاكاة NIHAO ومخطط الرصد الصوري.

2.1 NIHAO NoAGN

محاكاة NIHAO (Numerical Investigation of Hundred Astrophysical Objects) (Wang et al., 2015; Blank et al., 2019) هي حزمة من المحاكاة الكونية الهيدروديناميكية المكبرة، وتعمل بشيفرة GASOLINE2 (Wadsley et al., 2017). وتعتمد NIHAO كوسمولوجيا ΛCDM مسطحة ومعاملات مستمدة من نتائج القمر الصناعي Planck (Planck Collaboration et al., 2014). وتتضمن NIHAO تبريد Compton، والتأين الضوئي بفعل الخلفية فوق البنفسجية وفقًا لـ Haardt & Madau (2012)، وتشكّل النجوم والتغذية الراجعة من المستعرات العظمى (Stinson et al., 2006) والنجوم الضخمة (Stinson et al., 2012)، وتبريد المعادن، والإثراء الكيميائي. وقد أثبتت سلسلة من الأعمال السابقة أن مجرات NIHAO المحاكاة تعيد إنتاج علاقات قياس المجرات بصورة جيدة جدًا، بما في ذلك علاقة الكتلة النجمية بكتلة الهالة (Wang et al., 2015)، وعلاقة كتلة غاز القرص وحجم القرص (Macciò et al., 2016)، وعلاقة Tully-Fisher (Dutton et al., 2017)، وتنوع منحنيات دوران المجرات (Santos-Santos et al., 2017)، وعلاقة الكتلة بالمعدنية (Buck et al., 2021).

نشير إلى هذه النسخة الأساسية (المفصلة في Wang et al. (2015)) من محاكاة NIHAO باسم ‘NIHAO NoAGN’. وتمثل NIHAO NoAGN الأساس الذي تقوم عليه التنوعات الأخرى من NIHAO الموصوفة في الأقسام الفرعية أدناه.

2.2 NIHAO AGN

كما يوحي الاسم، لا تحتوي ‘NIHAO NoAGN’ على فيزياء النوى المجرية النشطة (AGN). وبما أنه من المقبول على نطاق واسع أن التغذية الراجعة للثقوب السوداء حاسمة في إخماد المجرات الإهليلجية (مثلًا Croton et al., 2006; Dutton et al., 2015) فقد أدخل Blank et al. (2019) تشكّل الثقوب السوداء وتراكمها وتغذيتها الراجعة في مشروع NIHAO. في NIHAO AGN تُزرع بذرة ثقب أسود عندما تتجاوز الهالة المركزية عتبة كتلة معينة، ثم تتبع نموذج التراكم (Bondi, 1952) والتغذية الراجعة الذي قدمه Springel et al. (2005)، وهو أحد أكثر النماذج استخدامًا ومن ثم اختبارًا. ويمكن العثور على مزيد من التفاصيل بشأن تطبيق AGN في NIHAO في Blank et al. (2019)، وكذلك في Waterval et al. (2022) للاطلاع على ملخص جيد.

عمليًا، NIHAO AGN هي إعادة تشغيل لـ NIHAO NoAGN، بالشروط الابتدائية والمعاملات والفيزياء نفسها تمامًا، باستثناء إضافة تطبيق AGN، وبذلك توفر النظير المزود بـ AGN لكل مجرات NIHAO الأساسية. وهي مثالية لاختبار أثر نموذج AGN المطبق من خلال مقارنة نظائر AGN وNoAGN بعلاقات القياس(Frosst et al., 2022; Waterval et al., 2022)، أو الآن على نحو أفضل، بدرجات الشذوذ لدينا.

2.3 NIHAO n80

ينطوي تشكّل المجرات على مجال ديناميكي هائل، من السحب الجزيئية إلى البيئة واسعة النطاق، مما يجعل حل بعض العمليات الأساسية بالكامل أمرًا مستحيلًا. وعادة ما تُعتمد نماذج فعالة، غالبًا ذات معاملات وعتبات، في المحاكاة العددية الكونية لمعالجة مشكلة ما دون الدقة هذه (Springel & Hernquist, 2003). فعلى سبيل المثال، يُنمذج تشكّل النجوم عادة بعتبة كثافة n، بوحدات الجسيمات لكل cm3. ولا تبدأ جسيمات الغاز بالتحول إلى جسيمات نجمية، أي تكوين النجوم، إلا عندما تُبلغ هذه العتبة. ورغم أن قيمة n «المتوقعة» في الكون الحقيقي تتجاوز 105cm3 (McKee & Ostriker, 2007)، فإن هذه الكثافة خارج نطاق المنال حتى لأعلى محاكاة لمجرة حلزونية دقة، كما استعرض Vogelsberger et al. (2020). وفي الواقع، تميل المحاكاة الكونية الرائدة حاليًا إلى استخدام n حول 0.11cm3 في الطرف الأدنى، مثل EAGLE (Schaye et al., 2014) وIllustris (Vogelsberger et al., 2014) وIllustrisTNG (Nelson et al., 2017)، وحول 10100cm3 في الطرف الأعلى، مثل Governato et al. (2010) وFIRE (Oñorbe et al., 2015) وBrook & Di Cintio (2015) وVINTERGATAN Agertz et al. (2021) وNIHAO (Wang et al., 2015). وتُضبط القيمة الدقيقة لـ n عادةً باستخدام علاقات قياس المجرات.

تستخدم كل محاكاة NIHAO الأخرى الموصوفة في هذا العمل، وهي NIHAO NoAGN وNIHAO AGN وNIHAO UHD، القيمة n=10cm3. ولاستكشاف قيم أخرى لـ n، أنتج Macciò et al. (2022) بضع عمليات إعادة تشغيل لمجرات NIHAO NoAGN باستخدام n=80cm3. وللتوضيح، لا تتضمن مجرات NIHAO n80 هذه فيزياء AGN، ولها دقة (كتلية) مماثلة لدقة NIHAO NoAGN وNIHAO AGN، لكن n فيها مضبوط على 80 cm3 بدلًا من 10 cm3. وللاطلاع على دراسة موسعة لأثر عتبة تشكّل النجوم في خواص مجرات NIHAO، انظر Dutton et al. (2019); Buck et al. (2019b); Dutton et al. (2020).

2.4 NIHAO UHD

تمتلك NIHAO NoAGN أصلًا دقة جيدة إلى حد بعيد: إذ تمتد كتلة جسيم المادة المظلمة من mdm=3.4×103M للمجرات القزمة إلى mdm=1.4×107M لأضخم المجرات. وتكون النسبة بين كتل جسيمات المادة المظلمة والغاز في البداية مساوية لنسبة كتلة المادة المظلمة إلى الباريونات الكونية، Ωdm/Ωb5.48. وتُضبط أطوال تليين القوة لجسيمات الغاز والنجوم لتكون أصغر بنحو 2.34 مرات من أطوال تليين جسيمات المادة المظلمة (Wang et al., 2015). وإضافة إلى ذلك، اختير عدد قليل من المجرات الشبيهة بدرب التبانة لإعادة محاكاتها بدقة أعلى (mdm105M). يقدم Buck et al. (2020) حزمة NIHAO UHD (Ultra High Definition)، التي تحتوي على نظائر أعلى دقة لست مجرات من NIHAO NoAGN، بالشروط الابتدائية نفسها والمعاملات نفسها (n=10cm3) والفيزياء نفسها (من دون AGN). وتُظهر تلك المجرات تقاربًا ممتازًا لمحاكاة NIHAO، وتبين توافقًا جيدًا بين دالة كتلة التوابع في MW وM31 (Buck et al., 2019a) وخواص انتفاخ MW (Buck et al., 2018, 2019c).

2.5 صور الرصد الصوري

في هذا العمل، نستخدم 77 مجرة NIHAO NoAGN، و77 مجرة NIHAO AGN، و12 مجرة NIHAO n80، و6 مجرة NIHAO UHD، مع إسقاط كل مجرة على طول 20 محاور موجهة عشوائيًا. ثم تُرصد هذه المحاكاة المجرية رصدًا صوريًا في نطاقات SDSS i-r-g كصور مجرات 64×64×3، أولًا عبر انتقال إشعاعي باستخدام SKIRT (Camps & Baes, 2020) باتباع المنهجية نفسها الواردة في Faucher et al. (2023)، ثم تُعالج لاحقًا بالاعتماد على RealSim (Bottrell et al., 2017a, b; Bottrell et al., 2019) للحصول على صور صورية واقعية.

يُعد SKIRT من أكثر شيفرات الانتقال الإشعاعي استخدامًا لإنتاج صور مجرات تركيبية مثالية من المحاكاة. ولكل جسيم نجمي، وبافتراض دالة كتلة ابتدائية (IMF) من Chabrier (Chabrier, 2003)، نسند توزيع طاقة طيفي (SED) من FSPS (Conroy et al., 2009; Conroy et al., 2010; Foreman-Mackey et al., 2015) باستخدام متساويات العمر MIST (Paxton et al., 2011; Paxton et al., 2013, 2015; Choi et al., 2016; Dotter, 2016) ومكتبة MILES الطيفية (Sánchez-Blázquez_2006) وفق عمره ومعدنيته وكتلته. تُؤخذ عينات الفوتونات من SED، وتُطلق على نحو متساوي الخواص في إطار سكون الجسيم ثم تُزاح لاحقًا بفعل دوبلر. ولتقليل العشوائية في تواريخ تشكّل النجوم الناتجة عن نمذجة تجمعات النجوم كجسيمات مفردة، نطبق وصفة تحت شبكية تُنعّم فعليًا تواريخ تشكّل النجوم المحاكاة بحيث يكون الفرق النموذجي في العمر بين جسيمين نجميين شابين متجاورين (بالمعنى الزمني) أقل من 1 Myr، وهي المدة الزمنية التي تُظهر خلالها أطياف التجمعات النجمية تغيرًا ملحوظًا. وبالنسبة إلى الجسيمات النجمية الأصغر عمرًا من 10 Myr، نحتاج أيضًا إلى احتساب الامتصاص والإصدار بواسطة الغبار داخل مناطق التفكك الضوئي (PDRs) الناتجة عن بقايا سحب الميلاد للنجوم المتشكلة حديثًا. ولأن هذه المناطق تقع دون الدقة المكانية للمحاكاة، نعتمد الطريقة الشائعة الاستخدام (Groves et al., 2008; Jonsson et al., 2010; Hayward & Smith, 2015; Trayford et al., 2017; Trčka_2020; Kapoor et al., 2021; Faucher et al., 2023) المتمثلة في إسناد SEDs من MAPPINGS-III، والتي تتضمن مسبقًا آثار التأين الضوئي والحجب داخل هذه السحب الجزيئية الكثيفة. ويتميز هذا النموذج بمعامل حر واحد يصف زمن إزالة السحب الجزيئية، ويؤخذ مساويًا لـ 2.5 Myrs وفقًا لـ Faucher et al. (2023). وبما أن محاكاة NIHAO لا تنمذج تجمع الغبار مباشرة، نفترض أن كل جسيم غازي يحتوي على كتلة غبار مقدارها 10% من كتلته في المعادن. كما نفترض عدم وجود غبار في الغاز فوق درجة حرارة قصوى تبلغ 16,000K. ولإجراء حسابات الانتقال الإشعاعي، نُجزئ الفضاء باستخدام شبكة مكانية من نوع OctTree نقسمها حتى تحتوي كل خلية شبكية على جسيم غازي واحد على الأكثر. ويُحدد الحجم الظاهري الفيزيائي لكل صورة مجرة من توزيع جسيمات المادة المظلمة المنتمية إلى الهالة الرئيسة للمجرة، كما يحدده كاشف الهالات AHF(Knollmann & Knebe, 2009). ويتراوح مقياس البكسل في صور NIHAO الصورية حول 0.58 - 3.74 kpc/pixel. ويمكن العثور على مزيد من التفاصيل ومخرجات نموذجية لإجرائنا في الانتقال الإشعاعي في Faucher et al. (2023).

نضيف بعد ذلك واقعية رصدية تشمل الالتفاف بدالة انتشار النقطة (PSF)، وضجيج اللقطات، وضجيج السماء الغاوسي، وتمديد arcsinh بالاعتماد على شيفرة RealSim الخاصة بـ Bottrell et al. (2017a, b); Bottrell et al. (2019). وللالتفاف مع PSF الخاصة بـ SDSS، نعتمد PSF غاوسية بعرض كامل عند نصف القيمة العظمى (FWHM) يساوي متوسط الرؤية في جميع مجرات SDSS Legacy (1.286′′ و1.356′′ و1.496′′ لنطاقات SDSS i-r-g). وتُحوّل العروض الفيزيائية للمجرات المحاكاة إلى أحجام زاوية بوضعها افتراضيًا عند مسافة انزياح أحمر 0.109، وهو متوسط الانزياح الأحمر لعينة التدريب من SDSS لدينا. أما ضجيج اللقطات فهو ضجيج Poisson تحدده نقاط الصفر، والكتلة الهوائية، والانطفاء، وكسب CCD في حقول المسح. ويُستحصل ضجيج السماء الغاوسي من متوسط ضجيج السماء عبر جميع مجرات Legacy. وأخيرًا، يُطبق تمديد arcsinh الذي اقترحه Lupton et al. (2004) لاتباع مخطط التصوير القياسي في SDSS.

3 البيانات الرصدية

3.1 قصاصات صور مجرات SDSS

يُعد SDSS (Blanton et al., 2017) أحد أكبر المسوح الجارية لرسم خريطة كوننا. وتتيح أداة قص الصور في SDSS الحصول على شرائح صور RGB عند الموضع والعرض المطلوبين. ويأتي اللون الأحمر في صور SDSS من مرشح SDSS القريب من تحت الأحمر (i) (7625Å)، واللون الأخضر من مرشح SDSS الأحمر (r) (6231Å)، واللون الأزرق من مرشح SDSS الأخضر (g) (4770Å). وللحصول على صور المجرات، نستخدم فهرس المجرات الذي أعده Meert et al. (2014)، والذي يوفر الإحداثيات والكتل النجمية لـ 670,722 مجرة. ومن خلال أداة قص الصور في SDSS22 2 نوفر السكربت اللازم لتنزيل مجموعة بيانات SDSS كاملة في https://github.com/ZehaoJin/Rate-galaxy-simulation-with-Anomaly-Detection/blob/main/SDSS_cutouts/download_cutouts.py.، نقتطع 64×64 بكسل حول إحداثيات كل مجرة بمقياس بكسل كاميرا SDSS (0.396′′/pix). ويمكن العثور على أمثلة لصور SDSS في الشكل 3.

نضع كذلك حدًا على الكتلة النجمية عند 109M لتجنب التلوث من النجوم. وتملك عينات SDSS هذه انزياحًا أحمر من 0.005 - 0.395، بمتوسط انزياح أحمر يبلغ 0.109، لتُقارن بلقطات NIHAO عند انزياح أحمر 0. وأخيرًا، تُقسم هذه الصور إلى مجموعة تدريب تضم 579,197 صورة، ومجموعة اختبار تضم 64,356 صورة. وخلال مرحلة التدريب، لا ترى الشبكة العصبية إلا صور مجموعة التدريب. وبعد اكتمال تدريب GANomaly، ستُستخدم مجموعة الاختبار للتحقق من أداء التدريب وستُستخدم في التحليل المعروض في هذه الورقة.

3.2 إحصاءات عينة NIHAO مقابل SDSS

اختيرت كل مجرات NIHAO المعروضة في هذا العمل بحيث تكون لها كتلة نجمية M>109M، بما يتوافق مع حد الكتلة النجمية المفروض على مجرات SDSS33 3 نجا 77 من أصل 127 أزواج من مجرات NIHAO NoAGN/AGN، و12 من أصل 20 مجرات NIHAO n80، و6 من أصل 6 مجرات NIHAO UHD من حد الكتلة النجمية.. يبين الشكل 1 توزيع الكتلة النجمية لمجرات NIHAO وSDSS. وتشترك العينات الثلاث كلها في نطاق مشابه من الكتلة النجمية، لكن التوزيع الدقيق على امتداد نطاق الكتلة يختلف. وتوزيع الكتلة في NIHAO NoAGN وNIHAO AGN متماثل إلى حد ما، ولا سيما عند الطرف الأدنى، لأن AGN لا يؤدي دورًا رئيسًا في المجرات الأقل كتلة مقارنة بالمجرات عالية الكتلة. وبحكم البناء، تملك عينتا NIHAO توزيعًا متقارب الانتظام ضمن نطاق الكتلة، مع عدد أعلى قليلًا من المجرات الأعلى كتلة، في حين تملك SDSS قمة في حاوية الكتلة المتوسطة ونقصًا في حاويتي الكتلة المنخفضة والعالية. وبما أن GANomaly تعلّم اعتمادًا على صور SDSS فقط، فمن المعقول أن تتعرف الشبكة العصبية إلى المجرات متوسطة الكتلة على نحو أفضل قليلًا من المجرات منخفضة وعالية الكتلة. نحن ندرك أثر الاختيار هذا، وسنقارن المجرات الواقعة في حاويات الكتلة نفسها للتغلب على هذه المسألة. ويمكن العثور على مزيد من النقاش حول كيفية تأثير الكتلة النجمية في درجة الشذوذ في القسم 5. وسنتعامل مع مجرات NIHAO UHD وNIHAO n80 كلًا على حدة لاحقًا في هذه الورقة، لأن تعدادها محدود. وكتلتها النجمية مشابهة جدًا لكتلة نظيرتها في NIHAO NoAGN.

Refer to caption
Figure 1: توزيع الكتلة النجمية المطبّع لكل من SDSS (تظليل أخضر)، وNIHAO NoAGN (خط أزرق)، وNIHAO AGN (خط برتقالي). وسيُستخدم مخطط الألوان نفسه في جميع أنحاء هذه الورقة. وتحيط الخطوط الرأسية الحمراء المتقطعة الأربعة كل عينة بثلاث حاويات كتلية (منخفضة، متوسطة، عالية). وستُقارن المجرات الواقعة في حاوية الكتلة نفسها بعضها ببعض في التحليل اللاحق. ومن الواضح أن توزيع الكتلة في SDSS يبلغ ذروته حول 1011M، بينما يكون توزيع الكتلة في NIHAO، بحكم البناء، أكثر تسطحًا على امتداد الكتل كلها، مع فائض طفيف عند الطرف الأعلى.

4 GANomaly

4.1 كشف الشذوذ بإعادة البناء

GANomaly (Akcay et al., 2019) هو نموذج لكشف الشذوذ قائم على شبكة توليدية تنافسية (GAN) (Goodfellow et al., 2014)، مستوحى من AnoGAN (Schlegl et al., 2017) وBiGAN (Donahue et al., 2016) وEGBAD (Zenati et al., 2018). يكشف GANomaly الشذوذ من خلال إعادة بناء الصور. ويُدرّب GANomaly على إعادة بناء الصور الطبيعية (غير الشاذة) بتعلّم السمات المشتركة شيوعًا في مجموعة الصور الطبيعية. وبعد انتهاء التدريب، ينبغي أن يكون GANomaly قادرًا فقط على إعادة بناء الصور الطبيعية، وأن يفشل في إعادة بناء أي شذوذ. ومن ثم تكشف المقارنة بين الصورة الأصلية والمعاد بناؤها عن الشذوذ.

4.2 بنية الشبكة

Refer to caption
Figure 2: بنية GANomaly، المعتمدة من Akcay et al. (2019) وDi Mattia et al. (2019). يتكون GANomaly أساسًا من شبكة مولِّد (المُرمِّز GE والمُفكِّك GD)، ومُرمِّز E، وشبكة مميِّز D. تُرمَّز صورة الدخل x أولًا بواسطة GE إلى z، وهو تمثيل x في الفضاء الكامن/فضاء السمات، ثم تُعاد عبر GD إلى x^. وتُرسل x^ المعاد بناؤها لاحقًا إلى E وتُرمَّز في z^، وهو تمثيل السمات للصورة المعاد بناؤها x^. وفي الوقت نفسه، يأخذ المميِّز D بصورة مجهولة كلًا من صورة الدخل x والصورة المعاد بناؤها x^، ويحاول التمييز بينهما. يهدف تدريب GANomaly إلى تقليل خسارة التنافس adv، والخسارة السياقية con، وخسارة المُرمِّز enc.

على وجه التحديد، يوضح الشكل 2 بنية GANomaly. وبصفته تنويعًا على GAN، يتكون GANomaly من شبكة مولِّد (المُرمِّز GE والمُفكِّك GD) وشبكة مميِّز D، مع مُرمِّز إضافي E. تمر صورة الدخل x (64×64×3 في هذا العمل) أولًا عبر جزء المُرمِّز من المولِّد GE وتُرمَّز، أو تُلخّص في صورة z (1×128 في هذا العمل)، أي تمثيل فضاء السمات للصورة x. ثم تصبح z دخلًا للمُفكِّك GD الذي يخرج x^ (64×64×3)، وهي النسخة المعاد بناؤها من x. وأخيرًا، تُرسل x^ المعاد بناؤها إلى مُرمِّز آخر E وتُرمَّز في z^ (1×128)، وهو تمثيل السمات للصورة المعاد بناؤها x^. وفي الأثناء، يأخذ المميِّز بصورة مجهولة كلًا من صورة الدخل الأصلية x والصورة المعاد بناؤها x^، ويحاول تحديد أيهما صورة الدخل الحقيقية وأيهما الصورة الزائفة التي ولّدها المولِّد. وهكذا يكون المولِّد G والمميِّز D في حالة تنافس ويتطوران معًا: إذ يحاول المولِّد خداع المميِّز بتوليد صور أكثر فأكثر واقعية، بينما يتعلم المميِّز أن يبقى حادًا ويميز الصور المولدة من الصور الحقيقية.

4.3 الخسارة ودرجة الشذوذ

لبلوغ هدف إعادة بناء الصور بنجاح، تُعرَّف ثلاث دوال خسارة ويجري تقليلها أثناء التدريب.

خسارة التنافس، adv: تحرك خسارة التنافس المنافسة بين المولِّد والمميِّز من خلال بيان ما إذا كان المميِّز قد نجح في التمييز بين الصور الحقيقية والمولدة. وبخلاف GAN الأساسية حيث تكون خسارة التنافس ثنائية ببساطة، صحيحة أو خاطئة44 4 يمكن أن تعمل خسارة تنافس ثنائية بسيطة في GANomaly أيضًا، فإن خسارة التنافس هنا، تبعًا لـ Schlegl et al. (2017) وZenati et al. (2018)، تعتمد على التمثيل الداخلي للمميِّز D.

adv=f(x)f(x^)2, (1)

حيث إن f طبقة وسيطة داخل المميِّز D. وتحسب دالة الخسارة هذه مسافة 2 بين تمثيل السمات للصورة الأصلية والصورة المولدة. لاحظ أنه على الرغم من أن x وf(x) كلاهما تمثيل سمات لـ z، فإنهما مختلفان. تأتي f(x) من طبقة في المميِّز، وستُدرَّب السمات كي تساعد على أفضل وجه في التمييز بين الصور الحقيقية والمولدة؛ أما z فتأتي من المُرمِّز، وستخدم السمات على أفضل وجه إعادة بناء x.

الخسارة السياقية، con: تقارن الخسارة السياقية مباشرة بين صورة الدخل والصورة المولدة باستخدام مسافة 1،

con=xx^1 (2)

إن تقليل con يدفع ببساطة الدخل x والبناء x^ إلى أن يكونا متطابقين قدر الإمكان، وبذلك تُتعلّم المعلومات السياقية للصور الطبيعية.

خسارة المُرمِّز، enc: خسارة المُرمِّز هي مسافة 2 بين تمثيل السمات المُرمَّز للأصل x والمعاد بناؤه x^.

enc=zz^2 (3)

يسمح تقليل enc للمولِّد بتعلّم كيفية التقاط سمات صورة غير شاذة.

وبوجه عام، يتمثل هدف تدريب GANomaly في تقليل المجموع الموزون للخسائر الثلاث:

=wadvadv+wconcon+wencenc (4)

حيث تتيح wadv وwcon وwenc ضبط أهمية الخسائر الثلاث.

أما درجة شذوذ الدخل x، أي 𝒜(x)، فلن تستخدم دالة الخسارة الكلية، بل تستخدم فقط الفرق في فضاء السمات enc. ويمكن استخدام الخسارة السياقية con، رغم أنها غير مرتبطة مباشرة بدرجة الشذوذ، لاستنتاج موضع الشذوذ.

𝒜(x)=enc=zz^2 (5)

4.4 التدريب

يُدرَّب GANomaly فقط على مجموعة التدريب المؤلفة من 579,197 صورة SDSS حقيقية. وتُضبط أبعاد الدخل/الخرج (x,x^) على 64×64×3، وتُختار أبعاد فضاء السمات (z,z^) لتكون 1×128. لاحظ أن بعد فضاء السمات أحد المعاملات الفائقة التي تتسم بقدر من الاعتباطية ويمكن ضبطها. وليست «السمات» مستقلة تمامًا ومتعامدة بعضها مع بعض، ولذلك يصعب تفسير فضاء السمات. يستطيع المُرمِّز تلخيص صورة في 128 بتًا، لكنه يستطيع أيضًا تلخيص الصورة نفسها بالكامل في 64 بتًا أو 256 بتًا. دُرّبت الشبكة العصبية على مدى 50 تكرار على مجموعة التدريب، بأوزان خسارة wadv=1 وwcon=50 وwenc=155 5 أوزان الخسارة نفسها المستخدمة في Akcay et al. (2019). تبدو wcon=50 مرتفعة لأن con يُوسَّط على 64×64×3 بكسلًا. وسيُخفف التباين السياقي المحلي بعد التوسيط، مما يتطلب وزنًا أعلى.، وحجم دفعة 64، ومعدل تعلم α=0.0002، ومُحسِّن Adam β1=0.5. استغرق التدريب كله نحو 150 ساعات على وحدة GPU مزدوجة من نوع NVIDIA Quadro P1000 بذاكرة تقارب 4GB.

5 النتائج

5.1 نظرة عامة

بعد التدريب على مجموعة تدريب SDSS، نطبق GANomaly على مجموعة اختبار SDSS وعلى صور NIHAO لدينا. لاحظ أن صور مجموعة اختبار SDSS لم تُعرض قط على GANomaly خلال مرحلة التدريب، ومن الآن فصاعدًا فإن كل صور SDSS المذكورة مأخوذة من مجموعة اختبار SDSS. وتُعرض مجموعة من مخرجات GANomaly النموذجية في الشكل 3 بصيغة [الأصلية، المعاد بناؤها، المتبقي]، مع درجة الشذوذ 𝒜 في الأعلى. لاحظ أن درجة الشذوذ طُبِّعت اعتمادًا على أدنى الدرجات وأعلاها في عينة SDSS، ومن ثم فهي تتراوح بين 0 و1 بالنسبة إلى SDSS (حالة أعلى درجة شذوذ، 1، هي حالة «الرؤية السوداء» في SDSS). ويمكن لصورة غير SDSS أن تحصل على درجات أعلى من 1 إذا كانت أشد غرابة حتى من حالة «الرؤية السوداء»، مثل التفاحة في الشكل 3. وتعني درجة شذوذ أقل أن الصورة تحتوي على شذوذ أقل في فضاء السمات، أو بصورة مبسطة أن صورة المجرة ذات درجة الشذوذ الأقل أكثر واقعية. وكما يظهر في المعرض، تُعاد بناء صور مجرات SDSS بصورة جيدة، مع متبقيات ضئيلة جدًا ودرجة شذوذ منخفضة للغاية. غير أن GANomaly يفشل في إعادة بناء أي شذوذ أو أي مجرة غير SDSS، مثل التفاحة، والرؤية السوداء، وحالة الشعاع الكوني (الصف السفلي في الشكل 3). وتُعاد بناء مجرات NIHAO المحاكاة بصورة جيدة إلى حد معقول وفق خريطة المتبقيات ودرجة الشذوذ. ويُعرض توزيع درجات الشذوذ لجميع صور مجموعة اختبار SDSS مقابل جميع صور NIHAO NoAGN وNIHAO AGN في الشكل 4. يتداخل توزيعا NIHAO NoAGN وNIHAO AGN مع توزيع SDSS بنحو 70 في المئة، لكن كليهما لا يستطيع بلوغ الدرجة المنخفضة جدًا التي يبلغ عندها توزيع SDSS ذروته، وكلاهما يملك ذيلًا أكبر من ذيل توزيع SDSS. ويشير ذلك إلى أن محاكاة NIHAO هي عمومًا محاكاة واقعية للمجرات، لكنها لا تزال تملك مجالًا للتحسين. وسيُعرض أدناه تفسير أدق لدرجات الشذوذ عبر مجموعات مختلفة من محاكاة NIHAO.

Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Figure 3: معرض لأداء GANomaly. في كل لوحة مؤلفة من ثلاث صور، تكون اليسرى هي صورة الدخل الأصلية، والوسطى هي الصورة التي أعاد GANomaly بناءها، واليمنى هي المتبقي بين الدخل والصورة المعاد بناؤها. وفي الأعلى تظهر درجة الشذوذ. تأتي درجة الشذوذ من خسارة المُرمِّز المطبّعة enc، بينما يكون المتبقي في اللوحة اليمنى هو الخسارة السياقية على مستوى البكسل. وتشير درجة شذوذ أصغر إلى أن صورة المجرة أكثر واقعية مقارنة بصور مجرات SDSS. وتلمح المتبقيات في اللوحات اليمنى إلى موضع الشذوذ، لكن لاحظ أنه لا توجد علاقة واحد إلى واحد بين المتبقي ودرجة الشذوذ (انظر القسم 8). اختيرت جميع الصور عشوائيًا. الصف 1st3rd: صور مجرات مجموعة اختبار SDSS من حاويات الكتلة المنخفضة والمتوسطة والعالية؛ الصف 4th: مجرات NIHAO NoAGN في كل حاوية كتلية؛ الصف 5th: مجرات NIHAO AGN في كل حاوية كتلية؛ الصف 6th: مجرات NIHAO n80 وNIHAO UHD؛ الصف 7th: فحص سلامة باستخدام تفاحة وصورتين شاذتين من مجموعة اختبار SDSS. إحداهما عندما لا تُرصد أي مجرة ويكون مجال الرؤية كله أسود، والأخرى عندما يضرب شعاع كوني الكاميرا.
Refer to caption
Figure 4: توزيع درجات الشذوذ لأرصاد SDSS ومحاكاة NIHAO. تُسقط كل مجرة من NIHAO في 20 اتجاهات عشوائية، وتُعد كل واحدة من هذه الاتجاهات 20 صورة مستقلة عند حساب توزيع درجة الشذوذ. تمتلك التوزيعات مساحة تداخل كبيرة، لكن NIHAO لا تعيد إنتاج قمة SDSS ولها ذيل أكبر.

5.2 NIHAO NoAGN مقابل NIHAO AGN في حاويات الكتلة

لأن الكتلة النجمية لا تتوزع بانتظام في مجموعة تدريب SDSS (الشكل 1)، ولأن اختلاف الكتلة النجمية يمكن أن يؤدي إلى مورفولوجيات مجرية متمايزة، فإن GANomaly سيفضل المجرات ذات كتل نجمية معينة، كما يبين الشكل 5. فالمجرات الأقل كتلة، بسبب جهدها الثقالي الأضعف، تكون بطبيعتها أكثر لاانتظامًا أو شذوذًا من حيث المورفولوجيا مقارنة بالمجرات الأعلى كتلة في حاويات الكتلة المتوسطة والعالية. ويؤدي الشذوذ الذاتي وتعداد الكتلة النجمية غير المتوازن في مجموعة التدريب معًا إلى جعل مجرات SDSS في حاوية الكتلة المنخفضة ذات درجات شذوذ أعلى من نظيراتها في حاويتي الكتلة المتوسطة والعالية. ولتحقيق مقارنة عادلة، نضع مجرات SDSS وNIHAO في حاويات كتلة منخفضة ومتوسطة وعالية، ونقارن التوزيع ضمن النطاق الكتلي نفسه.

يُعتقد أن التغذية الراجعة لـ AGN أساسية في إخماد المجرات الضخمة، ومن ثم يتوقع المرء فرقًا ضئيلًا في درجة الشذوذ بين NIHAO NoAGN وNIHAO AGN في حاوية الكتلة المنخفضة، بينما ينبغي لدرجة شذوذ NIHAO AGN أن تتفوق على NIHAO NoAGN كلما اتجهنا إلى كتل نجمية أعلى، إذا كان تطبيق AGN واقعيًا. يبين الشكل 6 توزيع درجات الشذوذ لكل من NIHAO NoAGN وNIHAO AGN وSDSS في كل واحدة من حاويات الكتلة الثلاث. وتبلغ مساحة التداخل (بالنسبة المئوية من مساحة SDSS) بين NIHAO وSDSS لكل من AGN مقابل NoAGN في حاويات الكتلة المنخفضة والمتوسطة والعالية 62 في المئة مقابل 68 في المئة، و66 في المئة مقابل 59 في المئة، و74 في المئة مقابل 63 في المئة66 6 لاحظ أن مساحة التداخل تعتمد على اختيار التقسيم إلى حاويات، ولذلك فهي لا تقيس مباشرة جودة NIHAO NoAGN أو NIHAO AGN إحداهما على الأخرى.. يبين الرسم أن لا NoAGN ولا AGN يتفوق على الآخر تفوقًا ملحوظًا في أي من حاويات الكتلة. وتشير مساحة التداخل إلى أنه في حاوية الكتلة المنخفضة لا يوجد فرق يذكر بين NIHAO NoAGN وNIHAO AGN لأن الثقوب السوداء لا تؤدي دورًا رئيسًا هناك، كما هو متوقع. أما في حاوية الكتلة المتوسطة، ولا سيما في حاوية الكتلة العالية، فيبدأ AGN بإظهار أفضلية طفيفة على NoAGN. وبصريًا، تأتي أفضلية AGN في حاوية الكتلة العالية من أن AGN يعيد إنتاج القمة الثانية حول درجة شذوذ 0.01 - 0.03 أفضل قليلًا مما يفعل NoAGN.

وباختصار، يلمح GANomaly إلى تحسن طفيف في نمذجة المجرات الأعلى كتلة عند تطبيق AGN، لكنه عمومًا يعلن تعادلًا بين الأداء الكلي مع AGN ومن دونه. وبالمثل، عند استخدام PixelCNN وتوزيع نسبة اللوغاريتم الاحتمالي (LLR) الخاص بها (وهو شبيه بتوزيع درجة الشذوذ هنا) لمقارنة صور SDSS في نطاق r، وجد Zanisi et al. (2021) تحسنًا هامشيًا فقط للمجرات الساكنة من Illustris إلى IllustrisTNG رغم اختلاف تطبيق التغذية الراجعة لـ AGN فيهما. يأخذ GANomaly صور مجرات مرصودة صوريًا، أي خرائط توزيع الضوء المطبّعة في نطاقات SDSS i-r-g، ولذلك يبدو أن تطبيقات AGN الحالية في NIHAO لا تملك «أثرًا صافيًا» في خرائط توزيع ضوء المجرات المطبّعة وفقًا لـ GANomaly. وفي القسم 7 سنعرض مزيدًا حول كيف تبدو درجات الشذوذ «غير حساسة» لنماذج AGN الحالية في NIHAO.

Refer to caption
Figure 5: التوزيع المطبّع لدرجات الشذوذ لحاويات الكتلة النجمية المختلفة في مجموعة اختبار SDSS. تشير الخطوط الملونة إلى حاويات الكتلة الثلاث، ويُظهر المدرج التكراري المظلل بالأخضر مجموعة البيانات المجمعة. تفضل درجة الشذوذ مجرات SDSS المتوسطة والعالية الكتلة على المجرات الأقل كتلة.
Refer to caption
Figure 6: NIHAO NoAGN (بالأزرق) مقابل NIHAO AGN (بالبرتقالي) مقابل SDSS (بالأخضر) في حاويات الكتلة المنخفضة والمتوسطة والعالية (من الأعلى إلى الأسفل). تُعامل الإسقاطات 20 لمجرة NIHAO بوصفها صورًا مستقلة عند حساب توزيع درجة الشذوذ. لا نرى تفضيلًا ذا دلالة لـ NIHAO AGN أو NIHAO NoAGN في أي من حاويات الكتلة.

5.3 أثر عتبة تشكّل النجوم

من بين 81 مجرة NIHAO NoAGN مستخدمة في هذا العمل، لدينا 12 مجرات لها نظائر NIHAO n80. لا تتضمن مجرات NIHAO n80 هذه تطبيق AGN، ولها عتبة كثافة لتشكّل النجوم مقدارها n=80cm3 بدلًا من n=10cm3 كما في NIHAO NoAGN (انظر القسم 2.3). وفي هذا القسم، سنشير إلى المقارنة بين هذه الأزواج 12 من المجرات باسم NIHAO n80 مقابل NIHAO n10 توخيًا للوضوح. ولاستقصاء هذا n، نقارن أداء درجة الشذوذ لـ n=80cm3 مقابل n=10cm3 مجرة مجرةً، كما يظهر في الشكل 7. وبالنسبة إلى هذه الأزواج 12 من المجرات، لا تُظهر المجرات الأقل كتلة (<1010M/M) فرقًا واضحًا بين n80 وn10 في درجة الشذوذ، بينما تُظهر المجرات الأعلى كتلة (>1010M/M) درجة شذوذ أفضل (أدنى) في NIHAO n10. وهذا يعني أن n=10cm3 تبدو خيارًا أفضل من n=80cm3 في إعداد شبيه بـ NIHAO NoAGN للمجرات عالية الكتلة. وهذه نتيجة مثيرة للاهتمام تختلف عن Macciò et al. (2022)، الذي يبين أن n=80cm3 خيار أفضل اعتمادًا على فحص خريطة الغاز بدلًا من خريطة الضوء النجمي المدروسة في هذا العمل. وتشير النتائج المتباينة المستخلصة من منظورات متنوعة إلى أن مقياسًا واحدًا لا يكفي لضبط المعاملات أو العتبات الفعالة في المحاكاة الكونية، وأن القيمة المثلى لـ n تستحق مزيدًا من الدراسة في أعمال مستقبلية.

Refer to caption
Figure 7: درجة الشذوذ لنظائر 12 من NIHAO n10 وNIHAO n80. تُسقط كل مجرة n10 وn80 في 20 دورانات مختلفة، مما يعطي 20 صورة مجرية (انظر القسم 2.5). في هذا الرسم تمثل كل نقطة متوسط درجة الشذوذ لكل 20 صورة مجرية على المحور y، ويشير شريط خطأ y إلى الانحراف المعياري لدرجات الشذوذ 20. أما المحور x فهو الكتلة النجمية لمجرة NIHAO n10، وذلك فقط لتجميع كل نظير. تفضل درجة الشذوذ n=10cm3 على n=80cm3 في المجرات الأعلى كتلة.

5.4 أثر الدقة

بطريقة مشابهة لحالة n80، نقارن 6 أزواج من مجرات NIHAO NoAGN (ويشار إليها في هذا القسم باسم ‘NIHAO HD’) ومجرات NIHAO UHD. وللتذكير، فإن الفرق الوحيد بينها هو أن NIHAO UHD أعلى دقة من NIHAO HD. يبين الشكل 8 أنه في جميع المجرات 6 تكون درجات الشذوذ شبه متطابقة عبر الدقات المختلفة. ويرجع ذلك إلى أن كلًا من HD وUHD ستكون لهما فعليًا صور صورية بالدقة نفسها بعد الالتفاف مع PSF. ويبين المستوى نفسه من أداء درجة الشذوذ أن NIHAO HD قادرة على إنتاج صور مجرات على نمط SDSS بجودة NIHAO HUD نفسها وبكلفة حاسوبية أدنى بكثير.

كما نعرض صورة المجرة المواجهة وإعادة بناء GANomaly لمجرتين من NIHAO لهما نظائر في جميع عينات NoAGN وAGN وn80 وUHD في الشكل 9. ويُعرض متوسط درجة الشذوذ لكل مجرة NIHAO ولكل مجرة اختبار SDSS في الشكل 10. ومرة أخرى، من حيث درجات الشذوذ، تنتهي مقارنة NIHAO AGN مقابل NIHAO AGN إلى تعادل مع أفضلية هامشية لـ NIHAO AGN عند الكتل الأعلى، ويتفوق NIHAO n10 على NIHAO n80 (أي NIHAO NoAGN) عند الكتل الأعلى، وتنتهي مقارنة NIHAO UHD مقابل NIHAO HD (أي NIHAO NoAGN) إلى تعادل.

Refer to caption
Figure 8: درجة الشذوذ لنظائر 6 من NIHAO HD وNIHAO UHD. كما في الشكل 7، تمثل كل نقطة متوسط درجة الشذوذ لكل إسقاطات مجرية 20 على المحور y، ويمثل شريط خطأ y الانحراف المعياري لدرجات الشذوذ 20. ويعرض المحور x الكتلة النجمية لمجرات NIHAO HD لتجميع كل نظير. درجات الشذوذ في HD وUHD شبه متماثلة، نتيجة تنعيم PSF.
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Refer to caption
Figure 9: مجرتا NIHAO المسميتان g7.08e11 وg8.26e11 معروضتان في نسخ NoAGN وAGN وn80 وUHD. في كل مجموعة من الصور، تكون اليسرى هي صورة المجرة الأصلية، والوسطى هي إعادة البناء بواسطة GANomaly، واليمنى هي المتبقي بين الأصلية والمعاد بناؤها، وفي الأعلى الاسم ودرجة الشذوذ. لاحظ أن محاور الإسقاط مختلفة عبر كل نسخة، ولذلك فإن المقارنة المباشرة لدرجات الشذوذ بين هذه الصور هنا ليست عادلة. وإضافة إلى ذلك، لا يرتبط المتبقي في اللوحات اليمنى بالضرورة بدرجة الشذوذ، ولذلك فإن متبقي إعادة بناء كبيرًا لا يفسر شذوذًا كبيرًا كما هو موضح في القسم 4.3.
Refer to caption
Figure 10: متوسط درجة الشذوذ لكل مجرة NIHAO عبر إسقاطاتها 20، إلى جانب توزيع درجات الشذوذ لجميع مجرات اختبار SDSS، مرسومًا بدلالة كتلتها النجمية. الأخضر - SDSS؛ الأزرق - NIHAO NoAGN؛ البرتقالي - NIHAO AGN؛ الرمادي - NIHAO n80؛ الأحمر - NIHAO UHD.

6 علاقات القياس

إن الالتزام بعلاقات القياس معيار شائع الاستخدام لتقييم المجرات المحاكاة، ومن الطبيعي أن نتساءل عما إذا كان معيار علاقات القياس يتفق مع درجات الشذوذ في GANomaly. ومن منظور قائم على علاقات القياس، يقارن Arora et al. (2023) مجرات NIHAO المحاكاة مع 2600 مجرة من النوع المتأخر من مسح Mapping Nearby Galaxy at Apache point (MaNGA) (Bundy et al., 2015). وتُجرى المقارنات باستخدام علاقات قياس بنيوية متعددة الأبعاد تتضمن كميات مثل الحجم (R)، والكتلة النجمية (M)، والسرعة الدورانية (V)، والكثافة السطحية النجمية داخل 1 kpc (Σ1). حيث تُقدر R وM وΣ1 باستخدام قياسات ضوئية بصرية grz من مسح DESI77 7 Dark Energy Sky Instrument (DESI Collaboration et al., 2016) (Arora et al., 2021)، بينما تمثل قياسات السرعة ملاءمات نموذج tanh لخرائط السرعة من MaNGA (انظر Arora et al., 2023, لمزيد من التفاصيل). وفي المقارنات، تُقاس جميع الكميات، باستثناء Σ1، عند نصف قطر يقابل كثافة سطحية للكتلة النجمية مقدارها 10Mpc2. ويتيح اختيار مقياس حجم ذي دافع فيزيائي مقارنة موحدة بين محاكاة المجرات وأرصادها (بعد أخذ أخطاء الرصد في الحسبان).

في الشكل 11، نستخدم 30 مجرة NIHAO AGN مشتركة بين التحليل المعروض هنا والتحليل في Arora et al. (2023). وتتفق مجرات NIHAO عمومًا مع أرصاد MaNGA جيدًا من حيث علاقات القياس، ولا تملك أي من المجرات درجة شذوذ استثنائية الارتفاع. غير أنه يتبين أن درجة شذوذ المجرة لا ترتبط بكون هذه المجرة تتبع أيًا من علاقات القياس: فمجرة محاكاة تقع مباشرة على علاقة قياس يمكن أن تكون لها درجة شذوذ أعلى من مجرة تبدو بعيدة عن علاقة القياس. وبصورة مبسطة، قد يفترض المرء أن المجرة الأقرب ملاءمة لعلاقة قياس أكثر واقعية من مجرة أبعد عنها، لكن درجة الشذوذ تشير إلى أن هذا الافتراض ليس صحيحًا دائمًا. وبعبارة أخرى، فإن GANomaly ودرجة الشذوذ ليسا موازيين لعلاقات القياس، بل مكملان لها. يفحص GANomaly صور المجرات الكاملة، أو خرائط توزيع الضوء، ومن ثم التوزيع المشترك لمواضع النجوم وأعمارها ومعدنيتها وكتلتها، وهو ما لا يمكن اختباره عبر علاقات القياس التقليدية. كما يوحي ذلك بأنه على الرغم من قدرة محاكاة المجرات الحديثة على إعادة إنتاج كثير من علاقات القياس المرصودة، فإن هذا النجاح في بضع كميات إحصائية لا يضمن صورة مجرة واقعية. ولتقييم جودة محاكاة مجرة، قد يكون تصحيح خريطة الضوء مهمًا بقدر تصحيح علاقات القياس التقليدية. ومع سعينا إلى محاكاة أدق على نحو متزايد وصورة أكمل لنماذج تشكّل المجرات، يصبح من الضروري استخدام كل من علاقات القياس التقليدية وتقنيات كشف شذوذ الصور المدفوعة بالتعلم العميق للحصول على فهم أفضل للمحاكاة، ومن ثم تعلّم صورة أكمل عن كوننا.

Refer to caption
Figure 11: علاقات قياس المجرات مرسومة لمجرات NIHAO AGN وللمجرات الحقيقية المرصودة في MaNGA. رُمّزت مجرات NIHAO AGN لونيًا حسب متوسط درجة الشذوذ عبر 20 اتجاهات مختلفة. تُقاس جميع الكميات عند نصف قطر يقابل كثافة سطحية للكتلة النجمية مقدارها 10Mpc2، باستثناء Σ1، وهي الكثافة السطحية النجمية داخل 1 kpc. لا توجد علاقة واضحة بين درجة الشذوذ والالتزام بعلاقات القياس في أي من علاقات القياس المعروضة.

7 المعاملات المورفولوجية

علاقات القياس مكملة لدرجات الشذوذ، لكن من المتوقع أن تكون المعاملات المورفولوجية أكثر اتساقًا مع درجات الشذوذ، إذ إن كليهما مشتق من صور المجرات. نستقصي هنا ما قد يتعلمه نموذج التعلم الآلي إضافة إلى الطرائق التقليدية التي طُبقت حتى الآن في دراسات الصور الصورية. وننظر هنا أساسًا في إحصاءات Gini-M20 (معامل gini، وM20، وإحصاءات الانتفاخ، Lotz et al., 2004)، وإحصاءات CAS (التركيز، واللاتناظر، والنعومة، Conselice, 2003)، وإحصاءات MID (تعدد الأنماط، والشدة، والانحراف، Freeman et al., 2013). ويمكن العثور على مراجعة جيدة لتعريف هذه المعاملات في Rodriguez-Gomez et al. (2019). نحسب المعاملات المورفولوجية لمجرات NIHAO NoAGN وNIHAO AGN ومجموعة اختبار SDSS باستخدام شيفرة statmorph المبينة أيضًا في Rodriguez-Gomez et al. (2019).

في الشكل 12 نقارن درجات الشذوذ بالمعاملات المورفولوجية عبر NIHAO وSDSS. تتفق كثير من المعاملات المورفولوجية مع درجة الشذوذ، كما في إحصاءات MID. ففي هذه الحالات تحصل مجرات NIHAO على درجة شذوذ أفضل عندما يطابق توزيع معاملاتها المورفولوجية توزيع مجرات SDSS على نحو أفضل. وعلاوة على ذلك، فإن الأداء العام لـ NIHAO NoAGN وNIHAO AGN متشابه تمامًا من حيث معظم المعاملات المورفولوجية، وهو ما يتفق مع ما وُجد في القسم 5.2 اعتمادًا على درجات الشذوذ. غير أن درجات الشذوذ تبدو غير متفقة مع بعض المعاملات المورفولوجية الأخرى. فعلى سبيل المثال، في حالتي اللاتناظر والنعومة88 8 قد تكون قيم اللاتناظر والنعومة العالية عند الطرف منخفض الكتلة من تجمع المجرات ناجمة، على نحو محتمل، عن اختيار PSF غاوسية مفردة بدلًا من PSF غير الغاوسية في صور SDSS الحقيقية(Stoughton et al., 2002; Xin et al., 2018)، لأن مناطق تشكّل النجوم المتكتلة غالبًا ما تكون مدمجة الحجم، كما هو مبين في Bignone et al. (2020); de Graaff et al. (2022). ومن الممكن أن تؤثر القيمة المتزايدة للاتناظر أيضًا في درجة الشذوذ، وهي مقياس كلي يتكون من 128 سمة. وسنستكشف الأوزان بين السمات المختلفة في عمل لاحق.، توجد أدنى درجات الشذوذ لـ NIHAO AGN عند أعلى الكتل، حيث يتباعد توزيع اللاتناظر والنعومة بين NIHAO AGN وSDSS. وإضافة إلى ذلك، في حالة M20، على الرغم من أن توزيع M20 بين NIHAO وSDSS يتطابق جيدًا إلى حد معقول عبر جميع حاويات الكتلة، فإن درجة الشذوذ يمكن أن تظل متغيرة. ويُظهر الاتفاق بين المعاملات المورفولوجية ودرجات الشذوذ وجود بعض التداخلات بين هذين النهجين، بينما يشير الاختلاف بين المعاملات المورفولوجية ودرجات الشذوذ إلى أن النهجين غير متكافئين.

وبخلاف علاقات القياس المبنية على الخواص الفيزيائية، فإن المعاملات المورفولوجية ودرجات الشذوذ تستندان كلتاهما إلى صور المجرات. لذلك ليس مفاجئًا أن تكون علاقات القياس ودرجات الشذوذ متكاملة، في حين تتقارب المعاملات المورفولوجية ودرجات الشذوذ أكثر وتتشارك كثيرًا من مواطن التداخل. غير أن المعاملات المورفولوجية مقاييس خاضعة للإشراف لوصف صور المجرات، بينما يمثل GANomaly نهجًا غير خاضع للإشراف يلخص صورة المجرة في 128 سمة. ويضمن النهج الخاضع للإشراف بحكم بنائه قابلية أكبر للتفسير، بينما يهدف النهج غير الخاضع للإشراف إلى استغلال كامل معلومات صور المجرات قدر الإمكان. ويمكن لـ GANomaly، المحسَّن لاستخراج سمات قادرة على إعادة بناء صورة مجرة على نمط SDSS بالكامل، أن يستغل معلومات من صورة المجرة أكثر مما تستغله مجموعة من المعاملات المورفولوجية المحددة بشريًا. ويمكن استكشاف الصلة الدقيقة بين درجة الشذوذ والمعاملات المورفولوجية بربط فضاء سمات GANomaly بالمعاملات المورفولوجية. غير أن حجم فضاء سمات GANomaly الحالي البالغ 128 كبير جدًا بحيث يصعب تفسيره بسهولة. وفي الملحق A حاولنا خفض بعد فضاء السمات باستخدام تحليل المركبات الرئيسة (PCA). وفي عمل قادم، سنُدخل الندرة في فضاء سمات GANomaly ونشجع فضاء السمات على الانكماش تلقائيًا إلى حجم أمثل. وسيكون فضاء سمات sparse-GANomaly أكثر قابلية للتفسير، وستُدرس صلته بالمعاملات المورفولوجية دراسة شاملة، بما يتيح الاستغلال الكامل للصور الصورية مع تعظيم قابلية التفسير.

Refer to caption
Figure 12: معاملات مورفولوجية متنوعة مقارنة بدرجات الشذوذ لكل من SDSS (دائرة)، وNIHAO AGN (مربع)، وNIHAO NoAGN (مثلث). تُظهر قيمة y للنقاط اتجاه الوسيط للمعاملات المورفولوجية، وتشير المنطقة المظللة إلى النطاق المئوي من 16th إلى 84th. رُمّزت مجرات NIHAO لونيًا حسب متوسط درجة الشذوذ عبر 20 اتجاهات مختلفة. بوجه عام، تمتلك مجرات NIHAO درجة شذوذ أقل (لونًا أغمق) عندما يطابق المعامل المورفولوجي نظيره في SDSS على نحو أفضل، ويظهر ذلك بأوضح صورة في العمود الأيمن من إحصاءات MID. ومع ذلك، لا تتفق درجة الشذوذ والمعاملات المورفولوجية دائمًا، كما في اللاتناظر والنعومة وM20.

8 الخلفية

عند التمعن في أي «صورة مجرة» مشار إليها في هذا العمل (مثل الشكل 3،9)، قد يلاحظ المرء أن مساحة كبيرة من الصورة تشغلها الخلفية (فراغات سوداء وتوابع)، لا المجرة محل الاهتمام. أشار Zanisi et al. (2021) إلى أن الخلفية لها أثر غير مهمل في حكم الشذوذ عند استخدام PixelCNN مفردة. يعمل PixelCNN بطريقة مشابهة للخسارة السياقية في GANomaly، con، حيث تُقارن كل من الصورة الأصلية والمعاد بناؤها بكسلًا ببكسل. وينعكس أي اختلاف في أي بكسل في درجة الشذوذ، بغض النظر عما إذا كان البكسل ينتمي إلى المجرة أم إلى الخلفية. واضطر Zanisi et al. (2021) إلى معالجة هذه المسألة بتدريب شبكتين منفصلتين من PixelCNN. أما في GANomaly، فتُعرَّف درجة الشذوذ فقط بخسارة المُرمِّز enc، أي الفرق بين السمات الأصلية والمعاد بناؤها. وينبغي لأي ضجيج في الخلفية لا يكون سمة مشتركة بين مجموعة التدريب ألا يؤثر بدرجة ملحوظة في درجة الشذوذ. فعلى سبيل المثال، في الشكل 13، أُزيل تابع خلفي يدويًا من مجرة SDSS مختارة عشوائيًا. ويؤدي هذا التغير في الخلفية بالفعل إلى فرق واضح في المتبقي على مستوى البكسل، كما تنبأ (Zanisi et al., 2021)، لكن درجة الشذوذ تبقى مستقرة إلى حد بعيد.

Refer to caption
Refer to caption
Figure 13: يعرض الصف العلوي صورة مجرة SDSS لها بعض التوابع في خلفيتها، ويعرض الصف السفلي مجرة SDSS نفسها بعد إزالة التوابع يدويًا. تؤدي الخلفية المختلفة إلى متبق مختلف (اللوحة في أقصى اليمين، الخسارة السياقية)، لكنها تعطي درجة شذوذ شبه متماثلة (موسومة في الأعلى، خسارة المُرمِّز).

9 الاستنتاجات

في هذه الورقة، قدمنا خوارزمية كشف شذوذ هي GANomaly، تُدرَّب فقط على مجرات حقيقية بهدف تقييم محاكاة المجرات كميًا. واستنادًا إلى فكرة كشف الشذوذ بإعادة البناء، يجمع GANomaly بين GAN وشبكة مُرمِّز تلقائي، بحيث يلخص أولًا صورة الدخل في تمثيلها في فضاء السمات/الفضاء الكامن، ثم يعيد بناء الصورة نفسها. ويُدرَّب GANomaly بالكامل على مجموعة بيانات طبيعية، ولذلك، بعد التدريب، لن تُعاد بناء أي صور شاذة أو قيم خارجة في الصورة. ويُقاس الشذوذ كميًا بتعريف درجة الشذوذ بوصفها الفرق في فضاء السمات قبل إعادة البناء وبعدها. وعلاوة على ذلك، نهتم فقط بدرجات الشذوذ النسبية بين مجموعات المحاكاة المختلفة. لاحظ أن هذه الاستراتيجية تضمن كذلك ألا تدخل أي لااتساق في عملية توليد الصور الصورية في التقييم.

ولتقييم محاكاة المجرات مقارنة بالأرصاد الحقيقية، نعامل صور SDSS في نطاقات i-r-g بوصفها بيانات المجموعة الطبيعية لتدريب GANomaly، ثم نطبق النموذج المدرَّب لتقييم الأرصاد الصورية لمحاكاة مجرات NIHAO. ومن خلال مقارنة محاكاة NIHAO مع تطبيق AGN ومن دونه، نجد أن نموذج AGN الحالي في NIHAO لا يحسن ولا يضعف الجودة العامة لصور المجرات. وإضافة إلى ذلك، نجد أن الدقة الإضافية في المحاكاة لا تؤثر في جودة الصورة الصورية بعد الالتفاف.

والأهم من ذلك أننا نرى أيضًا أن الالتزام بعلاقات قياس المجرات لا يرتبط مباشرة بدرجات الشذوذ. وهذا يشير إلى أن النجاح في إعادة إنتاج مجموعات معينة من خواص المجرات وعلاقات قياسها لا يعلن الانتصار النهائي في محاكاة كوننا، بل إن مجرة محاكاة تلائم علاقات القياس جيدًا يمكن أن تُظهر مع ذلك شذوذات عند النظر إلى صورة المجرة الكاملة. وبالمثل، فإن النظر إلى الصور وحدها قد يغفل بعض الرؤى الفيزيائية المهمة التي لا يمكن وصفها بالكامل بالصورة نفسها. ولتحقيق الهدف النهائي المتمثل في نمذجة كوننا، يجب على المحاكاة أن تعيد إنتاج كل من علاقات القياس المرصودة وصور المجرات الواقعية.

ومن جهة أخرى، يكرس كل من المعاملات المورفولوجية وGANomaly جهده لفحص صور المجرات. تفحص المعاملات المورفولوجية الصورة بطريقة خاضعة للإشراف، بمعاملات معرفة بوضوح، ومن ثم فهي أكثر قابلية للتفسير. أما GANomaly فهو طريقة تعلم عميق غير خاضعة للإشراف تبني فضاء سمات من البيانات، بحيث يستطيع فضاء السمات تمثيل صورة مجرة واقعية تمثيلًا كاملًا. يملك النهجان كليهما مزاياهما بوضوح، وسيتيح الجمع بينهما لنا تسخير قوة التعلم العميق من دون فقدان قابلية التفسير، ومن ثم استغلال المعلومات الغنية التي تحملها صور المجرات استغلالًا كاملًا.

يفحص نموذج GANomaly الموصوف في هذه الورقة صور المجرات المرصودة، أو المرصودة صوريًا، في نطاقات SDSS i-r-g. ولا يقتصر النموذج مطلقًا على حزمة محاكاة بعينها مثل NIHAO، بل يمكن تطبيقه مباشرة على أي محاكاة مجرات أخرى متى صُنعت أرصاد صورية في نطاقات SDSS i-r-g. كما أن الخوارزمية نفسها غير محدودة بتلسكوب أو مسح بعينه (SDSS)، ولا بمجموعة خرائط معينة (خريطة شدة النطاقات i-r-g). ويمكن إعادة تدريب GANomaly على صور من تلسكوبات أخرى، وبأطوال موجية مختلفة، أو حتى على خرائط مختلفة، مثل خرائط السرعة وخرائط الكثافة، لكشف الشذوذ إما في البيانات المحاكاة أو القيم الخارجة في الأرصاد نفسها.

ومع اتجاهنا نحو عصر من المحاكاة من الجيل التالي، بنماذج أكثر تطورًا، ودقة أعلى، وحجوم أكبر، وفيزياء أكثر شمولًا، وفي الوقت نفسه نحو مرحلة متدفقة من البعثات الرصدية الكبرى والمسوح الواسعة، تزداد الحاجة إلى تقنيات تحليل قادرة على الاستفادة المثلى من هذا التدفق الهائل من البيانات (بما يتجاوز الإحصاءات الملخصة الخالصة) الآتي من المحاكاة والأرصاد معًا. وستسهم تقنيات كشف الشذوذ، مثل GANomaly، إلى جانب الطرائق التقليدية مثل علاقات القياس والمعاملات المورفولوجية، في إلقاء ضوء جديد على فهمنا للكون.

الشكر والتقدير

تستند هذه المادة إلى عمل مدعوم من Tamkeen ضمن منحة CASS التابعة لمعهد الأبحاث في جامعة نيويورك أبوظبي. أُجري هذا البحث على موارد الحوسبة عالية الأداء في جامعة نيويورك أبوظبي. ونعرب عن امتناننا لـ Gauss Centre for Supercomputing e.V. (www.gauss-centre.eu) لتمويل هذا المشروع من خلال توفير وقت حوسبة على الحاسوب الفائق GCS SuperMUC في Leibniz Supercomputing Centre (www.lrz.de). وأتاح هذا البحث عدد كبير من حزم Python المتميزة، بما في ذلك Pynbody (Pontzen et al., 2013)، وPyTorch (Paszke et al., 2019)، وAstropy (Astropy Collaboration et al., 2013, 2018, 2022)، وNumPy (Harris et al., 2020)، وMatplotlib (Hunter, 2007)، وseaborn (Waskom, 2021). يقر MP بالدعم المالي من برنامج البحث والابتكار Horizon 2020 التابع للاتحاد الأوروبي بموجب اتفاقية منحة Marie Sklodowska-Curie رقم 896248. وقد أُتيح إسهام TB في هذا المشروع بفضل تمويل من Carl Zeiss Foundation.

توافر البيانات

يقع نموذج GANomaly الجاهز للاستخدام لتقييم محاكاة المجرات، إلى جانب الشيفرة اللازمة لإنتاج كل الرسوم في هذه الورقة، في https://github.com/ZehaoJin/Rate-galaxy-simulation-with-Anomaly-Detection.

References

Appendix A استكشاف الفضاء الكامن لـ GANomaly

للحصول على فهم أفضل للمتغيرات الكامنة التي يستخدمها GANomaly لترميز صور مجراتنا، نجري تحليل المركبات الرئيسة (PCA) على الفضاء الكامن ذي الأبعاد 128، z. لاحظ أن درجة الشذوذ تُعرَّف بالمسافة في الفضاء الكامن قبل إعادة البناء وبعدها، z-z^. ومن ثم، فإن العثور هنا على مركبة رئيسة مهمة في z يعني فقط أن هذه المركبة الرئيسة ذات أهمية للصورة قبل إعادة البناء، لكنه لا يكشف شيئًا عن درجة الشذوذ، z-z^. لذلك، لا نستكشف هنا ما تعنيه درجة الشذوذ ولا ما المعيار الذي يستخدمه GANomaly لتقييم صورة مجرة، بل نحاول فهم ما أهم الخواص لصورة المجرة.

في الشكل 14، نعرض كسر التباين المفسَّر لأول اثنتي عشرة مركبة رئيسة (أعلى) ولكل المركبات الرئيسة بمقياس لوغاريتمي (أسفل). أُجري PCA بصورة منفصلة لمجرات SDSS ولكل مجموعة من محاكاة NIHAO. ويتضح من هذه الرسوم أن البعد الذاتي للفضاء الكامن مرتفع نسبيًا، لأن المركبة الرئيسة الأولى لعينات SDSS لا تفسر إلا نحو 25 في المئة من التباين الكلي. وعلى الرغم من أن السلوك العام لـ SDSS ومختلف عينات NIHAO متشابه، فإن هناك فرقًا يتمثل في أن المركبات الأقل أهمية تفسر تباينًا أكبر في SDSS مقارنة بـ NIHAO. ونخمن أن ذلك قد يرجع إلى ضجيج رصدي فعلي ناتج من التأثيرات الآلية وغيرها، وهو ضجيج يصعب ضغطه.

وبصرف النظر عن ذلك، نجد أن عينات NIHAO تقع عمومًا ضمن النطاق الواقعي للفضاء الكامن الذي تمتد عليه مجرات SDSS، كما يبين الشكل 15، حيث نرسمها في مستوى أول مركبتين رئيستين. لبعض مجرات NIHAO قيم PC1s أدنى قليلًا من قيم مجرات SDSS، ولبعض مجرات NIHAO قيم PC2s أعلى أو أدنى من قيم مجرات SDSS.

في الشكل 16 نعرض عينة من صور مجرات SDSS مرتبة حسب قيمة PC الأولى (اللوحة العلوية)، وعينة مرتبة حسب قيمة PC الثانية (اللوحة السفلية). ويبدو أن المركبة الرئيسة الأولى ترتبط بالحجم الظاهري للمجرة في الصورة، والثانية باللون. وفي ضوء هذا التفسير، يبين الشكل 15 أن بعض مجرات NIHAO لها أحجام ظاهرية صغيرة جدًا، ويمكن معالجة ذلك في أعمال مستقبلية. وتمتلك بعض مجرات NIHAO الأخرى ألوانًا مفرطة التطرف قد تعود إلى أسباب عدة، مثل اختلاف في SFR أو حدود نموذج الغبار، لكن المعنى الفيزيائي الدقيق لذلك يحتاج إلى استكشاف بمزيد من التفصيل، ونتركه لعمل مستقبلي.

Refer to caption
Refer to caption
Figure 14: كسر التباين المفسَّر بدلالة رتبة المركبة الرئيسة. تُعرض SDSS باللون البني، وتُعرض عينات NIHAO بدرجات مختلفة من الأزرق (NIHAO No AGN بالأزرق الفاتح، وNIHAO AGN بالأزرق الأرجواني، وNIHAO UHD بالأزرق الداكن، وNIHAO n80 بالأزرق المخضر). تعرض اللوحة العلوية أول اثنتي عشرة مركبة فقط مع المحور y بمقياس خطي، وتعرض اللوحة السفلية كل المركبات 128 مع المحور y بمقياس لوغاريتمي.
Refer to caption
Figure 15: رسم المركبة الرئيسة الأولى مقابل المركبة الرئيسة الثانية لمجرات SDSS (بالأخضر). أُسقطت عينات مجرات NIHAO على أول مركبتين رئيستين لـ SDSS، وتُعرض بدرجات مختلفة من الأزرق.
Refer to caption
Refer to caption
Figure 16: صور لعينة من مجرات SDSS مرتبة حسب المركبة الرئيسة الأولى (اللوحات العلوية) وحسب المركبة الرئيسة الثانية (اللوحات السفلية).