معرّف ArXiv: 2505.02677v1
LaTeX الأصلي: ./nyuad_arxiv_papers/nyuad_papers_comprehensive/source_code/2505.02677v1_extracted/main.tex
تم التحويل: 2025-06-06 13:15:52

التعلم العميق متعدد الوسائط لتنبؤ واكتشاف السكتة الدماغية باستخدام تصوير الشبكية والبيانات السريرية

سعيد شُرّاب\(^{1}\)، أديم نيبال\(^{1}\)، تيرينس جي. لي-سانت جون\(^{2}\)، نيكولا جي. غازي\(^3\)
بارتولومييج بيتشوفسكي-جوزوياك\(^{3}\)، وفراح إي. شاموت\(^{1}\) 1 2 3 4

الملخص

تُعد السكتة الدماغية من أبرز المشكلات الصحية العامة، حيث تؤثر على ملايين الأشخاص حول العالم. أظهرت تقنيات التعلم العميق مؤخرًا إمكانات واعدة في تعزيز تشخيص السكتة الدماغية وتنبؤ مخاطرها. إلا أن الأساليب الحالية تعتمد غالبًا على تقنيات تصوير طبية باهظة الثمن مثل التصوير المقطعي المحوسب. تشير دراسات حديثة إلى أن تصوير الشبكية قد يوفر بديلاً فعالاً من حيث التكلفة لتقييم صحة الأوعية الدموية الدماغية، نظرًا للتشابه في المسارات السريرية بين الشبكية والدماغ. بناءً عليه، تستكشف هذه الدراسة أثر الاستفادة من صور الشبكية والبيانات السريرية في اكتشاف السكتة الدماغية وتنبؤ مخاطرها. نقترح شبكة عصبية عميقة متعددة الوسائط تعالج صور التصوير المقطعي البصري التوافقي (OCT) وصور انعكاس الأشعة تحت الحمراء للشبكية، بالإضافة إلى بيانات سريرية مثل المعلومات الديموغرافية، العلامات الحيوية، وأكواد التشخيص. قمنا بتدريب النموذج مبدئيًا باستخدام إطار تعلم ذاتي الإشراف على مجموعة بيانات حقيقية تتكون من \(37\) ألف صورة، ثم قمنا بضبط النموذج وتقييمه باستخدام مجموعة فرعية صغيرة معنونة. أظهرت نتائجنا التجريبية قدرة الوسائط المدروسة على التنبؤ بالكشف عن التأثيرات المستمرة في الشبكية المرتبطة بالسكتة الدماغية الحادة وتوقع خطر الإصابة في أفق زمني محدد. أظهرت النتائج فعالية الإطار المقترح بتحقيق تحسن في مقياس AUROC بنسبة \(5\)% مقارنة بنموذج الصور الأحادي، وتحسن بنسبة \(8\)% مقارنة بنموذج الأساس المتقدم. في الختام، تبرز دراستنا إمكانات تصوير الشبكية في تحديد المرضى الأكثر عرضة للخطر وتحسين النتائج الصحية على المدى الطويل. الأهمية السريرية— توضح هذه الدراسة إمكانات نماذج التعلم العميق في الاستفادة من صور الشبكية والبيانات السريرية لتنبؤ واكتشاف خطر السكتة الدماغية. يشجع النهج المقترح على تطوير تقنيات غير جراحية وفعالة من حيث التكلفة لتقييم خطر السكتة الدماغية، مما قد يساهم على المدى البعيد في تقليل عبء السكتة الدماغية عالميًا وتحسين النتائج الصحية من خلال التدخل المبكر.

المقدمة

تُعد السكتة الدماغية من الأسباب الرئيسية للوفاة والإعاقة طويلة الأمد على مستوى العالم، خاصة بين كبار السن. يشكل عبء السكتة الدماغية تحديًا صحيًا عالميًا متزايدًا، حيث لوحظ ارتفاع ملحوظ في معدلاتها بين عامي 1990 و2019، مع تسجيل أعلى نسب في الدول ذات الدخل المنخفض والمتوسط. يبرز ذلك الحاجة الملحة إلى تطوير نماذج دقيقة لتنبؤ خطر السكتة الدماغية، بما يتيح الوقاية المبكرة لدى الأفراد الأكثر عرضة.

تحدث السكتة الدماغية نتيجة انسداد أحد شرايين الدماغ (السكتة الإقفارية) والتي تمثل حوالي \(80\%\) من الحالات، أو نتيجة تمزق أحد الشرايين الدماغية (السكتة النزفية). تشمل عوامل الخطر الشائعة وجود أمراض مزمنة مثل السكري، الرجفان الأذيني، ارتفاع ضغط الدم، والفشل الكلوي، أو عوامل نمط الحياة مثل التدخين. يتم تشخيص السكتة الدماغية بناءً على ظهور مفاجئ للأعراض وتدهور سريع في حالة المريض، مما يستدعي التدخل السريع لتقليل الضرر الدماغي والحد من المضاعفات.

صورة توضيحية

يُعد التصوير المقطعي المحوسب (CT) والتصوير بالرنين المغناطيسي (MRI) المعيار الذهبي لتشخيص السكتة الدماغية بعد ظهور الأعراض. إلا أن هذه التقنيات مكلفة، وتستغرق وقتًا نسبيًا، وتعتمد على توفرها في المراكز الصحية. لذا تبرز الحاجة إلى استكشاف تقنيات أخرى فعالة وأقل تكلفة يمكن استخدامها لتقييم خطر السكتة الدماغية قبل ظهور الأعراض.

من المعروف أن الشبكية والدماغ يشتركان في الأصل التشريحي والفسيولوجي والجنيني، مما يجعل الشبكية مرشحًا واعدًا لفهم التغيرات التي تحدث في الدماغ. أظهرت أبحاث حديثة في طب الأعصاب العيني أن التصوير المقطعي البصري التوافقي (OCT) قادر على رصد تغيرات عصبية تعكس حالة الدماغ. يُعد OCT تقنية سريعة وغير جراحية وفعالة من حيث التكلفة، وتوفر صورًا عالية الدقة للأنسجة الشبكية. وقد أثبتت دراسات حديثة أهمية تصوير OCT في تشخيص أمراض عصبية متعددة مثل الزهايمر. يندرج هذا العمل ضمن مجال بحثي ناشئ يُعرف بـ العينوميات (Oculomics)، والذي يهدف إلى تعزيز فهمنا للصحة والأمراض الجهازية من خلال التصوير الشبكي عالي الدقة وتقنيات علم البيانات.

أسهم الذكاء الاصطناعي، وخاصة التعلم الآلي والعميق، بشكل كبير في تطوير الرعاية الصحية وتحسين التشخيص والتنبؤ والعلاج. في طب العيون، توفر تعقيدات البيانات متعددة الوسائط وتقنيات الذكاء الاصطناعي أساسًا قويًا لاستكشاف العلاقة بين العين والجسم. على سبيل المثال، ركزت العديد من الدراسات على استخدام صور الشبكية مع التعلم الآلي لتنبؤ أمراض القلب والأوعية الدموية والأمراض العصبية التنكسية. إلا أن الدراسات التي تناولت تحليل صور الشبكية لتنبؤ السكتة الدماغية باستخدام التعلم الآلي لا تزال محدودة. تركز الأعمال السابقة غالبًا على استخراج مؤشرات حيوية شبكية لنماذج تعلم آلي إحصائية مثل الانحدار والنماذج الشجرية، وذلك من صور قاع العين الملونة وتصوير OCT للأوعية الدموية.

حاولت بعض الدراسات تطوير نماذج تعلم عميق لتنبؤ السكتة الدماغية باستخدام صور الشبكية. على سبيل المثال، قام باحثون بتدريب ثلاث شبكات عصبية التفافية (CNN) لتنبؤ خطر السكتة خلال عام واحد باستخدام صور قاع العين بأطوال موجية مختلفة. كما طُوّر نموذج CNN آخر باستخدام صور OCT للأوعية الدموية لتمييز صور الشبكية بين مرضى السكتة وغيرهم. واقترحت دراسة أخرى نموذج أساس (RetFound) لتنبؤ أمراض جهازية متعددة، منها السكتة الإقفارية، ودُرّب باستخدام مجموعة بيانات ضخمة من صور قاع العين وOCT بشكل منفصل. أظهر النموذج أداءً واعدًا في التنبؤ بخطر السكتة خلال ثلاث سنوات على مجموعة التحقق الداخلية، لكنه لم يحقق نتائج مماثلة على مجموعة اختبار خارجية.

من هذا المنطلق، يمكن أن يسهم الاكتشاف الآلي للسكتة الدماغية باستخدام تصوير الشبكية في تحديد المرضى الأكثر عرضة للخطر عبر تقنيات غير جراحية ومنخفضة التكلفة مثل OCT. في هذه الدراسة، نقترح RetStroke (انظر الشكل)، وهو نموذج تعلم عميق مبني على أسس سريرية قادر على التنبؤ بالسكتة الدماغية باستخدام وسيلتين من تصوير الشبكية: OCT وصور انعكاس الأشعة تحت الحمراء. من العناصر المبتكرة في RetStroke اعتماده على بيانات سريرية ذات صلة تُجمع بشكل روتيني، مثل الأمراض المصاحبة (وفق أكواد التشخيص)، العلامات الحيوية، والمعلومات الديموغرافية، أثناء التدريب والتنبؤ لتعزيز الأداء. كما يتميز النموذج بقدرته على التنبؤ بخطر السكتة واكتشاف التأثيرات المستمرة بعد حدوثها. وعلى الرغم من بساطته، يبرز RetStroke فائدة التعلم متعدد الوسائط ويتفوق على نموذج الأساس المتقدم.

المنهجية

الموافقات الأخلاقية

حصلت هذه الدراسة على جميع الموافقات اللازمة من لجان الأخلاقيات البحثية في جامعة نيويورك أبوظبي (HRPP-2022-190) وعيادة كليفلاند أبوظبي (A-2022-059). لم تكن هناك حاجة للحصول على موافقة مستنيرة من المرضى حيث اعتُبرت الدراسة معفاة.

مجموعة البيانات

استخدمنا مجموعة بيانات خاصة جُمعت في عيادة كليفلاند أبوظبي (CCAD) بين مارس 2015 ويوليو 2023. تُعد CCAD مستشفى متعدد التخصصات يقدم خدمات الرعاية الأولية والثانوية والثالثية في أبوظبي، الإمارات العربية المتحدة. تتضمن مجموعة البيانات وسيلتين: بيانات سريرية مستخرجة من السجل الصحي الإلكتروني للمريض وصور تم جمعها خلال فحص OCT. جُمعت صور OCT باستخدام جهاز Heidelberg Spectralis، والذي يوفر صور OCT طيفية وصور انعكاس الأشعة تحت الحمراء لأجزاء مختلفة من العين مثل الشبكية، الشبكية المحيطة بالعصب البصري، والجزء الأمامي للعين. تشمل بيانات السجل الصحي الإلكتروني معلومات ديموغرافية، تشخيصات، قياسات العلامات الحيوية، وإجراءات سريرية.

معالجة البيانات

تصفية مجموعة المرضى

حددنا مجموعة من معايير الاشتمال والاستبعاد بالتعاون مع خبراء المجال لتحديد مجموعة مرضى السكتة الدماغية. اقتصرنا الدراسة على المرضى البالغين واستبعدنا جميع المرضى دون سن \(18\) عامًا عند الدخول. شملنا جميع الحالات المنومة التي تتوفر لها بيانات وقت الدخول والخروج، واستبعدنا الأنواع الأخرى من الحالات. بعد ذلك، شملنا جميع الحالات التي تحمل رمز تشخيص السكتة الدماغية وفق التصنيف الدولي للأمراض (ICD-10-CM). شملت رموز ICD المستهدفة: I60 (نزيف تحت العنكبوتية غير الرضحي)، I61 (نزيف دماغي غير رضحي)، I62 (نزيف داخل الجمجمة غير رضحي آخر وغير محدد)، I63 (احتشاء دماغي)، وG459 (نوبة نقص تروية دماغية عابرة غير محددة). شملنا جميع المرضى الذين خضعوا لتصوير CT أو تصوير الأوعية الدموية بالـCT. بعد ذلك، صنفنا نوع السكتة إلى نوبة نقص تروية عابرة (TIA)، سكتة إقفارية (IS)، ونزيف داخل الجمجمة (ICH) وفق رموز التشخيص. بالنسبة لمرضى TIA، أكدنا حدوث السكتة بناءً على صرف أدوية مضادة للصفيحات أثناء الإقامة. أما مرضى IS، فتم التأكيد بناءً على صرف منشط البلازمينوجين النسيجي (r-TPA) أو أدوية مضادة للصفيحات. أما مرضى ICH، فتم التأكيد بناءً على إقامة بالمستشفى تزيد عن \(12\) يومًا، وفق معايير المستشفى.

معالجة بيانات التصوير

حددنا أيضًا معايير الاشتمال والاستبعاد لمرضى مجموعة بيانات OCT. شملنا المرضى البالغين واستبعدنا من هم دون \(18\) عامًا. اقتصرنا الدراسة على المرضى الذين التقطت صورهم منطقة البقعة فقط. شملنا جميع المرضى الذين خضعوا لفحوصات OCT تلقائية في الوقت الحقيقي واستبعدنا أنماط المسح الأخرى. كما استبعدنا المرضى الذين لم تكن صور OCT الخاصة بهم مرتبطة بصور انعكاس الأشعة تحت الحمراء.

تنسيق مجموعة البيانات

استخدمنا معرفات المرضى لربط دراسات OCT مع حالات السكتة الدماغية. لكل دراسة OCT، أُعطي التصنيف الإيجابي إذا تم جمع الصورة خلال 365 يومًا (سنة واحدة) من حدوث السكتة الدماغية. أُعطي التصنيف السلبي إذا لم تكن الحالة ضمن 365 يومًا من السكتة. شملنا جميع العينات السلبية لزيادة متانة النموذج وتعكس التوزيع الواقعي حيث أن عدد المرضى الذين لديهم سكتة دماغية وصورة OCT قليل. اعتبرنا كل صورة (مسح) كعينة بيانات منفصلة. وأخيرًا، قسمنا مجموعة البيانات إلى مجموعة تدريب واختبار بنسبة \(80/20\)، مع ضمان عدم تسرب بيانات المريض بين المجموعتين.

معالجة البيانات السريرية

حددنا واستخرجنا مجموعة من الخصائص الثابتة من السجل الصحي الإلكتروني، تشمل العوامل الديموغرافية ونمط الحياة، قياسات العلامات الحيوية، وتاريخ الأمراض وفق أكواد ICD (بإجمالي 34 خاصية). شملت الفئة الأولى عمر المريض، الجنس، وحالة التدخين. شملت العلامات الحيوية مؤشر كتلة الجسم، ضغط الدم الانقباضي والانبساطي، درجة الحرارة، معدل النبض، ومعدل التنفس. استخدمنا العلامات الحيوية المأخوذة من نفس زيارة OCT إن وجدت، وإلا استخدمنا أحدث قياسات متوفرة قبل الزيارة. إذا لم تتوفر القياسات، استبدلناها بقيم "طبيعية" معيارية وفق المعرفة السريرية. مثّلنا تاريخ الأمراض باستخدام مجموعات أكواد ICD، واسترجعنا جميع أكواد التشخيص المسندة للمريض قبل زيارة OCT. رُمّزت المتغيرات الفئوية بطريقة one-hot، في حين تم تطبيع المتغيرات العددية باستخدام min-max.

عنونة البيانات للتدريب والتقييم

صغنا مهمة التنبؤ كنموذج تصنيف ثنائي باستخدام التصنيفات المسندة لصور OCT. تجدر الإشارة إلى أن طريقة العنونة لدينا تأخذ في الاعتبار كلتا الحالتين: حدوث السكتة قبل أو بعد التقاط صورة OCT. قمنا بتدريب وتقييم النموذج باستخدام هذا التصنيف العام نظرًا لصغر حجم مجموعة البيانات في هذه الدراسة الاسترجاعية.

افترض أن \(t_{OCT}\) هو وقت التقاط صورة OCT و\(t_{stroke}\) هو وقت حدوث السكتة الدماغية. قمنا أيضًا بتقييم النموذج في سيناريوهين إضافيين: تنبؤ الخطر (حيث تحدث السكتة بعد OCT: \(t_{stroke} > t_{OCT}\))، واكتشاف التأثيرات المستمرة (حيث تحدث السكتة قبل OCT: \(t_{stroke} < t_{OCT}\)). ولتحليل أكثر تفصيلاً، قيمنا أداء النموذج عبر آفاق زمنية مختلفة (\(N\) يومًا)، تشمل 90، 180، 270، و365 يومًا.

نموذج التنبؤ

صياغة المشكلة

افترض أن \(\mathcal{D} = \{(x_{oct}^{i}, x_{ehr}^{i}, y^{i}) \mid i = 1, 2, \dots, n\}\) هي مجموعة بيانات معنونة متعددة الوسائط، حيث \(n\) هو عدد العينات. لتمثل \(x^{i}_{oct}\in \mathbb{R}^{h\times w}\) صورة OCT، حيث \(h\) و\(w\) هما الارتفاع والعرض. وترتبط الصورة بـ\(x^{i}_{ehr} \in \mathbb{R}^{s}\)، وهو متجه خصائص ثابتة مستخرجة من بيانات السجل الصحي للمريض، حيث \(s\) هو عدد الخصائص. كل زوج بيانات (\(x^{i}_{oct}\)، \(x^{i}_{ehr}\)) مرتبط بتصنيف حقيقي \(y^{i} \in \{0,1\}\) يمثل حالة السكتة الدماغية. هدفنا هو تدريب شبكة عصبية متعددة الوسائط قادرة على التنبؤ بـ\(y^i\) بناءً على البيانات المدخلة.

البنية

يُعد RetStroke شبكة عصبية متعددة الوسائط مصممة لمعالجة بيانات التصوير والمعلومات السريرية. يتكون النموذج المقترح من أربعة وحدات: (1) مشفر بصري يُمثل بشبكة CNN ويرمز له بـ\(f_{oct}\)، (2) مشفر بيانات السجل الصحي يُمثل بشبكة إدراك متعددة الطبقات ويرمز له بـ\(f_{ehr}\)، (3) وحدة دمج غير معلمية يُرمز لها بـ\(\oplus\)، و(4) رأس تنبؤ يُمثل بطبقة متصلة بالكامل ويرمز له بـ\(g_{fuse}\). نوضح فيما يلي دور كل وحدة.

أولاً، تُشفّر صورة OCT، \(x_{oct}\)، بواسطة المشفر البصري \(f_{oct}\) للحصول على التمثيل \(z_{oct}\). كما تُشفّر بيانات السجل الصحي الثابتة \(x_{ehr}\) عبر المشفر \(f_{ehr}\) للحصول على التمثيل \(z_{ehr}\). يستخدم RetStroke استراتيجية الدمج المتأخر لدمج المعلومات من كلا الوسيطين. لكل من المشفر البصري ومشفر السجل الصحي رأس تنبؤ خاص به يُرمز لهما بـ\(g_{oct}\) و\(g_{ehr}\)، على التوالي، لمعالجة \(z_{oct}\) و\(z_{ehr}\) والحصول على تنبؤات خاصة بكل وسيط \(p_{oct}\) و\(p_{ehr}\). تُدمج التنبؤات عبر وحدة الدمج \(\oplus\) وتُمرر إلى رأس التنبؤ الرئيسي للنموذج \(g_{fuse}\) للحصول على التنبؤ النهائي \(\hat{y}\). استخدمنا دالة خسارة الانتروبيا الثنائية (BCE) لتدريب النموذج: \[\label{bce} \mathcal{L} = - \frac{1}{n} \sum_{i=1}^n \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right].\]

استراتيجية التدريب

نظرًا لصغر حجم مجموعة البيانات المعنونة لتدريب RetStroke، اعتمدنا استراتيجية تدريب من مرحلتين: تدريب ذاتي الإشراف للمشفر البصري باستخدام بيانات غير معنونة، يليه ضبط دقيق باستخدام البيانات المعنونة. في مرحلة التدريب الذاتي، استخدمنا إطار SimCLR، وهو إطار تدريب غير إشرافي يعتمد على خسارة التباين لتعلم تمثيلات عالية الجودة. تتيح خسارة التباين للنموذج تعلم تمثيلات من خلال تعظيم التشابه بين الأزواج الإيجابية وتقليله مع الأزواج السلبية: \[\label{contrastive} \mathcal{L}_{i,j} = -\log\frac{\exp\left(\text{sim}\left(\mathbf{z}_{i}, \mathbf{z}_{j}\right)/\tau\right)}{\sum^{2K}_{k=1}1_{[k\neq{i}]}\exp\left(\text{sim}\left(\mathbf{z}_{i}, \mathbf{z}_{k}\right)/\tau\right)},\]

حيث K هو عدد العينات في الدفعة، \(\mathbf{z}\) هو التمثيل الكامن الناتج عن المشفر البصري، و\(\tau\) هو معامل درجة الحرارة الذي يتحكم في حدة درجات التشابه بين الأزواج. بدلاً من تثبيت \(\tau\)، استخدمنا معامل درجة حرارة قابل للتعلم يتم تعديله تلقائيًا أثناء التدريب.

لأغراض التدريب الذاتي، أنشأنا مجموعتي بيانات OCT وواحدة لانعكاس الأشعة تحت الحمراء. ونظرًا لأن مسح OCT ثلاثي الأبعاد ويحتوي على عدة شرائح (بين 25 و49 شريحة)، اعتبرنا كل شريحة عينة مستقلة، ما نتج عنه مجموعة بيانات تضم \(1.1\) مليون صورة. أما مجموعة بيانات التدريب الثانية فشملت الشريحة الوسطى فقط من كل حجم OCT، بينما شملت مجموعة بيانات الأشعة تحت الحمراء صورة واحدة من كل دراسة. قُسمت مجموعات بيانات التدريب بنسبة \(90/10\) بين التدريب والتحقق. بعد التدريب الذاتي، استخدمنا الأوزان المدربة لتهيئة المشفر البصري \(f_{oct}\) في RetStroke، ثم قمنا بضبط النموذج بالكامل باستخدام تصنيفات السكتة الدماغية.

إعداد التجارب

تدريب النموذج المبدئي

لتجهيز SimCLR للتدريب المبدئي، اتبعنا نفس التحسينات المستخدمة في الورقة الأصلية، بما في ذلك القص العشوائي، وتغيير الألوان، والتغبيش الغاوسي، والتدوير العشوائي أفقيًا وعموديًا (تسمى تحسينات قاسية). كما حسبنا إحصائيات خاصة بمجموعة البيانات لاستخدامها في التطبيع. استخدمنا خوارزمية AdamW كخوارزمية تحسين، وحجم دفعة \(256\). كما استخدمنا جدولة معدل التعلم بطريقة الاضمحلال الكوني. بالنسبة لـ\(\tau\)، حددنا القيمة الابتدائية \(0.5\) وثبتناها عند \(0.1\) إذا انخفضت عن هذا الحد أثناء التدريب. دربنا كل نموذج لمدة \(200\) حقبة مع إيقاف مبكر (patience = \(10\) حقب وتغير أدنى \(1e-6\) في خسارة التحقق). كما قمنا بتحسين معدل التعلم وتفكك الأوزان بقيم ضمن \([1e-6, 1e-5]\) و\([0, 1e-1]\) على التوالي، باستخدام بحث عشوائي لعشرة تجارب لكل إعداد.

الضبط الدقيق للنموذج

استخدمنا ResNet-18 كأساس للمشفر البصري في RetStroke \(f_{oct}\). استخدمنا طبقتين متصلتين بالكامل مع تطبيع الدفعة وتفعيل ReLU لمشفر السجل الصحي \(f_{ehr}\). أما رأس التنبؤ \(g_{fuse}\) فكان طبقة خطية تعالج التنبؤات المدمجة من كلا المشفرين للحصول على التنبؤ النهائي. استخدمنا خوارزمية Adam مع جدولة معدل التعلم بطريقة الاضمحلال الكوني. بالنسبة لتحسين الصور، طبقنا تدوير أفقي عشوائي، وتدوير، وقص، وترجمة باحتمالية \(0.5\) (تسمى تحسينات بسيطة).

لتحسين معاملات RetStroke، أجرينا بحثًا بايزيًا مع التحقق المتقاطع K-fold. استخدمنا مساحة تحت منحنى ROC (AUROC) لاختيار أفضل النماذج باستخدام مجموعة التحقق. حددنا عدد الطيات بخمسة في جميع التجارب. شملت المعاملات المحسنة: معدل التعلم ضمن \([1e-6,5e-5]\)، تفكك الأوزان ضمن \([0,1e-3]\)، حجم الدفعة ضمن \([64,128,256]\)، ونوع التحسينات [بسيطة، قاسية]. حددنا عدد الحقبات أثناء التحسين بـ\(100\) مع إيقاف مبكر (patience = \(10\)). أجرينا \(100\) تجربة تحسين لكل إعداد. بعد التحسين، اخترنا النموذج الأفضل وفق AUROC وقيّمناه على مجموعة الاختبار. استخدمنا وحدات معالجة رسومية Nvidia A100 في جميع التجارب.

النماذج المرجعية

لتقييم متانة RetStroke، قارنا نتائجنا مع نموذجين مرجعيين: (1) التدريب الأحادي باستخدام الصور فقط، و(2) نموذج الأساس RetFound. يُعد RetFound نموذج أساس مدرب على مجموعة بيانات ضخمة وقادر على أداء مهام تنبؤية متعددة. قمنا بتجميد أوزانه واستخدمناه كمستخرج خصائص لضمان عدالة المقارنة. كما أجرينا تجربة مع RetFound بإضافة الخصائص السريرية المستخدمة في RetStroke لدراسة أدائه في بيئة متعددة الوسائط. وأخيرًا، استخدمنا نفس الإعدادات في تجاربنا لتدريب RetFound. للتقييم، أبلغنا عن AUROC، ومساحة تحت منحنى الاسترجاع والدقة (AUPRC)، والحساسية عند خصوصية ثابتة.

النتائج

بعد تطبيق معايير الاشتمال والاستبعاد لتحديد الحالات المصابة بالسكتة الدماغية، تكونت مجموعة المرضى من \(5,523\) مريضًا تم تشخيصهم بالسكتة، وارتبطوا بـ\(6,152\) حالة دخول للمستشفى. جُمعت مجموعة بيانات OCT الأولية من \(9,056\) مريضًا، وتضمنت \(23,708\) دراسة فريدة. بعد تطبيق معايير الاشتمال والاستبعاد على مجموعة OCT، أصبحت المجموعة تتكون من \(18,996\) دراسة OCT فريدة من \(7,427\) مريضًا. ربط المجموعتين نتج عنه \(468\) دراسة OCT إيجابية من \(183\) مريضًا مصابًا بالسكتة. تكونت المجموعة النهائية من \(37,587\) صورة لكلتا العينين، منها \(19,455\) للعين اليمنى و\(18,132\) لليسرى. يلخص الجدول التالي الخصائص الرئيسية لمجموعة البيانات النهائية المستخدمة لضبط RetStroke.

الأداء الكلي للنماذج الأحادية ومتعددة الوسائط.
الأداء الكلي لمقياس AUROC (\(\pm\) الانحراف المعياري) مقارنة بين النماذج الأحادية ومتعددة الوسائط.
النماذج أحادي الوسيط متعدد الوسائط
الأشعة تحت الحمراء
RetStroke 0.619 (0.032) 0.658 (0.013)
OCT
RetFound 0.600 (0.011) 0.684 (0.01)
RetStroke 0.637 (0.023) 0.683 (0.03)

يلخص الجدول أعلاه أداء RetStroke في الإعدادين الأحادي ومتعدد الوسائط لكل من الأشعة تحت الحمراء وOCT مقارنة بـRetFound، بينما يوضح الشكل النتائج بصريًا. باستخدام صور الأشعة تحت الحمراء، يحقق RetStroke قيمة AUROC تبلغ \(0.658\) مقارنة بنسخته الأحادية التي تحقق \(0.619\). أما في صور OCT، تحقق النسخة الأحادية من RetStroke أداءً أفضل من RetFound (0.637 مقابل 0.600 AUROC). علاوة على ذلك، يستفيد كل من RetStroke وRetFound من دمج المعلومات السريرية (أي الإعداد متعدد الوسائط).

لفهم أداء النموذج المقترح بشكل أفضل، أجرينا تحليلًا فرعيًا حسب عمر المريض، الأمراض المصاحبة، ونوع السكتة. كما هو موضح في الشكل، يحقق RetStroke أفضل أداء في الفئة العمرية \((40-60)\) سنة، بقيمة AUROC تبلغ \(0.740\) لـOCT و\(0.690\) للأشعة تحت الحمراء. في الفئة الأصغر سنًا (\(<40\))، ينخفض الأداء قليلاً ليصل إلى \(0.700\) لـOCT و\(0.670\) للأشعة تحت الحمراء. أما في الفئة الأكبر سنًا (\(>60\))، فيكون الأداء أقل نسبيًا (~\(0.640\)). يبلغ متوسط عمر العينة 57.8 سنة.

يوضح الشكل أداء RetStroke حسب نوع السكتة. نلاحظ أن النموذج يحقق أداءً أفضل في الأنواع الإقفارية (IS وTIA)، بقيمة AUROC تقارب \(0.710\) لكلا النوعين باستخدام OCT و\(0.650\) للأشعة تحت الحمراء. أما في حالات النزيف داخل الجمجمة (ICH)، فيكون الأداء أقل (\(0.61-0.63\)). يمكن تفسير ذلك بارتفاع نسبة السكتات الإقفارية (\(80\%\)) مقارنة بالنزفية (\(20\%\)).

أداء RetStroke حسب الأمراض المصاحبة: H00-H59 (أمراض العين وملحقاتها)، I00-I99 (أمراض الجهاز الدوري)، G00-G99 (أمراض الجهاز العصبي)، D50-D89 (أمراض الدم والأعضاء المكونة للدم وبعض الاضطرابات الأخرى).
أداء RetStroke حسب نوع السكتة (IS: سكتة إقفارية، ICH: نزيف داخل الجمجمة، TIA: نوبة نقص تروية عابرة).

يوضح الشكل أداء RetStroke بالنسبة للأمراض المصاحبة قبل التقاط الصورة. أفضل أداء تحقق لدى المرضى المصابين بأمراض الدم (D50-D89) باستخدام OCT (AUROC = 0.819)، بينما كان الأداء أقل بكثير مع الأشعة تحت الحمراء (0.711) لنفس الفئة. بالنسبة لأمراض الجهاز العصبي (G00-G99) والجهاز الدوري (I00-I99)، يحقق النموذج أداءً متقاربًا (AUROC ~0.760) باستخدام OCT. في المقابل، كان الأداء الأدنى لدى مرضى أمراض العين (H00-H59)، حيث بلغ AUROC 0.686 لـOCT و0.640 للأشعة تحت الحمراء. يتفق هذا مع أبحاث سابقة تشير إلى أن وجود أمراض عينية يقلل من دقة النماذج التنبؤية.

أداء RetStroke حسب الفئات العمرية.

درسنا أيضًا أداء RetStroke في تنبؤ السكتة واكتشاف التأثيرات المستمرة، كما هو موضح في الجدول. باستخدام الأشعة تحت الحمراء، يحقق النموذج أداءً أعلى في تنبؤ خطر السكتة خاصة في أول ستة أشهر (AUROC = \(0.774\) و\(0.766\) للفترتين \(<90\) و\(<180\) يومًا). مع زيادة الفترة الزمنية، ينخفض الأداء بشكل ملحوظ ليصل إلى أقل من \(0.710\) للفترتين \(<270\) و\(<365\) يومًا. أما في اكتشاف التأثيرات المستمرة، فيكون الأداء أقل (AUROC بين \(0.620\) و\(0.640\)).

أما باستخدام صور OCT، فيحقق النموذج AUROC = \(0.723\) و\(0.736\) لتنبؤ الخطر خلال \(<90\) و\(<180\) يومًا على التوالي. ينخفض الأداء مع الفترات الأطول ليصل إلى أقل من \(0.71\). في اكتشاف التأثيرات المستمرة، يحقق النموذج أداءً متقاربًا عبر أول ثلاث فترات زمنية (AUROC بين \(0.705-0.719\)). من الملاحظ أن RetStroke يحقق أداءً أفضل في تنبؤ الخطر باستخدام الأشعة تحت الحمراء، بينما يتفوق OCT في اكتشاف التأثيرات المستمرة عبر جميع الفترات.

أخيرًا، يوضح الجدول التالي حساسية RetStroke في تنبؤ الخطر عبر الأشعة تحت الحمراء وOCT عند خصوصية 0.5. يحقق النموذج أداءً أفضل نسبيًا مع OCT مقارنة بالأشعة تحت الحمراء.

المناقشة والاستنتاجات

في هذا البحث، قدمنا RetStroke، إطارًا مبنيًا على أسس سريرية قادرًا على الاستفادة من صور الشبكية لاكتشاف وتنبؤ السكتة الدماغية. يتميز RetStroke بكونه متعدد الوسائط، حيث يدمج الأمراض المصاحبة، العلامات الحيوية، والمعلومات الديموغرافية أثناء التدريب والتنبؤ لتعزيز الدقة. أظهر RetStroke تفوقًا ملحوظًا مقارنة بالنماذج الأحادية المعتمدة على الصور فقط مثل OCT والأشعة تحت الحمراء. كما حقق أداءً أفضل من نموذج الأساس RetFound، الذي يتكون من حوالي \(300\) مليون معامل ودُرّب على مجموعة بيانات OCT أكبر بكثير في بيئة أحادية. درسنا أيضًا دمج المعلومات السريرية في RetFound وأظهرنا أن ذلك يحسن الأداء بشكل كبير، مما يبرز أهمية المعلومات السريرية في إطارنا المقترح. بالإضافة إلى ذلك، أظهر تقييم RetStroke عبر مجموعات فرعية متنوعة من المرضى (العمر، نوع السكتة، الأمراض المصاحبة) متانته. بشكل عام، يُعد RetStroke إضافة فريدة لمجال العينوميات لتعزيز فهمنا لأمراض هامة مثل السكتة الدماغية.

يمنح التصميم الفريد لـRetStroke عدة مزايا تخدم الأطباء والباحثين في الذكاء الاصطناعي وتفتح آفاقًا بحثية واعدة. أولاً، يلبي RetStroke حاجة سريرية غير ملباة عبر تطوير طرق فحص السكتة باستخدام بيانات منخفضة التكلفة وسريعة التحصيل ومستقلة عن ظهور الأعراض، مما يعزز الوقاية. كما يعمل النموذج على جبهتين: تنبؤ خطر السكتة واكتشاف التأثيرات المستمرة في الشبكية، ما يساعد في الوقاية ويوفر رؤى حول التغيرات الشبكية الناتجة عن السكتة والتي تؤثر مباشرة على صحة العين.

من الناحية التقنية، يعتمد RetStroke على شبكة بسيطة وخفيفة (ResNet-18) أقل استهلاكًا للموارد مقارنة بـRetFound، كما يعتمد على تقنيات دمج مباشرة تقلل من تعقيد النموذج. وأخيرًا، يستفيد من خصائص سريرية بسيطة وسهلة الجمع ثبت أنها تعزز الأداء، ويمكن تطبيقها في حالات استخدام أخرى.

من ناحية أخرى، هناك بعض القيود التي تشير إلى اتجاهات بحثية مستقبلية. أولاً، رغم مقارنة النموذج مع نماذج خارجية، إلا أنه تم تقييمه فقط على مجموعة بيانات داخلية خاصة، ما يثير تساؤلات حول تعميمه. إلا أن الوصول لمثل هذه البيانات يمثل تحديًا بسبب خصوصية البيانات الصحية والقيود التنظيمية، ما يتطلب جهودًا إضافية لاختبار النموذج على مجموعات خارجية ونماذج مرجعية أخرى. ثانيًا، حجم مجموعة البيانات المستخدمة لتطوير RetStroke صغير نسبيًا (183 مريضًا)، ما يحد من قدرة النموذج على تعلم خصائص خاصة بالسكتة ويؤثر على الأداء. يتطلب ذلك أبحاثًا إضافية، مثل استخدام دوال خسارة تعالج عدم توازن الفئات (مثل focal loss)، أو تطبيق استراتيجيات زيادة العينات للفئات النادرة. ثالثًا، حددنا أفق التنبؤ بسنة واحدة، لكن فترات أطول قد تكشف رؤى مختلفة. وأخيرًا، رغم تطوير RetStroke خصيصًا للسكتة، إلا أن تطبيقه على أمراض أخرى مثل أمراض القلب والأمراض العصبية التنكسية قد يعزز فائدته السريرية. معالجة هذه القيود ستسهم في تقدم هذا المجال البحثي الهام.

الشكر والتقدير

تم دعم هذا العمل من قبل ASPIRE، الذراع التنفيذي لبرامج التكنولوجيا في مجلس أبحاث التكنولوجيا المتقدمة بأبوظبي (ATRC)، من خلال منحة معهد أبحاث الطب الدقيق أبوظبي (ASPIREPMRIAD) رقم VRI-20-10، ومركز الذكاء الاصطناعي والروبوتات بجامعة نيويورك أبوظبي، الممول من تمكين ضمن منحة معهد أبحاث NYUAD رقم CG010. أُجريت الأبحاث باستخدام موارد الحوسبة عالية الأداء في جامعة نيويورك أبوظبي.


  1. \(^{1}\)سعيد شُرّاب، أديم نيبال، وفراح إي. شاموت من قسم الهندسة، جامعة نيويورك أبوظبي، الإمارات العربية المتحدة saeed.shurrab@nyu.edu, aadim.nepal@nyu.edu, farah.shamout@nyu.edu↩︎

  2. \(^{2}\)تيرينس جي. لي-سانت جون من معهد الحياة الصحية أبوظبي، الإمارات العربية المتحدة T.leestjohn@ihlad.ae↩︎

  3. \(^{3}\)نيكولا جي. غازي من معهد العيون في عيادة كليفلاند أبوظبي، الإمارات العربية المتحدة GhaziN2@clevelandclinicabudhabi.ae↩︎

  4. \(^{4}\)بارتولومييج بيتشوفسكي-جوزوياك من مستشفى كانبيرا، كانبيرا، أستراليا bartlomiejpj@gmail.com↩︎


تم تحويل هذا الإصدار HTML تلقائيًا من LaTeX.
يتم عرض المعادلات الرياضية باستخدام MathJax.