معرّف ArXiv: 2210.05881v1
LaTeX الأصلي: ./nyuad_arxiv_papers/nyuad_papers_comprehensive/source_code/2210.05881v1_extracted/main.tex
تاريخ التحويل: 2025-06-06 13:13:50

التنبُّؤ بالتدهور باستخدام السلاسل الزمنية لثلاثة مؤشرات حيوية والخصائص السريرية الحالية لدى مرضى كوفيد-19

سرمد مهرداد،
فرح الشاموت، ياو وانغ، وس. فاروق أتاشزار\(^*\)، 1

الملخَّص

إن عدم التعرُّف المُبكِّر على تدهور حالة المرضى قد يفضي إلى ارتفاع معدّلات المُراضة والوفيات. معظم نماذج التنبُّؤ بالتدهور الحالية تتطلّب كمّاً كبيراً من المعلومات السريرية التي تُجمع غالباً في المستشفيات، مثل الصور الطبية أو التحاليل المخبرية الشاملة. هذا غير عملي في حلول الطبّ عن بُعد، ويبرز الحاجة إلى نماذج تنبُّؤية تعتمد على بيانات محدودة يمكن جمعها على نطاق واسع في أي عيادة أو دار رعاية أو حتى في منزل المريض. في هذه الدراسة، نقترح ونطوِّر نموذجاً تنبُّؤيّاً يتوقّع ما إذا كان المريض سيواجه تدهوراً خلال 3 إلى 24 ساعة قادمة. يُعالج النموذج، على نحوٍ تسلسلي، ثلاثة مؤشرات حيوية روتينية: (أ) تشبُّع الأكسجين، (ب) معدّل ضربات القلب، و(ج) درجة الحرارة. كما نُزوِّد النموذج بمعلومات أساسية عن المريض تشمل الجنس، العمر، حالة التطعيم، تاريخ التطعيم، وحالة السُّمنة أو ارتفاع ضغط الدم أو السكري. درَّبنا وقيَّمنا النموذج على بيانات مُجمّعة من 37,006 مريض كوفيد-19 في مركز NYU Langone Health بنيويورك، الولايات المتحدة. حقّق النموذج المساحة تحت منحنى ROC (AUROC) بين 0.808 و0.880 لتنبُّؤ التدهور خلال 3 إلى 24 ساعة. وأجرينا كذلك تجارب إخفاء لتقييم أهمية كل ميزة مدخلة، وأظهرت النتائج أهمية المراقبة المتواصلة لتغيُّرات المؤشرات الحيوية. تُظهر نتائجنا إمكانية التنبُّؤ الدقيق بالتدهور باستخدام مجموعة ميزات محدودة يمكن الحصول عليها بسهولة نسبياً عبر الأجهزة القابلة للارتداء إلى جانب معلومات المريض الذاتية.

الكلمات المفتاحية: كوفيد-19، التعلُّم العميق، التنبُّؤ بالتدهور، مراقبة المؤشرات الحيوية.

المقدمة

فرضت جائحة فيروس كورونا المستجد (كوفيد-19) صدمة كبيرة على أنظمة الرعاية الصحية حول العالم، وأعادت تشكيل أساليب تقديم وإدارة الخدمات الصحية . ووفقاً لمنظمة الصحة العالمية، تم تشخيص أكثر من 620 مليون حالة إصابة بكوفيد-19 حتى أكتوبر 2022، مع تسجيل حوالي 6.52 مليون حالة وفاة . ومنذ مارس 2020، تم إدخال 96.2 مليون مريض إلى أقسام الطوارئ في الولايات المتحدة الأمريكية .

قد يواجه مرضى كوفيد-19 تدهوراً سريعاً يتطلّب تدخُّلاً طبياً مكثّفاً يرتبط بمعدّلات مُراضة ووفيات مرتفعة . خلال الجائحة، كان التنبُّؤ بمآل المرضى تحدّياً كبيراً، لا سيّما في المراحل الأولى عندما كانت المعرفة بالمرض محدودة، وأي تعديل في بروتوكولات القبول كان كفيلاً بالتأثير على نتائج المرضى . وقد أبرز ذلك أهمية المراقبة الروتينية للمرضى لضمان حصول الأكثر عُرضةً للتدهور على الرعاية المُبكِّرة .

ونتيجة لازدحام أنظمة الرعاية الصحية والخوف من التعرُّض غير الضروري للعدوى، نُصح العديد من المرضى الخارجيين أو المقيمين في دور الرعاية بمتابعة أعراضهم عن بُعد والإبلاغ عنها عبر الطبّ عن بُعد . وبذلك، باتت زيارات مرافق الطوارئ مقتصرة على الحالات ذات الأعراض الشديدة التي تستدعي تدخُّلاً عاجلاً . ورغم أن هذا الإجراء قد يقلّل من خطر التعرُّض للعدوى ويخفّف الضغط على خدمات الطوارئ ، إلا أنه قد يفضي أيضاً إلى سوء مآل بعض المرضى؛ ففي بعض الحالات، لا سيّما لدى من يعانون أمراضاً مُصاحبة، قد يُتبع ظهور الأعراض تدهورٌ مفاجئ وحاد حتى بعد الخروج من العيادة .

وبالنظر إلى الكمّ الهائل من البيانات المُجمّعة من مرضى كوفيد-19 في أقسام الطوارئ حول العالم، طُوِّرت تقنيات تعلُّم عميق وتعلُّم آلي للتشخيص المُبكِّر ، وتقييم شدّة المرض ، والتنبُّؤ بمآل المرضى . في الجدول 1 نلخّص الأعمال ذات الصلة وفق نوع البيانات والنماذج المستخدمة لمهام التنبُّؤ المختلفة. ونظراً لغزارة الأبحاث، يعرض الجدول الأول قائمة متوازنة من الدراسات.

تركّز معظم الدراسات السابقة على تشخيص كوفيد-19 أكثر من التنبُّؤ بمآل المرضى، وتعتمد كثيرٌ منها على مجموعات ميزات كبيرة، لا سيّما الصور الطبية عالية الأبعاد مثل التصوير المقطعي المحوسب أو صور الصدر، بالإضافة إلى نتائج التحاليل المخبرية. كما أن العديد من النماذج لا يستفيد من التغيُّرات الزمنية في البيانات. ورغم أن استخدام هذه البيانات أظهر إمكانات كبيرة، إلا أن هناك نقصاً في النماذج القابلة للتوسُّع بسهولة التي تعتمد على مجموعات ميزات محدودة تُجمع على مدى الزمن. نركّز في هذه الدراسة على البيانات التي يمكن جمعها ليس فقط في المستشفيات، بل أيضاً في دور الرعاية أو منازل المرضى باستخدام أجهزة قابلة للارتداء مثل الساعات الذكية .

ملخّص الأعمال ذات الصلة. نظرة عامة على الدراسات المتعلقة بتشخيص مرضى كوفيد-19، وتقييم شدّة المرض، والتنبُّؤ بمآل المرضى.
الدراسة المهمة البيانات نموذج التعلُّم الآلي
تشخيص أشعة الصدر، التصوير المقطعي، السجلات الطبية الإلكترونية، بيانات سريرية وأمراض مُصاحبة CNN، GBM، VGG19، APACHE، ResNet50، VAE، LSTM
تقييم الشِّدَّة أشعة الصدر، ميزات سريرية وأمراض مُصاحبة SVM، DenseNet، CNN، MLP
تنبُّؤ بالمآل أشعة الصدر، التصوير المقطعي CNN، DenseNet121-FPN، GLM، GBM، XGBoost، DT، AlexNet، Inception-V4

في هذه الدراسة، نقترح شبكة عصبية عميقة لنمذجة السلاسل الزمنية لثلاثة مؤشرات حيوية فقط بهدف التنبُّؤ بتدهور حالة مرضى كوفيد-19. الهدف النهائي هو توفير نموذج تنبُّؤي خفيف وقابل للتوسُّع لدعم اتخاذ القرار السريري لمجموعة واسعة من المرضى على المدى الطويل، بما في ذلك المرضى في المنازل والعيادات الداخلية والخارجية. لتقليل حجم ميزات الإدخال، نركّز على ثلاثة مؤشرات حيوية أساسية (تشبُّع الأكسجين، معدّل ضربات القلب، ودرجة الحرارة)، نظراً لتوفّر أجهزة قابلة للارتداء ترصد هذه المؤشرات. استبعدنا مؤشرات أخرى مثل ضغط الدم لصعوبة قياسها عبر الأجهزة القابلة للارتداء المتاحة.

لتطوير وتقييم النموذج، استخدمنا بيانات حقيقية مُجمّعة في مركز NYU Langone Health بين يناير 2020 وسبتمبر 2022. يتنبّأ النموذج بحدوث التدهور خلال أفق زمني يتراوح بين 3 و24 ساعة، بالاعتماد على بيانات السلاسل الزمنية للمؤشرات الحيوية المُسجَّلة خلال 24 ساعة تسبق لحظة التنبُّؤ (أي بداية أفق التنبُّؤ). ويُعرَّف التدهور بحدوث الوفاة داخل المستشفى أو الدخول إلى العناية المركّزة أو الحاجة إلى التنبيب. نشير إلى بيانات المؤشرات الحيوية باسم بيانات SEQ في بقية الورقة. كما نُزوِّد النموذج بمجموعة صغيرة من الميزات السريرية (CCC) تشمل الجنس، العمر، حالة التطعيم، تاريخ التطعيم، وحالة السمنة، ارتفاع ضغط الدم، والسكري (وتُسمّى بيانات non-SEQ). يتضمّن النموذج شبكة LSTM لمعالجة بيانات SEQ، وشبكة MLP تجمع بين الحالة المُخفية الأخيرة للـ LSTM وبيانات non-SEQ. وتستخدم شبكة LSTM التمدُّد الزمني للوصول إلى ديناميكيات ذاكرة أطول دون زيادة كبيرة في حجم وتعقيد النموذج. لكل أفق تنبُّؤ، يُدرَّب نموذج منفصل ويُحسَّن باستخدام دالة فقدان الانتروبيّ المتقاطع عبر استراتيجية تدريب ثلاثيَّة المراحل.

نظرة عامة على مجموعة المرضى. نلخّص خصائص المرضى، بما في ذلك المعلومات الديموغرافية وتوزيع المؤشرات الحيوية، للمرضى الذين تعرّضوا للتدهور والذين لم يتعرّضوا له.
الخصائص تدهور بدون تدهور
عدد المرضى 6104 30902
العمر (سنة)، المتوسط (الانحراف المعياري) (18.4) (18.0)
الجنس (إناث)، عدد (%) (41.5) (57.5)
سكري بدون مضاعفات، عدد (%) (24.7) (18.0)
سكري مع مضاعفات، عدد (%) (1.8) (1.2)
ارتفاع ضغط الدم، عدد (%) (44.5) (38.0)
التطعيم، عدد (%) (39.1) (54.2)
المدة منذ آخر تطعيم (شهر)، المتوسط (الانحراف المعياري) (6.2) (7.3)
السُّمنة، عدد (%) (16.4) (17.3)
مجموعة ميزات المؤشرات الحيوية
تشبُّع الأكسجين (%)، المتوسط (الانحراف المعياري) (4.5) (2.7)
معدّل ضربات القلب (نبضة/دقيقة)، المتوسط (الانحراف المعياري) (27.1) (18.57)
درجة الحرارة (فهرنهايت)، المتوسط (الانحراف المعياري) (1.6) (1.4)

أظهرت النتائج أن النموذج المقترح يحقّق AUROC بين 0.808 و0.880 ضمن آفاق التنبُّؤ من 3 إلى 24 ساعة، وذلك باستخدام التحقُّق المُتقاطع ثلاثيّ الطَّيَّات. ورغم أن النتائج غير قابلة للمقارنة المباشرة مع الدراسات السابقة لاختلاف طرق معالجة البيانات، إلا أن أداء النموذج مماثل. فعلى سبيل المثال، النموذج في الذي استخدم صور أشعة الصدر وبيانات سريرية أخرى حقّق AUROC مقداره 0.765 لتنبُّؤ التدهور خلال 24 ساعة.

ولفهم أهمية ميزات CCC المختلفة وأهمية التاريخ الزمني للمؤشرات الحيوية، أجرينا أيضاً تحليلاً للحساسية عبر تجربة إخفاء الميزات. عموماً، تبرز نتائجنا إمكانية تحقيق أداء عالٍ في التنبُّؤ بتدهور مرضى كوفيد-19 باستخدام مجموعات ميزات محدودة وسهلة الجمع ليس فقط في المستشفيات، بل أيضاً في دور الرعاية ومنازل المرضى.

المنهجية

مجموعة البيانات

استخدمنا في هذه الدراسة مجموعة بيانات كوفيد-19 مجهولة الهوية من مركز NYU Langone جُمِعت من المرضى بين يناير 2020 وسبتمبر 2022. وُضعت معايير شمول واستبعاد واضحة؛ ففي حال وجود عدة زيارات للمريض، تم اختيار أحدث زيارة. شملت العيّنة المرضى الذين ثبُتت إصابتهم بكوفيد-19 في المركز أو شُخّصوا عند القبول، بالإضافة إلى المرضى الداخليين الذين لديهم قياسات للمؤشرات الحيوية. تم قياس المؤشرات الحيوية (تشبُّع الأكسجين، درجة الحرارة، معدّل ضربات القلب) بشكل دوري كل 4–5 ساعات تقريباً. كما سُجّل العمر، الجنس، حالة وتاريخ التطعيم، ووجود أمراض مُصاحبة مثل السُّمنة، السكري، وارتفاع ضغط الدم.

وبالاستناد إلى الدراسات السابقة ، عُرِّف التدهور بحدوث أيٍّ من النتائج التالية: الوفاة، الدخول إلى العناية المركّزة، أو التنبيب. في حال تعدّد الأحداث السلبية، اعتُبر أوّل حدث فقط. وإذا تكرّر الحدث من النوع نفسه (مثلاً دخول العناية المركّزة) بفاصل زمني يزيد عن أسبوع، اعتُبر الحدث الأخير فقط كمرجع. بالنسبة للمرضى الذين تعرّضوا للتدهور، استُخرجت بيانات المؤشرات الحيوية خلال 48 ساعة تسبق لحظة التدهور.

استُخدمت هذه البيانات لتعريف «نوافذ إيجابية» لكل أفق تنبُّؤ، حيث يمثّل \(t=0\) نهاية النافذة و\(t=-24\) بدايتها؛ بحيث في أفق تنبُّؤ 24 ساعة يحدث التدهور عند \(t=24\). أمّا المرضى الذين لم يتعرّضوا للتدهور وتم إخراجهم، فاستُخدمت نافذة 48 ساعة تسبق آخر تسجيل للمؤشرات الحيوية لتعريف «النوافذ السلبية». واستُبعدت جميع العيّنات التي تحتوي على أقل من 48 ساعة من المراقبة.

لتحضير بيانات السلاسل الزمنية، أُجري أولاً تطبيع باستخدام Z-score لكل مؤشر حيوي. ونظراً لعدم انتظام القياسات زمنياً، أُعيد الانتظام الزمني عبر الاستيفاء بالمنحنيات التكعيبية (cubic spline) ثم أُخذت عينات منتظمة كل 15 دقيقة. يوضّح الشكل 1 مخططاً لخطوات معالجة البيانات (بيانات SEQ).

أمّا بيانات non-SEQ، فثبِّت ترميز الجنس، وحالة التطعيم، وحالتي ارتفاع ضغط الدم والسُّمنة كثنائيات (0 أو 1). أمّا حالة السكري فتم ترميزها بطريقة one-hot: غير مصاب (\([1, 0, 0]\))، مصاب دون مضاعفات (\([0, 1, 0]\))، مصاب مع مضاعفات (\([0, 0, 1]\)). قُسِّم العمر إلى 18 فئة عمرية واستُبدل كل عمر بالفئة المناسبة (من 1 إلى 18). وبالنسبة لتاريخ التطعيم فحُسِب عدد الأشهر المنقضية منذ الجرعة الثانية حتى لحظة التنبُّؤ (\(t=0\)).

نموذج التنبؤ بالتدهور المعتمد على التعلُّم العميق

يتكوّن النموذج المقترح من طبقات LSTM وطبقات كاملة الاتصال (FC). يوضّح الشكل 2 البنية العامة للشبكة، والتي أطلقنا عليها اسم شبكة المؤشرات الحيوية المتسلسلة (SVS-Net). تتكوّن الشبكة من وحدتين: وحدة SEQ التي تُعالج بيانات المؤشرات الحيوية عبر LSTM وطبقة FC واحدة، ووحدة non-SEQ التي تُعالج البيانات السريرية عبر طبقة FC مستقلة. يُدمَج التمثيلان لإنتاج التنبُّؤ النهائي.

تفاصيل بنية SVS-Net

تُعرف شبكات LSTM بقدرتها على التعلّم من البيانات التسلسلية، وقد استُخدمت على نطاق واسع في الدراسات المعتمدة على السلاسل الزمنية للتنبُّؤ بالأحداث المستقبلية . تتكوّن الوحدة الزمنية من LSTM مُمَدَّد زمنياً، يستقبل ثلاثة مؤشرات حيوية في كل خطوة زمنية، ويتكوّن من ثلاث طبقات تحتوي كلٌّ منها على 32 وحدة مُخفية. تُمرَّر الحالة المُخفية النهائية (بعدد أبعاد 32) عبر طبقة FC تعطي تمثيلاً بعدد أبعاد 16. أمّا بيانات non-SEQ (بعدد أبعاد 9) فتمر عبر طبقة FC تُنتج تمثيلاً بعدد أبعاد 16.

يُدمَج التمثيلان بعد ذلك في متجه بعدد أبعاد 32، ويُمرَّر عبر طبقة دمج FC تُنتج 8 أبعاد، ثم طبقة FC نهائية مع تفعيل سيغمويد لإخراج تنبُّؤ أحادي البعد يمثّل احتمال حدوث التدهور خلال الأفق الزمني المحدَّد. جميع طبقات FC تستخدم تفعيل دالة الظلّ الزائدي (tanh) باستثناء الطبقة الأخيرة التي تستخدم سيغمويد.

استراتيجية التدريب ثلاثيَّة المراحل

لتحسين أداء الشبكة المقترحة، اعتُمِدت استراتيجية تدريب من ثلاث مراحل كما يلي:

  • المرحلة الأولى: تدريب وحدة SEQ فقط
    تُدرَّب وحدة SEQ فقط وتُجمَّد باقي الطبقات. يُوصَل إخراج طبقة FC في وحدة SEQ بطبقة FC أخرى لإنتاج التنبُّؤ. بعد هذه المرحلة، تُستخدم الأوزان لتهيئة وحدة SEQ في المرحلة التالية، وتُزال طبقة FC الثانية المستخدمة في التنبُّؤ المبدئي.

  • المرحلة الثانية: تدريب طبقة الدمج
    تُحسب تمثيلات بيانات SEQ بعد تهيئة الوحدة بأوزان المرحلة الأولى، ثم تُجمَّد وحدة SEQ. بعد ذلك، تُدرَّب طبقة FC، وطبقة الدمج FC، وطبقة التنبُّؤ FC باستخدام بيانات non-SEQ.

  • المرحلة الثالثة: ضبط نهائي شامل للشبكة
    تُهيَّأ جميع معلمات الشبكة بأوزان المرحلتين السابقتين، ثم تُدرَّب الشبكة بالكامل بهدف تحسين الأداء الكُلِّي.

تدريب النموذج وتقييمه

دُرِّب النموذج وقُيِّم باستخدام التحقُّق المُتقاطع ثلاثيّ الطَّيَّات. قُسِّمت مجموعة البيانات عشوائياً إلى ثلاث طيّات مع الحفاظ على توزيع العينات الإيجابية والسلبية ذاته في كل طيّة. حُسب الأداء النهائي بأخذ متوسّط نتائج التحقُّق عبر الطيّات الثلاث.

دُرِّب النموذج في كل طيّة لمدّة 200 حقبة باستخدام استراتيجية التدريب ثلاثيَّة المراحل. في المرحلتين الأولى والثانية، استُخدم معدل تعلّم \(0.0001\)، وفي مرحلة الضبط النهائي \(0.00001\). استخدمنا خوارزمية ADAM بمعاملات \(\beta_1 = 0.9\)، \(\beta_2 = 0.999\)، \(\epsilon = 10^{-8}\). ولتجنُّب الإفراط في التكيُّف، اعتُمدت فترة «صبر» مقدارها 100 حقبة لإيقاف التدريب إذا لم يتحسّن فقدان التحقُّق. تم اختيار أفضل نموذج بناءً على أقل فقدان تحقُّق. استخدمنا دالة فقدان الانتروبيّ المتقاطع البؤرية الثنائية لمعالجة عدم توازن الفئات . وقُيِّم الأداء باستخدام ثلاث مقاييس: الدقّة (عند عتبة 0.5)، المساحة تحت منحنى ROC (AUROC)، والمساحة تحت منحنى الدقّة–الاستدعاء (AUPRC).

النتائج والمناقشة

مجموعة المرضى

يوضّح الشكل [fig_3](A) تطبيق معايير الشمول والاستبعاد، حيث تم الحصول على 37,006 عيّنة مرضى، منها 6,104 عيّنة إيجابية و30,902 عيّنة سلبية. يُلخّص الجدول 2 خصائص المرضى. وفي الشكل [fig_3](B) تظهر الفروقات في المؤشرات الحيوية بين المجموعتين عند \(t=0\)، بينما يوضّح الشكل [fig_3](C) الفروقات عند \(t=-24\). أظهرت اختبارات t-test أن الفروقات بين المجموعتين ذات دلالة إحصائية حتى قبل 24 ساعة من التدهور، ما يدعم استخدام التعلُّم العميق لاكتشاف الأنماط الخفية. يوضّح الشكل 3 توزيع المرضى عبر الزمن.

أداء النموذج

يُلخّص الجدول 3 والشكل 4 أداء النموذج بعد استراتيجية التدريب ثلاثيَّة المراحل. عند أفق 24 ساعة، بلغت الدقّة 86.4%، وAUROC 0.808، وAUPRC 0.559. ورغم اختلاف مجموعات البيانات، إلا أن النتائج مماثلة لتلك المنشورة سابقاً . كما لوحظ تحسُّن الدقّة مع تقليل أفق التنبُّؤ.

يُظهر الشكل 4 أن AUROC وAUPRC يتحسّنان بصورة مطّردة بعد كل مرحلة تدريبية، باستثناء أفق الثلاث ساعات حيث كان التحسُّن محدوداً. ويشير ذلك إلى أن استراتيجية التدريب الثلاثية أكثر فاعلية في الآفاق الزمنية الأطول.

عند مقارنة أداء المراحل الثلاث، يتّضح أن الاستراتيجية المعتمدة تُعزِّز أداء النموذج عبر دفعه لاستخراج المعلومات أولاً من بيانات SEQ ثم من دمج SEQ مع non-SEQ، وهو ما يتجلّى في تحسُّن الدقّة وAUROC وAUPRC.

أداء النموذج. ملخّص أداء الشبكة المقترحة بعد التدريب عبر جميع آفاق التنبُّؤ.
أفق التنبُّؤ (ساعات) 3 6 9 12 15 18 21 24
الدقّة
AUROC
AUPRC

دراسات الاستبعاد

لفهم أثر الخيارات التصميمية في بنية النموذج، قورِن النموذج المقترح بنموذجين آخرين. النموذج الأول، شبكة المؤشرات الحيوية عديمة الذاكرة (MLVS-Net)، يُعالج بيانات non-SEQ وآخر مجموعة من المؤشرات الحيوية فقط دون أي معلومات زمنية؛ حيث تُعالج البيانات عبر MLP من طبقتين FC (كل منهما 16 بعداً)، ثم تُدمج مع تمثيل non-SEQ. دُرِّب النموذج بالاستراتيجية ذاتها مع تجميد أوزان MLP في المرحلة الثانية. النموذج الثاني، شبكة الحالة الصحية غير الزمنية (nSHS-Net)، يعتمد فقط على بيانات non-SEQ، حيث تمر عبر طبقتين FC لإنتاج التنبُّؤ.

تظهر المقارنة في الشكل 5. أولاً، أداء nSHS-Net هو الأضعف، ما يؤكّد أهمية المؤشرات الحيوية. وعند مقارنة MLVS-Net بـ SVS-Net، يتفوّق الأخير في جميع آفاق التنبُّؤ وجميع المقاييس، ما يبرز أهمية المعلومات الزمنية في تحسين دقّة التنبُّؤ. النتائج الرقمية موضّحة في الملحق الأول، الجدول الرابع.

تحليل الإخفاء

لتقييم أثر كل متغيِّر مُدخل، أجرينا تحليل إخفاء على النموذج النهائي، حيث يُخفى كلُّ متغيِّر على حدة (بجعل قيمته صفراً) ثم يُقيَّم الأداء على مجموعة التحقُّق. وكلّما انخفضت مؤشرات الأداء عند إخفاء ميزة معيّنة، ازدادت أهميتها في التنبُّؤ.

تظهر النتائج في الشكل [fig_7]. كما هو موضّح في الشكل [fig_7](A)، من بين ميزات non-SEQ، كان للعمر التأثير الأكبر على أداء النموذج. أمّا بقية ميزات CCC فكان تأثيرها أقل وغير ثابت عبر المقاييس وآفاق التنبُّؤ. ويجدر التنبيه إلى أن الترابط بين الميزات قد يحجب أهمية بعضها في هذا التحليل.

على سبيل المثال، إذا أثّرت إحدى ميزات CCC على تغيُّرات المؤشرات الحيوية عبر الزمن، فقد يلتقط النموذج هذا التأثير ضِمنيّاً. في هذه الحالة، قد يُظهر تحليل الإخفاء أن الميزة غير مهمة، لكن ذلك لا ينفي أهميتها الفعلية. أمّا بين ميزات SEQ، فكان معدّل ضربات القلب الأكثر أهمية، يليه تشبُّع الأكسجين، ثم درجة الحرارة.

من المهم الإشارة إلى أن الشكل 7 يوضّح أن المؤشرات الحيوية أكثر أهمية من الميزات السريرية والأمراض المُصاحبة، وأن السلاسل الزمنية للمؤشرات الحيوية توفّر معلومات إضافية مقارنة بالقياسات اللحظية فقط. وتتوافق هذه الملاحظة مع التحليل السابق. النتائج الرقمية موضّحة في الملحق الأول، الجدول الخامس.

الخلاصة

انطلقت هذه الدراسة من توفُّر الأجهزة الطبية الشخصية مثل الأنظمة القابلة للارتداء (كالساعات الذكية) التي تسجّل بيانات طبية زمنية، وإمكان الاستفادة منها في الطبّ عن بُعد للتنبُّؤ بتدهور الحالة الصحية. باختصار، اقترحنا وطوَّرنا وقيَّمنا نموذج تنبُّؤ بالتدهور باستخدام مجموعة بيانات كبيرة (n=37,006) جُمعت في NYU Langone Health بين يناير 2020 وسبتمبر 2022. حقّق النموذج AUROC بين 0.808 و0.880 عبر آفاق التنبُّؤ من 3 إلى 24 ساعة.

وتتميّز الدراسة بعدة نقاط قوة: أوّلاً، يعتمد النموذج على مجموعة ميزات محدودة تتكوّن من سلاسل زمنية لثلاثة مؤشرات حيوية روتينية (تشبُّع الأكسجين، معدّل ضربات القلب، ودرجة الحرارة)، بالإضافة إلى معلومات أساسية عن المريض (الجنس، العمر، حالة وتاريخ التطعيم، السُّمنة، ارتفاع ضغط الدم، والسكري) يمكن جمعها بسهولة. مقارنة بالدراسات السابقة التي حقّقت AUROC بمقدار 0.765، فإن نموذجنا يحقّق أداءً مماثلاً رغم اختلاف نوعية البيانات. ولتقييم أهمية الميزات السريرية والأمراض المصاحبة وأهمية استخدام السلاسل الزمنية، أجرينا تحليلاً للحساسية عبر تجربة الإخفاء ودراسة الاستبعاد. وأظهرت النتائج أهمية نمذجة التغيُّرات الزمنية للمؤشرات الحيوية وإمكان تحقيق دقّة عالية دون الحاجة إلى صور طبية متقدّمة. كما أن الإطار المقترح قابل للتوسُّع ليشمل آفاق تنبُّؤ مختلفة ونوافذ زمنية متنوّعة.

هناك بعض القيود: أوّلاً، حُدِّدت نوافذ الإدخال بـ 24 ساعة فقط. في الدراسات المستقبلية، نُخطّط لتغيير طول النوافذ ودراسة أثر ذلك على الأداء بهدف تقليل التعقيد الحسابي إذا أمكن تحقيق نتائج مماثلة بنوافذ أقصر. ثانياً، لم يُجرَ تحقُّق خارجي أو مستقبلي للنموذج بسبب عدم توفّر بيانات مماثلة. وأخيراً، نعتقد أن النتائج النهائية يمكن تحسينها عبر ضبط المعاملات الفائقة مثل معدل التعلّم، وهو ما سنعمل عليه مستقبلاً.

ختاماً، تبرز هذه الدراسة إمكانية تطوير نموذج تنبُّؤي سهل الوصول وقابل للتوسُّع لدعم الكادر الطبي في اتخاذ القرار. وتكمن أهمية النموذج في إمكان جمع البيانات المستخدمة بسهولة من المرضى عبر أجهزة الاستشعار القابلة للارتداء وبعض البيانات السريرية الذاتية.

الشكر والتقدير

\(\bullet\) التمويل: تم تنفيذ هذا العمل بدعم من المؤسسة الوطنية للعلوم (منحة رقم 2031594).

\(\bullet\) تضارب المصالح: س. فاروق أتاشزار وياو وانغ هما مُخترعا «جهاز ذكي قابل للارتداء لتتبُّع الصحة، تتبُّع المُخالطين، وتنبُّؤ تدهور الحالة الصحية» المرخَّص لشركة Tactile Robotics, Ltd., كندا.

الملحق الأول

نقدّم هنا النتائج الرقمية المتعلقة بالشكل 5 في الجدول 4، والنتائج المتعلقة بالشكل [fig_7] في الجدول 5.

مقارنة رقمية بين SVS-Net وMLVS-Net وnSHS-Net عبر آفاق التنبُّؤ من 3 إلى 24 ساعة
أفق التنبُّؤ (ساعات) 3 6 9 12 15 18 21 24
SVS-Net 0.879 0.871 0.866 0.868 0.866 0.865 0.865 0.864
MLVS-Net
nSHS-Net
SVS-Net 0.880 0.857 0.843 0.829 0.817 0.817 0.814 0.808
MLVS-Net
nSHS-Net
SVS-Net 0.666 0.628 0.601 0.592 0.572 0.574 0.568 0.559
MLVS-Net
nSHS-Net

مقارنة رقمية لجميع عمليات الإخفاء على الميزات السريرية وميزات الأمراض المصاحبة وبيانات المؤشرات الحيوية الزمنية عبر آفاق التنبُّؤ من 3 إلى 24 ساعة
أفق التنبُّؤ (ساعات) 3 6 9 12 15 18 21 24
بدون إخفاء
الجنس
السُّمنة
العمر
السكري
ارتفاع ضغط الدم
مدّة التطعيم
حالة التطعيم
معدّل ضربات القلب
تشبُّع الأكسجين
درجة الحرارة


  1. سرمد مهرداد يعمل في قسم الهندسة الكهربائية وهندسة الحاسوب بجامعة نيويورك (NYU). ياو وانغ تعمل في القسم نفسه، بالإضافة إلى قسم الهندسة الطبية الحيوية. فرح الشاموت تعمل في قسم الهندسة بجامعة نيويورك أبوظبي، وأيضاً في علوم الحاسوب والهندسة الطبية الحيوية في NYU Tandon. س. فاروق أتاشزار يعمل في قسم الهندسة الكهربائية وهندسة الحاسوب، وأيضاً في قسم الهندسة الميكانيكية والفضائية بجامعة نيويورك.
    \(^*\) المؤلف المُراسِل: س. ف. أتاشزار (f.atashzar@nyu.edu)↩︎


تم تحويل هذه النسخة تلقائياً من LaTeX.
تُعرض المعادلات الرياضية باستخدام MathJax.