معرّف ArXiv: 2210.05881v1
LaTeX الأصلي: ./nyuad_arxiv_papers/nyuad_papers_comprehensive/source_code/2210.05881v1_extracted/main.tex
تاريخ التحويل: 2025-06-06 13:13:50

تنبؤ التدهور باستخدام السلاسل الزمنية لثلاثة مؤشرات حيوية والخصائص السريرية الحالية لدى مرضى كوفيد-19

سرمد مهرداد،
فرح الشاموت، ياو وانغ، وس. فاروق أتاشزار\(^*\)، 1

الملخص

إن عدم التعرف المبكر على تدهور حالة المرضى قد يؤدي إلى ارتفاع معدلات المراضة والوفيات. معظم نماذج التنبؤ بالتدهور الحالية تتطلب عدداً كبيراً من المعلومات السريرية، والتي غالباً ما تُجمع في المستشفيات، مثل الصور الطبية أو التحاليل المخبرية الشاملة. هذا الأمر غير عملي في حلول الطب عن بُعد، ويبرز الحاجة إلى نماذج تنبؤ بالتدهور تعتمد على بيانات محدودة يمكن جمعها على نطاق واسع في أي عيادة أو دار رعاية أو حتى في منزل المريض. في هذه الدراسة، نقترح ونطور نموذجاً تنبؤياً يتوقع ما إذا كان المريض سيواجه تدهوراً خلال 3 إلى 24 ساعة قادمة. يعالج النموذج بشكل متسلسل ثلاثة مؤشرات حيوية روتينية: (أ) تشبع الأكسجين، (ب) معدل ضربات القلب، و(ج) درجة الحرارة. كما يُزود النموذج بمعلومات أساسية عن المريض تشمل الجنس، العمر، حالة التطعيم، تاريخ التطعيم، وحالة السمنة أو ارتفاع ضغط الدم أو السكري. قمنا بتدريب وتقييم النموذج باستخدام بيانات جمعت من 37,006 مريض كوفيد-19 في مركز NYU Langone Health في نيويورك، الولايات المتحدة الأمريكية. حقق النموذج مساحة تحت منحنى الاستجابة (AUROC) تتراوح بين 0.808 و0.880 لتنبؤ التدهور خلال 3 إلى 24 ساعة. كما أجرينا تجارب إخفاء لتقييم أهمية كل ميزة مدخلة، وأظهرت النتائج أهمية المراقبة المستمرة لتغيرات المؤشرات الحيوية. تظهر نتائجنا إمكانية التنبؤ الدقيق بالتدهور باستخدام مجموعة ميزات محدودة يمكن الحصول عليها بسهولة نسبياً عبر الأجهزة القابلة للارتداء ومعلومات المريض الذاتية.

كوفيد-19، التعلم العميق، التنبؤ بالتدهور، مراقبة المؤشرات الحيوية

المقدمة

لقد فرضت جائحة فيروس كورونا المستجد (كوفيد-19) صدمة كبيرة على أنظمة الرعاية الصحية حول العالم، وأعادت تشكيل أساليب تقديم وإدارة الخدمات الصحية . ووفقاً لمنظمة الصحة العالمية، تم تشخيص أكثر من 620 مليون حالة إصابة بكوفيد-19 حتى أكتوبر 2022، مع تسجيل حوالي 6.52 مليون حالة وفاة . ومنذ مارس 2020، تم إدخال 96.2 مليون مريض إلى أقسام الطوارئ في الولايات المتحدة الأمريكية .

يمكن أن يواجه مرضى كوفيد-19 تدهوراً سريعاً يتطلب تدخلاً طبياً مكثفاً يرتبط بمعدلات مراضة ووفيات مرتفعة . خلال الجائحة، كان التنبؤ بمآل المرضى تحدياً كبيراً، خاصة في المراحل الأولى عندما كانت المعرفة بالمرض محدودة، وأي تعديل في بروتوكولات القبول كان من شأنه أن يؤثر بشكل كبير على نتائج المرضى . وقد أبرز ذلك أهمية المراقبة الروتينية للمرضى لضمان حصول الأكثر عرضة للتدهور على الرعاية المبكرة .

ونظراً لازدحام أنظمة الرعاية الصحية والخوف من التعرض غير الضروري للعدوى، تم نصح العديد من المرضى الخارجيين أو المقيمين في دور الرعاية بمتابعة أعراضهم عن بُعد والإبلاغ عنها عبر الطب عن بُعد . وبذلك، أصبح المرضى يتجنبون زيارة مرافق الطوارئ إلا إذا كانت الأعراض شديدة وتستدعي تدخلاً عاجلاً . ورغم أن هذا الإجراء قد يقلل من التعرض للعدوى ويخفف الضغط على خدمات الطوارئ ، إلا أنه قد يؤدي أيضاً إلى سوء مآل بعض المرضى. ففي بعض الحالات، خاصة لدى من يعانون من أمراض مصاحبة، قد يتبع ظهور الأعراض تدهور مفاجئ وحاد وغير متوقع، حتى بعد الخروج من العيادة .

وبالنظر إلى الكم الهائل من البيانات التي تم جمعها من مرضى كوفيد-19 في أقسام الطوارئ حول العالم، تم تطوير العديد من تقنيات التعلم العميق والتعلم الآلي للتشخيص المبكر ، وتقييم شدة المرض ، أو التنبؤ بمآل المرضى . في الجدول 1، نلخص الأعمال ذات الصلة بناءً على نوعية البيانات والنماذج المستخدمة لمهام التنبؤ المختلفة. ونظراً لكثرة الأبحاث في هذا المجال، يقدم الجدول الأول قائمة متوازنة من الدراسات.

تركز معظم الدراسات السابقة على تشخيص كوفيد-19 أكثر من التنبؤ بمآل المرضى، وتعتمد العديد منها على مجموعات ميزات كبيرة، خاصة الصور الطبية عالية الأبعاد مثل الأشعة المقطعية أو أشعة الصدر، بالإضافة إلى نتائج التحاليل المخبرية. كما أن العديد من النماذج لا تستفيد من التغيرات الزمنية في البيانات. ورغم أن استخدام هذه البيانات في النماذج الحاسوبية أظهر إمكانات كبيرة، إلا أن هناك نقصاً في النماذج القابلة للتوسع بسهولة والتي تعتمد على مجموعات ميزات محدودة تُجمع على مدى الزمن. نركز في هذه الدراسة على البيانات التي يمكن جمعها ليس فقط في المستشفيات، بل أيضاً في دور الرعاية أو منازل المرضى باستخدام أجهزة قابلة للارتداء مثل الساعات الذكية .

ملخص للأعمال ذات الصلة. نظرة عامة على الدراسات المتعلقة بتشخيص مرضى كوفيد-19، وتقييم شدة المرض، والتنبؤ بمآل المرضى.
الدراسة المهمة البيانات نموذج التعلم الآلي
تشخيص أشعة الصدر، الأشعة المقطعية، السجلات الطبية الإلكترونية، بيانات سريرية وأمراض مصاحبة CNN، GBM، VGG19، APACHE، ResNet50، VAE، LSTM
تقييم الشدة أشعة الصدر، ميزات سريرية وأمراض مصاحبة SVM، DenseNet، CNN، MLP
تنبؤ بالمآل أشعة الصدر، الأشعة المقطعية CNN، DenseNet121-FPN، GLM، GBM، XGBoost، DT، AlexNet، Inception-V4

في هذه الدراسة، نقترح شبكة عصبية عميقة لنمذجة السلاسل الزمنية لثلاثة مؤشرات حيوية فقط بهدف التنبؤ بتدهور حالة مرضى كوفيد-19. الهدف النهائي هو توفير نموذج تنبؤي خفيف وقابل للتوسع لدعم اتخاذ القرار السريري لمجموعة واسعة من المرضى على المدى الطويل، بما في ذلك المرضى في المنازل والعيادات الداخلية والخارجية. لتقليل حجم ميزات الإدخال، نركز على ثلاثة مؤشرات حيوية أساسية (تشبع الأكسجين، معدل ضربات القلب، ودرجة الحرارة)، وذلك نظراً لتوفر أجهزة قابلة للارتداء تراقب هذه المؤشرات. استبعدنا مؤشرات أخرى مثل ضغط الدم لصعوبة قياسها عبر الأجهزة القابلة للارتداء المتاحة.

لتطوير وتقييم النموذج، استخدمنا بيانات حقيقية جمعت في مركز NYU Langone Health بين يناير 2020 وسبتمبر 2022. يتنبأ النموذج بحدوث التدهور خلال أفق زمني يتراوح بين 3 و24 ساعة، باستخدام بيانات السلاسل الزمنية للمؤشرات الحيوية المسجلة خلال 24 ساعة تسبق لحظة التنبؤ (أي بداية أفق التنبؤ)، ويُعرّف التدهور بحدوث الوفاة داخل المستشفى أو الدخول إلى العناية المركزة أو الحاجة للتنبيب. نشير إلى بيانات المؤشرات الحيوية باسم بيانات SEQ في بقية الورقة. كما يُزود النموذج بمجموعة صغيرة من الميزات السريرية (CCC) تشمل الجنس، العمر، حالة التطعيم، تاريخ التطعيم، وحالة السمنة، ارتفاع ضغط الدم، والسكري (وتسمى بيانات non-SEQ). يتضمن النموذج شبكة LSTM لمعالجة بيانات SEQ، وشبكة MLP تجمع بين الحالة المخفية الأخيرة للـ LSTM وبيانات non-SEQ. وتستخدم شبكة LSTM التمدد الزمني للوصول إلى ديناميكيات ذاكرة أطول دون زيادة كبيرة في حجم وتعقيد النموذج. لكل أفق تنبؤ، يتم تدريب نموذج منفصل وتحسينه باستخدام دالة فقدان الانتروبيا المتقاطعة عبر استراتيجية تدريب ثلاثية المراحل.

نظرة عامة على مجموعة المرضى. نلخص في هذا الجدول خصائص المرضى، بما في ذلك المعلومات الديموغرافية وتوزيع المؤشرات الحيوية، للمرضى الذين تعرضوا للتدهور والذين لم يتعرضوا له.
الخصائص تدهور بدون تدهور
عدد المرضى 6104 30902
العمر (سنة)، المتوسط (الانحراف المعياري) (18.4) (18.0)
الجنس (إناث)، عدد (%) (41.5) (57.5)
سكري بدون مضاعفات، عدد (%) (24.7) (18.0)
سكري مع مضاعفات، عدد (%) (1.8) (1.2)
ارتفاع ضغط الدم، عدد (%) (44.5) (38.0)
التطعيم، عدد (%) (39.1) (54.2)
المدة منذ آخر تطعيم (شهر)، المتوسط (الانحراف المعياري) (6.2) (7.3)
السمنة، عدد (%) (16.4) (17.3)
مجموعة ميزات المؤشرات الحيوية
تشبع الأكسجين (%)، المتوسط (الانحراف المعياري) (4.5) (2.7)
معدل ضربات القلب (نبضة/دقيقة)، المتوسط (الانحراف المعياري) (27.1) (18.57)
درجة الحرارة (فهرنهايت)، المتوسط (الانحراف المعياري) (1.6) (1.4)

أظهرت النتائج أن النموذج المقترح يحقق AUROC بين 0.808 و0.880 ضمن آفاق التنبؤ من 3 إلى 24 ساعة، وذلك باستخدام التحقق المتقاطع ثلاثي الطيات. ورغم أن النتائج ليست قابلة للمقارنة المباشرة مع الدراسات السابقة بسبب اختلاف طرق معالجة البيانات، إلا أن أداء النموذج مماثل. فعلى سبيل المثال، النموذج في الذي استخدم صور أشعة الصدر وبيانات سريرية أخرى حقق AUROC بمقدار 0.765 لتنبؤ التدهور خلال 24 ساعة.

ولفهم أهمية ميزات CCC المختلفة وأهمية التاريخ الزمني للمؤشرات الحيوية، أجرينا أيضاً تحليلاً للحساسية عبر تجربة إخفاء الميزات. بشكل عام، تبرز نتائجنا إمكانية تحقيق أداء عالٍ في التنبؤ بتدهور مرضى كوفيد-19 باستخدام مجموعات ميزات محدودة وسهلة الجمع ليس فقط في المستشفيات، بل أيضاً في دور الرعاية ومنازل المرضى.

المنهجية

مجموعة البيانات

في هذه الدراسة، استخدمنا مجموعة بيانات كوفيد-19 مجهولة الهوية من مركز NYU Langone والتي جمعت من المرضى بين يناير 2020 وسبتمبر 2022. تم تحديد معايير شمول واستبعاد واضحة؛ ففي حال وجود عدة زيارات للمريض، تم اختيار أحدث زيارة. شملت العينة المرضى الذين ثبتت إصابتهم بكوفيد-19 في المركز أو تم تشخيصهم عند القبول، بالإضافة إلى المرضى الداخليين الذين لديهم قياسات للمؤشرات الحيوية. تم قياس المؤشرات الحيوية (تشبع الأكسجين، درجة الحرارة، معدل ضربات القلب) بشكل دوري كل 4-5 ساعات تقريباً. كما تم تسجيل العمر، الجنس، حالة وتاريخ التطعيم، ووجود أمراض مصاحبة مثل السمنة، السكري، وارتفاع ضغط الدم.

وبالاستناد إلى الدراسات السابقة ، تم تعريف التدهور بحدوث أي من النتائج التالية: الوفاة، الدخول إلى العناية المركزة، أو التنبيب. في حال تعدد الأحداث السلبية، تم اعتبار أول حدث فقط. وإذا تكررت نفس نوعية التدهور (مثلاً دخول العناية المركزة) بفاصل زمني يزيد عن أسبوع، تم اعتبار الحدث الأخير فقط كمرجع. بالنسبة للمرضى الذين تعرضوا للتدهور، تم استخراج بيانات المؤشرات الحيوية خلال 48 ساعة تسبق لحظة التدهور.

تم استخدام هذه البيانات لتعريف "نوافذ إيجابية" لكل أفق تنبؤ، حيث يمثل \(t=0\) نهاية النافذة و\(t=-24\) بدايتها، بحيث في أفق تنبؤ 24 ساعة، يحدث التدهور عند \(t=24\). أما المرضى الذين لم يتعرضوا للتدهور وتم إخراجهم، فتم استخدام نافذة 48 ساعة تسبق آخر تسجيل للمؤشرات الحيوية لتعريف "النوافذ السلبية". تم استبعاد جميع العينات التي تحتوي على أقل من 48 ساعة من المراقبة.

لتحضير بيانات السلاسل الزمنية، تم أولاً إجراء تطبيع باستخدام Z-score لكل مؤشر حيوي. ونظراً لأن القياسات غير منتظمة زمنياً، تم إعادة التعيين الزمني عبر الاستيفاء التكاملي (cubic spline) ثم أخذ عينات منتظمة كل 15 دقيقة. يوضح الشكل 1 مخططاً لخطوات معالجة البيانات (بيانات SEQ).

أما بيانات non-SEQ، فقد تم ترميز الجنس، حالة التطعيم، حالة ارتفاع ضغط الدم والسمنة كثنائية (0 أو 1). أما حالة السكري فتم ترميزها بطريقة one-hot: غير مصاب (\([1, 0, 0]\))، مصاب بدون مضاعفات (\([0, 1, 0]\))، مصاب مع مضاعفات (\([0, 0, 1]\)). تم تقسيم العمر إلى 18 فئة عمرية واستبدال كل عمر بالفئة المناسبة (من 1 إلى 18). أما تاريخ التطعيم فتم حساب عدد الأشهر المنقضية منذ الجرعة الثانية حتى لحظة التنبؤ (\(t=0\)).

نموذج التنبؤ بالتدهور المعتمد على التعلم العميق

يتكون النموذج المقترح من طبقات LSTM وطبقات كاملة الاتصال (FC). توضح الشكل 2 البنية العامة للشبكة، والتي أطلقنا عليها اسم شبكة المؤشرات الحيوية المتسلسلة (SVS-Net)، وتتكون من وحدتين: وحدة SEQ التي تعالج بيانات المؤشرات الحيوية عبر LSTM وطبقة FC واحدة، ووحدة non-SEQ التي تعالج البيانات السريرية عبر طبقة FC مستقلة. يتم دمج التمثيلات من الوحدتين لإنتاج التنبؤ النهائي.

تفاصيل بنية SVS-Net

تُعرف شبكات LSTM بقدرتها على التعلم من البيانات التسلسلية، وقد استُخدمت على نطاق واسع في الدراسات التي تعتمد على السلاسل الزمنية للتنبؤ بالأحداث المستقبلية . تتكون الوحدة الزمنية من LSTM ممدد زمنياً، يستقبل ثلاثة مؤشرات حيوية في كل خطوة زمنية، ويتكون من ثلاث طبقات كل منها تحتوي على 32 وحدة مخفية. تُمرر الحالة المخفية النهائية (بعدد أبعاد 32) عبر طبقة FC تعطي تمثيلاً بعدد أبعاد 16. أما بيانات non-SEQ (بعدد أبعاد 9) فتمر عبر طبقة FC تعطي تمثيلاً بعدد أبعاد 16.

يتم بعد ذلك دمج التمثيلين في متجه بعدد أبعاد 32، ويُمرر عبر طبقة دمج FC تعطي 8 أبعاد، ثم طبقة FC نهائية مع تفعيل سيغمويد لإخراج تنبؤ أحادي البعد يمثل احتمال حدوث التدهور خلال الأفق الزمني المحدد. جميع طبقات FC تستخدم تفعيل دالة الظل الزائدي (tanh) باستثناء الطبقة الأخيرة التي تستخدم سيغمويد.

استراتيجية التدريب ثلاثية المراحل

لتحسين أداء الشبكة المقترحة، تم اعتماد استراتيجية تدريب من ثلاث مراحل كما يلي:

  • المرحلة الأولى: تدريب وحدة SEQ فقط
    يتم تدريب وحدة SEQ فقط وتجميد باقي الطبقات. يُوصل إخراج طبقة FC في وحدة SEQ بطبقة FC أخرى لإنتاج التنبؤ. بعد هذه المرحلة، تُستخدم الأوزان لتهيئة وحدة SEQ في المرحلة التالية، ويتم إزالة طبقة FC الثانية المستخدمة في التنبؤ المبدئي.

  • المرحلة الثانية: تدريب طبقة الدمج
    يتم حساب تمثيلات بيانات SEQ بعد تهيئة الوحدة بالأوزان من المرحلة الأولى، ثم تُجمّد وحدة SEQ. بعد ذلك، يتم تدريب طبقة FC، وطبقة الدمج FC، وطبقة التنبؤ FC باستخدام بيانات non-SEQ.

  • المرحلة الثالثة: ضبط نهائي شامل للشبكة
    يتم تهيئة جميع معلمات الشبكة بالأوزان من المرحلتين السابقتين، ثم تُدرّب الشبكة بالكامل بهدف تحسين الأداء الكلي.

تدريب النموذج وتقييمه

تم تدريب وتقييم النموذج باستخدام التحقق المتقاطع ثلاثي الطيات. تم تقسيم مجموعة البيانات عشوائياً إلى ثلاث طيات مع الحفاظ على نفس توزيع العينات الإيجابية والسلبية في كل طية. تم حساب الأداء النهائي بأخذ متوسط نتائج التحقق عبر الطيات الثلاث.

تم تدريب النموذج في كل طية لمدة 200 حقبة باستخدام استراتيجية التدريب ثلاثية المراحل. في المرحلتين الأولى والثانية، تم اختيار معدل تعلم \(0.0001\)، وفي مرحلة الضبط النهائي \(0.00001\). استخدمنا خوارزمية ADAM بمعاملات \(\beta_1 = 0.9\)، \(\beta_2 = 0.999\)، \(\epsilon = 10^{-8}\). لتجنب الإفراط في التكيف، تم اعتماد فترة صبر 100 حقبة لإيقاف التدريب إذا لم يتحسن فقدان التحقق. تم اختيار أفضل نموذج بناءً على أقل فقدان تحقق. استخدمنا دالة فقدان الانتروبيا الثنائية البؤرية لمعالجة عدم توازن الفئات. تم تقييم الأداء باستخدام ثلاث مقاييس: الدقة (مع عتبة 0.5)، AUROC، وAUPRC.

النتائج والمناقشة

مجموعة المرضى

يوضح الشكل [fig_3](A) تطبيق معايير الشمول والاستبعاد، حيث تم الحصول على 37,006 عينة مرضى، منها 6,104 عينة إيجابية و30,902 عينة سلبية. يلخص الجدول 2 خصائص المرضى. في الشكل [fig_3](B)، تظهر الفروقات في المؤشرات الحيوية بين المجموعتين عند \(t=0\)، بينما يوضح الشكل [fig_3](C) الفروقات عند \(t=-24\). أظهرت اختبارات t-test أن الفروقات بين المجموعتين ذات دلالة إحصائية حتى قبل 24 ساعة من التدهور، مما يدعم استخدام التعلم العميق لاكتشاف الأنماط الخفية. يوضح الشكل 3 توزيع المرضى عبر الزمن.

أداء النموذج

يلخص الجدول 3 والشكل 4 أداء النموذج بعد استراتيجية التدريب ثلاثية المراحل. عند أفق 24 ساعة، بلغت الدقة 86.4%، وAUROC 0.808، وAUPRC 0.559. رغم اختلاف مجموعات البيانات، إلا أن النتائج مماثلة لتلك المنشورة سابقاً . كما لوحظ تحسن الدقة مع تقليل أفق التنبؤ.

يظهر من الشكل 4 أن AUROC وAUPRC يتحسنان باستمرار بعد كل مرحلة تدريبية، باستثناء أفق الثلاث ساعات حيث كان التحسن محدوداً. يشير ذلك إلى أن استراتيجية التدريب الثلاثية أكثر فعالية في الآفاق الزمنية الأطول.

عند مقارنة أداء المراحل الثلاث، يتضح أن الاستراتيجية المعتمدة تعزز أداء النموذج من خلال إجباره على استخراج المعلومات أولاً من بيانات SEQ ثم من دمج SEQ وnon-SEQ، ويظهر ذلك في تحسن الدقة وAUROC وAUPRC.

أداء النموذج. ملخص أداء الشبكة المقترحة بعد التدريب عبر جميع آفاق التنبؤ.
أفق التنبؤ (ساعات) 3 6 9 12 15 18 21 24
الدقة
AUROC
AUPRC

دراسات الاستبعاد

لفهم أثر الخيارات التصميمية في بنية النموذج، تمت مقارنة النموذج المقترح مع نموذجين آخرين. النموذج الأول، شبكة المؤشرات الحيوية غير الذاكرية (MLVS-Net)، يعالج بيانات non-SEQ وآخر مجموعة من المؤشرات الحيوية فقط دون أي معلومات زمنية، حيث تُعالج البيانات عبر MLP من طبقتين FC (كل منها 16 بعداً)، ثم تُدمج مع تمثيل non-SEQ. تم تدريب النموذج بنفس الاستراتيجية مع تجميد أوزان MLP في المرحلة الثانية. النموذج الثاني، شبكة الحالة الصحية غير الزمنية (nSHS-Net)، يعتمد فقط على بيانات non-SEQ، حيث تمر عبر طبقتين FC لإنتاج التنبؤ.

تظهر المقارنة في الشكل 5. أولاً، أداء nSHS-Net هو الأضعف، ما يؤكد أهمية المؤشرات الحيوية. عند مقارنة MLVS-Net وSVS-Net، يتفوق الأخير في جميع آفاق التنبؤ وجميع المقاييس، ما يبرز أهمية المعلومات الزمنية في تحسين دقة التنبؤ. النتائج الرقمية موضحة في الملحق الأول، الجدول الرابع.

تحليل الإخفاء

لتقييم تأثير كل متغير مدخل، أجرينا تحليل إخفاء على النموذج النهائي، حيث يتم إخفاء كل ميزة على حدة (بجعل قيمتها صفراً) وتقييم الأداء على مجموعة التحقق. كلما انخفضت مؤشرات الأداء عند إخفاء ميزة معينة، زادت أهميتها في التنبؤ.

تظهر النتائج في الشكل [fig_7]. كما هو موضح في الشكل [fig_7](A)، من بين ميزات non-SEQ، كان للعمر التأثير الأكبر على أداء النموذج. أما بقية ميزات CCC فكان تأثيرها أقل وغير ثابت عبر المقاييس وآفاق التنبؤ. يجب التنويه إلى أن الترابط بين الميزات قد يخفي أهمية بعضها في هذا التحليل.

على سبيل المثال، إذا أثرت إحدى ميزات CCC على تغيرات المؤشرات الحيوية عبر الزمن، فقد يلتقط النموذج هذا التأثير ضمنياً. في هذه الحالة، قد يظهر تحليل الإخفاء أن الميزة غير مهمة، لكن ذلك لا يعني عدم أهميتها الفعلية. أما بين ميزات SEQ، فكان معدل ضربات القلب الأكثر أهمية، يليه تشبع الأكسجين، ثم درجة الحرارة.

من المهم الإشارة إلى أن الشكل 7 يوضح أن المؤشرات الحيوية أكثر أهمية من الميزات السريرية والأمراض المصاحبة، وأن السلاسل الزمنية للمؤشرات الحيوية تقدم معلومات إضافية مقارنة بالقياسات اللحظية فقط. تتوافق هذه الملاحظة مع التحليل السابق. النتائج الرقمية موضحة في الملحق الأول، الجدول الخامس.

الخلاصة

انطلقت هذه الدراسة من توفر الأجهزة الطبية الشخصية مثل الأنظمة القابلة للارتداء (كالساعات الذكية) التي تسجل بيانات طبية زمنية، وإمكانية الاستفادة منها في الطب عن بُعد للتنبؤ بتدهور الحالة الصحية. باختصار، قمنا باقتراح وتطوير وتقييم نموذج تنبؤ بالتدهور باستخدام مجموعة بيانات كبيرة (n=37,006) جمعت في NYU Langone Health بين يناير 2020 وسبتمبر 2022. حقق النموذج AUROC بين 0.808 و0.880 عبر آفاق التنبؤ من 3 إلى 24 ساعة.

تتميز الدراسة بعدة نقاط قوة: أولاً، يعتمد النموذج على مجموعة ميزات محدودة تتكون من سلاسل زمنية لثلاثة مؤشرات حيوية روتينية (تشبع الأكسجين، معدل ضربات القلب، ودرجة الحرارة)، بالإضافة إلى معلومات أساسية عن المريض (الجنس، العمر، حالة وتاريخ التطعيم، السمنة، ارتفاع ضغط الدم، والسكري) يمكن جمعها بسهولة. مقارنة بالدراسات السابقة التي حققت AUROC بمقدار 0.765، فإن نموذجنا يحقق أداء مماثلاً رغم اختلاف نوعية البيانات. لتقييم أهمية الميزات السريرية والأمراض المصاحبة وأهمية استخدام السلاسل الزمنية، أجرينا تحليلاً للحساسية عبر تجربة الإخفاء ودراسة الاستبعاد. أظهرت النتائج أهمية نمذجة التغيرات الزمنية للمؤشرات الحيوية وإمكانية تحقيق دقة عالية دون الحاجة لصور طبية متقدمة. كما أن الإطار المقترح قابل للتوسع ليشمل آفاق تنبؤ مختلفة ونوافذ زمنية متنوعة.

هناك بعض القيود: أولاً، تم تحديد نوافذ الإدخال بـ24 ساعة فقط. في الدراسات المستقبلية، نخطط لتغيير طول النوافذ ودراسة أثر ذلك على الأداء بهدف تقليل التعقيد الحسابي إذا أمكن تحقيق نتائج مماثلة بنوافذ أقصر. ثانياً، لم يتم إجراء تحقق خارجي أو مستقبلي للنموذج بسبب عدم توفر بيانات مماثلة. وأخيراً، نعتقد أن النتائج النهائية يمكن تحسينها عبر ضبط المعاملات الفائقة مثل معدل التعلم، وهو ما سنعمل عليه مستقبلاً.

ختاماً، تبرز هذه الدراسة إمكانية تطوير نموذج تنبؤي سهل الوصول وقابل للتوسع لدعم الكادر الطبي في اتخاذ القرار. وتكمن أهمية النموذج في إمكانية جمع البيانات المستخدمة بسهولة من المرضى عبر أجهزة الاستشعار القابلة للارتداء وبعض البيانات السريرية الذاتية.

الشكر والتقدير

\(\bullet\) التمويل: تم تنفيذ هذا العمل بدعم من المؤسسة الوطنية للعلوم (منحة رقم 2031594).

\(\bullet\) تضارب المصالح: س. فاروق أتاشزار وياو وانغ هما مخترعا "جهاز ذكي قابل للارتداء لتتبع الصحة، تتبع المخالطين، وتنبؤ تدهور الحالة الصحية" المرخص لشركة Tactile Robotics, Ltd., كندا.

الملحق الأول

نقدم هنا النتائج الرقمية المتعلقة بالشكل 5 في الجدول 4، والنتائج المتعلقة بالشكل [fig_7] في الجدول 5.

مقارنة رقمية بين SVS-Net وMLVS-Net وnSHS-Net عبر آفاق التنبؤ من 3 إلى 24 ساعة
أفق التنبؤ (ساعات) 3 6 9 12 15 18 21 24
SVS-Net 0.879 0.871 0.866 0.868 0.866 0.865 0.865 0.864
MLVS-Net
nSHS-Net
SVS-Net 0.880 0.857 0.843 0.829 0.817 0.817 0.814 0.808
MLVS-Net
nSHS-Net
SVS-Net 0.666 0.628 0.601 0.592 0.572 0.574 0.568 0.559
MLVS-Net
nSHS-Net

مقارنة رقمية لجميع عمليات الإخفاء على الميزات السريرية وميزات الأمراض المصاحبة وبيانات المؤشرات الحيوية الزمنية عبر آفاق التنبؤ من 3 إلى 24 ساعة
أفق التنبؤ (ساعات) 3 6 9 12 15 18 21 24
بدون إخفاء
الجنس
السمنة
العمر
السكري
ارتفاع ضغط الدم
مدة التطعيم
حالة التطعيم
معدل ضربات القلب
تشبع الأكسجين
درجة الحرارة


  1. سرمد مهرداد يعمل في قسم الهندسة الكهربائية وهندسة الحاسوب بجامعة نيويورك (NYU). ياو وانغ تعمل في نفس القسم، بالإضافة إلى قسم الهندسة الطبية الحيوية. فرح الشاموت تعمل في قسم الهندسة بجامعة نيويورك أبوظبي، وأيضاً في علوم الحاسوب والهندسة الطبية الحيوية في NYU Tandon. س. فاروق أتاشزار يعمل في قسم الهندسة الكهربائية وهندسة الحاسوب، وأيضاً في قسم الهندسة الميكانيكية والفضائية بجامعة نيويورك.
    \(^*\) المؤلف المراسل: س. ف. أتاشزار (f.atashzar@nyu.edu)↩︎


تم تحويل هذه النسخة تلقائياً من LaTeX.
يتم عرض المعادلات الرياضية باستخدام MathJax.