ArXiv ID: 2408.02547v1
Original LaTeX: ./nyuad_arxiv_papers/nyuad_papers_comprehensive/source_code/2408.02547v1_extracted/Root_ArXiv.tex
Converted: 2025-06-06 13:15:52

دور الشبكات العضلية الوظيفية في تحسين إدراك إشارات اليد لواجهات الإنسان-الآلة

كوستانزا أرميني\(^{*1}\)، توكا الحناي\(^{2}\)، فرح إي. شمعوت\(^{2,3,4}\)، إس. فاروق أطشزار\(^{3,5,6}\) 1 2 3 4 5 6 7

الملخص

تطوير نماذج دقيقة لإدراك إشارات اليد يُعد أمرًا بالغ الأهمية للعديد من تطبيقات الروبوتات، خاصة الروبوتات التفاعلية والروبوتات العصبية. تُمكّن هذه النماذج من تحقيق تواصل أكثر سلاسة وفعالية بين الإنسان والآلة، مما يؤثر بشكل مباشر على مجال الروبوتات العصبية. في الآونة الأخيرة، حظيت تقنية تخطيط كهربية العضلات السطحية (sEMG) باهتمام واسع نظرًا لغناها المعلوماتي وسهولة استخدامها عند دمجها مع تقنيات تعلم الآلة المتقدمة والأنظمة القابلة للارتداء. وقد تناولت الأدبيات العديد من الأساليب لتحسين الأداء مع ضمان المتانة في الروبوتات العصبية باستخدام sEMG، إلا أن هذه الجهود غالبًا ما تؤدي إلى نماذج تتطلب قدرة معالجة عالية وبيانات ضخمة وحلول أقل قابلية للتوسع. تتناول هذه الورقة هذا التحدي من خلال اقتراح فك تشفير تزامن العضلات بدلاً من تفعيل العضلات الفردية. ندرس الشبكات العضلية الوظيفية المعتمدة على التوافق (coherence) كأساس للعملية الحسابية في نموذج الإدراك لدينا. نفترض أن التزامن الوظيفي بين العضلات والشبكة الرسومية الناتجة عن ترابط العضلات تحمل معلومات سياقية حول إشارات اليد المقصودة، ويمكن فك تشفيرها باستخدام تقنيات تعلم آلة بسيطة (مثل آلات الدعم الناقل) دون الحاجة إلى شبكات عميقة زمنية تتطلب موارد حسابية كبيرة. من شأن هذه التقنية أن تؤثر على التحكم العضلي الكهربائي في الروبوتات العصبية من خلال تقليل العبء الحسابي بشكل كبير وتعزيز الكفاءة. تم اختبار المنهجية المقترحة باستخدام قاعدة بيانات Ninapro DB-2، التي تحتوي على 12 إشارة EMG من 40 مشاركًا يؤدون 17 إشارة يد مختلفة. حقق النهج دقة إجمالية بلغت \(\mathbf{85.1\%}\)، مما يُظهر تحسنًا في الأداء مقارنة بالطرق الحالية مع تقليل كبير في متطلبات القدرة الحسابية. تدعم النتائج الفرضية القائلة بأن الشبكة العضلية الوظيفية المعتمدة على التوافق تحمل معلومات أساسية تتعلق بتنفيذ الإشارات، مما يعزز بشكل كبير إدراك إشارات اليد مع إمكانيات تطبيقية في أنظمة الروبوتات العصبية والآلات التفاعلية.

الروبوتات المتمركزة حول الإنسان، اللمس وواجهات اللمس، الروبوتات والأنظمة الطبية.

المقدمة

تُعد الروبوتات العصبية والروبوتات التفاعلية من أبرز المجالات البحثية التي طُبقت فيها نماذج التعرف على إشارات اليد بشكل واسع. إذ تشكل هذه النماذج جوهر استراتيجيات التحكم، حيث تتيح تواصلاً بديهيًا وفعالًا بين الإنسان والآلة، وهو أمر أساسي لتحقيق تفاعل سلس. لقد دُرست تقنية تخطيط كهربية العضلات السطحية (sEMG) على نطاق واسع لتطبيقاتها في التحكم بالأطراف الاصطناعية والروبوتات العصبية وواجهات الإنسان-الآلة ، ، ، . ويعود ذلك إلى قدرتها على التعرف على إشارات اليد والتنبؤ بها بطريقة قابلة للارتداء وغير جراحية.

عند دمج إشارات sEMG مع تقنيات تعلم الآلة، تبرز إمكانيات كبيرة لتطوير نماذج إدراك دقيقة، مما يعزز تفسيرها ويُمكّن من بناء نماذج فعالة للتعرف على إشارات اليد ، . في هذه الأساليب، تُستخرج الميزات عادة من المجال الزمني (مثل الجذر التربيعي المتوسط، التباين، القيمة المطلقة المتوسطة، عدد عبور الصفر، المدرج التكراري) أو المجال الترددي (مثل تحويل فورييه قصير الزمن، معاملات السبيستروم)، ثم تُغذى إلى مصنفات تقليدية مثل آلات الدعم الناقل (SVM) أو تحليل التمييز الخطي (LDA) ، ، ، . من أبرز القيود في هذه الأساليب التقليدية بساطة الميزات المستخرجة والنماذج المستخدمة، مما يجعلها تواجه صعوبة في الحفاظ على دقة عالية مع زيادة تعقيد وتنوع الإشارات. مع ظهور البيانات الضخمة، اتجه الباحثون نحو تقنيات التعلم العميق (DL)، التي أظهرت نتائج واعدة في تحسين أداء مهام التعرف على إشارات اليد المعتمدة على sEMG. تستفيد هذه النماذج من كميات ضخمة من البيانات وبنى الشبكات العصبية المتقدمة لتحقيق دقة ومتانة أعلى. على وجه الخصوص، تزيل الشبكات العصبية الالتفافية (CNN) الحاجة إلى هندسة الميزات يدويًا، مما يحسن أداء النموذج ، . كما تم استخدام شبكات الذاكرة طويلة وقصيرة الأمد (LSTM) لقدرتها على التقاط ديناميكيات الإشارات الزمنية ، . مؤخرًا، أظهر فريقنا إمكانيات نماذج التعلم العميق الأكثر تقدمًا، مثل المحولات البصرية (Vision Transformers) مع التعلم الانتقالي، مما عزز الأداء وقابلية التعميم لواجهات الأعصاب ، . رغم هذه الإمكانيات، تواجه نماذج التعلم العميق تحديات خاصة بها، إذ أن معظمها صُممت أساسًا لمعالجة النصوص وتستهلك موارد حسابية كبيرة وتتطلب مجموعات بيانات ضخمة، مما يعيق تطبيقها العملي في الأنظمة الزمنية الحقيقية. في هذه الورقة، نقدم منهجية جديدة تركز على مفهوم الشبكات العضلية الوظيفية، بهدف توفير نموذج دقيق لإدراك إشارات اليد يوازن بين الأداء والكفاءة الحسابية.

image

مؤخرًا، ظهر مفهوم الشبكات العضلية الوظيفية المعتمدة على التوافق في علم الأعصاب بهدف نمذجة الترابط التآزري بين العضلات المختلفة، خاصة لتطبيقات التشخيص والمؤشرات الحيوية لاضطرابات الجهاز العصبي العضلي، مثل الفيزيولوجيا المرضية لمرض باركنسون ، والتغيرات في الترابط العضلي الوظيفي لدى الناجين من السكتة الدماغية ، وبروتوكولات التأهيل الجديدة ، ، أو تأثير التعب أثناء التمارين المتكررة ، . كما تم دراسة التوافق العضلي لفهم تقنيات التزامن والتحكم في الجسم البشري أثناء أداء المهام اليومية البسيطة، مثل مهام التوازن ، والمشي ، أو لتقييم الأداء الصوتي واضطرابات الصوت . مستلهمين من نظرية الرسوميات وتحليل ترابط الدماغ، تمثل الشبكات العضلية الوظيفية أداة ناشئة لفك شفرة كيفية توزيع الدفعة العصبية القادمة من الجهاز العصبي المركزي (CNS) بشكل تآزري بين العضلات المختلفة للتحكم في الجهاز العضلي الهيكلي. يمكن لهذه الشبكات أن توفر رؤى مهمة حول كيفية تحكم الجهاز العصبي المركزي وتنسيقه لتفعيل العضلات أثناء أداء المهام الوظيفية. من المقبول على نطاق واسع أنه عند أداء حركة ما، يقوم الجهاز العصبي المركزي بترميز الوظيفة من خلال التحكم في سلسلة من الوظائف العضلية التعاونية (مثل اختيار إجراء من مكتبة الحركات) . وقد تم دراسة هذا المفهوم تقليديًا في الأدبيات تحت مسمى التحكم التآزري للعضلات، وتم توسيعه مؤخرًا ليشمل مفهوم الشبكات الوظيفية التآزرية التي تقدم رؤية شاملة لتوزيع الدفعة العصبية عبر العضلات المختلفة أثناء أداء المهام الوظيفية . تؤكد هذه المفاهيم أن الجهازين العصبي والعضلي الهيكلي يعملان معًا لتنسيق التآزر العضلي اللازم لتنفيذ الحركات والسلوكيات المعقدة. يمثل التوافق العضلي درجة التزامن بين العضلات التي تعمل بتناغم عند ترددات مختلفة لتنفيذ المهام الوظيفية. ويجدر الإشارة إلى أن مصطلح التوافق يشير إلى مقياس إحصائي يُستخدم لدراسة العلاقة بين إشارتين عند ترددات مختلفة، بينما يدرس التوافق العضلي تحديدًا تزامن الإشارات العضلية المختلفة . في هذا السياق، يُستخدم مقياس التوافق التربيعي المطلق (MSC) كمؤشر للارتباط الخطي بين إشارتين في المجال الترددي. تتراوح قيمة MSC بين \(0\) و\(1\)، حيث تشير \(MSC = 1\) إلى ارتباط خطي تام (أي أن الإشارتين متطابقتان) عند تردد معين، بينما تشير \(MSC = 0\) إلى عدم وجود ارتباط عند ذلك التردد.

في هذه الورقة، نقدم مصنف تعلم آلي يعتمد على تحليل تزامن العضلات الوظيفية التي تمثل تنسيق العضلات أثناء أداء إشارة اليد. يوضح الشكل التخطيطي للعملية المقترحة في الشكل [fig::WorkFlow]. لاختبار فرضيتنا، قمنا بتقييم النموذج باستخدام مجموعة بيانات عامة - NinaPro . في هذا السياق، قمنا بدراسة أنماط الشبكات العضلية الوظيفية المعتمدة على التوافق لـ \(40\) مشاركًا سليمًا أثناء أداء \(17\) حركة يد مختلفة. تُعالج الميزات المستخرجة من الشبكات العضلية الوظيفية في المجال الترددي بواسطة آلة دعم ناقل بسيطة لتصنيف الإشارات. دعمت النتائج الفرضية المركزية لهذه الورقة، حيث أظهرت أن الشبكات العضلية الوظيفية المعتمدة على التوافق تحمل معلومات أساسية تتعلق بتنفيذ الإشارات، مما يسمح بتطوير مصنف إشارات منخفض الأبعاد يستفيد بفعالية من التناغم الوظيفي بين العضلات المختلفة بدلاً من التركيز على شدة التفعيل في كل عضلة على حدة. كما يعزز هذا النهج فهمنا لتنسيق العضلات ويبرز التطبيقات العملية لشبكات التوافق العضلي في بناء نماذج فعالة ودقيقة لإدراك الإشارات. يمكن أن يؤدي هذا الأسلوب إلى تبسيط عملية التصنيف وزيادة كفاءتها، مما يجعله خيارًا مناسبًا للتطبيقات الزمنية الحقيقية، بما في ذلك الروبوتات العصبية والأنظمة التفاعلية. علاوة على ذلك، توفر النتائج رؤى أعمق حول العمليات العصبية العضلية الأساسية وتُمكّن من تطوير نماذج أكثر تقدمًا وقابلة للتفسير.

تنظم بقية الورقة على النحو التالي: في القسم 2 نستعرض البيانات ومعالجتها المسبقة، بينما يوضح القسم 3 تحليل التوافق ودراسة الشبكات العضلية. في القسم 4 نستخدم هذه النتائج لتطوير مصنف إشارات اليد باستخدام آلة الدعم الناقل، مع عرض النتائج ومقارنتها مع الأدبيات الحالية. أخيرًا، في القسم 5 نستخلص الاستنتاجات ونناقش آفاق العمل المستقبلي.

البيانات والمعالجة المسبقة

تم تقديم العديد من مجموعات بيانات sEMG وإتاحتها للعامة في الأدبيات ، ومن بينها تبرز مبادرة NinaPro لشعبيتها في المجتمع العلمي ومجال الروبوتات. تمثل NinaPro (الأطراف الاصطناعية التكيفية غير الجراحية) مشروعًا بحثيًا شاملاً يوفر مجموعة واسعة من تسجيلات sEMG المأخوذة من أشخاص سليمين ومبتوري اليد من مستوى الساعد أثناء أداء مجموعة من إشارات وحركات اليد والمعصم. تتكون من \(10\) مجموعات بيانات تختلف في عدد المشاركين والحركات وطرق التسجيل.

image

نستخدم في هذا العمل قاعدة بيانات Ninapro DB-2، التي تحتوي على بيانات sEMG وحركية وقوة من \(40\) مشاركًا سليمًا (\(28\) ذكور، \(12\) إناث؛ متوسط العمر \(29.9 \pm 3.9\) سنة؛ \(34\) أيمن و\(6\) أعسر). تم جمع البيانات الحركية باستخدام قفاز Cyberglove 2، بينما تم جمع إشارات sEMG باستخدام \(12\) قطبًا من نوع Delsys Trigno، وُزعت كالتالي: ثمانية أقطاب حول الساعد بالقرب من مفصل الكوع، وقطبان على مواقع النشاط الرئيسية لعضلتي الثني والباسط للأصابع، وقطبان على مواقع النشاط الرئيسية للعضلتين ذات الرأسين والثلاثية الرؤوس. تم أخذ عينات إشارات sEMG بتردد \(2000\) هرتز.

خلال جمع البيانات، طُلب من المشاركين تقليد حركات تظهر في مقاطع فيديو على شاشة حاسوب محمول. أدى جميع المشاركين الحركات باليد اليمنى لمدة \(5\) ثوانٍ، تليها \(3\) ثوانٍ من الراحة، وتضمن البروتوكول \(6\) تكرارات لكل حركة. بينما تحتوي قاعدة البيانات الكاملة على \(49\) حركة يد ومعصم، نركز هنا فقط على \(17\) إشارة من التمرين B، الموضحة في الشكل [fig::Gestures].

image

المعالجة المسبقة

نستخدم كامل مدة بيانات كل إشارة وهي \(5\) ثوانٍ، بما في ذلك الطور الانتقالي (يمثل أول \(1\) ثانية من تفعيل الحركة ) وحالة الثبات للانقباض (الأربع ثواني المتبقية). تم تقسيم بيانات التدريب والاختبار لتصنيف الإشارات بناءً على رقم التكرار، كما في ودراسات أخرى نستخدمها كمرجعية: التكرارات \(1\)، \(3\)، \(4\)، و\(6\) للتدريب، بينما التكرارات \(2\) و\(5\) للاختبار.

لضمان جودة وقابلية استخدام بيانات sEMG، تم تنفيذ سلسلة من خطوات المعالجة المسبقة باستخدام مرشحات رقمية:

  • الترشيح النطاقي (Bandpass): تم تصميم مرشح Butterworth من الدرجة الرابعة بنطاق تمرير من \(10\) هرتز إلى \(900\) هرتز للاحتفاظ بالترددات ذات الصلة لإشارات sEMG مع تقليل الترددات غير المرغوب فيها.

  • الترشيح النوتشي (Notch): تم تطبيق مرشح نوتشي لإزالة تداخل التيار الكهربائي عند \(50\) هرتز.

تم أيضًا تطبيق ترشيح عديم الطور (Zero-phase) لتجنب تشويه الطور. بعد ذلك، تم تطبيق معيار Z-score حيث تم تطبيع البيانات ليكون متوسطها \(0\) وانحرافها المعياري \(1\)، بناءً على مجموعة التدريب فقط. يضمن ذلك أن تكون البيانات على مقياس موحد، وهو أمر أساسي للتحليل الفعال والمقارنة.

تحليل التوافق العضلي

يشير التوافق العضلي إلى مدى تطابق مكونات التردد في إشارة عضلية مع أخرى عبر الزمن. تشير القيم العالية للتوافق إلى أن العضلات تعمل بتنسيق عالٍ، بينما تشير القيم المنخفضة إلى قلة التآزر. يمكن قياس التوافق بين زوج من الإشارات باستخدام مقياس التوافق التربيعي المطلق (MSC). إذا كان لدينا إشارتان \(x(t)\) و\(y(t)\)، فإن MSC يُعرّف كالتالي: \[\label{eq:MSC} MSC(f) = \frac{|{P}_{xy}(f)|^2}{P_{xx}(f) \cdot P_{yy}(f)} \; ,\]

حيث:

تتراوح قيمة MSC بين \(0\) و\(1\)، حيث تشير \(MSC = 1\) إلى ارتباط خطي تام عند تردد معين (أي أن الإشارتين متطابقتان عند هذا التردد)، بينما تشير \(MSC = 0\) إلى عدم وجود ارتباط خطي عند ذلك التردد (أي أن الإشارتين غير مترابطتين تمامًا). من خلال تحليل قيم MSC عبر أزواج العضلات والترددات المختلفة، يمكننا استخلاص أنماط تنسيق النشاط العضلي أثناء أداء الإشارات المدروسة.

image

لحساب الكثافات الطيفية في المعادلة [eq:MSC]، تم استخدام طريقة ويلش (Welch) بحجم نافذة \(600\) عينة (أي ما يعادل \(300\) مللي ثانية عند تردد أخذ العينات \(2\) كيلوهرتز) وتداخل بنسبة \(50\%\). في النهاية، تم الحصول على مصفوفات التوافق التي تحتوي على قيم MSC عبر المجال الترددي لكل زوج من الإشارات.

يعرض الشكل [fig::MSC] النتائج التي تم الحصول عليها للمشارك رقم \(19\) لجميع الإشارات السبعة عشر. تحتوي كل مصفوفة على \(12 \times 12 = 144\) خانة، تمثل القيم المتوسطة للتوافق لكل زوج من الإشارات عبر جميع التكرارات. اللون يعكس شدة التوافق الزوجي، حيث يشير اللون الأزرق إلى \(MSC = 0\) (عدم وجود توافق) والأصفر إلى \(MSC = 1\) (توافق أقصى). ونظرًا لأن الترابط بين الإشارات غير موجه، فإن المصفوفات متماثلة. كما أن القيم القطرية تمثل توافق الإشارة مع نفسها، أي \(x=y\) في المعادلة [eq:MSC]، مما يؤدي بالضرورة إلى \(MSC=1\) (الإشارتان متطابقتان). تم تعيين هذه القيم يدويًا إلى \(0\) لتجنب طغيانها على أنماط الترابط الأخرى ذات القيم المنخفضة.

يمثل الشكل [fig::Networks] الشبكات التوافقية المستخرجة من بيانات المشارك رقم 1. كل عقدة تمثل حساسًا، بينما تمثل الحواف بين العقد قيم التوافق، ويعكس لون الحافة شدة التوافق.

من خلال الشكلين، يمكن ملاحظة أن إشارة تمديد المعصم (رقم \(14\)) أظهرت أعلى قيم التوافق العضلي، تليها إشارات \(5\) (إبعاد جميع الأصابع)، \(6\) (قبضة اليد)، \(8\) (إبعاد الأصابع الممدودة)، \(13\) (ثني المعصم) و\(15\) (انحراف المعصم الشعاعي)، مع اختلاف مستويات MSC حسب المشارك.

نموذج تصنيف الإشارات

في هذا القسم، نقدم النموذج المقترح مع مناقشة الأعمال السابقة التي استخدمت نفس مجموعة البيانات والتي تمثل خط الأساس للمقارنة. لقد استُخدمت قاعدة بيانات Ninapro DB-2 على نطاق واسع لتصنيف إشارات sEMG باستخدام أساليب تعلم الآلة التقليدية مثل الغابات العشوائية، وآلات الدعم الناقل، وأقرب الجيران ، بالإضافة إلى تقنيات التعلم العميق المتقدمة مثل الشبكات العصبية الالتفافية ، ، وشبكات LSTM ، والأساليب الهجينة ، وشبكة الكبسولات الفعالة (CapsNet) . يوضح الجدول [table:Comparison] خصائص ودقة الأساليب التي استخدمت نفس مجموعة البيانات (التمرين B مع \(17\) إشارة)، مما يشكل خط الأساس لطريقتنا. تهدف هذه الورقة إلى إثبات أنه من خلال الاستفادة من مفهوم التوافق العضلي يمكن تحقيق نتائج تصنيف مماثلة أو أفضل. يركز نهجنا على استخراج ميزات ذات معنى من التوافق التربيعي المطلق لإشارات sEMG، مما يقلل من تعقيد النموذج دون التأثير على دقته. يمكن تحقيق ذلك باستخدام نموذج تعلم آلة تقليدي مثل آلة الدعم الناقل (SVM).

بعد الحصول على مصفوفات MSC في القسم 3، تم تقليل التكلفة الحسابية للنموذج من خلال حساب المتوسط لقيم MSC عبر المجال الترددي. ينتج عن هذه العملية مصفوفة ميزات بحجم \(102 \times 132\). عدد الصفوف (\(102\)) ناتج عن حاصل ضرب \(17\) حركة في \(6\) تكرارات. على سبيل المثال، الصفوف \(1-6\) تحتوي على بيانات التكرارات الستة للإشارة الأولى، والصفوف \(7-12\) للإشارة الثانية، وهكذا. كل صف يحتوي على مصفوفة التوافق المتوسطة لحركة وتكرار معينين، مرتبة في شكل متجه بدون القيم القطرية حيث \(MSC = 1\). بذلك نحصل على \(132\) عمودًا: \(12 \times 12 = 144\) احتمال لزوج إشارات، ناقص \(12\) قيم قطرية.

الإشارة الدقة [\(\textbf{\%}\)] الدقة الإيجابية [\(\textbf{\%}\)] الاسترجاع [\(\textbf{\%}\)] معدل F1 [\(\textbf{\%}\)] AUC [\(\mathbf{10^{-2}}\)]
1 إشارة الإبهام للأعلى 91.3 87.3 91.3 87.6 97.8
2 تمديد وثني السبابة والوسطى 83.6 85.4 83.8 81.9 95.7
3 ثني البنصر والخنصر، تمديد الباقي 82.5 80.6 82.5 78.4 97.5
4 الإبهام مقابل قاعدة الخنصر 85.0 82.9 85.0 81.3 98.3
5 إبعاد جميع الأصابع 82.5 77.2 82.5 76.7 98.3
6 قبضة اليد 87.5 92.5 87.5 88.1 98.0
7 إشارة السبابة 83.8 76.7 83.8 78.1 97.1
8 إبعاد الأصابع الممدودة 83.8 87.9 83.8 83.4 95.9
9 استدارة المعصم (محور السبابة) 77.5 85.8 77.5 79.2 94.4
10 كب المعصم (محور السبابة) 86.3 86.7 86.3 84.4 97.9
11 استدارة المعصم (محور الخنصر) 87.5 85.8 87.5 84.3 96.6
12 كب المعصم (محور الخنصر) 86.2 79.2 86.3 81.4 97.4
13 ثني المعصم 85.0 92.5 85.0 86.8 96.4
14 تمديد المعصم 80.0 97.9 80.0 85.3 93.3
15 انحراف المعصم الشعاعي 76.2 84.6 76.3 78.6 91.7
16 انحراف المعصم الزندي 93.8 94.6 93.8 92.9 99.8
17 تمديد المعصم مع انغلاق اليد 93.8 96.2 93.8 93.5 98.5
المتوسط \(\textbf{85.1}\) \(\textbf{86.7}\) \(\textbf{85.1}\) \(\textbf{83.6}\) \(\textbf{96.8}\)

تُستخدم مصفوفة الميزات بعد ذلك لتدريب نموذج آلة دعم ناقل متعدد الحدود. لضمان مقارنة عادلة مع الأدبيات، اتبعنا النهج القياسي باستخدام التكرارات \(1\)، \(3\)، \(4\)، و\(6\) للتدريب، مع تخصيص التكرارين المتبقيين للاختبار. ونظرًا لمحدودية البيانات وعدم وجود مجموعة تحقق منفصلة، استخدمنا التحقق المتقاطع بثلاثة أضعاف (3-fold cross-validation) لإجراء بحث شبكي لضبط معاملات آلة الدعم الناقل، أي رتبة النواة متعددة الحدود ومعامل التنظيم \(\mathcal{C}\). أدى ذلك إلى اختيار نواة متعددة الحدود من الرتبة \(2\) وقيمة \(\mathcal{C}\) تساوي \(10\)، والتي أعطت أفضل أداء في تجارب التحقق المتقاطع.

النتائج

تم تدريب واختبار مصنف SVM على كل مشارك بشكل منفصل. يعرض الجدول [table:Accuracy] متوسط الدقة والدقة الإيجابية والاسترجاع ومعدل F1 ومساحة تحت منحنى ROC (AUC) لكل إشارة مدروسة. كما يوضح الشكل [fig::ConfMatrix] متوسط مصفوفة الالتباس عبر جميع المشاركين. لكل إشارة، يتكون مجموعة الاختبار من \(2\) تكرارات. في المتوسط، تم التنبؤ بشكل صحيح بـ \(28.9\) عينة من أصل \(34\) عينة. أظهرت الفئة 9 (استدارة المعصم حول محور السبابة) أعلى معدلات الالتباس، وغالبًا ما تم الخلط بينها وبين الفئة 11 (استدارة المعصم حول محور الخنصر). يمكن توقع ذلك أيضًا من الشكلين [fig::MSC] و[fig::Networks]، حيث تظهر هاتان الفئتان قيم MSC متشابهة. كما تم الخلط بين الفئة 15 (انحراف المعصم الشعاعي) والفئة 3 (ثني البنصر والخنصر مع تمديد الباقي)، ومن نتائج المشارك 19 في الشكل [fig::MSC]، يمكن ملاحظة تشابه مصفوفتَي MSC لهاتين الفئتين.

رغم استخدام مصنف بسيط منخفض التكلفة الحسابية، كانت النتائج مماثلة أو حتى متفوقة أحيانًا على تلك الملخصة في الجدول [table:Comparison]، والتي تتضمن دقة الأساليب الحديثة باستخدام نفس مجموعة البيانات. تم تحقيق ذلك من خلال استخدام التوافق بين أزواج الإشارات كميزة رئيسية للمصنف بدلاً من النظر إلى كل إشارة على حدة، مما أدى إلى تقليل تعقيد الخوارزمية بشكل كبير.

image

المرجع المنهجية الميزات عدد الإشارات الدقة
التعلم الانتقالي لشبكة الكبسولات الفعالة ميزات مستخرجة بواسطة CNN 17 \(78.3\%\)
LSTM وCNN موسعة ميزات مستخرجة بواسطة CNN 17 \(82.0\%\)
توسيع زمني في LSTM وDeepNet ميزات مستخرجة بواسطة CNN 17 \(82.4\%\)
CNN متعددة المقاييس بالتوازي ميزات مستخرجة بواسطة CNN 17 \(83.8\%\)
هذه الورقة SVM MSC 17 \(\textbf{85.1\%}\)

أظهر نهجنا، كما هو موضح في الجدول [table:Comparison]، دقة إجمالية بلغت \(85.1\%\). حتى عند مقارنة نتائجنا مع أفضل أساليب التعلم العميق، نلاحظ تحسنًا في الدقة. وبينما تزيل تقنيات التعلم العميق الحاجة لاستخراج الميزات يدويًا، إلا أنها تتطلب بيانات ضخمة وموارد حسابية كبيرة. في المقابل، أظهرنا أن فك تشفير إشارات sEMG للحصول على التوافق بين العضلات يوفر رؤى مهمة حول استراتيجيات التحكم العصبي أثناء حركات اليد. من خلال استغلال هذه المعلومات، بنينا ميزاتنا وأثبتنا أن الأساليب الأبسط يمكن أن تكون فعالة بنفس القدر.

الخلاصة

في هذه الورقة، قدمنا مصنف تعلم آلي جديد يعتمد على الشبكات العضلية الوظيفية المعتمدة على التوافق لتحسين إدراك إشارات اليد. من خلال تحليل تنسيق العضلات أثناء الحركات اليدوية، يوفر نهجنا مصنف إشارات منخفض الأبعاد يلتقط بفعالية المعلومات الأساسية اللازمة لتنفيذ الإشارات بدقة. أظهر استخدام التوافق التربيعي المطلق لإشارات sEMG ومعالجتها بواسطة مصنف SVM بسيط أن هذه الطريقة لا تحسن فقط دقة التصنيف، بل توفر أيضًا كفاءة حسابية مناسبة للتطبيقات الزمنية الحقيقية. تؤكد النتائج إمكانيات الشبكات العضلية الوظيفية المعتمدة على التوافق في فك شفرة التنسيق العصبي العضلي، وتبرز أهميتها في تطوير واجهات إنسان-آلة بديهية وفعالة.

تمهد نتائجنا الطريق لتطورات في مجال الروبوتات العصبية والأنظمة التفاعلية، حيث يُعد التعرف على إشارات اليد بدقة وكفاءة وفي الزمن الحقيقي أمرًا بالغ الأهمية. من خلال استخراج ميزات ذات معنى عبر التوافق العضلي، يمكن دمج الطريقة المقترحة في استراتيجيات التحكم الروبوتي، مما يعزز دقة ومرونة واجهات الأعصاب. وبالنظر إلى الطبيعة متعددة الأنماط لمجموعة البيانات، يمكن للأعمال المستقبلية تحسين المصنف من خلال دمج معلومات إضافية، مما يزيد من متانته وتنوعه في السيناريوهات العملية. علاوة على ذلك، توفر نتائجنا رؤى أعمق حول العمليات العصبية العضلية المرتبطة بتنفيذ الإشارات، وتدعم تطوير نماذج متقدمة وقابلة للتفسير للأنظمة الروبوتية العصبية والآلات التفاعلية. سيركز العمل المستقبلي على تحسين النموذج بشكل أكبر، واستكشاف تطبيقه على مجموعة أوسع من الإشارات والسيناريوهات الواقعية، ودمجه في أنظمة عملية لتحقيق أقصى استفادة من إمكانياته.


  1. تم دعم المادة المقدمة في هذه الورقة جزئيًا من قبل مركز الذكاء الاصطناعي والروبوتات (CAIR) في جامعة نيويورك أبوظبي: الجائزة CG010. كما تم دعم العمل جزئيًا من قبل المؤسسة الوطنية للعلوم في الولايات المتحدة بموجب المنحتين رقم 2229697 و2121391. كما تم دعم العمل بجائزة من شركة Mathworks.

    المؤلف المراسل: كوستانزا أرميني ca3072@nyu.edu.↩︎

  2. \(^{1}\) مركز الذكاء الاصطناعي والروبوتات (CAIR)، جامعة نيويورك أبوظبي (NYUAD)، أبوظبي، الإمارات العربية المتحدة↩︎

  3. \(^{2}\) قسم الهندسة، جامعة نيويورك أبوظبي (NYUAD)، أبوظبي، الإمارات العربية المتحدة↩︎

  4. \(^{3}\) قسم الهندسة الطبية الحيوية، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎

  5. \(^{4}\) قسم علوم وهندسة الحاسوب، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎

  6. \(^{5}\) قسم الهندسة الكهربائية وهندسة الحاسوب، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎

  7. \(^{6}\) قسم الهندسة الميكانيكية والفضائية، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎


تم تحويل هذا الإصدار HTML تلقائيًا من LaTeX.
يتم عرض المعادلات الرياضية باستخدام MathJax.