يُعَدّ تطوير نماذج دقيقة لإدراك إشارات اليد أمرًا بالغ الأهمية لعدد كبير من تطبيقات الروبوتات، ولا سيّما الروبوتات التفاعليّة والروبوتات العَصَبيّة. تُتيح هذه النماذج تواصُلًا أكثر سلاسة وفاعليّة بين الإنسان والآلة، بما ينعكس مباشرةً على أداء الواجهات العَصَبيّة. في الآونة الأخيرة، حظيت تقنية تخطيط كهربيّة العضل السطحي (sEMG) باهتمام واسع نظرًا لغناها المعلوماتي، وإمكانية ارتدائها، وسهولة توظيفها مع تعلُّم الآلة المتقدِّم والأنظمة القابلة للارتداء. وعلى الرغم من كثرة الأساليب المقترحة لتحسين الأداء وضمان المتانة في الروبوتات العَصَبيّة اعتمادًا على sEMG، فإن كثيرًا منها يقود إلى نماذج تحتاج قدرة معالجة عالية وبيانات ضخمة، وتكون أقل قابليةً للتوسّع.
تعالج هذه الورقة هذا التحدّي عبر اقتراح فكّ ترميز التزامُن بين العضلات بدلًا من التركيز على تفعيل كل عضلة على حدة. ندرس الشبكات العضلية الوظيفية القائمة على التوافُق (coherence) كأساس حسابي في نموذج الإدراك لدينا. نفرض أنّ التزامُن الوظيفي بين العضلات، وما ينتج عنه من شبكة ترابُط عضلي، يحمل معلومات سياقيّة عن إشارات اليد المقصودة، ويمكن فكّ ترميزها باستخدام تقنيات تعلُّم آلة بسيطة مثل آلة الدَّعم الناقل (SVM)، من غير الحاجة إلى شبكات عميقة زمنية مُكلفة حسابيًّا. يُتوقَّع أن يؤثِّر هذا النهج إيجابًا في التحكُّم الكهربي العضلي في الروبوتات العَصَبيّة عبر خفض العبء الحسابي وتعزيز الكفاءة.
اختُبرت المنهجيّة المقترحة باستخدام قاعدة بيانات Ninapro DB-2، التي تضم 12 قناة sEMG لعدد 40 مشاركًا يؤدّون 17 إشارة يد مختلفة. حقّق النهج دقّة إجمالية بلغت \(\mathbf{85.1\%}\)، مُظهِرًا تحسُّنًا في الأداء مقارنةً بالأساليب الراهنة مع خفض كبير في المتطلّبات الحسابيّة. تؤكِّد النتائج فرضية أنّ الشبكات العضلية الوظيفية المعتمدة على التوافُق تحمل معلومات جوهرية تتعلّق بتنفيذ الإشارات، ما يُحسِّن إدراك إشارات اليد ويُبرز قابليّة التطبيق في الأنظمة العَصَبيّة والآلات التفاعليّة.
تُمثِّل الروبوتات العَصَبيّة والروبوتات التفاعُليّة من أبرز المجالات التي استُخدمت فيها نماذج التعرُّف إلى إشارات اليد على نطاق واسع؛ إذ تشكِّل هذه النماذج جوهر استراتيجيات التحكُّم، فتتيح تواصُلًا بديهيًّا وفعّالًا بين الإنسان والآلة، وهو أمر أساسي لتحقيق تفاعل سلس. لقد دُرست تقنية تخطيط كهربيّة العضل السطحي (sEMG) على نطاق واسع لتطبيقاتها في التحكُّم بالأطراف الاصطناعية والروبوتات العَصَبيّة وواجهات الإنسان-الآلة ، ، ، ، وذلك لقدرتها على التعرُّف إلى إشارات اليد والتنبّؤ بها بطريقة قابلة للارتداء وغير جراحيّة.
عند دمج إشارات sEMG مع تقنيات تعلُّم الآلة، تظهر إمكانات كبيرة لتطوير نماذج إدراك دقيقة وقابلة للتفسير، ما يُمكِّن من بناء مصنِّفات فعّالة لإشارات اليد ، . في هذه الأساليب، تُستخرَج الميزات عادةً من المجال الزمني (مثل الجذر التربيعي المتوسط، والتباين، والمتوسط المطلق للقيمة، وعدّ عبور الصفر، والمدرّج التكراري) أو من المجال التردُّدي (مثل تحويل فورييه قصير الزمن، ومعاملات السبيستروم)، ثم تُغذّى إلى مصنِّفات تقليدية كآلة الدَّعم الناقل (SVM) أو تحليل التمييز الخطي (LDA) ، ، ، . من قيود هذه الأساليب بساطةُ الميزات والنماذج، ما يجعل الحفاظ على دقّة عالية صعبًا مع تزايد تعقيد وتنوُّع الإشارات.
مع توسُّع البيانات، اتّجه الباحثون إلى التعلُّم العميق، الذي أظهر نتائج واعدة في تحسين أداء التعرُّف إلى إشارات اليد المعتمدة على sEMG. تستفيد هذه النماذج من كمّيات بيانات كبيرة وبُنى عصبية متقدّمة لتحقيق دقّة ومتانة أعلى. وعلى وجه الخصوص، تُغني الشبكات الالتفافية (CNN) عن هندسة الميزات يدويًّا، فتُحسِّن أداء النموذج ، . كما استُخدمت شبكات الذاكرة طويلة وقصيرة الأمد (LSTM) لقدرتها على التقاط ديناميّات الإشارات الزمنيّة ، . ومؤخرًا، أظهر فريقنا إمكانات نماذج أكثر تقدُّمًا مثل المحوِّلات البصريّة (Vision Transformers) مع التعلُّم الانتقالي، ما حسَّن الأداء وقابلية التعميم لواجهات الأعصاب ، . رغم ذلك، تبقى نماذج التعلُّم العميق مُكلفة حسابيًّا وتتطلّب مجموعات بيانات كبيرة، ما يحدّ من تطبيقها العملي في الزمن الحقيقي.
ظهر مفهوم الشبكات العضلية الوظيفية القائمة على التوافُق في علوم الأعصاب لنمذجة الترابُط التآزري بين العضلات المختلفة، لا سيّما لأغراض التشخيص والمؤشّرات الحيويّة لاضطرابات الجهاز العصبي العضلي، مثل الفيزيولوجيا المرضيّة لمرض باركنسون ، والتغيّرات في الترابُط الوظيفي لدى الناجين من السكتة الدماغيّة ، وبروتوكولات التأهيل الجديدة ، ، أو تأثير التعب أثناء التمارين المتكرّرة ، . كما استُخدم التوافُق العضلي لفهم آليات التزامُن والتحكُّم في الجسم عند أداء مهام يومية بسيطة، مثل التوازن ، والمشي ، وكذلك لتقييم الأداء الصوتي واضطرابات الصوت .
استلهامًا من نظرية الرسوم وتحليل ترابُط الدماغ، تُعدّ الشبكات العضلية الوظيفية أداة ناشئة لفكّ كيفيّة توزيع الدفعة العصبيّة الواردة من الجهاز العصبي المركزي (CNS) تآزريًّا بين العضلات للتحكُّم في الجهاز العضلي الهيكلي. يمكن لهذه الشبكات أن توفّر رؤى مهمّة حول كيف ينسِّق الجهاز العصبي المركزي تفعيل العضلات أثناء أداء المهام الوظيفية. ويُعتقد على نطاق واسع أنّ CNS يُشفِّر الحركات عبر التحكُّم في تآزرات عضلية وظيفية ، وقد دُرس هذا المفهوم تقليديًّا تحت مسمّى التحكُّم التآزري للعضلات، وتوسّع حديثًا إلى مفهوم الشبكات الوظيفية التآزرية التي تُقدِّم رؤية شاملة لتوزيع الدفعة العصبية عبر العضلات أثناء تنفيذ المهام .
يمثِّل التوافُق العضلي درجة التزامُن بين العضلات العاملة بتناغم عند تردّدات مختلفة لتنفيذ المهام الوظيفية. ونُشير هنا إلى أنّ مصطلح التوافُق هو مقياس إحصائي لدراسة العلاقة بين إشارتين عبر التردّدات، بينما يدرس التوافُق العضلي تحديدًا تزامُن الإشارات العضلية . في هذا السياق، يُستخدم مقياس التوافُق التربيعي المُطلق (MSC) كمؤشِّر للارتباط الخطي بين إشارتين في المجال التردّدي. تتراوح قيمة MSC بين \(0\) و\(1\)، حيث تشير \(MSC = 1\) إلى ارتباط خطي تام عند تردّد معيّن، و\(MSC = 0\) إلى انعدامه.
نُقدِّم في هذه الورقة مصنِّف تعلُّم آلة يعتمد على تحليل تزامُن العضلات الوظيفي الذي يمثِّل تنسيق العضلات أثناء أداء إشارة اليد. يوضّح الشكل التخطيطي للعملية المقترحة في الشكل [fig::WorkFlow]. لاختبار فرضيتنا، قيَّمنا النموذج على مجموعة بيانات NinaPro ، حيث درسنا أنماط الشبكات العضلية الوظيفية القائمة على التوافُق لـ\(40\) مشاركًا أصحّاء أثناء أداء \(17\) حركة يد. تُعالَج الميزات المُستخرجة من هذه الشبكات في المجال التردّدي بواسطة آلة دَّعم ناقل بسيطة لتصنيف الإشارات.
دعمت النتائج فرضيتنا المركزية بأن شبكات التوافُق العضلي تحمل معلومات أساسية ترتبط بتنفيذ الإشارات، ما يسمح ببناء مصنِّف منخفض الأبعاد يستثمر التناغم الوظيفي بين العضلات بدلًا من الاكتفاء بشدّة تفعيل كل عضلة منفردة. يُبَسِّط هذا النهج عملية التصنيف ويرفع كفاءتها، ما يجعله مناسبًا للتطبيقات الزمنية الحقيقية، بما يشمل الروبوتات العَصَبيّة والأنظمة التفاعلية. كما توفّر النتائج رؤى أعمق حول العمليات العَصَبيّة العضلية الأساسية وتدعم تطوير نماذج أكثر قابليةً للتفسير.
تُنظَّم بقية الورقة كما يلي: في القسم 2 نستعرض البيانات والمعالجة المسبقة، وفي القسم 3 نعرض تحليل التوافُق وبناء الشبكات. في القسم 4 نطوِّر مصنِّف إشارات اليد باستخدام آلة الدَّعم الناقل ونقدِّم النتائج مع مقارنتها بالأدبيات. وأخيرًا، في القسم 5 نخلص إلى الاستنتاجات وآفاق العمل المستقبلي.
قُدِّمت مجموعات بيانات sEMG عديدة وأُتيحت للعموم في الأدبيات ، وتبرز مبادرة NinaPro لشعبيتها في المجتمع العلمي ومجال الروبوتات. تمثّل NinaPro (الأطراف الاصطناعية التكيفية غير الجراحية) مشروعًا بحثيًّا شاملًا يوفّر تسجيلات sEMG واسعة من أشخاص أصحّاء ومن مبتوري الساعد أثناء أداء مجموعة من إشارات وحركات اليد والمعصم. تتكوّن المبادرة من \(10\) قواعد بيانات تختلف في عدد المشاركين والحركات وطرائق التسجيل.
نعتمد في هذا العمل قاعدة بيانات Ninapro DB-2، التي تحتوي على بيانات sEMG وحركية وقوة لـ\(40\) مشاركًا أصحّاء (\(28\) ذكور، \(12\) إناث؛ متوسط العمر \(29.9 \pm 3.9\) سنة؛ \(34\) أيمن و\(6\) أعسر). جُمعت البيانات الحركية باستخدام قفاز Cyberglove 2، فيما جُمعت إشارات sEMG بواسطة \(12\) قطبًا من نوع Delsys Trigno، وُزِّعت كالتالي: ثمانية أقطاب حول الساعد قرب مفصل الكوع، وقطبان فوق منطقتَي النشاط الرئيسيتين لعضلتي الثني والباسط للأصابع، وقطبان فوق منطقتَي النشاط للعضلتين ذات الرأسين والثلاثية الرؤوس. أُخذت عينات sEMG بمعدّل \(2000\) هرتز.
طُلِب من المشاركين تقليد حركات تظهر في مقاطع فيديو على شاشة حاسوب محمول. أُدّيت الحركات باليد اليمنى لمدة \(5\) ثوانٍ تليها \(3\) ثوانٍ راحة، مع \(6\) تكرارات لكل حركة. ورغم أن القاعدة تضم \(49\) حركة يد ومعصم، نركّز هنا على \(17\) إشارة من التمرين B، الموضّحة في الشكل [fig::Gestures].
استُخدمت كامل مدة كل إشارة (خمس ثوانٍ) بما يشمل الطور الانتقالي الأوّل (يمثِّل ثانية واحدة من بدء الحركة ) وحالة الثبات للانقباض (الأربعُ ثوانٍ المتبقية). جرت قسمة بيانات التدريب والاختبار وفق رقم التكرار، كما في ومراجع أخرى نعتمدها: التكرارات \(1\)، \(3\)، \(4\)، و\(6\) للتدريب، والتكراران \(2\) و\(5\) للاختبار.
لضمان جودة إشارات sEMG وقابليتها للاستخدام، نُفِّذت سلسلة ترشيحات رقمية:
ترشيح نطاقي (Bandpass): مُرشِّح Butterworth من الرتبة الرابعة بنطاق تمرير من \(10\) إلى \(900\) هرتز للاحتفاظ بالتردّدات ذات الصلة وتقليل الضوضاء غير المرغوبة.
ترشيح نُوتشي (Notch): لإزالة تداخل التيار الكهربائي عند \(50\) هرتز.
طُبِّق كذلك ترشيح عديم الطور (Zero-phase) لتفادي تشوّه الطور. ثم استُخدم معيار Z-Score حيث طُبِّعت البيانات لتكون بمتوسط \(0\) وانحراف معياري \(1\) اعتمادًا على مجموعة التدريب فقط، لضمان مقياس موحّد ملائم للتحليل والمقارنة.
يشير التوافُق العضلي إلى مدى تطابُق مكوّنات التردّد في إشارة عضلية مع أخرى عبر الزمن. قيم التوافُق العالية تعني تنسيقًا أعلى بين العضلات، والمنخفضة تعني قلّة التآزر. يُقاس التوافُق بين زوج إشارات بمقياس التوافُق التربيعي المُطلق (MSC). إذا كانت لدينا إشارتان \(x(t)\) و\(y(t)\)، فإنّ MSC يُعرَّف كما يلي:
حيث:
\(P_{xy}(f)\) الكثافة الطيفيّة المُتقاطِعة بين \(x\) و\(y\) عند التردّد \(f\)؛
\(P_{xx}(f)\) و\(P_{yy}(f)\) الكثافتان الطيفيتان لكلّ من \(x\) و\(y\) عند التردّد ذاته.
تتراوح قيمة \(MSC\) بين \(0\) و\(1\)؛ فـ\(MSC = 1\) تعني ارتباطًا خطيًّا تامًّا عند تردّد معيّن، و\(MSC = 0\) تعني عدم وجود ارتباط خطي. بتحليل قيم \(MSC\) عبر أزواج العضلات والتردّدات المختلفة، يمكن استخلاص أنماط تنسيق النشاط العضلي أثناء أداء الإشارات.
لإحصاء الكثافات الطيفية في المعادلة [eq:MSC]، استُخدمت طريقة ويلش (Welch) بنافذة حجمها \(600\) عيّنة (أي \(300\) مللي ثانية عند تردّد أخذ عيّنات \(2\) كيلوهرتز) وتداخُل نسبته \(50\%\). في النهاية، حُصِلت مصفوفات التوافُق التي تحتوي قيم \(MSC\) عبر المجال التردّدي لكل زوج إشارات.
يعرض الشكل [fig::MSC] النتائج للمشارك رقم \(19\) لجميع الإشارات السبعة عشر. تحوي كل مصفوفة \(12 \times 12 = 144\) خانة تمثّل المتوسط عبر التكرارات لقيم التوافُق لكل زوج. يعكس اللون شدة التوافُق: الأزرق لـ\(MSC = 0\) والأصفر لـ\(MSC = 1\). وبما أنّ الترابُط غير مُوجَّه فالمصفوفات متماثلة. وتمثّل القيم القطرية توافُق الإشارة مع نفسها (\(x=y\)) ما يُفضي إلى \(MSC=1\)، وقد أُبدلت هذه القيم إلى \(0\) لتفادي طغيانها على الأنماط الأخرى.
يوضح الشكل [fig::Networks] الشبكات التوافقية للمشارك رقم 1، حيث تمثّل كل عقدة حساسًا، وتمثّل الحوافّ قيم التوافُق، ويعبّر لون الحافة عن شدّته.
من الشكلين، تُظهِر إشارة تمديد المعصم (رقم \(14\)) عادةً أعلى قيم توافُق، تليها الإشارات \(5\) (إبعاد جميع الأصابع)، \(6\) (قبضة اليد)، \(8\) (إبعاد الأصابع الممدودة)، \(13\) (ثني المعصم) و\(15\) (الانحراف الشعاعي للمعصم)، مع اختلافات بين المشاركين.
نقدِّم هنا النموذج المقترح ونقارن بالأعمال السابقة على القاعدة نفسها، بوصفها خطّ أساس. استُخدمت Ninapro DB-2 على نطاق واسع لتصنيف sEMG باستخدام أساليب تقليدية مثل الغابات العشوائية، وآلة الدَّعم الناقل، وأقرب جار ، وكذلك بأساليب تعلُّم عميق متقدِّمة كـCNN ، ، وLSTM ، والمناهج الهجينة ، وشبكة الكبسولات (CapsNet) . يوضّح الجدول [table:Comparison] خصائص ودقّة الأساليب على التمرين B (17 إشارة)، وهو ما نعتمده للمقارنة.
بعد الحصول على مصفوفات \(MSC\) في القسم 3، خُفِّضت الكلفة الحسابية بأخذ المتوسّط عبر المجال التردّدي لكل زوج، فنحصل على مصفوفة ميزات أبعادها \(102 \times 132\) لكل مشارك. عدد الصفوف (\(102\)) يساوي \(17\) حركة × \(6\) تكرارات. مثلًا: الصفوف \(1\!-\!6\) تخصّ الإشارة الأولى، والصفوف \(7\!-\!12\) تخصّ الثانية، وهكذا. يحتوي كل صف على مصفوفة التوافُق المتوسّطة للحركة والتكرار المعنيَّين، مُسطّحةً إلى متجه بعد إهمال القيم القطرية حيث \(MSC = 1\)، فنحصل على \(132\) عمودًا: \(12 \times 12 = 144\) زوجًا ممكنًا ناقص \(12\) عناصر قطرية.
الإشارة | الدقّة [\(\textbf{\%}\)] | الدقّة الإيجابية [\(\textbf{\%}\)] | الاسترجاع [\(\textbf{\%}\)] | معدل F1 [\(\textbf{\%}\)] | AUC [\(\mathbf{10^{-2}}\)] | |
---|---|---|---|---|---|---|
1 | إشارة الإبهام للأعلى | 91.3 | 87.3 | 91.3 | 87.6 | 97.8 |
2 | تمديد وثني السبابة والوسطى | 83.6 | 85.4 | 83.8 | 81.9 | 95.7 |
3 | ثني البنصر والخنصر، تمديد الباقي | 82.5 | 80.6 | 82.5 | 78.4 | 97.5 |
4 | الإبهام مقابل قاعدة الخنصر | 85.0 | 82.9 | 85.0 | 81.3 | 98.3 |
5 | إبعاد جميع الأصابع | 82.5 | 77.2 | 82.5 | 76.7 | 98.3 |
6 | قبضة اليد | 87.5 | 92.5 | 87.5 | 88.1 | 98.0 |
7 | إشارة السبابة | 83.8 | 76.7 | 83.8 | 78.1 | 97.1 |
8 | إبعاد الأصابع الممدودة | 83.8 | 87.9 | 83.8 | 83.4 | 95.9 |
9 | استدارة المعصم (محور السبابة) | 77.5 | 85.8 | 77.5 | 79.2 | 94.4 |
10 | كبّ المعصم (محور السبابة) | 86.3 | 86.7 | 86.3 | 84.4 | 97.9 |
11 | استدارة المعصم (محور الخنصر) | 87.5 | 85.8 | 87.5 | 84.3 | 96.6 |
12 | كبّ المعصم (محور الخنصر) | 86.2 | 79.2 | 86.3 | 81.4 | 97.4 |
13 | ثني المعصم | 85.0 | 92.5 | 85.0 | 86.8 | 96.4 |
14 | تمديد المعصم | 80.0 | 97.9 | 80.0 | 85.3 | 93.3 |
15 | الانحراف الشعاعي للمعصم | 76.2 | 84.6 | 76.3 | 78.6 | 91.7 |
16 | الانحراف الزندي للمعصم | 93.8 | 94.6 | 93.8 | 92.9 | 99.8 |
17 | تمديد المعصم مع انغلاق اليد | 93.8 | 96.2 | 93.8 | 93.5 | 98.5 |
المتوسط | \(\textbf{85.1}\) | \(\textbf{86.7}\) | \(\textbf{85.1}\) | \(\textbf{83.6}\) | \(\textbf{96.8}\) |
تُستخدم مصفوفة الميزات لتدريب مصنِّف آلة دَّعم ناقل بنواة متعددة الحدود. اتّبعنا الإعداد القياسي ذاته في تقسيم التكرارات: \(1\)، \(3\)، \(4\)، \(6\) للتدريب، و\(2\) و\(5\) للاختبار. ونظرًا لمحدودية البيانات وعدم توافر مجموعة تحقّق منفصلة، استُخدم التحقّق المتقاطع بثلاثة أطراف (3-fold) مع بحث شبكي لضبط معاملات SVM، أي رتبة النواة متعددة الحدود ومعامل التنظيم \(\mathcal{C}\). أفضى ذلك إلى اختيار نواة من الرتبة \(2\) وقيمة \(\mathcal{C}=10\)، مع أفضل أداء في التحقّق المتقاطع.
دُرِّب واختُبر مصنِّف SVM لكل مشارك على حدة. يقدّم الجدول [table:Accuracy] متوسّط الدقّة والدقّة الإيجابية والاسترجاع وF1 وAUC لكل إشارة. ويوضّح الشكل [fig::ConfMatrix] متوسّط مصفوفة الالتباس عبر جميع المشاركين. لمجموعة الاختبار، يوجد \(2\) تكرارات لكل إشارة، وبالمتوسط جرى التنبّؤ الصحيح بـ\(28.9\) عيّنة من أصل \(34\). سُجِّلت أعلى معدّلات الالتباس في الفئة 9 (استدارة المعصم بمحور السبابة)، وغالبًا ما التُبسَت بالفئة 11 (استدارة المعصم بمحور الخنصر)، وهو متسق مع الشكلين [fig::MSC] و[fig::Networks] حيث تتقارب قيم \(MSC\). كما ظهر التباس بين الفئة 15 (الانحراف الشعاعي للمعصم) والفئة 3 (ثني البنصر والخنصر مع تمديد البقية)، وهو ما تؤكّده مصفوفتا \(MSC\) للمشارك 19 في الشكل [fig::MSC].
على الرغم من استخدام مصنِّف بسيط ومنخفض الكلفة، جاءت النتائج مماثلةً أو متفوِّقةً على تلك المُلخّصة في الجدول [table:Comparison] لأساليب حديثة على القاعدة نفسها. وقد تحقق ذلك بالاعتماد على التوافُق بين أزواج الإشارات كميزة رئيسية بدلًا من معالجة كل قناة على انفراد، ما خفّض تعقيد الخوارزمية بشكل كبير.
المرجع | المنهجيّة | الميزات | عدد الإشارات | الدقّة |
---|---|---|---|---|
تعلُّم انتقالي لشبكة الكبسولات | ميزات مُستخرَجة بواسطة CNN | 17 | \(78.3\%\) | |
LSTM مع CNN موسّعة | ميزات مُستخرَجة بواسطة CNN | 17 | \(82.0\%\) | |
توسيع زمني في LSTM وDeepNet | ميزات مُستخرَجة بواسطة CNN | 17 | \(82.4\%\) | |
CNN متعددة المقاييس بالتوازي | ميزات مُستخرَجة بواسطة CNN | 17 | \(83.8\%\) | |
هذه الورقة | SVM | MSC | 17 | \(\textbf{85.1\%}\) |
أظهر نهجُنا دقّةً إجماليّة تبلغ \(85.1\%\)، متفوِّقًا حتى على أفضل نتائج التعلُّم العميق المبلّغ عنها للتمرين ذاته. وبينما تُخفِّف نماذج التعلُّم العميق عبء هندسة الميزات يدويًّا، فإنها تتطلّب بيانات وفيرة وموارد حسابية كبيرة. بالمقابل، برهنا أنّ فكّ ترميز sEMG إلى توافُق بين العضلات يقدّم رؤًى مهمّة حول استراتيجيات التحكُّم العَصَبي أثناء حركات اليد، ومن ثمّ يمكن لأساليب أبسط أن تكون فعّالة بالقدر نفسه عندما تُصمَّم الميزات بعناية.
قدّمنا مصنِّف تعلُّم آلة يعتمد على الشبكات العضلية الوظيفية القائمة على التوافُق لتحسين إدراك إشارات اليد. عبر تحليل تنسيق العضلات أثناء الحركات، يقدّم النهج مصنِّفًا منخفض الأبعاد يلتقط المعلومات الجوهرية اللازمة لتعرُّف الإشارات بدقّة. أظهر استخدام التوافُق التربيعي المُطلق لإشارات sEMG، ثم معالجته بمصنِّف SVM بسيط، أنّ هذه الطريقة تُحسِّن الدقّة وتُقلِّل الكلفة الحسابية بما يلائم التطبيقات في الزمن الحقيقي. تؤكّد النتائج إمكانات الشبكات العضلية الوظيفية القائمة على التوافُق في فكّ شفرة التنسيق العَصَبي العضلي، وتُبرز أهميتها لتطوير واجهات إنسان-آلة بديهية وفعّالة.
تُمهِّد نتائجنا لتطوّرات في الروبوتات العَصَبيّة والأنظمة التفاعلية، حيث يُعَدّ التعرُّف الدقيق والفعّال زمنيًّا على إشارات اليد أمرًا محوريًّا. ومن خلال استخراج ميزات دالّة عبر التوافُق العضلي، يمكن دمج الطريقة المقترحة في استراتيجيات التحكُّم الروبوتي لتعزيز الدقّة والمرونة. وبالنظر إلى الطبيعة متعدّدة الأنماط لقاعدة البيانات، قد تُحسَّن النتائج مستقبلًا بدمج معلومات إضافية، بما يزيد المتانة والتنوّع في السيناريوهات العمليّة. كما توفّر النتائج رؤًى أعمق في العمليات العَصَبيّة العضلية المرتبطة بتنفيذ الإشارات، وتدعم تطوير نماذج متقدّمة وقابلة للتفسير. سيركّز العمل اللاحق على تحسين النموذج، وتوسيعه إلى مجموعة أوسع من الإشارات والسيناريوهات الواقعية، ودمجه في أنظمة عملية لتحقيق أقصى استفادة من إمكاناته.
دُعمَت المادة المقدَّمة في هذه الورقة جزئيًّا من مركز الذكاء الاصطناعي والروبوتات (CAIR) في جامعة نيويورك أبوظبي: الجائزة CG010. كما دُعم العمل جزئيًّا من المؤسسة الوطنية للعلوم في الولايات المتحدة بموجب المنحتين رقم 2229697 و2121391، إضافةً إلى جائزة من شركة MathWorks.
المؤلف المراسل: كوستانزا أرميني ca3072@nyu.edu
.↩︎
\(^{1}\) مركز الذكاء الاصطناعي والروبوتات (CAIR)، جامعة نيويورك أبوظبي (NYUAD)، أبوظبي، الإمارات العربية المتحدة↩︎
\(^{2}\) قسم الهندسة، جامعة نيويورك أبوظبي (NYUAD)، أبوظبي، الإمارات العربية المتحدة↩︎
\(^{3}\) قسم الهندسة الطبية الحيوية، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎
\(^{4}\) قسم علوم وهندسة الحاسوب، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎
\(^{5}\) قسم الهندسة الكهربائية وهندسة الحاسوب، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎
\(^{6}\) قسم الهندسة الميكانيكية والفضائية، جامعة نيويورك (NYU)، نيويورك، الولايات المتحدة الأمريكية↩︎