نحو توثيقٍ متوافق مع مبادئ FAIR لسير العمل والنماذج في الرياضيات التطبيقية

Marco Reidelbach

Björn Schembera

Marcus Weber

latex

مُلخّص

تلعب سير العمل في النمذجة والمحاكاة والتحسين دوراً أساسياً في الرياضيات التطبيقية. استجابت مبادرة بيانات البحث الرياضية، MaRDI، لهذا عبر تطوير قالبٍ عادلٍ وقابلٍ للمعالجة الآلية لتوثيقٍ شاملٍ لهذه العمليات. يتيح MaRDMO، وهو إضافةٌ لمنظم إدارة بيانات البحث، للعلماء من مختلف المجالات توثيقَ سير عملهم ونشرَه بسهولة على بوابة MaRDI باستخدام نموذج MaRDI. في صميم هذه العمليات تكمن النماذج الرياضية، التي تعالجها MaRDI من خلال أونتولوجيا MathModDB، المقدّمة كوصفٍ نموذجيٍ رسميٍ منظم. نبيّن هنا التفاعل بين MaRDMO ورسم المعرفة الخاص بـ MathModDB من خلال سير عمل نمذجة جبرية في مجال العلوم الإنسانية الرقمية. يبرز هذا المثال مرونةَ الخدمتين خارج نطاقهما العددي الأصلي.

مقدمة

تحتل بيانات البحث الرياضي دوراً محورياً في تعزيز الفهم العلمي عبر تخصصات متعددة، بدءاً من العلوم الرياضية الأساسية وصولاً إلى المجالات التطبيقية مثل الهندسة والفيزياء والعلوم الإنسانية الرقمية. لا تقتصر هذه البيانات على الأرقام أو الرموز المستخلصة في مجموعات البيانات، بل تشمل أيضاً المعلومات المتعلقة بالنماذج وخوارزميات الحل وغيرها من المكونات الظاهرة في سير العمل الخاص بالنمذجة والمحاكاة والتحسين (MSO) (Koprucki2018, MaRDI2022). رداً على التعقيدات الجوهرية لسير عمل الرياضيات والحاجة إلى توثيق موحد، أطلقت مبادرة بيانات البحث الرياضي (MaRDI)، وهي مشروع ضمن البنية التحتية الوطنية الألمانية لبيانات البحث (NFDI) (Hartl2021)، قالباً لتوثيق سير العمل يتماشى مع مبادئ العثور والوصول والتشغيل المتبادل وإعادة الاستخدام (FAIR) (Wilkinson2016). يوفر هذا القالب توثيقاً تفصيلياً لسير عمل MSO في الرياضيات التطبيقية، بما يشمل النماذج الرياضية والطرق والبرمجيات والأجهزة وبيانات الإدخال والإخراج التي تخدم أهداف البحث المحددة (Boege2023). يستند هذا القالب إلى الجهود التي قام بها تحالف NFDI4ING (Schmitt2020)، حيث طُورت أونتولوجيا Metadata4Ing (metadata4ing) لوصف سير عمل الهندسة. ولتشجيع التبني الواسع لهذا القالب، طرحت MaRDI إضافة MaRDMO Plugin (Reidelbach2023_CoRDI) المدمجة في منظم إدارة بيانات البحث (RDMO) (Engelhardt2017). وبالاستناد إلى شعبية RDMO كأشهر برمجيات إنشاء خطط إدارة البيانات (DMPs) في ألمانيا (Enke2023)، يبسط MaRDMO توثيق سير عمل MSO عبر استرجاع معلومات إضافية من مصادر متنوعة مثل Wikidata (Vrandecic2012swMath (Greuel2014) و zbMath (Hulek2020)، مما يتيح توثيقاً كاملاً عبر بوابة MaRDI. يعزز هذا النهج شبه الآلي الكفاءة مع الحفاظ على اكتمال ودقة ما يُوثّق.

في قلب سير عمل MSO يكمن التوثيق الدقيق للنماذج الرياضية. واعترافاً بهذه الأهمية، طوّرت MaRDI أونتولوجيا قاعدة بيانات النماذج الرياضية (MathModDB) (Schembera2023_CoRDI, Schembera2023_arxiv)، المصممة بعناية لالتقاط العناصر الجوهرية للأنماط الرياضية، بما في ذلك مجالات البحث والمشكلات والصياغات والكميات والمهام. وسيُتاح للمجتمع العلمي الوصول إلى هذه النماذج الكمية الموثقة عبر رسم المعرفة (KG) الخاص بـ MathModDB، مما يضمن تسهيل الاستخدام الواسع لهذه الموارد القيمَة.

في هذه الورقة، نهدف إلى إنشاء ربط بين MaRDMO وMathModDB KG، مما يتيح للباحثين الوصول إلى مجموعة موحدة من النماذج الرياضية عبر MaRDMO. بالإضافة إلى ذلك، يمكن أن تعمل MaRDMO كواجهة إضافية لـMathModDB لجمع نماذج جديدة من العلماء في مختلف التخصصات عبر RDMO. ومن خلال مثال تطبيقي على سير عمل جبري لتحليل البيانات المنطقية في العلوم الإنسانية الرقمية، نوضّح كيف يسهل هذا التكامل التوثيق الشامل والتحليل، مما يعزز قابلية التكرار والشفافية والتعاون والابتكار متعدد التخصصات في المجتمع العلمي. علاوة على ذلك، نستعرض إمكانية نقل MaRDMO وMathModDB، اللتين تم تطويرهما أصلاً لالتقاط سير عمل MSO ونماذجها العددية، ليعملا في سياقات النمذجة الجبرية.

ما هو MaRDMO وMathModDB وعلاقتهما

ما هو MaRDMO؟

تعتمد إضافة MaRDMO على قدرات RDMO، التي تتيح إنشاء خطط إدارة البيانات البحثية عبر استبيانات قابلة للتخصيص. حتى الآن، تقتصر هذه الاستبيانات على نماذج عامة تعكس متطلبات جهات التمويل المختلفة، إلى جانب قوائم خاصة بالموضوع. مع MaRDMO، قدمنا استبياناً مخصصاً لتوثيق سير عمل نماذج النظم المتعددة وأضفنا إمكانية تصدير مخصص. توسع هذه الإضافات وظائف RDMO، مثل تسهيل التصدير إلى Zenodo. كما يتيح MaRDMO التصدير المباشر إلى بوابة MaRDI. وعلى حد علمنا، تعد هذه أول وصلة بين RDMO وقاعدة معرفة.

يرشد استبيان MaRDMO الباحثين خلال عملية التوثيق، إذ يساعدهم في تسجيل المعلومات الجوهرية حول سير عملهم. وينقسم الاستبيان إلى أربعة أقسام تغطي مختلف مراحل البحث، بما في ذلك الجوانب العامة (1)، النماذج والمتغيرات والمعاملات (2)، تفاصيل العملية (3)، واعتبارات إعادة الإنتاج (4). عبر سلسلة من الأسئلة المنظمة، يدخل الباحثون معلومات عن أهدافهم البحثية، النماذج الرياضية، البرمجيات والأجهزة المستخدمة، البيانات الواردة والصادرة، الطرق المتبعة، والمزيد.

المبدأ التوجيهي لإضافة MaRDMO هو إعادة استخدام المعلومات القائمة من مصادر البيانات المؤسسية قدر الإمكان. يضمن هذا النهج اندماجاً سلساً في بيئة بيانات البحث الحالية مع تقليل الجهود المكررة. وقد قامت النسخة الأخيرة من MaRDMO بتبسيط عملية استرجاع المعلومات الإضافية لتتم بسلاسة في الخلفية. هذا التحسين، إلى جانب الاستعلامات الديناميكية عند الطلب من المستودعات، يعزز قابلية الاستخدام ووظائف الإضافة. على سبيل المثال، عند توفير DOI لمنشور مرتبط بسير العمل، يسترجع MaRDMO تلقائياً كافة المعلومات المتعلقة بالاستشهاد والمؤلف، ثم يعرضها للتحقق والتعديل، مما يضمن توثيقاً دقيقاً لسياق البحث.

عند اكتمال الإجابة على الاستبيان، يتيح MaRDMO تصدير سير العمل الموثق إلى بوابة MaRDI. وبذلك يُنشأ ملخصٌ شامل وفقاً لنموذج MaRDI ويُنشر كصفحة ويكي. تُدمج التفاصيل الأساسية (المنشورات ذات الصلة، المجالات العلمية والرياضية، النموذج الرياضي المطبق، الطرق، البرمجيات، البيانات الواردة والصادرة) في قاعدة المعرفة الخاصة ببوابة MaRDI، ما يتيح للباحثين الآخرين البحثَ عنها واستكشافها. وبهذه الطريقة، يمكّن MaRDMO الباحثين من التقاط ومشاركة سير عمل نماذج النظم المتعددة بكفاءة، مما يعزز التعاون وإمكانية إعادة الإنتاج والشفافية داخل المجتمع العلمي.

أونتولوجيا MathModDB

تم تصميم أونتولوجيا MathModDB استجابة للطبيعة المعقدة للنماذج الرياضية في مجال MSO. ففي المشهد العلمي الواسع، تلعب النماذج الرياضية دوراً أساسياً بوصفها أدواتٍ لا غنى عنها للتجريد والتنظيم الرسمي والتحليل والفهم عبر تخصصات متعددة. غير أن التعقيدات والتنوّع المتأصلين في هذه النماذج يستلزمان إطاراً دلالياً موحداً يلتقط جوهرها بشكلٍ شامل.

ومع الاعتراف بهذه الحاجة، تُقدم أونتولوجيا MathModDB تصميماً متطوراً يلبي الاحتياجات المتعددة الجوانب للنمذجة الرياضية. فبفضل تنظيم المعرفة الرياضية في إطارٍ متماسك، تعزز MathModDB التمثيل الدلالي للنماذج كما يظهر في سير عمل MSO، مع دعم التشغيل المتبادل وإمكانيات الوصول عبر التخصصات.

تنظم الأونتولوجيا المعرفة ضمن ثماني فئات أساسية تصف النماذج الرياضية بشكلٍ شامل، وهي ثمرة تطوير تكراري ما زال مستمراً (Schembera2023_arxiv, Schembera2023_CoRDI)، اتكأ على مناقشاتٍ داخلية المشروع وتعليقاتٍ قيّمةٍ من مجتمع الرياضيات. وتطورت هذه الفئات بمرور الوقت لتعكس الاحتياجات ووجهات النظر المتنوعة في مجال النمذجة الرياضية، بما يضمن تمثيلاً شاملاً للنماذج. كما يبرز هذا المسار التكراري قابلية الأونتولوجيا للتكيف مع الاتجاهات الناشئة والمتطلبات المتطورة في المجتمع الرياضي.

تشمل فئات MathModDB النموذج الرياضي ذاته، والمجال البحثي الذي ينتمي إليه، والمشكلة البحثية التي يعالجها، والتصورات الرياضية المكيفة له، والكميات وأنواعها المشاركة في تلك التصورات، والمهام الحسابية المرتبطة بالنموذج، فضلاً عن المنشورات التي ابتكرت النموذج أو درستَه أو راجعته أو استخدمته. وقد أُضيفت فئة "المهمة الحسابية" إلى MathModDB مؤخراً لاستيعاب تنوع المهام والأسئلة المطروحة على النموذج، مما يفضي إلى تصورات ومدخلات ومخرجات متنوعة.

MaRDMO وMathModDB

تمثل العلاقة بين MaRDMO وMathModDB تقدماً كبيراً في توثيق سير العمل والنماذج الرياضية، التي كان نطاقها سابقاً محصوراً في العمليات العددية التقليدية. قبل الدمج، اقتصر توثيق MaRDMO للنماذج الرياضية – التي لم تكن بعد موجودة في المستودعات المعتمدة – على معلوماتٍ أساسية مثل اسم النموذج والوصف والموضوع الرئيسي والصيغ التعريفية والمعرفات. وغالباً ما كان هذا غير كافٍ لفهمٍ شاملٍ للنموذج، لا سيما عند عزله عن سياق سير العمل.

لمعالجة هذا القصور، دمجنا أونتولوجيا MathModDB في MaRDMO، ما يسهّل إنشاء توثيق شامل وعميق للنماذج المستخدمة في سياق MSO. ويقدم هذا الدمج مجموعات أسئلة إضافية تتوافق مع فئات MathModDB. واتباعاً لمبدأ MaRDMO في إعادة استخدام الموارد القائمة، تستفيد هذه المجموعات من MathModDB بصفتها KG. باتباع هذا النهج، يمكن ربط النماذج الرياضية الجديدة بجوانب موثقة من نماذج سابقة باستخدام مفردات MathModDB. وفي الحالات التي لا يوجد فيها كيان مناسب، يمكن إنشاء كيانات جديدة مع تحديد الحقوق الإلزامية والاختيارية لكل مجال. ولضمان دمجٍ صحيح للنماذج ومكوناتها في المخطط البياني القائم، يمكّن MaRDMO أيضاً إنشاء علاقات بين النماذج عبر مفردات MathModDB، مثل التعميمات والمواصفات والجمعيات. ورغم أن هذه العلاقات ضرورية لتعظيم الاستفادة من MathModDB KG، فإنها قد تشكل تحدياً للباحثين الأفراد، مما يجعلها اختيارية في الأساس. فإذا قرر الباحثون عدم ربط نموذجهم، تقع المسؤولية على خبراء المجال لتنظيم هذا الربط في KG. ويُضمن بهذا النهج المزدوج أن يظل KG ذا قيمة مع مراعاة الاحتياجات ووجهات النظر المتنوعة للمجتمع البحثي.

تمثيل دلالي لسير عمل النمذجة الجبرية

نقدّم هنا دليلاً أولياً على كيفية تمثيل سير عمل النمذجة الجبرية دلالياً باستخدام MaRDMO وMathModDB.

مقدمة

تتشابك هنا عملية تحليل البيانات المنطقية القائمة على الجبر النمطي في العلوم الرقمية، وخصوصاً في مجال علم المصريات، مع معارف الرياضيات والآثار لكشف الأنماط الخفية في قاعدة البيانات. وتنبع هذه الدراسة من كاشيت الكرنك، مخزن أثري اكتُشف عام 1903 على يد جي. ليغران (Legrain1904)، وتهدف إلى تحديد القواعد الأساسية التي تحكم أنماط التدمير الملحوظة في القطع المصرية القديمة. فقد كشفت نتائج ليغران عن أنماط متكررة مثل فقدان الرؤوس وتقطيع الأطراف والقطع المجزأة، مما أثار التساؤل عما إذا كانت تقبع قواعد محددة وراء هذه الظواهر.

بيانات الكائن والترميز

توفر قاعدة بيانات عبر الإنترنت1، التي تُسجّل التماثيل المكتشفة في الكاشيت، الأساس لهذا التحليل. فقد حدد خبراء علم المصريات 16 خاصية ذات دلالة محتملة في عينةٍ مكونة من 333 قطعة أثرية، ثم تم ترميزها بتمثيل ثنائي يشير إلى وجود أو عدم وجود كل خاصية.

التعاون متعدد التخصصات

نُقلت مجموعة البيانات المشفرة من علماء المصريات إلى علماء الرياضيات، ممثلةً بذلك تبادلاً حيوياً بين التخصصات. ثم طبق الرياضيون نموذج "مقارنة الكائنات" (Weber2022)، باستخدام حلقات بوليانية، لكشف القواعد الأساسية التي تحكم أنماط التدمير. وبالاستعانة بخوارزمية "القواعد والأنماط" 2 المكتوبة بلغة جوليا (Bezanson2017) ومكتبة OSCAR (OSCAR)، تم احتساب مولد القاعدة المثالي كأساس غروبينر مكون من 172 قاعدة منطقية.

التفسير والتحقق

تسلّط النتائج الحسابية الضوء على القواعد الكامنة المحتملة. ويتولى خبراء علم المصريات بعد ذلك التحقق من هذه التعبيرات من منظور أهميتها العلمية والإحصائية، مما يعيدها إلى أصلها التخصصي. ويضمن هذا التبادل متعدد التخصصات تقييماً شاملاً للقواعد المكتشفة.

القابلية للتكرار والتطبيقات المستقبلية

تتبع طريقة النمذجة الجبرية المعروضة هنا منهجيةً منظمة تتضمن اختيار البيانات وترميزها والتحليل الحسابي وتفسير النتائج. وتبرز هذه المنهجية بقابلية تكرار عالية، ما يؤكد موثوقيتها للدراسات المستقبلية. بعيداً عن علم الآثار، يعد نموذج "مقارنة الكائنات" واعداً لحل مهام حسابية متنوعة ومعالجة مشكلات في مجالات أخرى، مثل تحليل الأدب (Weber2022). فإلى جانب "استخراج القواعد المنطقية"، تشمل المهام الحسابية الأخرى تصنيف الكائنات واستخراج الميزات، مما يوسع آفاق تطبيق النموذج خارج نطاقه الأولي.

يمكن الاطلاع على توثيق عملية "تحليل البيانات المنطقية"، المتوافق مع قالب مركز بيانات الرياضيات (MaRDI)، عبر بوابة المركز3. ويُصوَّر نموذج "مقارنة الكائنات" الأساسي في الشكل [fig1]، نظراً إلى أن قاعدة بيانات النمذجة الرياضية (MathModDB KG) لم تُطرح بعد للعامة. ويمكن توثيق جميع الجوانب السابقة لعملية النمذجة الجبرية بواسطة إضافة MaRDMO وأونتولوجيا MathModDB المدمجة.

الخلاصة والتوقعات

يسهم دمج قاعدة البيانات الخاصة بالنماذج الرياضية في نظام إدارة البيانات البحثية في رفع جودة توثيق سير العمل، إذ يوفر رؤية أكثر شمولية وفهماً للنماذج الرياضية المطبقة. ومن خلال هذا النظام، نتوقع جذب علماء من تخصصات متنوعة وتيسير وصولهم إلى توثيق موحد وغني للنماذج.

لقد أظهرنا كيف يمكن لمشروع بحثي من مجال مختلف تماماً، ألا وهو العلوم الإنسانية، الاستفادة من هذا النهج. يتضمن ذلك تمييز أنماط التدمير في القطع القديمة، التي يمكن نمذجتها رياضياً/جبرياً وتثريتها دلالياً باستخدام الأدوات المقدمة (نظام إدارة البيانات البحثية الرياضية وقاعدة بيانات النماذج الرياضية). وعلاوةً على ذلك، بيّنّا أن حلولنا صالحة خارج نطاق سير العمل العددي التقليدي؛ فقد طُبِّقت بنجاح على سير عمل النمذجة الجبرية، حيث استُخلصت جميع المعلومات ذات الصلة بواسطة أدوات صُممت أصلاً للعمليات العددية.

في المستقبل، نخطط لربط نظام إدارة البيانات البحثية الرياضية بقاعدة بيانات الخوارزميات الرياضية (AlgoData2022)، التي طُورت أيضاً ضمن مبادرة البيانات البحثية الرياضية، لتعزيز مكون الطرق في توثيق سير العمل. ويمكن لهذا الدمج الاستفادة من الروابط بين قاعدتي الخوارزميات والنماذج؛ إذ يتيح للمستخدمين اختيار خوارزميات ملائمة لمهام مرتبطة بنماذج معينة، مما يعزز سهولة الاستخدام. بالإضافة إلى ذلك، وبالنظر إلى الطبيعة متعددة التخصصات لهذه العمليات، نسعى للتعاون مع كونسورتيهات أخرى ضمن المبادرة الوطنية لبيانات البحث لاستكشاف الروابط مع الخدمات غير الرياضية، ما سيوسع نطاق وفائدة النظام مستقبلاً. ولا يزال ثمة مجال لمزيدٍ من البحث لإثبات فعالية الربط بين نظام إدارة البيانات البحثية الرياضية وقاعدة بيانات النماذج في سياقات الجبر المتقدمة.

الشكر والتقدير

يُعرب ماركو ريدلباخ، بيورن شيمبرا، وماركوس ويبر عن امتنانهم لدعم مبادرة البيانات البحثية الرياضية الممولة من الجمعية الألمانية للبحث (DFG)، برقم المشروع 460135501، NFDI 29/1 "مبادرة البيانات البحثية الرياضية".


  1. https://www.ifao.egnet.net/bases/cachette/

  2. https://github.com/pynoor/The-RAP-Algorithm

  3. فيديو التوثيق، صفحة ويكي وإدخال الرسم المعرفي:
    https://portal.mardi4nfdi.de/wiki/MaRDMO
    https://portal.mardi4nfdi.de/wiki/Logical_Data_Analysis_for_Egyptian_Objects
    https://portal.mardi4nfdi.de/wiki/Item:Q6032641