نحو توثيق عادل لسير العمل والنماذج في الرياضيات التطبيقية

Marco Reidelbach

Björn Schembera

Marcus Weber

latex

مُلخّص

تلعب سير العمل في النمذجة والمحاكاة والتحسين دوراً أساسياً في الرياضيات التطبيقية. لقد استجابت مبادرة بيانات البحث الرياضية، MaRDI، لهذا من خلال تطوير قالب عادل وقابل للتفسير آلياً لتوثيق شامل لمثل هذه سير العمل. يمكن MaRDMO، وهو إضافة لمنظم إدارة بيانات البحث، العلماء من مختلف المجالات من توثيق ونشر سير عملهم على بوابة MaRDI بسلاسة باستخدام قالب MaRDI. في صميم هذه سير العمل توجد النماذج الرياضية. تعالج MaRDI هذه النماذج من خلال أونتولوجيا MathModDB، التي تقدم وصفاً نموذجياً رسمياً منظماً. هنا، نعرض التفاعل بين MaRDMO ورسم المعرفة MathModDB من خلال سير عمل نمذجة جبرية من العلوم الإنسانية الرقمية. يُظهر هذا العرض مرونة كلتا الخدمتين خارج مجالهما العددي الأصلي.

مقدمة

تحتل بيانات البحث الرياضي دوراً محورياً في تعزيز الفهم العلمي في مختلف التخصصات، بدءاً من العلوم الرياضية الأساسية وصولاً إلى المجالات التطبيقية مثل الهندسة والفيزياء والعلوم الإنسانية الرقمية. لا تقتصر بيانات البحث الرياضي على البيانات الرقمية أو الرمزية الموجودة في مجموعات البيانات، بل تشمل أيضاً البيانات المتعلقة بالنماذج وخوارزميات الحل والعديد من الجوانب الأخرى التي تظهر في سير عمل النمذجة والمحاكاة والتحسين (MSO) (Koprucki2018, MaRDI2022). رداً على التعقيدات الطبيعية لسير عمل الرياضيات والحاجة إلى توثيق موحد، قامت مبادرة بيانات البحث الرياضي (MaRDI)، وهي مشروع تحت مظلة البنية التحتية الوطنية الألمانية لبيانات البحث (NFDI) (Hartl2021)، بتطوير قالب توثيق سير العمل يلتزم بمبادئ العثور والوصول والتشغيل المتبادل وإعادة الاستخدام (FAIR) (Wilkinson2016). يوفر هذا القالب توثيقاً شاملاً لسير عمل MSO في الرياضيات التطبيقية، بما في ذلك النماذج الرياضية والطرق والبرمجيات والأجهزة وبيانات الإدخال والإخراج التي تعالج أهداف البحث المحددة (Boege2023). يرتبط هذا القالب بالتطورات في تحالف NFDI4ING (Schmitt2020)، حيث تم إنشاء أونتولوجيا Metadata4Ing (metadata4ing) لالتقاط سير عمل الهندسة. لتسهيل التبني الواسع النطاق لهذا القالب التوثيقي، قدمت MaRDI أداة MaRDMO Plugin (Reidelbach2023_CoRDI)، وهي أداة مدمجة في منظم إدارة بيانات البحث (RDMO) (Engelhardt2017). من خلال الاستفادة من شعبية RDMO كأكثر البرمجيات استخداماً لإنشاء خطط إدارة البيانات (DMPs) في ألمانيا (Enke2023)، يبسط MaRDMO عملية توثيق سير عمل MSO من خلال جلب معلومات إضافية من مصادر متنوعة مثل Wikidata (Vrandecic2012swMath (Greuel2014) و zbMath (Hulek2020) وجعل التوثيق الكامل متاحاً عبر بوابة MaRDI، وهي قاعدة بيانات للرياضيات. يعزز هذا النهج شبه الآلي الكفاءة مع ضمان اكتمال ودقة سير العمل الموثق.

في قلب سير عمل MSO هذه يكمن التوثيق السليم للنماذج الرياضية. واعترافاً بهذا الجانب الأساسي، طورت MaRDI أونتولوجيا قاعدة بيانات النماذج الرياضية (MathModDB) (Schembera2023_CoRDI, Schembera2023_arxiv)، المصممة بعناية لالتقاط العناصر الأساسية المرتبطة بالنماذج الرياضية، بما في ذلك مجالات البحث، المشكلات، الصياغات، الكميات، والمهام. ستتاح النماذج العددية الموثقة من خلال هذا النظام للجمهور عبر رسم المعرفة (KG) لـ MathModDB، مما يضمن توافر هذه الموارد القيمة واستخدامها على نطاق واسع.

في هذه الورقة، نهدف إلى إنشاء اتصال بين MaRDMO و MathModDB KG، مما يتيح للباحثين الوصول إلى مجموعة موحدة من النماذج الرياضية من خلال MaRDMO. بالإضافة إلى ذلك، يمكن لـ MaRDMO أن يكون واجهة إضافية لـ MathModDB لجمع نماذج جديدة من العلماء في مختلف التخصصات عبر RDMO. من خلال مثال عملي على سير عمل جبري لتحليل البيانات المنطقية من العلوم الإنسانية الرقمية، نوضح كيف يسهل هذا التكامل التوثيق الشامل والتحليل، مما يعزز القابلية للتكرار والشفافية والتعاون والابتكار متعدد التخصصات في المجتمع العلمي. بالإضافة إلى ذلك، نعرض قابلية نقل MaRDMO و MathModDB، اللتين تم تطويرهما في الأصل لالتقاط سير عمل MSO ونماذجها العددية، إلى تطبيقات النمذجة الجبرية.

ما هو ردمو، ماثمود دي بي وعلاقتهما

ما هو ردمو

تعتمد إضافة ما ردمو على قدرات RDMO، التي تمكن من إنشاء خطط إدارة البيانات البحثية من خلال استبيانات قابلة للتخصيص. حتى الآن، توجد استبيانات عامة تعكس متطلبات منظمات التمويل الفردية، بالإضافة إلى قوائم محددة حسب الموضوع. مع ما ردمو، قدمنا استبياناً مصمماً في البداية لتوثيق سير العمل لنماذج النظم المتعددة وأضافت تصديراً مخصصاً. توسع هذه الإضافات وظائف RDMO، على سبيل المثال، تسهيل التصدير إلى زينودو. بدوره، يمكن ما ردمو من التصدير المباشر إلى بوابة ماردي. حسب علمنا، هذه هي أول وصلة لـ RDMO مع قاعدة معرفة.

يوجه استبيان ما ردمو الباحثين خلال عملية التوثيق، مما يسهل التقاط المعلومات الحاسمة حول سير عملهم. ينقسم الاستبيان إلى أربعة أقسام، يغطي كل قسم جوانب مختلفة من عملية البحث، بما في ذلك الجوانب العامة (1)، النماذج والمتغيرات والمعاملات (2)، معلومات العملية (3)، واعتبارات إعادة الإنتاج (4). من خلال سلسلة من الأسئلة المنظمة، يمكن للباحثين إدخال تفاصيل حول أهدافهم البحثية، النماذج الرياضية، البرمجيات والأجهزة المستخدمة، البيانات الواردة والصادرة، الطرق، والمزيد.

المبدأ التوجيهي لما ردمو هو إعادة استخدام المعلومات القائمة كلما أمكن من مصادر البيانات المؤسسية. يضمن هذا النهج الاندماج السليم في المشهد الحالي لبيانات البحث مع تقليل الجهود المكررة. لقد قامت النسخة الأخيرة من ما ردمو بتبسيط استرجاع المعلومات الإضافية، والتي يتم إجراؤها الآن بسلاسة في الخلفية. هذا التحسين، جنباً إلى جنب مع الاستعلامات الديناميكية عند الطلب من المستودعات، يعزز قابلية الاستخدام ووظائف الإضافة. على سبيل المثال، عندما يتم توفير DOI لمنشور متعلق بسير العمل، يقوم ما ردمو تلقائياً باسترجاع جميع المعلومات ذات الصلة بالاستشهاد والمؤلف. ثم يتم تقديم هذه المعلومات للتحقق منها وإكمالها، مما يضمن توثيقاً سليماً لسياق سير العمل.

عند اكتمال الاستبيان، يسهل ما ردمو تصدير سير العمل الموثق إلى بوابة ماردي. وبالتالي، يتم إنشاء ملخص شامل وفقاً لنموذج ماردي ونشره كصفحة ويكي. يتم دمج التفاصيل الأساسية (المنشورات ذات الصلة، المجالات العلمية والمجالات الرياضية، النموذج الرياضي المطبق، الطرق، البرمجيات، البيانات الواردة والصادرة) في قاعدة معرفة بوابة ماردي، مما يجعلها متاحة للباحثين الآخرين للبحث والاستكشاف. وبهذا، يمكن ما ردمو الباحثين من التقاط ومشاركة سير عمل نماذج النظم المتعددة بكفاءة، مما يعزز التعاون وإعادة الإنتاج والشفافية داخل المجتمع العلمي.

MathModDB

تم تصميم أونتولوجيا MathModDB لمعالجة الطبيعة المعقدة للنماذج الرياضية في مجال MSO. ضمن المشهد الواسع للتفكير العلمي، تلعب النماذج الرياضية دوراً أساسياً، حيث تعتبر أدوات لا غنى عنها للتجريد والتنظيم الرسمي والتحليل والفهم في مختلف التخصصات. ومع ذلك، تستلزم التعقيدات والتنوع المتأصل في النماذج الرياضية إطاراً دلالياً موحداً لالتقاط جوهرها بشكل شامل.

مع الاعتراف بهذه الضرورة، تظهر أونتولوجيا MathModDB كأونتولوجيا متطورة صممت لتلبية الاحتياجات المتعددة الجوانب للنمذجة الرياضية. من خلال تنظيم المعرفة الرياضية في إطار متماسك، تعزز MathModDB التمثيل الدلالي للنماذج الرياضية كما تظهر في سير عمل MSO، مع تعزيز التشغيل المتبادل والوصول عبر المجالات.

تم تنظيم الأونتولوجيا حول ثماني فئات أساسية لوصف النماذج الرياضية بشكل شامل، وهي نتيجة أولية لتطوير تكراري (وما زال مستمراً) (Schembera2023_arxiv, Schembera2023_CoRDI) تم تشكيله بواسطة مناقشات داخلية للمشروع وتعليقات قيمة من مجتمع الرياضيات. لقد تطورت هذه الفئات بمرور الوقت لتعكس الاحتياجات ووجهات النظر المتنوعة داخل مجال النمذجة الرياضية، مما يضمن تمثيلاً شاملاً للنماذج الرياضية. علاوة على ذلك، يبرز هذا العمل التكراري قابلية التكيف للأونتولوجيا، مع إمكانية لمزيد من التطوير استجابة للاتجاهات الناشئة والمتطلبات المتطورة داخل مجتمع الرياضيات.

تشمل فئات MathModDB النموذج الرياضي نفسه، المجال البحثي الذي يعمل ضمنه النموذج، المشكلة البحثية التي يعالجها، التصورات الرياضية التي تنظم النموذج، الكميات وأنواع الكميات المشاركة في التصورات الرياضية، المهام الحسابية المرتبطة بالنموذج، والمنشورات التي تخترع، تدرس، تراجع، أو تستخدم النموذج. تم تقديم فئة المهمة الحسابية إلى MathModDB مؤخراً فقط لاستيعاب مجموعة متنوعة من المهام أو الأسئلة المطروحة على النموذج، مما يؤدي إلى تصورات ومدخلات ومخرجات مختلفة.

ما ردمو وماثمود دي بي

تمثل العلاقة بين ما ردمو وماثمود دي بي تقدماً كبيراً في توثيق سير العمل والنماذج الرياضية، والتي كانت حتى الآن تقتصر فقط على مجال العمليات الرياضية الموحدة. قبل الدمج، كان توثيق ما ردمو للنماذج الرياضية، التي لم تكن موجودة بعد في المستودعات المعتمدة، محدوداً، حيث يمكن للباحثين فقط تقديم معلومات أساسية مثل اسم النموذج، الوصف، الموضوع الرئيسي، الصيغ التعريفية، والمعرفات. غالباً ما كان هذا يقصر عن توفير فهم شامل للنموذج، خاصة عند النظر إليه بمعزل عن سير العمل السياقي.

لمعالجة هذا القصور، تم دمج أونتولوجيا ماثمود دي بي في ما ردمو، مما يسهل إنشاء توثيق شامل وعميق للنماذج المستخدمة في سير عمل العمليات الرياضية الموحدة. يقدم هذا الدمج مجموعات أسئلة إضافية متماشية مع فئات ماثمود دي بي. باتباع مبدأ ما ردمو الإرشادي لاستخدام الموارد الموجودة، تستفيد هذه المجموعات من ماثمود دي بي كـ KG. الآن، يمكن توثيق النماذج الرياضية من خلال ربط جوانب موثقة من نماذج أخرى باستخدام مفردات ماثمود دي بي. في الحالات التي لا يوجد فيها كيان مناسب، يمكن إنشاء كيانات جديدة، حيث يتميز كل مجال بحقوق إلزامية واختيارية. لدمج النماذج الرياضية الجديدة ومكوناتها بشكل صحيح في المشهد البياني القائم، يمكن لما ردمو أيضاً إنشاء ترابطات بين النماذج من خلال مفردات ماثمود دي بي، مثل استخدام التعميمات، المواصفات أو الجمعيات. بينما تعتبر هذه الترابطات ضرورية لتعظيم فائدة ماثمود دي بي KG، فقد تشكل تحديات للباحثين الأفراد، مما يجعلها أصلاً اختيارياً. إذا اختار الباحثون عدم ربط نموذجهم، تقع المسؤولية على خبراء المجال لتنسيق ماثمود دي بي KG. يضمن هذا النهج المزدوج أن يظل KG ذا قيمة مع مراعاة الاحتياجات ووجهات النظر المتنوعة للباحثين.

تمثيل دلالي لسير عمل نمذجة جبرية

نعرض الآن دليلاً أولياً على مفهوم كيف يمكن تمثيل سير عمل من النمذجة الجبرية بشكل دلالي من خلال MaRDMO و MathModDB.

مقدمة

تتشابك عملية تحليل البيانات المنطقية، التي تستند إلى الجبر النمذجي في العلوم الرقمية، وبشكل خاص علم المصريات، مع علوم الرياضيات والآثار لكشف الأنماط المخفية داخل قاعدة بيانات. تنبع هذه العملية من كاشيت الكرنك، مستودع أثري تم اكتشافه في عام 1903 بواسطة جي. ليغران (Legrain1904)، وتهدف إلى تحديد القواعد الأساسية التي تحكم أنماط التدمير الملحوظة في الأجسام المصرية القديمة. كشفت نتائج ليغران عن أنماط تدمير شائعة مثل الرؤوس المفقودة، والأطراف المبتورة، والقطع المجزأة، مما أثار التساؤل حول ما إذا كانت هناك قواعد محددة تحكم هذه الظواهر.

بيانات الكائن والترميز

توفر قاعدة بيانات عبر الإنترنت1 التي تسجل التماثيل المكتشفة في الكاشيت الأساس للتحليل. حدد خبراء من علم المصريات 16 خاصية محتملة الأهمية موجودة في مجموعة فرعية من 333 قطعة أثرية، والتي تم بعد ذلك ترميزها إلى أرقام ثنائية، تشير إلى وجود أو عدم وجود كل خاصية.

التعاون متعدد التخصصات

تم نقل مجموعة البيانات المشفرة من علم المصريات إلى الرياضيات، مما يمثل تبادل البيانات بين التخصصات المختلفة. ثم قام علماء الرياضيات بتطبيق نموذج مقارنة الكائنات (Weber2022)، باستخدام حلقة بوليانية، لكشف القواعد الأساسية التي تحكم أنماط التدمير. باستخدام خوارزمية "القواعد والأنماط" 2، المكتوبة بلغة جوليا (Bezanson2017) وباستخدام حزمة أوسكار (OSCAR)، تم حساب مولد الأساس المثالي كأساس جرويبنر يتألف من 172 قاعدة منطقية.

التفسير والتحقق

تسلط النتائج الحسابية الضوء على القواعد الكامنة المحتملة. يقع على عاتق خبراء علم المصريات التحقق من هذه التعبيرات من حيث الأهمية العلمية والإحصائية، مما يعيد البيانات إلى أصلها التخصصي. يضمن هذا التبادل متعدد التخصصات تقييماً شاملاً للقواعد المحددة.

القابلية للتكرار والتطبيقات المستقبلية

تتبع عملية النمذجة الجبرية المقدمة هنا عملية منظمة، تشمل اختيار البيانات وترميزها، التحليل الحسابي، وتفسير النتائج. تتميز المنهجية بقابليتها للتكرار، مما يؤكد موثوقيتها للدراسات المستقبلية. بعيداً عن علم الآثار، يحمل نموذج مقارنة الكائنات وعداً لحل مهام حسابية متنوعة ومعالجة مشكلات مختلفة في مجالات متعددة، مثل تحليل الأدب (Weber2022). المهام الحسابية، بخلاف "استخراج القواعد المنطقية"، تشمل تصنيف الكائنات واستخراج الميزات، مما يوسع من تطبيق النموذج خارج سياقه الأولي.

يمكن الوصول إلى توثيق عملية "تحليل البيانات المنطقية"، التي تتبع قالب مركز البيانات الرياضية (MaRDI)، من خلال بوابة مركز البيانات الرياضية3. يتم تصوير نموذج "مقارنة الكائنات" الأساسي في الشكل [fig1] نظراً لأن قاعدة بيانات النمذجة الرياضية (MathModDB KG) ليست متاحة للعموم بعد. يمكن توثيق جميع جوانب عملية النمذجة الجبرية الموصوفة سابقاً من خلال إضافة مركز البيانات الرياضية (MaRDMO) وأونتولوجيا قاعدة بيانات النمذجة الرياضية المتكاملة.

الخلاصة والتوقعات

يعزز دمج قاعدة بيانات النماذج الرياضية في نظام إدارة البيانات البحثية الرياضية بشكل كبير من جودة توثيق سير العمل، مما يوفر تصويراً أكثر شمولاً وفهماً للنماذج الرياضية المطبقة. من خلال نظام إدارة البيانات البحثية الرياضية، نتوقع مرة أخرى الوصول إلى علماء من تخصصات متنوعة وتسهيل وصولهم إلى توثيق النماذج الموحد والمثري.

لقد أظهرنا كيف يمكن لمشروع بحثي من مجال مختلف تماماً، ألا وهو العلوم الإنسانية، أن يستفيد من نهجنا. يتضمن ذلك تمييز أنماط التدمير في الأشياء القديمة، والتي يمكن نمذجتها باستخدام الطرق الرياضية/الجبرية وتثري دلالياً وتمثل بمساعدة الأدوات المقدمة (نظام إدارة البيانات البحثية الرياضية وقاعدة بيانات النماذج الرياضية). علاوة على ذلك، لقد أظهرنا أن حلولنا تعمل خارج نطاق سير عمل العمليات العددية الكلاسيكية حيث تم تطبيقها على سير عمل نمذجة جبرية. تم التقاط جميع المعلومات ذات الصلة بواسطة أدوات تم تطويرها في الأصل للعمليات العددية.

مستقبلاً، هدفنا التالي هو ربط نظام إدارة البيانات البحثية الرياضية بقاعدة بيانات الخوارزميات الرياضية (AlgoData2022)، التي تم تطويرها أيضاً ضمن مبادرة البيانات البحثية الرياضية، لتعزيز مكون الطريقة في توثيق سير العمل. يمكن لهذا الدمج أن يستفيد من الروابط القائمة بين قاعدة بيانات الخوارزميات الرياضية وقاعدة بيانات النماذج الرياضية، مما يوفر للمستخدمين مجموعة منتقاة من الخوارزميات لمعالجة المهام المحددة المرتبطة بنماذج معينة، وبالتالي تعزيز القابلية للاستخدام. علاوة على ذلك، نظراً للطبيعة متعددة التخصصات لهذه السير، نهدف إلى التعاون مع الكونسورتيا الأخرى لمبادرة البيانات البحثية الوطنية لاستكشاف الروابط المحتملة مع الخدمات غير الرياضية، مما يوسع نطاق وفائدة نظام إدارة البيانات البحثية الرياضية في المستقبل. بالإضافة إلى ذلك، هناك حاجة إلى مزيد من البحث لإظهار أن الربط بين نظام إدارة البيانات البحثية الرياضية وقاعدة بيانات النماذج الرياضية يعمل أيضاً لسير العمل المتقدمة في مجال الجبر.

الشكر والتقدير

ماركو ريدلباخ، بيورن شيمبرا، وماركوس ويبر مدعومون من قبل مبادرة البيانات البحثية الرياضية، الممولة من قبل الجمعية الألمانية للبحث (DFG)، رقم المشروع 460135501، NFDI 29/1 "مبادرة البيانات البحثية الرياضية".


  1. https://www.ifao.egnet.net/bases/cachette/

  2. https://github.com/pynoor/The-RAP-Algorithm

  3. فيديو التوثيق، صفحة ويكي وإدخال الرسم المعرفي:
    https://portal.mardi4nfdi.de/wiki/MaRDMO
    https://portal.mardi4nfdi.de/wiki/Logical_Data_Analysis_for_Egyptian_Objects
    https://portal.mardi4nfdi.de/wiki/Item:Q6032641