تَدَفُّقاتُ التَّطْبِيعِ ذاتُ التَّغْيِيرِ الزَّمَنيّ لِنمذجةِ المُعادَلاتِ التَّفاضُلِيَّةِ العَشْوائِيَّةِ بِدِقَّة

Naoufal El Bekri, Lucas Drumetz, Franck Vermet

إطارٌ عامّ لِتَدَفُّقاتِ التَّطْبِيع في الزَّمان يَستندُ إلى تَغْيِيرِ وقتِ حركةِ براون

مُلَخَّص

أصبحت النماذجُ التوليديةُ ذاتَ أهميّةٍ مُتزايدةٍ في تعلُّم الآلة ونماذجِ التعلُّمِ العميق. ومن بين هذه النماذج تتألّقُ تَدَفُّقاتُ التَّطْبِيع (Normalizing Flows)، إذ تُتيح تقديرَ الاحتماليةِ الدقيق عبر تحويل توزيعٍ أساسيّ من خلال تحوّلاتٍ تمايُزيّة (دِفّيومورفيّة). وقد أدّى توسيعُ إطارِ عملِ تَدَفُّقاتِ التَّطْبِيع للتعامُل مع التحويلاتِ المُفهرسةِ بالزمن إلى ظهور تَدَفُّقاتِ تطبيعٍ ديناميكيّة تُعَدّ أداةً قويّةً لِنمذجة السلاسلِ الزمنية والعمليّاتِ العشوائية والمعادلات التفاضلية العشوائية العصبية. في هذا العمل نقترح نسخةً جديدةً من هذه التدفّقات، هي تَدَفُّقُ التَّطْبِيعِ ذاتُ التَّغْيِير الزَّمَنيّ (TCNF)، بالاعتمادِ على تَغْيِيرِ وقتِ حركةِ براون، بما يُنتج عائلةً واسعةً ومُتنوّعةً من العمليات الغاوسية. يُمكّننا هذا النهج من نمذجة بعض المعادلات التفاضلية العشوائية التي يتعذّر التقاطُها بطرائق أُخَر، بما في ذلك عملياتٌ كلاسيكيّة مثل عملية أورنشتاين–أولنبيك؛ كما يُعمِّم المنهجيّاتِ السابقة ويُفضي إلى نتائجَ محسّنة وقدرةٍ أفضل على الاستدلال والتنبؤ.

مُقَدِّمَة

تُستخدَم الأنظمةُ الديناميكية على نطاقٍ واسعٍ في مجالاتٍ علميةٍ متعدّدة مثل المالية وعلوم الأرض والفيزياء. ويشمل تمثيلُ هذه الأنظمة عادةً معادلاتٍ تفاضليةً عاديةً أو معادلاتٍ تفاضليةً عشوائيةً (oksendal2013stochastic) عند أخذ الضوضاء والاضطرابات في الاعتبار، إلى جانب المُكوِّن الحتمي. من التطبيقات الحاسمة نمذجةُ التقلبات في البيانات المالية وتقديرُ الشكوك ونشرُها في علوم الأرض. وقد شهدت معالجةُ هذه الأنظمة، عبر نمذجة السلاسل الزمنية وتعلُّم الآلة، تزايدًا ملحوظًا في الشُّهرة حديثًا بفضل النماذج التوليدية للتنبؤ والتصفية والاستيفاء مع أخذ الشكوك في الحسبان.

تشمل النماذجُ التوليدية الشائعة الشبكاتِ العصبيةَ التوليديةَ التنافسية (conf/nips/GoodfellowPMXWOCB14) والمُشَفِّراتِ التباينيةَ الذاتية (journals/corr/KingmaW13)، وأيضًا مؤخرًا تَدَفُّقاتِ التَّطْبِيع (jmlr/PapamakariosNRM21, journals/pami/KobyzevPB21) والنماذجَ المبنيّة على الانتشار/الدرجة (Score) (conf/nips/SongE19). وعلى الرغم من إمكان تطبيق هذه النماذج لتوليد السلاسل الزمنية، فإنها قد تُعامِل هذه البيانات كمتجهاتٍ في \(\mathbb{R}^{T}\)، حيث \(T\) عددُ الخطوات الزمنية، دون مراعاة البنية السببيّة. وقد جرى تكييف الشبكاتِ التنافسية والمُشَفِّراتِ التباينية وتَدَفُّقاتِ التطبيع لبيانات السلاسل الزمنية في (conf/nips/YoonJS19, kidger2021neural)، (li2020scalable, zeng2023latent)، (mehrasa2019point, conf/iclr/ShchurBG20) على التوالي. في هذا العمل نُركّز على تَدَفُّقاتِ التطبيع لقدرتها على إتاحة توزيعٍ صريح، وهو أمرٌ حاسم عند الحاجة لتقدير الشكوك أو كشف الشذوذ.

تعتمد تَدَفُّقاتُ التطبيع على صيغةِ تغييرِ المُتغيّر المعروفة، التي تُوفِّر تعبيرًا لكثافة الاحتمال لتحويلاتٍ تمايزيةٍ لمتغيّرٍ عشوائي. وعن طريق اختيار التحويلات بعناية، إذا كانت الكثافةُ الأساسية قابلةً للتعامل (تحمل احتمالًا صريحًا ويسهل أخذُ عيناتٍ منها، وغالبًا ما تكون غاوسية)، أمكن التلاعبُ بالكثافة المُحوّلة وأخذُ العينات منها بسهولةٍ أيضًا، شريطةَ القدرة على حساب مُحدِّدِ يعقوبي التحويل بفعّالية. وفي الحدّ النظري عند تطبيق عددٍ لا نهائيّ من التحويلات، نصل إلى تَدَفُّقِ التطبيع المستمر (DBLP:conf/iclr/GrathwohlCBSD19). في هذه الحالة، يُوصَفُ التدفق بمعادلةٍ تفاضليةٍ عادية يمكن دمجُها للحصول على الكثافة الناتجة، مما يزيد من كفاءة الحساب عبر استبدال مُحدِّد اليعقوبي بتكامل أثره.

تَمّ توسيعُ تَدَفُّقاتِ التطبيع إلى الإعداد الديناميكي عن طريق استبدال التوزيعِ الأساسي القابل للتعامل بعمليةٍ احتماليةٍ قابلةٍ للتعامل، أي حركة براونية (deng2020modeling)، مما يجعل هذا النوع من النماذج أكثر كفاءةً لتوليد السلاسل الزمنية. غير أنّ (deng2021continuous) أظهروا أنّ هذه النماذج لا تستطيع نظريًا تمثيل بعض العمليات الأساسية والشائعة، مثل عملية أورنشتاين–أولنبيك الكلاسيكية.

وعليه، نقترح في هذه الورقة تعميمًا لهذا النهج باستخدام عائلةٍ واسعةٍ من العمليات الغاوسية كعمليةٍ أساسية بدلًا من الحركة البراونية القياسية. وتُنشَأ هذه العمليات الغاوسية من خلال تَغْيِيرِ وقتِ حركةِ براون، بما يُفضي إلى تَدَفُّقِ التطبيع ذاتِ التَّغْيِير الزَّمَنيّ، وهو نموذجٌ يمتلك خصائصَ رياضيةً تُتيح له وصفَ ديناميكيات ومعادلاتٍ تفاضليةٍ عشوائيةٍ لا تستطيع النماذجُ السابقة التقاطَها، مع الحفاظ على التعبيرية العالية لتَدَفُّقاتِ التطبيع الديناميكية. ونؤكّد هذه النتائج من خلال تجاربَ عديدةٍ على عدّةِ عملياتٍ معروفة.

تُنظَّم بقيّةُ الورقة على النحو الآتي: نُقدِّم أوّلًا، في قسم «الخَلْفِيَّة»، لمحةً عن المعادلات التفاضلية العشوائية العصبية — حيث يُمثَّل كلٌّ من الانجراف والانتشار بشبكاتٍ عصبية — ونستعرض منهج «عملية التدفق الزمني المستمر» CTFP وحدودَه. بعد ذلك، في القسم «tcnf»، نعرض نموذجَنا ونصف خصائصَه وخوارزميةَ تدريبه. ثم نُقدِّم النتائجَ الكمية في قسم «التَّجارِب» مع مقارنتها بنماذج أخرى مبنيّة على التدفق، ونختتم بالملاحظات الختامية في قسم «الخُلاصَة».

الخَلْفِيَّة

الأَعْمالُ ذاتُ الصِّلَة

مُعادَلاتُ التَّفاضُلِ العَشْوائِيَّةُ العَصَبيّة

نعتبر فضاءً احتماليًا مُفلترًا \((\Omega, \mathcal{F}, P)\) وأفقًا زمنيًّا \(T\). تُعرَّف عمليةُ الانتشار \(X = \{X_t\}_{t\in [0, T]}\) بواسطة معادلةِ إيتو للتفاضل العشوائي (SDE): \[ \begin{aligned} \label{eq:EDS_X} dX_t = \mu(X_t, t)\,dt + \sigma(X_t,t)\,dW_t,\quad t\in [0, T] \end{aligned} \] حيث \(W = \{W_t\}_{t\in [0, T]}\) عمليةُ وينر القياسية ذات البُعد \(m\)، و\(\mu:\mathbb{R} ^d \times [0,T] \to \mathbb{R} ^d\) و\(\sigma:\mathbb{R} ^d \times [0,T] \to \mathbb{R} ^{d\times m}\) هما معاملا الانجراف والانتشار على التوالي. وعندما تُنفَّذ هاتان الدالتان بواسطة شبكاتٍ عصبية، يُسمّى ذلك SDE عصبيًا (tzen2019neural, liu2019neural).

اقتَرحَت عدّةُ دراساتٍ تعلُّمَ SDEs عصبية باستخدام أطرٍ توليدية مختلفة، مثل المُشَفِّراتِ التباينية (li2020scalable, zeng2023latent) والشبكاتِ التوليدية التنافسية (kidger2021neural). في هذه الورقة نُركّز تحديدًا على نموذج تَدَفُّقِ التطبيع.

تَدَفُّقاتُ التَّطْبِيع

تَدَفُّقُ التطبيع (jmlr/PapamakariosNRM21, journals/pami/KobyzevPB21, DBLP:conf/iclr/GrathwohlCBSD19) هو تحويلٌ مُصمَّمٌ لنمذجة متغيّرٍ عشوائي \(X\) وتوزيعِه المعقّد \(p_X\) انطلاقًا من توزيعٍ أساسي \(p_Z\) ودالةٍ ثنائيةِ الاتجاه قابلةٍ للتفاضل \(f:\mathbb{R} ^d \to \mathbb{R} ^d\). وتُتيح هذه النمذجة تقديرَ الكثافةِ الدقيق والأخذَ العيّني الفعّال، باستخدام صيغة تغيير المُتغيّر لـ \(X=f(Z)\):

\[ \log p_X(x) = \log p_Z(z) - \log \left|\det J_{f}(z)\right| \]

حيث يعبِّر يعقوبي \(J_f(z) = \left[\frac{\partial f_i}{\partial z_j} \right]_{1\leq i,j \leq d}\) عن المشتقات الجزئية لـ \(f\).

وقد وَسّعت أعمالٌ سابقةٌ هذا الإطار بنمذجة السلاسل الزمنية والعمليات العشوائية عبر تَبايُنٍ مستمرٍّ مُفهرسٍ بالزمن \(F(\cdot, t)\) مع حركةِ براون كعمليةٍ أساسية، بما يُنتج «عمليةَ التدفق الزمني المستمر» (deng2020modeling): \[ \begin{aligned} X_t = F(W_t, t). \end{aligned} \]

وتقترح طريقةٌ أُخرى (deng2021continuous) دمجَ ديناميكيات عملية أورنشتاين–أولنبيك مع تَدَفُّقِ التطبيع بغيةَ نمذجة المعادلات التفاضلية العشوائية بفعالية.

وقد أثبتت هذه النماذجُ جدواها في التقاط السلوك المعقّد لأنواعٍ مختلفةٍ من العمليات العشوائية والمعادلات التفاضلية العشوائية. غير أنّ قيودًا مهمّةً تنشأ عند تطبيق قاعدة إيتو على عملية التدفق الزمني المستمر لاشتقاق عملية أورنشتاين–أولنبيك الأُحاديّة البُعد المُوصوفة بـ:

\[ \begin{aligned} \label{eq:ou} dY_t = -a(Y_t - b)\,dt + \sigma \,dW_t \end{aligned} \]

فعند تطبيق قاعدة إيتو على \(F(W_t,t)\) نحصل على: \[ \begin{aligned} \label{eq:NF-OU} \begin{split} dF(W_t,t) = & \ \frac{\partial F}{\partial t}(W_t,t)\,dt + \frac{\partial F}{\partial x}(W_t,t)\,dW_t \\ & \ + \frac{1}{2}\frac{\partial^2 F}{\partial x^2}(W_t,t)\,dt. \end{split} \end{aligned} \]

وبالمقارنة بين المعادلتين نستنتج أنّه لِنمذجة عملية أورنشتاين–أولنبيك يجب أن تتحقّق \(\frac{\partial F}{\partial x}(W_t,t) = \sigma\)، بما يعني \(F(W_t, t) = \sigma W_t + g(t)\) حيث \(g\) دالة قابلة للتفاضل. لكن تفاضُل هذه العلاقة يُفضي إلى الشرط التالي: \[ \begin{aligned} \label{OUabsurde} \frac{dg}{dt}(t) + a\, g(t) - a\, b = -a\,\sigma\, W_t, \end{aligned} \] وهي معادلةٌ غيرُ قابلةٍ للحلّ لأن الطرف الأيسر حتميٌّ بينما يعتمد الطرف الأيمن عشوائيًّا على \(W_t\). وبناءً عليه تظهر حدودٌ واضحةٌ لقدرة «عملية التدفق الزمني المستمر» على نمذجة بعض العمليات العشوائية بفعاليّة.

في القسم التالي نقترح نموذجًا يُعالج هذا القيد ويُحسِّن النتائج.

تَدَفُّقُ التَّطْبِيعِ الدِّينامِيكِيّ مَعَ تَغْيِيرِ الزَّمَن

تَدَفُّقُ التَّطْبِيعِ ذاتُ التَّغْيِيرِ الزَّمَنيّ

نقترح نمذجةَ عمليةٍ عشوائيةٍ مُراقَبة \(X = \{X_t\}_{t\in [0, T]}\) عبر دمجِ تَدَفُّقِ تطبيعٍ مع حركةِ وينر مُغَيَّرةِ الوقت لالتقاط السلوكِ الديناميكي لـ \(X_t\) انطلاقًا من سلسلةٍ زمنيةٍ مُحقَّقة \(\{(x_{t_i},t_i)\}_{i=1}^n\). نركّز في هذه الورقة على الحالة الأحادية البُعد، أمّا الحالةُ العامة فتتطلب تعميمًا زمنيًّا مناسبًا لكلّ بُعد. نُعرِّف «تدفّقَ التطبيع ذي التَّغْيِير الزَّمَنيّ» (TCNF) كما يأتي:

\[ \begin{aligned} X_t = f_\theta \bigl(W_{\phi(t)},\ \phi(t)\bigr), \quad \forall\, t \in [0,T], \end{aligned} \]

حيث \(f_\theta(\cdot,t):\mathbb{R}\to \mathbb{R}\) تبايُنٌ قابلٌ للتفاضل بمعلمات \(\theta\)، و\(W_{\phi(t)}\) حركةُ براون مع تَغْيِيرِ وقتٍ (revuz2013continuous). ودالةُ تَغْيِيرِ الوقت \(\phi : \mathbb{R} ^{+} \to \mathbb{R} ^{+}\) قابلةٌ للقياس وموجبةٌ ومُتزايدة. وتضمن خاصيتا القياس والإيجابية التعريفَ الصحيحَ لـ \(W_{\phi(t)}\)، بينما يضمن التزايدُ الملاءمةَ المارتينجاليّة والخواصَّ الأساسية للتغاير التربيعي. وعليه ينبغي أن تُنتِج الشبكةُ العصبيةُ المُمهِّدة لـ \(\phi\) دالةً موجبةً ومُتزايدة بطبيعتها. إنّ تَغْيِيرَ الوقت يُنتِج عائلةً عامةً من العمليات الغاوسية أوسعَ من الحركة البراونية القياسية. كما تؤكِّد مبرهنةُ دامبس–دوبينس–شوارتس (revuz2013continuous) أنّ كلَّ مارتينجالٍ محليٍّ يمكن تمثيلُه كحركةِ براون مُغَيَّرةِ الوقت.

لذا، عبر جعل العمليةِ الأساسية حركةَ براون مُغَيَّرةِ الوقت يمكننا التقاطُ فئاتٍ واسعةٍ من المارتينجالاتِ المحلية وشبهِ المارتينجالات، ومن ثَمَّ تعميمُ إعداد CTFP. في الواقع، يُعطى حلُّ عمليةِ أورنشتاين–أولنبيك بالصّيغة:

\[ \begin{aligned} Y_t = Y_0 e^{-a t} + b\,(1 - e^{-a t}) \;+\; \frac{\sigma e^{-a t}}{\sqrt{2a}}\, W_{\,e^{2a t}-1}, \end{aligned} \]

وهو تمثيلٌ يمكن نمذجتُه بكفاءة بواسطة TCNF. كما أنّ صورًا أعمَّ لعملياتٍ ذات تباينٍ تربيعيٍّ معتمدٍ على الزمن أو تقلباتٍ زمنيةٍ يمكن التعبيرُ عنها كتَغْيِيرِ وقتٍ قابلةٌ للتمثيل ضمن TCNF. وأخيرًا، عند اختيار \(\phi(t) = t\) نستعيدُ إعدادَ CTFP التقليدي الملائمَ للعمليات التي لا تتطلّب تَغْيِيرًا زمنيًا، مثل الحركةِ البراونية الهندسية (oksendal2013stochastic).

دالَّةُ تَغْيِيرِ الوقت

لضمان خصائصِ دالّةِ تَغْيِيرِ الوقت (الإيجابية والرتابية)، نستخدم شبكةً عصبيةً أحاديةَ البُعد مُصمَّمةً لِتكون مُرتفعةَ الاشتقاق ومُوجِبةَ الاشتقاق. تحديدًا نعتمد بُنية (M-MGN) (chaudhari2023learning) المبنيّة على وحداتٍ مُعرَّفةٍ بالصيغ:

\[ \begin{aligned} \begin{split} \widetilde{t}_k &= W_k\, t + b_k, \\ \mathrm{M\mbox{-}MGN}(t) &= a + V^\top V\,t + \sum_{k=1}^K s_k(\widetilde{t}_k)\, W_k^\top \sigma_k(\widetilde{t}_k), \end{split} \end{aligned} \]

حيث \(W_k, b_k \in \mathbb{R}^{l \times 1}\) متجهاتُ الوزن والانحياز للطبقة \(k\)، و\(\sigma_k:\mathbb{R}^l \to \mathbb{R}^l\) دالةُ تنشيط، و\(s_k :\mathbb{R}^l \to \mathbb{R}\) دالةٌ بدائيّةٌ لـ \(\sigma_k\) بحيث \(s_k'=\sigma_k\). و\(a \in \mathbb{R}\)، و\(V \in \mathbb{R}^{l \times 1}\) معامِلان إضافيّان. ولأن خرج (M-MGN) قد لا يكون موجبًا بطبيعته، نُضيف إزاحةً موجبةً صغيرة لضمان إيجابيّةِ تَغْيِيرِ الوقت.

خوارزميّةُ التَّدريب

هدفُنا تدريبُ الشبكةِ الزمنيةِ المشروطة لتعظيم لوغاريتمِ الاحتمالية لمجموعةِ البيانات المرصودة \(\{(x_{t_i},t_i)\}_{i=1}^n\):

\[ \begin{aligned} \label{eq:LL} L = \log p_{X_{t_1}, \dots, X_{t_n}}(x_{t_1}, \dots, x_{t_n}). \end{aligned} \]

ولحسابِ ذلك نستخدمُ صيغةَ تغييرِ المُتغيّر ونستفيد من استقلاليةِ الزيادات \(W_{\phi(t_i)} - W_{\phi(t_{i-1})}\). وبناءً عليه تُكتَبُ الاحتماليةُ اللوغاريتمية كما يلي:

\[ \begin{aligned} \begin{split} L = \sum_{i=1}^n \Big[ & \log p_{W_{\phi(t_i)}\mid W_{\phi(t_{i-1})}}\bigl(w_{\phi(t_i)}\bigr) \\ &- \log \Bigl|\det \frac{\partial f_\theta \bigl(w_{\phi(t_i)},\ \phi(t_i)\bigr)}{\partial W_{\phi(t_i)}} \Bigr| \,\Big], \end{split} \end{aligned} \]

حيث \(w_{\phi(t_i)} = f_\theta^{-1}\bigl(x_{t_i}; \phi(t_i)\bigr)\) و\(p_{W_{\phi(t_i)}\mid W_{\phi(t_{i-1})}}\) توزيعٌ Gaussّي شرطيّ بمتوسط \(W_{\phi(t_{i-1})}\) وتباين \(\phi(t_i)- \phi(t_{i-1})\). وهذا يُشكِّل فارقًا جوهريًّا مقارنةً باحتماليةِ التوزيع الزمني المشروط التي تستخدم التباين \(t_i - t_{i-1}\) بدلًا من \(\phi(t_i)- \phi(t_{i-1})\).

التَّجارِب

مَجْمُوعاتُ البَياناتِ التَّجريبيّة

لتقييم أداءِ النموذج المقترح، أجرينا تجاربَ على ثلاث مجموعاتِ بياناتٍ اصطناعيةٍ أحاديةِ البُعد. وجرى توليدُ تلك المجموعات بأخذ عيناتٍ من ثلاث عملياتٍ عشوائيةٍ مختلفة، واستخدمنا في تجاربنا بُنيةً مشابهةً لبنية نموذج CTFP المعتمِد على CNFs.

المجموعة الأولى (Toy-SDE1) مُنشأةٌ من عمليةِ OU المعطاة بـ \(dX_t = -\theta(X_t - \mu)\,dt + \sigma\, dW_t\)، حيث \(\mu\) و\(\sigma\) معامِلا الانجراف والتقلّب الثابتان، و\(\theta\) يُحدِّد سرعةَ تقارب المسار نحو حدِّ الانجراف. وتهدف هذه المجموعة إلى اختبار قدرة النموذج على التقاط ديناميكياتٍ ثابتةِ المعاملات عبر الزمن.

المجموعة الثانية (Toy-SDE2) مُعرّفةٌ بالمعادلة \(dX_t = -\theta(X_t - \mu)\,dt + \sigma \sqrt{t}\,dW_t\)، وهي عمليةُ OU بمعاملِ انتشارٍ معتمدٍ على الزمن، لاختبار قدرة النموذج على التقاط تغيّراتٍ زمنيةٍ معقّدة. يُستخدَم هذا النمط من SDE في نماذج النقاط الأساسية (yang2022diffusion) حيث تُقاد الضوضاء تدريجيًّا أثناء التدريب.

المجموعة الثالثة (Toy-SDE3) تخصّ الحركةَ البراونية الهندسية المعطاة بـ \(dX_t = \mu X_t\, dt + \sigma X_t\, dW_t\)، حيث \(\mu\) و\(\sigma\) معامِلان ثابتان للانجراف والتقلّب. وصُمِّمت هذه المجموعة لإظهار قدرة TCNF على التعامل مع SDEs التي لا تحتاج تَغْيِيرًا زمنيًا، وتعلُّم الدالة البسيطة \(\phi(t) = t\) بفعالية، مُبرزةً شمولية إطار CTFP.

قارنّا النماذجَ بمقاييسِ المتوسط \(m_{X_t}\) والانحراف المعياري \(\sigma_{X_t}\) والمُدى بين الرُّبعين IQR (\(Q_{3}-Q_{1}\)) والكثافة \(p_{X_t}\). ولكلّ نموذجٍ حسبنا خطأ المتوسط المطلق (MAE) مقارنةً بالحقائق الأساسية. وقد جرى تقديرُ المتوسط والانحراف والرباعيات بالاستناد إلى 1000 مسارِ عيّنة عبر 1000 تكرار، فيما استُخدمت شبكةٌ مكانية من 1000 نقطة و500 نقطةٍ زمنية ضمن الفترة \([0, T = 1.5]\) لتقدير الكثافة. تُظهر النتائجُ المبلّغُ عنها في الجدول [tab:quant_error_toy12] أنّ TCNF لا يفقد العمومية في حالات عدم الحاجة لتَغْيِير الوقت، وأنّ نموذجَنا يتفوّق في التقاط السلوك المُتغيّر زمنيًّا.

مَجْمُوعاتُ البَياناتِ الواقِعيّة

لتقييم قدرة نموذجِنا على التقاط ديناميكياتٍ أكثر تعقيدًا، درّبناه على مجموعتي بياناتٍ حقيقيّتين: تنبؤات العملات المشفّرة (Crypto) (g-research-crypto-forecasting) واستهلاك الطاقة الكهربائية (ECL) (zhou2021informer). تحتوي مجموعة Crypto على أسعارٍ تاريخيةٍ لعدّة عملاتٍ مُشفّرة، وركّزنا على العوائد اللُّغاريتمية لإيثريوم خلال عام 2020. أمّا مجموعة ECL فتشمل بياناتِ استهلاكِ الكهرباء لعدّة عملاء بفاصل 15 دقيقة، وقد نمذجنا استهلاكَ العميل «200» على امتداد فترته الزمنية.

تتضمّن النتائجُ أخطاءَ المتوسط المطلق (MAE) لتقدير المتوسط (\(m_{X_t}\)) والانحراف المعياري (\(\sigma_{X_t}\)) لمجموعة Crypto. كما استخدمنا الأخطاءَ النسبيةَ المتوسّطة (MRE) لمجموعة ECL لملاءمة اختلاف المقاييس. وأُبلِغ عن هذه النتائج في الجدول [tab:real-world] مع مقارنتها بـ CTFP.

الخُلاصَة

قدّمنا نهجًا مُعمَّمًا لنمذجة المعادلات التفاضلية العشوائية عبر شبكاتٍ عصبيةٍ ديناميكية مقرونةٍ بتَغْيِيرِ الوقت. فمن خلال تَغْيِيرِ وقتِ حركةِ وينر نولِّد عملياتٍ غاوسيةً متنوّعة تُطابق العمليةَ المرصودة عند تَطبيق تَدَفُّقاتِ التطبيع. ويُتيح تَغْيِيرُ الوقت، مقترنًا بالشبكة الديناميكية، نمذجةَ عملياتٍ يتعذّر التقاطُها تقليديًّا، مع الحفاظ على مزايا تَدَفُّقاتِ التطبيع في تقدير الكثافة الدقيق والأخذ العيّني الفعّال.

وأظهرت التجاربُ تفوّق نموذجِنا وقدرتَه على التعميم. ونعتقد أنّ ربطَ تَغْيِيرِ الوقت بلحظات العملية أو بتباينها التربيعي قد يُفضي إلى تحسيناتٍ إضافية، ويفتح البابَ لِتوسيع الطريقة إلى أبعادٍ أعلى.