مُلَخَّص
تُقَدِّم هذه الورقة طريقةً بَيْزِيّة لاستنتاج عمق المنافسة واحتمال المُفاجأة غير الصفري في نماذج الترتيب الزوجي. نعتمد الاستدلال البَيْزِي لتقدير هذه الكميات انطلاقاً من البيانات المرصودة للمواجهات. وبخلاف النماذج التقليدية التي تُهمِل تقلبات الأداء بين المتنافسين، يوفِّر منهجُنا تحسيناً ملحوظاً في دقة التنبؤ، ولا سيّما حين تكون التقلبات عالية.
مُقَدِّمَة
في سياقات عديدة مثل الرياضة والألعاب والانتخابات، يُستعمل الترتيب الزوجي لتحديد الفائز بين متنافسَيْن. تقليدياً يُفترَض أن لكل متنافس مستوى أداء ثابت، إلا أنّ الأداء في الواقع قد يتغيّر خلال الموسم أو حتى أثناء المنافسة نفسها. لذا يصبح من المهم تطوير نماذج تراعي هذه التقلبات لتحسين دقة التنبؤ.
النموذج
نقترح إطاراً بَيْزِيّاً لتقدير عمق المنافسة واحتمال المُفاجأة. نُعرِّف عمق المنافسة بوصفه مقياساً لمدى تقارب مستويات الأداء بين المتنافسين، بينما يُقاس احتمال المُفاجأة بمدى احتمال وقوع نتيجة مخالفة للتوقعات المَبنيّة على الفروق المهارية.
تعريف النموذج
نقدِّم نموذجاً تمهيدياً كما يلي: \[ \begin{aligned} P(A \text{ يفوز على } B) &= \frac{1}{1 + e^{-(\alpha_A - \alpha_B)}}, \\ \alpha_i &= \mu + \sigma X_i, \end{aligned} \] حيث \(\alpha_A\) و\(\alpha_B\) معاملا أداء للمتنافسين \(A\) و\(B\) على التوالي، و\(X_i\) متغير عشوائي يتبع التوزيع الطبيعي المعياري. يوضّح هذا البناء كيف تؤدي تقلبات الأداء إلى تغيّر في احتمالات الفوز.
تقدير المعلمات
نُقدِّر المعلمتين \(\mu\) و\(\sigma\) بطرائق بَيْزِيّة اعتماداً على البيانات المرصودة، مع تحديث المعتقدات قبليّاً ولاحقاً مع ورود البيانات الجديدة، بما يُحسِّن التقديرات بمرور الوقت.
التحقق من صحة النموذج
للتحقق من صحة الإطار، نجري تحليلاً تجريبياً على بيانات واقعية من مسابقات رياضية، ونقارن تنبؤات النموذج بالنتائج الفعلية لتقييم دقته.
النتائج
تُظهِر النتائج دقةً تنبؤية مرتفعة للنموذج، خصوصاً عندما تكون تقلبات الأداء كبيرة، ما يؤكد أهمية تضمين هذه التقلبات في نماذج الترتيب الزوجي.
الخاتمة
يوفِّر نموذجُنا إطاراً متيناً لفهم وتقدير عمق المنافسة واحتمال المُفاجأة في الترتيب الزوجي. ومن خلال تضمين تقلبات الأداء، يمكن تحسين دقة التنبؤ في سياقات تنافسية متنوعة.
مُقَدِّمَة مُوسَّعَة
عند دراسة نتائج المنافسات، واختيارات المستهلكين، والترتيبات الاجتماعية، غالباً ما نحتاج إلى تحويل مقارنات زوجية بين مجموعة من العناصر إلى ترتيب كامل للمجموعة بأكملها. فقد يتنافس لاعبو شطرنج في بطولة ويُسجَّل الفوز والخسارة فيما بينهم؛ أو تُسجَّل سلسلة من التفضيلات بين أزواج المنتجات في اختبارات A/B؛ أو يتقاتل سرب من الدجاج فيما يُسجِّل الباحث مَن نقر مَن. هذا التشابه البنيوي يدعو إلى أدوات مشتركة لاستنباط ترتيب أساسي للعناصر: لإيجاد أفضل لاعب شطرنج، وأكثر المنتجات جاذبية، والأعلى هيمنةً في سلوك الدجاج (بل واستخراج الترتيب الكامل أيضاً). سنستخدم لغة اللاعبين الذين يتغلب بعضُهم على بعض في مباريات، على أن التقنيات تنطبق على طيف واسع من الإعدادات.
استناداً إلى ملاحظات المباريات، غالباً لا يوجد ترتيب يضمن أن الأعلى تصنيفاً يفوز دائماً على الأدنى. فحتى الأدنى تصنيفاً يفوز أحياناً. بسبب هذا الغموض، لا يظهر ترتيب وحيد غير قابل للجدل من البيانات، ويجب وضع افتراضات حول كيفية وزن انتصارات وخسائر اللاعبين. لذلك يُستَخدم عادةً نموذج احتمالي توليدي يروي قصةً مع بعض العشوائية عن كيفية تولّد النتائج الملحوظة.
على مدى قرن، طُوِّر طيف واسع من النماذج لهذه المهمة. في كثير منها نُسنِد لكل لاعب \(i\) درجة قوة أساسية \(s_i\) تعكس ميله للتغلب على الآخرين. ثم نفترض أنه عندما يلعب \(i\) ضد \(j\)، تُحَدَّد النتيجة بقلب عملة مُرَجَّحة بشكل مستقل: يفوز \(i\) باحتمال \(p_{ij} = f(s_i - s_j)\)، وهي دالة في فرق الدرجات. تكون \(f\) متزايدة أحادية؛ فإذا كان \(s_i > s_j\) كان \(i\) أرجح للفوز. يُقدَّر عادةً متجه الدرجات الأكثر احتمالاً لإنتاج النتائج المرصودة وتُبلَّغ قيم الاحتمال الأقصى \(\text{ML}\) لـ\(s_i\).
إذا كانت \(f\) لوجستية نحصل على نموذج برادلي–تيري الشائع (صياغة زيرميلو الأصلية). وإذا كانت \(f\) هي دالة التوزيع التراكمي للتوزيع الطبيعي نحصل على نموذج ثورستون. عموماً، أي اختيار معقول لـ\(f\) يُولِّد نموذجاً جديداً؛ وقد اقتُرح كثيرٌ منها، وسُمّيت هذه النماذج بـالنماذج الخطية وفق ديفيد.
في هذا السياق نقترح عائلة جديدة من النماذج تُحدَّد باختيارات موسَّعة لدالة الدرجات \(f\)، بوصفها تعميماً للدالة اللوجستية لنموذج برادلي–تيري. الجديد في اقتراحنا أن هذه الدوال تسمح بضبط حدّة المُفاجآت ديناميكياً واستيعاب تغيّر الأداء زمنياً، ما يجعل النموذج أكثر مرونة للتطبيقات المتنوعة. ونُبيِّن أن إعادة المعلمة إلى متغيرات أكثر قابلية للتفسير فيزيائياً مفيدة.
التحقق المتقاطع
على غرار ورقة SpringRank، نُولِّد التوزيع التنبؤي اللاحق ونُقيِّم أداء النموذج عبر تحققٍ متقاطع خُماسيّ الطِّيّات.
النموذج
نموذج برادلي–تيري
لنفترض أننا نرصد مباريات بين \(n\) لاعبين. نُمثِّل هذه المباريات بمصفوفة \(A\) حيث \(A_{ij}\) هو عدد مرّات فوز اللاعب \(i\) على اللاعب \(j\) لـ\(i,j=1,\dots,n\). في سياق تنافسي، يمكن فهم \(A\) كجدول للسجلات المباشرة بين اللاعبين. نهدف إلى استنباط ترتيب العناصر \(n\) من هذه التفاعلات المرصودة.
ننظُر في نماذج توليدية تُحدِّد احتمال ملاحظة \(A\) اعتماداً على معلمات كامنة حقيقية \(s_i \in \mathbb{R}\) لـ\(i=1,\dots,n\)، تُعَدّ درجات قوة. بين كل زوج \(i,j\) نأخذ احتمال فوز \(i\) على \(j\) بوصفه دالةً لفرق الدرجات فقط: \(p_{ij} = f(s_{ij})\) حيث \(s_{ij} \equiv s_i - s_j\). يكون الاحتمال الكلّي: \[ \begin{aligned} P(A|\vec{s},f) &= \prod_{(i,j)} f(s_{ij})^{A_{ij}}, \end{aligned} \] حيث جمعنا الدرجات في متجه ذي بُعد \(n\) هو \(\vec{s}\)، ويمتد الجداء على جميع الأزواج المرتّبة \((i,j)\) التي لديها تفاعلات (\(A_{ij}\neq 0\)). إذا فُسِّرت \(A\) كمصفوفة مجاورة فهي تمثّل حواف شبكة التفاعلات.
ينشأ نموذج برادلي–تيري باختيار الدالة اللوجستية: \[ \begin{aligned} f_{BT}(s) = \frac{1}{1 + e^{-s}}. \end{aligned} \] وتؤدّي اختيارات أُخَر إلى نماذج بديلة، مثلاً نموذج ثورستون باستخدام دالة التوزيع التراكمي للتوزيع الطبيعي: \[ \begin{aligned} f_{TH}(s) = \Phi(s). \end{aligned} \] في تحليلنا سنحصل على تعميم لنموذج برادلي–تيري، مع إمكان تطبيق طرائقنا لتوسيع نموذج ثورستون أيضاً.
بالنظر إلى \(A\) واختيار \(f\)، نُعرِّف تقديرات الاحتمال الأقصى للدرجات: \[ \begin{aligned} \vec{s}_{\text{ML}} = \arg\max_{\vec{s}}\, P(A|\vec{s},f). \end{aligned} \] لكن هذا النهج يعاني مشكلاتٍ معتادة؛ فمتى ما لم تكن شبكة التفاعلات متصلة بقوة قد لا يوجد حدٌّ أقصى مُنتهٍ إذ تتباعد الدرجات.
يمكن تلافي ذلك بإدخال أولوية على الدرجات. نستخدم أولوية غاوسية قياسية مستقلة: \[ \begin{aligned} P(\vec{s}) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{s_i^2}{2}\right). \end{aligned} \] مع هذه الأولوية نُعرِّف تقدير الأرجحية العظمى بعديّاً \(\text{MAP}\): \[ \begin{aligned} \arg\max_{\vec{s}} P(\vec{s}|A,f) = \arg\max_{\vec{s}}\, P(A|\vec{s},f)\,P(\vec{s}). \end{aligned} \] كما يمكن أخذ التوقعات اللاحقة للحصول على تقديرات متوقَّعة بعديّاً.
سننظر في عائلة من الدوال \(f\) تُعرِّف عائلة من النماذج. لاختيار النموذج الملائم لمجموعة بيانات بعينها، نقارن الدليل البَيْزِي: \[ \begin{aligned} P(A|f) = \int d\vec{s}\; P(A,\vec{s}|f) = \int d\vec{s}\; P(A|\vec{s},f) P(\vec{s}). \end{aligned} \] وننتقي النموذج الذي يُعظِّم الدليل: \[ \begin{aligned} f^* = \arg\max_f P(A|f). \end{aligned} \] هذا التحليل البَيْزِي الكامل مُكلف حسابياً في غياب تبسيطات تحليلية، غير أنّ طرائق مونتِ كارلو الهاملتونية الحديثة تُظهِر خلطاً كافياً لإعطاء تقديرات متقاربة للدليل في تطبيقاتنا.
تعميمنا
قبل تعميم نموذج برادلي–تيري ذي الدالة اللوجستية \(f_{BT}(s)=1/(1+e^{-s})\)، نحدّد خصائص ينبغي أن تتوافر في أي \(f\) أخرى. بما أنّ \(p_{ij} = f(s_i - s_j)=f(s_{ij})\) فهي احتمال، ينبغي لكل \(s\in\mathbb{R}\) أن: \[ \begin{aligned} 0 \le f(s) \le 1. \end{aligned} \] وفي غياب التعادلات، إما أن يفوز \(i\) أو \(j\)، لذا: \[ \begin{aligned} 1 = p_{ij}+p_{ji} = f(s_{ij}) + f(-s_{ij}) \;\Rightarrow\; f(-s) = 1 - f(s). \end{aligned} \] كما نتوقّع أن تكون \(f\) غيرَ متناقصة: بزيادة الفارق المهاري يزداد احتمال فوز الأفضل. هذا القيد الأخير مفيد للتفسير وإن لم يكن ضرورياً لسلامة التعريف.
التحسين
نوجِّه الاهتمام إلى اختيار النموذج الأمثل وفق \(P(\eta,u|A)\)، حيث \(\eta\) معلمة شكل للأولوية و\(u\) معلمة تُلخِّص حدّة المُفاجآت. نعيد كتابة: \[ \begin{aligned} P(\eta,u|A) &= \frac{P(\eta)\,P(u)\,P(A|\eta,u)}{P(A)}\\ &\propto P(\eta)\int d\vec{s}\; P(\vec{s}|\eta)\, P(A|\vec{s},u)\\ &\propto P(\eta)\!\int\! d\vec{s}\; P(\vec{s}|\eta^*) P(A|\vec{s},u^*)\, \frac{P(\vec{s}|\eta)\,P(A|\vec{s},u)}{P(\vec{s}|\eta^*)\,P(A|\vec{s},u^*)}\\ &\propto P(\eta)\left\langle \frac{P(\vec{s}|\eta)\,P(A|\vec{s},u)}{P(\vec{s}|\eta^*)\,P(A|\vec{s},u^*)} \right\rangle_{\eta^*,u^*}. \end{aligned} \] نُقدِّر هذه التوقعات بسحب عينات \(\vec{s}\) من \(P(\vec{s},A|\eta^*,u^*)=P(\vec{s}|\eta^*)P(A|\vec{s},u^*)\). يمكن استخدام المجموعة نفسها من العينات لتقدير \(P(\eta,u|A)\) لعدة أزواج \((\eta,u)\) قريبة من \((\eta^*,u^*)\).
لتحسين التقارب حين تكون نسبة الاحتمال غير متجانسة، نُعيد تحجيم التكامل: \[ \begin{aligned} P(\eta,u|A) &\propto P(\eta)\!\int\! d\vec{s}\; P(\vec{s}|\eta)\, P(A|\vec{s},u)\\ &\propto P(\eta)\!\int\! d\vec{s}\; \lambda_\eta^n\, P(\lambda_\eta\vec{s}|\eta)\, P(A|\lambda_\eta\vec{s},u)\\ &\propto P(\eta)\lambda_\eta^n \!\int\! d\vec{s}\; P(\vec{s}|\eta^*) P(A|\vec{s},u^*) \frac{P(\lambda_\eta\vec{s}|\eta)\, P(A|\lambda_\eta\vec{s},u)}{P(\vec{s}|\eta^*)\, P(A|\vec{s},u^*)}\\ &\propto P(\eta)\lambda_\eta^n \left\langle \frac{P(\lambda_\eta\vec{s}|\eta)\, P(A|\lambda_\eta\vec{s},u)}{P(\vec{s}|\eta^*)\, P(A|\vec{s},u^*)} \right\rangle_{\eta^*,u^*}. \end{aligned} \] لاختيار \(\lambda_\eta\) قد نساوي تباين التوزيعين: \[ \begin{aligned} \operatorname{var} P(\vec{s}|\eta^*) &= 2\,\psi_1(\eta^*), \\ \operatorname{var} P(\lambda_\eta\vec{s}|\eta) &= \frac{2}{\lambda_\eta^2}\,\psi_1(\eta), \end{aligned} \] فتكون \[ \begin{aligned} \lambda_\eta = \sqrt{\frac{\psi_1(\eta)}{\psi_1(\eta^*)}}. \end{aligned} \]
- نُحاذِر من الوقوع في حدودٍ محلية.
- نُضمِّن اختبار اتساق للطريقة في الملحق، ونُبيِّن أثر ثراء البيانات على القدرة على تمييز التأثيرات.
الدليل البَيْزِي
نسأل إن كان بالإمكان إجراء التكامل داخل التوقع للتخلّص من خطأ التقريب عند الانتقال من \(P(A|\eta,u)\) إلى \(P(A)\) لحساب الدليل. على الأرجح لا يتاح ذلك على نحوٍ عام دون بنى خاصة تسهِّل التكامل.
اختبار قيمة \(p\) على التوزيع التنبؤي اللاحق
لشبكة معيّنة \(A\) نُعرِّف قيمة \(p\) لمدى اتساق الملاحظة مع نموذجٍ مختار بالسؤال عن: \[ \begin{aligned} P\!\big(\log P(\tilde{A}|A) < \log P(A|A)\big), \end{aligned} \] حيث تُسحَب \(\tilde{A}\) من \(P(\tilde{A}|A)\). نكتب: \[ \begin{aligned} P(\tilde{A}|A) = \int d \vec{s}\, d\alpha\, d\beta\; P(\tilde{A}|\vec{s},\alpha,\beta)\, P(\vec{s},\alpha,\beta|A), \end{aligned} \] ومن ثم \[ \begin{aligned} \log P(\tilde{A}|A) &= \log \!\left[\int d \vec{s}\, d\alpha\, d\beta\; P(\tilde{A}|\vec{s},\alpha,\beta)\,P(\vec{s},\alpha,\beta|A)\right]\\ &= \sum_{ij} \int d \vec{s}\, d\alpha\, d\beta\; \log P(\tilde{A}_{ij}|s_{ij},\alpha,\beta)\, P(\vec{s},\alpha,\beta|A). \end{aligned} \]
التحقق خارج العيِّنة
نُقارن أداء نموذجنا مع نماذج أُخَر في أدبيات الترتيب الزوجي، مع تركيزٍ على التنبؤ خارج البيانات المُدرَّبة. نعتمد تحققاً متقاطعاً خُماسيّ الطِّيّات: تدريب على 80% من البيانات واختبار على 20% المتبقية.
نستخدم مقياسين. الأول بَيْزِي بالكامل، إذ نبحث عن النموذج الذي يُعظِّم التوزيع التنبؤي اللاحق \(P(A_{\text{test}}|A_{\text{train}})\): \[ \begin{aligned} P(A_{\text{test}}|A_{\text{train}}) &= \int d \vec{s}\, du\, dd\; P(A_{\text{test}}|\vec{s},u,d)\, P(\vec{s},u,d|A_{\text{train}})\\ &\equiv \left\langle P(A_{\text{test}}|\vec{s},u,d) \right\rangle_{\vec{s},u,d|A_{\text{train}}}. \end{aligned} \] ونُقرِّبه بعيناتٍ لاحقة: \[ \begin{aligned} P(A_{\text{test}}|A_{\text{train}}) \approx \frac{1}{N}\sum_{k=1}^N P(A_{\text{test}}|\vec{s}^{(k)},u^{(k)},d^{(k)}). \end{aligned} \]
ولأجل هذا نحتاج صياغةً بَيْزِيّة كاملة للنماذج المقارنة. نعرض بإيجاز SpringRank. لديه معامِلان فائقان \(\beta\) و\(c\) إضافةً إلى درجات \(\vec{s}\). الاحتمال: \[ \begin{aligned} P(A|\vec{s},\beta,c) = \prod_{i,j}\frac{\big(c\, e^{-\frac{\beta}{2}(s_i - s_j - 1)^2}\big)^{A_{ij}}}{A_{ij}!}\; \exp\!\left[-\,c\, e^{-\frac{\beta}{2}(s_i - s_j - 1)^2}\right], \end{aligned} \] أي توزيع بواسون لمعدّل \(c\, e^{-\frac{\beta}{2}(s_i - s_j - 1)^2}\). قيمة الاحتمال الأقصى لـ\(c\): \[ \begin{aligned} c = \frac{\sum_{ij} A_{ij}}{\sum_{ij} e^{-\frac{\beta}{2} (s_i - s_j - 1)^2}}, \end{aligned} \] وبالإدخال نحصل على لوغاريتم الاحتمال: \[ \begin{aligned} \mathcal{L}(A|\vec{s},\beta) \propto -\,\frac{\beta}{2}\sum_{ij}A_{ij}(s_i - s_j - 1)^2 \;-\; M \log \!\left[\sum_{ij} e^{-\frac{\beta}{2} (s_i - s_j - 1)^2}\right], \end{aligned} \] مع إمكان إضافة أولوية Gaussian منظِّمة، حيث يستخدمون \(\alpha=2\) للنسخة المُنظَّمة و\(\alpha=0\) لغير المنظَّمة: \[ \begin{aligned} P(\vec{s}) = \prod_i \exp\!\left[-\frac{\alpha \beta}{2}(s_i - 1)^2\right]. \end{aligned} \] يُضبَط \(\beta\) و\(c\) غالباً بقيم الاحتمال الأقصى.
المقياس الثاني يعتمد قيم الاحتمال الأقصى مباشرةً للتنبؤ، بمقارنة \[ \begin{aligned} -\log P(A_{\text{test}}|\vec{s}^*,u^*,d^*), \end{aligned} \] حيث \((\vec{s}^*,u^*,d^*)\) تعظِّم \(P(\vec{s},u,d|A_{\text{train}})\). نقيس أيضاً الدقّة (النسبة المئوية للتطابق مع ترتيب النتائج الفعلي).
نُحدِّد \(\vec{s}\) لتعظيم: \[ \begin{aligned} P(\vec{s}\,|\,A_{\text{train}},u^*,d^*). \end{aligned} \] أي نُثبِّت المعلمات الفائقة المُحسَّنة لتحديد النموذج ثم نجد تقديرات ML للدرجات كما في النماذج الأخرى.
النماذج المُقارنة:
- النموذج الكامل (معلمات فائقة على \(d\) و\(u\)).
- برادلي–تيري القياسي (\(u=0\)، معلمة فائقة على \(d\)).
- برادلي–تيري بَيْزِي (تغيير شكل الأولوية إلى لوجستية موحّدة تقابل \(\eta=1\)، مع الضبط الموافق مثل \(\theta=0.244979\)).
- نموذج الدالة الخطّية (تكافئ حدّ \(d\to\infty\)، معلمة فائقة على \(u\)).
- SpringRank غير المُنظَّم (\(\alpha=0\)).
- SpringRank المُنظَّم (\(\alpha=2\)).
ينبغي أيضاً النظر في الاحتمال المشروط على النسخة غير الموجَّهة من الرسم: لنموذج برادلي–تيري: \[ \begin{aligned} P(A|\vec{s},\bar{A}) = \prod_{(i,j)} \binom{\bar{A}_{ij}}{A_{ij}}\, f(s_{ij})^{A_{ij}}\, f(s_{ji})^{A_{ji}}, \end{aligned} \] حيث يمتد الجداء على الحواف غير الموجَّهة \((i,j)\)، و\(\bar{A}_{ij}=A_{ij}+A_{ji}\). هذا التكييف مهم خصوصاً عند تفاوت تكرارات المواجهات.
ومن ثم يكون التوزيع التنبؤي اللاحق المشروط على وجود المواجهات: \[ \begin{aligned} P(A_{\text{test}}|A_{\text{train}},\bar{A}_{\text{test}}) = \int d \vec{s}\, d\alpha\, d\beta\; P(A_{\text{test}}|\vec{s},\alpha,\beta,\bar{A}_{\text{test}})\, P(\vec{s},\alpha,\beta|A_{\text{train}}). \end{aligned} \]
النتائج
قيم العوامل المثلى
نستعرض قيم المعلمات الفائقة المُثلى بحسب الدليل البَيْزِي والتنبؤ خارج العيِّنة.
التأثير على التصنيفات
نُقارن بين تقديرات ML، وتقديرات MAP، والمتوقَّع البَعدي للدرجات، ضمن الطرحين النموذجي والأمثل، ونرصد أثر ذلك على ترتيب العناصر.
التقريبات العملية
التنفيذ البَيْزِي الكامل يتطلّب حسابات مكثّفة (HMC). في تطبيقات كبيرة، قد لا يكون ذلك عملياً، فنلجأ إلى تقريباتٍ أسرع.
لا مُفاجآت: \(u = 0\)
حالة \(u=0\) تُعيد نموذج برادلي–تيري القياسي. نُسارع إلى تقدير درجات MAP تحت أولوية لوجستية عامة ثم نقارب بغاوسي: \[ \begin{aligned} P(\eta|A) \propto P(A|\eta) = \int d\vec{s}\; P(A|\vec{s})\, P(\vec{s}|\eta), \end{aligned} \] حيث نفترض أولوية ثابتة على \(\eta\) ونعتبر عرض الأولوية متغيراً. نأخذ \[ \begin{aligned} P(\vec{s}|\eta) &= \prod_i \frac{\Gamma(2\eta)}{\Gamma(\eta)^2}\left[\frac{e^{-s_i}}{(1+e^{-s_i})^2}\right]^\eta,\\ \log P(\vec{s}|\eta) &= \sum_i \log \frac{\Gamma(2\eta)}{\Gamma(\eta)^2} + \eta \log \frac{e^{-s_i}}{(1+e^{-s_i})^2}, \end{aligned} \] ومثلاً أولوية أسية \(P(\eta)=e^{-\eta}\). بالتوسع حول \(\vec{s}^*\) قُرب نقطة سرج نحصل على تقريب لابلاس: \[ \begin{aligned} \log P(\eta|A) &\approx -\log P(A) - \eta + \log P(A|\vec{s}^*) + \log P(\vec{s}^*|\eta) \\ &\quad + \frac{n}{2}\log(2\pi) - \tfrac{1}{2}\log\det H + \tfrac{1}{2}\,\vec{B}^{\!\top} H^{-1}\vec{B}, \end{aligned} \] حيث \[ \begin{aligned} H_{ij} &\equiv -\partial_i\partial_j \log P(A|\vec{s}) - \partial_i\partial_j \log P(\vec{s}|\eta),\\ B_i &\equiv \partial_i \log P(A|\vec{s}) + \partial_i \log P(\vec{s}|\eta). \end{aligned} \] وبالاشتقاق نحصل على \[ \begin{aligned} \partial_i \partial_j \log P(\vec{s}|\eta) &= -\,\frac{\delta_{ij}\,\eta}{1+\cosh(s_i)}, \\ \partial_i \log P(\vec{s}|\eta) &= -\,\eta\, \tanh\!\left(\frac{s_i}{2}\right). \end{aligned} \] وتُستخلص مشتقات لوغاريتم الاحتمال لبرادلي–تيري تحليلياً، ثم تُستكمَل عناصر \(H,B\) والمشتقات بالنسبة لـ\(\eta\) عدديّاً.
إجمالاً، قد لا تكون \(P(\eta|A)\) مُقعَّرة لوغاريتمياً دائماً في \(\eta\)، لكن في أمثلتنا رُصِدت سلوكيات حسنة.
دالةُ الخُطوة: \(\eta = 0\)
في الحدّ \(\eta=0\) تُقارِب \(f_u\) دالةَ خطوة تقفز من \(u\) إلى \(1-u\)، وهي ملائمة لهرمية قوية (كما في بعض بيانات الهيمنة الحيوانية). من منظور بَيْزِي: \[ \begin{aligned} P(0,u|A) &\propto \int d\vec{s}\; \prod_{(i,j)} f_u(s_{ij})^{A_{ij}} \;\propto\; \sum_{\pi \in \mathfrak{S}_n} u^{m_{\pi,A}}\,(1-u)^{m - m_{\pi,A}}, \end{aligned} \] حيث \[ \begin{aligned} m_{\pi,A} \equiv \sum_{(i,j)} A_{ij}\, \mathbf{1}\big(\pi(i) < \pi(j)\big), \end{aligned} \] و\(m\) إجمالي عدد الحواف. الترتيب الأمثل يُصغِّر \(m_{\pi,A}\)، ويكون \(u^* \approx m_{\pi,A}/m\) إذا هيمن تبادل واحد.
الأولوية الفائقة على \(d\)
يحتاج عمق اللعبة \(d>0\) إلى أولوية فائقة ملائمة، مثل: \[ \begin{aligned} P(d) = e^{-d}. \end{aligned} \]
وصف مجموعة البيانات
نصف هنا مجموعات البيانات المستخدمة، وكلّها متاحة علناً، وتشمل دوريات محترفة وإعدادات أكثر انفتاحاً:
- البوكر: مجموعة بيانات صغيرة نسبياً ونطمح إلى توسيعها.
- التنس: جميع المباريات الرسمية في بطولات المحترفين الكبرى 2010–2019.
- الكريكيت: بطولات دولية ومحلية (مثل IPL) بين 2010 و2019.
- كرة القدم (Soccer): مباريات الدوريات الأوروبية الكبرى 2010–2019.
- كرة السلة: جميع مباريات مواسم NBA الكاملة 2010–2019، مع اعتبار الفرق مختلفة بين المواسم. البيانات من
https://www.kaggle.com/datasets/nathanlauga/nba-games
. - البيسبول: جميع مباريات مواسم MLB الكاملة 2010–2019، مع اعتبار الفرق مختلفة بين المواسم. البيانات من
retrosheet.org
. - كرة القدم الأمريكية: جميع مباريات مواسم NFL الكاملة 2010–2019، مع اعتبار الفرق مختلفة بين المواسم. البيانات من
pro-football-reference.com
. - الهوكي: جميع مباريات مواسم NHL الكاملة 2010–2019، مع اعتبار الفرق مختلفة بين المواسم. بيانات متاحة من
hockey-reference.com
أو مصادر رسمية مماثلة. - شبكات الصداقة: 84 شبكة من الدراسة الطولية الوطنية لصحة المراهقين في الولايات المتحدة (AddHealth)، كما في ورقة براين ونيومان (BN13).