LaTeX

ملخّص

أظهرت النماذج اللغويّة الكبيرة فعاليّةً عاليةً في مهام لغويّة مُتعدِّدة، مثل تلخيص النصوص وتوليد المحتوى المُوجَّه. ومع ذلك، لا تزال الدراسات غير كافية لاستكشاف قدرتها على التبديل بين الأساليب من خلال ضبط التعليمات. تركز هذه الدراسة على قدرات التبديل بين الأساليب في النماذج اللغويّة الكبيرة، وتقدّم نهجًا جديدًا يُسمّى ProSwitch، يُتيح للنموذج توليد نصوص بأسلوبَيْن: احترافي وغير احترافي، بدعمٍ من المعرفة الخاصّة بالمجال والأسلوب في مرحلتَي الضبط والتقييم. يتألّف ProSwitch من ثلاث مراحل: تحضير مُعزَّز عبر جمع معرفة متخصِّصة بالمجال وتوليد أزواج الأسئلة والأجوبة؛ وضبط التعليمات باستخدام صِيَغ متعدّدة لتحسين قدرات النموذج؛ ثم تقييم شامل يقيس كلًّا من تمييز الطابع الاحترافي وجودة النص المُولَّد بالقياس إلى مراجع موثوقة. وتُظهر التحليلات المقارنة لِـ ProSwitch مع النماذج اللغويّة الكبيرة العامّة والمتخصِّصة تفوّق منهجنا في التبديل بين توليد النصوص الاحترافيّة وغير الاحترافيّة.

مقدّمة

تفوقت النماذج اللغويّة الكبيرة، مثل ChatGPT وLlama (llama)، في مهام معالجة اللغة الطبيعيّة، بما في ذلك الإجابة عن الأسئلة (omar2023chatgpt, tan2023chatgpt, baek2023knowledgeaugmented) واستخراج المعلومات (perot2023lmdx, PromptIE). في المجالات المتخصِّصة، يمكن لهذه النماذج تقديم إجابات تتوافق مع أسلوب معيّن عبر دمج معرفة المجال، كما في ChatDoctor (chatdoctor)، وChatLaw (chatlaw)، وFinGPT (fingpt). ومع ذلك، لا تزال قدرتها على التبديل بين سياقات وأساليب مختلفة، مثل الأساليب الاحترافيّة وغير الاحترافيّة، غير مُستثمرة على النحو الكافي.

تناولت الأبحاث السابقة هذا الهدف من منظورات تخصّصيّة متنوّعة. فقد ركزت دراسات في اللسانيّات والتربية على وصف خصائص الأسلوب الاحترافي وغير الاحترافي (malyuga2021expressive, orrego2016reception, malyuga2012professional)، مُشيرةً إلى أنّ السمة المميِّزة للأسلوب الاحترافي هي المعجم المصطلحي والبنية المنطقيّة. وتناولت دراسات أخرى في علوم الحاسوب نقلَ الأسلوب لاستهداف المستخدمين الخبراء والعامّة (pu-demberg-2023-chatgpt, xu2022self) عبر توليد نصوص قابلة للتحكُّم، حيث تُقدَّم مُطالَبة تحدِّد الأسلوب المطلوب للنموذج لإنتاج محتوى يحاكي السيناريوهات الواقعيّة (zhou2023controlled, NEURIPS2021_d0f5edad, li2022diffusionlm, pascual-etal-2021-plug-play). ومع ذلك، لا تزال هناك قضايا غير مُستكشَفة: أوّلًا، لم تُعالج الأبحاث الحالية على نحوٍ كافٍ اكتسابَ قدرات التبديل بين الأساليب من الجوانب المعجميّة والبنيويّة، لا سيّما فيما يتعلّق بالنصوص الاحترافيّة وغير الاحترافيّة. ثانيًا، من الضروري اقتراح استراتيجيّات تقييم كمّية تمكّن من قياس التمييز الأسلوبي للنصوص المُولَّدة.

تستند هذه الملاحظات إلى السؤال التالي: كيف يمكن تعزيز قدرة النماذج اللغويّة الكبيرة على التبديل بين استجابات بأسلوب احترافي وغير احترافي دون الإضرار بجودة توليد النصوص؟

تقدّم هذه الدراسة ProSwitch، وهو إطار عمل لتحسين القدرة على التبديل بين الأساليب الاحترافيّة وغير الاحترافيّة في النماذج اللغويّة الكبيرة عبر تعديل التعليمات المُوجَّهة بالمعرفة وتقييم النتائج. تتضمّن العمليّة ثلاث مراحل، كما هو موضَّح في الشكل~\ref{framework}. في مرحلة إعداد البيانات، نجمع مقالات ومفاهيم متخصِّصة بالمجال، ثم نولِّد مجموعة متوازنة وموصومة من أزواج الأسئلة والأجوبة عبر عمليّة توسعة شبه آليّة. وخلال ضبط التعليمات، نصمّم صِيَغًا متعدّدة للمطالبات للنموذج المُدرَّب مسبقًا، بهدف تحسين قدرته على التبديل بين الأساليب من خلال توفير معلومات خاصّة بالمجال مُتدرِّجة في مستوى التفصيل. واستنادًا إلى معايير الاحتراف المعروفة وقدرات التحليل الدلالي القويّة لِـ GPT-4 (openai2023gpt4)، نقترح استراتيجيّة تقييم شاملة تشمل مؤشِّرات لتمييز الطابع الاحترافي وجودة النص بالقياس إلى مراجع موثوقة. تشير نتائجنا إلى أنّ ProSwitch يُعزِّز بشكلٍ ملحوظٍ قدرة التبديل بين الأساليب مقارنةً بالنماذج اللغويّة الكبيرة العامّة والمتخصِّصة.

باختصار، إسهاماتنا كالآتي: (1) تقديم ProSwitch، أوّل إطار يتناول توليد نصوص بأسلوبَيْن: احترافي وغير احترافي، عبر استثمار معرفة المجال في تعديل تعليمات النماذج اللغويّة الكبيرة؛ وهو يختلف عن دراسات نقل الأسلوب التي تركّز فقط على التغيّرات المعجميّة. (2) اقتراح وتحليل صِيَغ تعليمات متعدِّدة المستويات لتعديل التعليمات عبر تزويد النموذج بمعلومات غنيّة عن المجال على مستويات تفصيل مُتدرِّجة، بخلاف تكييف المطالبات التقليدي. (3) إجراء تقييم شامل باقتراح مؤشِّرات لكلٍّ من تمييز الطابع الاحترافي وجودة النص مقارنةً بمراجع موثوقة. وتُظهر نتائج ProSwitch على مجموعتَي بيانات للأسئلة والأجوبة في مجالي الطبّ وتقنيّة المعلومات تفوّقه على النماذج اللغويّة الكبيرة العامّة والمتخصِّصة في قدرته على التبديل بين توليد النصوص الاحترافيّة وغير الاحترافيّة.