12تُدرَّب النماذج اللغوية الكبيرة مسبقًا على "مدونة" ضخمة من البيانات النصية. غير أن هذه البيانات لا تكون منظمة زمنيًا. فإذا احتوت المدونة نسختين مختلفتين من مكتبة شفرة، فإن كلتيهما تُعاملان بالتساوي، مما ينتج نماذج لغوية كبيرة لا تستطيع بسهولة التمييز بين الإصدارين.