قاعدة Zipf.. اللغز الرياضي الذي يربط جميع لغات العالم
يُظهر استخدامنا للغة نمطًا رياضيًا متكررًا وغير عشوائي، وهو ما يكشف عن سمة مشتركة بين جميع اللغات البشرية.
هذا النمط المعروف باسم "قاعدة Zipf"، تم اكتشافه منذ أكثر من 80 عامًا، لكنه لا يزال يشكل لغزًا يثير الفضول حول السبب وراءه، رغم أن العديد من اللغات حول العالم تتبعه.
القاعدة التي اكتشفها جورج كينغسلي زيبف قبل نحو 80 عامًا، تنص على أن تكرار استخدام الكلمات في نصوص كبيرة يتبع نمطًا رياضيًا محددًا.
ببساطة الكلمة الأكثر استخدامًا — مثل "the" في اللغة الإنجليزية — تُستخدم ضعف عدد مرات الكلمة التالية في الترتيب، وثلاثة أضعاف الكلمة الثالثة، وهكذا، وفقًا لعلاقة رياضية بين التكرار والترتيب.
الغريب في الأمر أن هذا النمط لا يقتصر على اللغة الإنجليزية أو أي لغة بعينها، بل يظهر في جميع اللغات التي تمت دراستها، سواء كانت هندية أو فرنسية أو صينية أو إسبانية. حتى النصوص غير المفهومة مثل "مخطوطة فوينيتش" التي لم تُفك شفرتها بعد، تتبع نفس القاعدة.
تتعدى القاعدة نطاق اللغات إلى نصوص معينة وكبيرة الحجم مثل كتاب "أصل الأنواع" لتشارلز داروين، وأعمال شكسبير مثل "هاملت". الرسم البياني لهذه الظاهرة يظهر بوضوح في استخدام أول 10 ملايين كلمة في موسوعة ويكيبيديا بـ30 لغة مختلفة.
على الرغم من محاولات العلماء لتفسير هذه الظاهرة، لا يزال السبب الدقيق غير معروف. وقد اقترح زيبف أن هذا النمط ناتج عن توازن بين تقليل الجهد الذي يبذله المتحدثون باستخدام كلمات شائعة، وسعي المستمعين أو القراء لفهم اللغة باستخدام كلمات أقل تكرارًا. كما يعتقد البعض أن الكلمات الأكثر استخدامًا تكتسب شعبية مع مرور الوقت، مما يؤدي إلى تأثير "كرة الثلج".
إذا كنت ترغب في اختبار هذه الظاهرة بنفسك، يمكنك إدخال نصوص طويلة في حاسبة توزيع الكلمات للتحقق من مدى تطابقها مع قاعدة Zipf. لكن لا تتفاجأ إذا اكتشفت أن أسلوبك في الكتابة قابل للتنبؤ مثل أعظم الأدباء.