قانون زيبف
قانون مشهور في القياسات الببليومترية bibliometrics يتعلق بتكرار الألفاظ في النصوص. وقد سمي هذا القانون بعد العالم اللغوي George Kingsley Zipf (1902-1950).
ويمكن بيان هذا القانون إذا أحصينا عدد تكرار كل كلمة في أحد النصوص، ثم
رتبنا الكلمات حسب مراتبها بحيث أن الكلمات التي تتكرر كثيرا ترد في
الترتيب أولا. والنصوص المكتوبة باللغة الإنكليزية تتضمن كلمات تتكرر كثيرا
باستمرار، مثل:
the, a
أو أي كلمات أخرى ذات معاني سطحية، وبهذا يمكننا التعبير عن قانون زيبف بقانونين.
القانون الأول: والقانون الأول: r * f = C
حيث:
r
تكون المرتبة الخاصة بالألفاظ التي تتكرر عدد
f
من المرات.
Zipf,
G. K. (1949). Human
behavior and the principle of least effort.
Cambridge, MA:
Addison Wesley.
أنه وجد علاقة ارتباطية واضحة بين عدد الكلمات المختلفة في كتاب
Ulysses of James
Joyce
وتكرار استعمال تلك الكلمات، بمعنى أنها تقارب المعادلة البسيطة للقطع
الزائد القائم
equilateral
hyperbola.
وناتج ضرب 10 * 2653 هو 26530
القانون الثاني:
والقانون الثاني لزيبف يتعلق بالألفاظ ذات التردد المنخفض. ودرجة الانخفاض
تعتمد على النص الجاري تحليله، ولكنها بالتأكيد ستشمل الألفاظ ذات الترددات
1، 2، 3، 4، 5.
وفي نفس العمل (صفحة 32) يذكر زيبف القانون كالآتي: N(f2 - ¼) = C
N
هي عدد الألفاظ التي تكررت كل منها
f
مرة
وفي المقالة التالية،
Booth,
A. D. (1967). A "law" of occurrences for words of low frequency. Information and Contnol, 10,
386-393.
ورد قانون زيبف في الصيغة التالية:
حيث:
In
هي عدد الألفاظ التي تكررت
n
مرة
|