قال رسول الله صلى الله علية وسلم عندما سأله معاذ بن جبل :
"
يا رسول الله، أو كلما نقول
بألسنتنا يُكتب علينا؟ " ثكلتك
أمك يا معاذ، ،وهل يكب الناس في
النار على مناخرهم إلا حصائد
ألسنتهم!"
{المعجم الكبير20-ص75}
نار الدنيا
الحال جد خطير وعلينا العمل على
استحداث تقنيات مقابلة، وأن نضع نصب أعيننا أنه
في
أي حديث تليفوني أرضى أو محمول
(سلكي أو لاسلكي)
،أو رسائل الكترونية ، أو على
مواقع الدردشة هناك من يتصنت
علينا ليعرف سرنا ويكشف سترنا
ليكبنا على النار بأي صورة من
الصور
أي
أن حديث الرسول
(صلى الله عليه وسلم)
يعني نار الدنيا أيضا .. و صدق رسول الله.
تطالعنا الأخبار اليومية والبحثية
يومياً بكل ما هو جديد وعجيب، ومع
الانفجار المعلوماتي والتقني في
الآونة الأخيرة، قيل إن ما عرفته
البشرية من علوم ومعارف في
العشرين سنة الأخيرة يعادل ما
عرفته البشرية منذ بدء الخليقة
لحينها، وأصبحنا نسمع عن تقنيات
لم ترد بفكر أو بال.
وبطبيعة العالم الجديد ..
العدوانية وصراع القوى الكبرى
ومحاولات الهيمنة الأمريكية على
العالم، سُخرت التقنيات لخدمة هذه
الأغراض؛ فظهرت الأسلحة الحديثة
مثل الأدوات القتالية التي تتتبع
البشر -عن طريق حرارة الأجسام-
وهناك أنواع معدلة لتتبع شخص
بعينه -عن طريق الجينات- وهناك
أيضاً الأنواع المتقدمة من
الدبابات والقنابل التي تصل إلى
عمق ستة أمتار تحت سطح الأرض،
كالتي استخدمت في حرب لبنان.
وإذا تابعنا النشرات الإخبارية
لوجدنا البذلات العسكرية المجهزة
للجنود الأمريكيين والإسرائيليين
والتي تحوي تقنيات كثيرة منها
الرؤية الليلية، والمدى الطويل
للأسلحة، والاتصال بشبكة التوجيه
للجنود وغيرها، وبطبيعة الحال فإن
وسائل وتقنيات التجسس تتقدم أيضا،
وهذا هو موضوع المقال.
وقد نتساءل: ما علاقة الحديث
النبوي في الافتتاحية بموضوعنا؟
والإجابة هي أن كلا منا لديه
جاسوس في بيته (الهاتف) أو في
جيبه (المحمول/الجوال) أو على
مكتبه (الحاسب الآلي).
المتون النصية والمعتمد النصي
المتون النصية Corpus،
عبارة عن مجموعة هائلة من النصوص
في مجال محدد أو مجالات متعددة
يتم تجميعها في نُسخ مطبوعة أو
إلكترونية لاستخدامات عديدة. وكان
من أوائل استخدامات المتون النصية
استخدامها في عمل المعاجم؛ حيث
كان يتم حصر جميع الجُمل التي
تحتوى كلمة ما ورصد معنى الكلمة
في كل سياق (جُملة) حتى تُحدد
جميع المعاني المتاحة، ثم تتم
عملية رصد إحصائي تركيبي لجميع
هذه المعاني المتاحة؛ فمثلاً كلمة
عين
تأتى بمعنى "عين كائن" حتى بأعلى
نسبة، يليها عين بمعنى "عين
ماء"، يليها عين بمعنى "جاسوس"
وهكذا.
بعد ذلك حدث تطور في استخدام
المتون بهدف دراسة الظواهر
اللغوية وتعليم اللغات وحصر
موضوعات محددة، كالمستخدمة في
البحث على الشبكات (محركات البحث)
Google
–
Yahoo
وغيرها من الاستخدامات.
التجسس و المتون
أما الاستخدام الأحدث والأخطر
لهذه المتون فهو التجسس؛ فبينما
كان دور الجاسوس قديماً أن يستمع
لأحاديث الناس فيحدد منها:
-
معلومات معينة.
-
مشكلات الناس.
-
الحالة النفسية.
-
الرأي العام في منشئ
المعلومات وغيرها الذي تلعبه.
أصبح
هذا هو نفس الدور الذي تستغل فيه
الآلات الثلاث:
الهاتف،
المحمول، الحاسب
الآلي
المتصل بشبكة الاتصال
العالمية.
كيف تتم عملية التجسُس؟
عملية تجميع المتون الصوتية والكتابية
-
حصر المكالمات التليفونية من
التليفون العادي.
-
حصر المكالمات التليفونية من
التليفون المحمول.
-
حصر المحادثات على مواقع
الدردشة
Chat
-
حصر
الرسائل الإلكترونية
E-mail
.. وغيرها.
تحويل المادة الصوتية إلى مادة مكتوبة
وقد قطعت العديد من الشركات شوطاً
لا بأس به في هذا المجال منها
IBM
والتي خرجت بآلية لتحويل الصوت
إلى نص مكتوب فيما يسمى بالإملاء
الآلي.
دراسة المتون النصية لتحديد نفس أغراض التجسس السابق الإشارة
إليها.
أدلة على التجسس
1. نشر
موضوعات علمية عن دراسة متون نصية
"محادثات تليفونية في المنطقة
العربية باللغة العربية"،
وهذا بحث منشور ومتوفر على
الشبكات.
2. أغلب
الدراسات الأجنبية للغة العربية
تستخدم المتون باللهجات العامية
(لغة حديث رجل الشارع).
3. العديد
من الدراسات الأجنبية تعمل على
متون نصية مستخرجة
من غرف
الدردشة على شبكات الاتصال وتليفونات المنازل.
4. محاولات
التصنت إلي قامت بها إسرائيل –
أثناء حرب لبنان –على المحادثات
الهاتفية بين أعضاء حزب الله
؛لرصد تحركاتهم وأماكنهم
،ومحاولات حزب الله المضللة
الناجحة – حيث قاموا باستخدام
رموز عربية مبهمة متغيرة في
محادثاتهم – لأنهم فطنوا لذلك فلم
تفلح أجهزة التصنت التي استخدمها
الإسرائيليون في عملية التجسس.
معالجة المتون والمدونات
الخطوة التالية هي اختصار النصوص.
أي
أن الأبحاث الجديدة تعمل على
دراسة كيفية رصد متن نص مكون من
مليون كلمة مثلاً و
اختصاره
إلى
1000 كلمة تحدد:
-
معلومات معينة.
-
مشكلات الناس.
-
الحالة النفسية.
-
الرأي العام في منشئ
المعلومات وغيرها الذي تلعبه.
يستخلص كل هذا من خلال هذه المتون بتقنيات لغوية الحديثة وهي اختصار
النصوص.
- ثم ترجمة الألف كلمة. والتركيز
على الترجمة الآلية – تقنية لغوية
جديدة- ، أي يمكن أن يصل لإدارة
التجسس تقرير يومي عن الأحوال
بالمنطقة العربية في حدود 1000
كلمة.
-
أما بالنسبة للتعامل اللغوي فهناك تقنية أخرى يتم من خلالها تحويل
النص المنطوق بلغة
ما إلى
نص منطوق بلغة أخرى لاستخدامه في أجهزة المحتلين للتواصل مع العرب في العراق وغيرها من
البلدان.
وبالرجوع لواحد من الأبحاث
الأجنبية القائمة على اللغة
العربية
[*]
نرى أنه :
-
في عام 1995 تم جمع 18 تنوع
لغوي
18 linguistic varieties
لدعم البحث تحيد اللغة وتحويل
النص الصوتي لنص مكتوب.
-
تحتوي أكثر من 450 محادثة
تليفونية بالعامية المصرية
والعربية بصفة عامة.
-
تم تحويل 10 دقائق من كل
محادثة – 200 محادثة – بينما
أهملت 120 محادثة.
-
المنشورات تضم استقبال الصوت
المنبسط
plain audio
ورصف الرمز الصوتي بالوقت
time-aligned transcripts
ومعجم النطق
pronouncing lexicon
المعجم يحتوي : الشكل السطحي
surface form
، النطق
pronunciation
التحليل الصرفي
morphological analysis
تردد في ثلاث عينات من البيانات
frequency in .3 data sets
ويوضح الجدول الذي ساقه البحث
أيضا صور العينات اللغوية التي
تقوم الدراسات عليها فنرى العينة
الممثلة للغة العربية صوتية
تليفونية. والشئ المؤسف فعلاً أن
نجد محادثة تليفونية بين دارسة في
الخارج وأبيها في مصر - في البحث
- فهل وافقا على تسجلها أم ماذا؟
؟.
وربما قال البعض أن الجدول به
عينات من دول مختلفة وأنا أقول له
أن هناك مشروعات عالمية تجمع هذه
الدول بينما يمثل اللغة العربية
افراد مغتربين بالخارج. وأقول أن
التقنيات المقابلة أي التي قامت
على اللغات الأجنبية ليست متوفرة
لدينا ونحن بأية حال نرفض التجسس
علينا بأية حجة.
فهرس كيف تستغل لغتنا العربية

صورة من العينات اللغوية التي
تقوم الدراسات
عينة لمحادثة أب وابنته باللغة
المصرية العامة مع إظهار التوقيت
!

المراجع
[*]محمد معموري، "مصادر عربية
لمعالجة اللغة الطبيعية
Resources for Arabic Natural
Language Processing"
، الندوة العالمية لمعالجة
العربية،
FLM،
أبريل ، 2002.
الباحثة :
د.
سلوى حمادة
معهد بحوث الالكترونيات – القاهرة |