.

أوسترو عرب نيوز
 
الديـنالطــبالقانونالتعلـيمالتربيـةكومبيوترثقــافـة
آثــارتغذ يـةتراجــمالأدبكتــــب

فى بيتنا جاسوس
اللغة سلاح ضد العرب
(بحث علمى)

 

قال رسول الله صلى الله علية وسلم عندما سأله معاذ بن جبل :

 "  يا رسول الله، أو كلما نقول بألسنتنا يُكتب علينا؟ " ثكلتك أمك يا معاذ، ،وهل يكب الناس في النار على مناخرهم إلا حصائد ألسنتهم!"
{المعجم الكبير20-ص75}

 نار الدنيا  
الحال جد خطير وعلينا العمل على استحداث تقنيات مقابلة
، وأن نضع نصب أعيننا أنه في أي حديث تليفوني أرضى أو محمول (سلكي أو لاسلكي) ،أو رسائل الكترونية ، أو على مواقع الدردشة هناك من يتصنت علينا ليعرف سرنا ويكشف سترنا ليكبنا على النار بأي صورة من الصور أي أن حديث الرسول (صلى الله عليه وسلم) يعني نار الدنيا أيضا .. و صدق رسول الله.

تطالعنا الأخبار اليومية والبحثية يومياً بكل ما هو جديد وعجيب، ومع الانفجار المعلوماتي والتقني في الآونة الأخيرة، قيل إن ما عرفته البشرية من علوم ومعارف في العشرين سنة الأخيرة يعادل ما عرفته البشرية منذ بدء الخليقة لحينها، وأصبحنا نسمع عن تقنيات لم ترد بفكر أو بال.

وبطبيعة العالم الجديد .. العدوانية وصراع القوى الكبرى ومحاولات الهيمنة الأمريكية على العالم، سُخرت التقنيات لخدمة هذه الأغراض؛ فظهرت الأسلحة الحديثة مثل الأدوات القتالية التي تتتبع البشر -عن طريق حرارة الأجسام- وهناك أنواع معدلة لتتبع شخص بعينه -عن طريق الجينات- وهناك أيضاً الأنواع المتقدمة من الدبابات والقنابل التي تصل إلى عمق ستة أمتار تحت سطح الأرض، كالتي استخدمت في حرب لبنان.

وإذا تابعنا النشرات الإخبارية لوجدنا البذلات العسكرية المجهزة للجنود الأمريكيين والإسرائيليين والتي تحوي تقنيات كثيرة منها الرؤية الليلية، والمدى الطويل للأسلحة، والاتصال بشبكة التوجيه للجنود وغيرها، وبطبيعة الحال فإن وسائل وتقنيات التجسس تتقدم أيضا، وهذا هو موضوع المقال.

وقد نتساءل: ما علاقة الحديث النبوي في الافتتاحية بموضوعنا؟ والإجابة هي أن كلا منا لديه جاسوس في بيته (الهاتف) أو في جيبه (المحمول/الجوال) أو على مكتبه (الحاسب الآلي).

 المتون النصية والمعتمد النصي
المتون النصية   
Corpus، عبارة عن مجموعة هائلة من النصوص في مجال محدد أو مجالات متعددة يتم تجميعها في نُسخ مطبوعة أو إلكترونية لاستخدامات عديدة. وكان من أوائل استخدامات المتون النصية استخدامها في عمل المعاجم؛ حيث كان يتم حصر جميع الجُمل التي تحتوى كلمة ما ورصد معنى الكلمة في كل سياق (جُملة) حتى تُحدد جميع المعاني المتاحة، ثم تتم عملية رصد إحصائي تركيبي لجميع هذه المعاني المتاحة؛ فمثلاً كلمة عين تأتى بمعنى "عين كائن" حتى بأعلى نسبة، يليها  عين بمعنى "عين ماء"، يليها عين بمعنى "جاسوس" وهكذا.

بعد ذلك حدث تطور في استخدام المتون بهدف دراسة الظواهر اللغوية وتعليم اللغات وحصر موضوعات محددة، كالمستخدمة في البحث على الشبكات (محركات البحث) Google Yahoo وغيرها من الاستخدامات.

 التجسس و المتون
أما الاستخدام الأحدث والأخطر لهذه المتون فهو التجسس؛ فبينما كان دور الجاسوس قديماً أن يستمع لأحاديث الناس فيحدد منها:

  1. معلومات معينة.
  2. مشكلات الناس.
  3. الحالة النفسية.
  4. الرأي العام في منشئ المعلومات وغيرها الذي تلعبه.

أصبح هذا هو نفس الدور الذي تستغل فيه  الآلات الثلاث: الهاتف، المحمول، الحاسب الآلي المتصل بشبكة الاتصال العالمية.

 كيف تتم عملية التجسُس؟
عملية تجميع المتون الصوتية والكتابية

  • حصر المكالمات التليفونية من التليفون العادي.
  • حصر المكالمات التليفونية من التليفون المحمول.
  • حصر المحادثات على مواقع الدردشة Chat
  • حصر الرسائل الإلكترونية E-mail  .. وغيرها.

تحويل المادة الصوتية إلى مادة مكتوبة وقد قطعت العديد من الشركات شوطاً لا بأس به في هذا المجال منها IBM والتي خرجت بآلية لتحويل الصوت إلى نص مكتوب فيما يسمى بالإملاء الآلي.

دراسة المتون النصية لتحديد نفس أغراض التجسس السابق الإشارة إليها.                           

 أدلة على التجسس

1.      نشر موضوعات علمية عن دراسة متون نصية "محادثات تليفونية في المنطقة العربية باللغة العربية"، وهذا بحث منشور ومتوفر على الشبكات.

2.      أغلب الدراسات الأجنبية للغة العربية تستخدم المتون باللهجات العامية (لغة حديث رجل الشارع).

3.      العديد من الدراسات الأجنبية تعمل على متون نصية مستخرجة من غرف الدردشة على شبكات الاتصال وتليفونات المنازل.

4.      محاولات التصنت إلي قامت بها إسرائيل – أثناء حرب لبنان –على المحادثات الهاتفية بين أعضاء حزب الله ؛لرصد تحركاتهم وأماكنهم ،ومحاولات حزب الله المضللة الناجحة – حيث قاموا باستخدام رموز عربية مبهمة متغيرة في محادثاتهم – لأنهم فطنوا لذلك فلم تفلح أجهزة التصنت التي استخدمها الإسرائيليون في عملية التجسس.

 معالجة المتون والمدونات
الخطوة التالية هي اختصار النصوص. أي أن الأبحاث الجديدة تعمل على دراسة كيفية رصد متن نص مكون من مليون كلمة مثلاً و اختصاره  إلى 1000 كلمة تحدد:

  1. معلومات معينة.
  2. مشكلات الناس.
  3. الحالة النفسية.
  4. الرأي العام في منشئ المعلومات وغيرها الذي تلعبه.

يستخلص كل هذا من خلال هذه المتون بتقنيات لغوية الحديثة وهي اختصار النصوص.

-  ثم ترجمة الألف كلمة. والتركيز على الترجمة الآلية – تقنية لغوية جديدة- ، أي يمكن أن يصل لإدارة التجسس تقرير يومي عن الأحوال بالمنطقة العربية في حدود   1000 كلمة.

-     أما  بالنسبة للتعامل اللغوي فهناك تقنية أخرى يتم من خلالها تحويل النص المنطوق بلغة ما إلى نص منطوق بلغة أخرى لاستخدامه في أجهزة المحتلين للتواصل مع العرب في العراق وغيرها من البلدان.

وبالرجوع لواحد من الأبحاث الأجنبية القائمة على اللغة العربية [*] 
نرى أنه :

  •  في عام 1995 تم جمع 18 تنوع لغوي 18 linguistic varieties لدعم البحث تحيد اللغة وتحويل النص الصوتي لنص مكتوب.
  • تحتوي أكثر من 450 محادثة تليفونية بالعامية المصرية والعربية بصفة عامة.
  • تم تحويل 10 دقائق من كل محادثة – 200 محادثة – بينما أهملت 120 محادثة.
  • المنشورات تضم استقبال الصوت المنبسط plain audio ورصف الرمز الصوتي بالوقت time-aligned transcripts ومعجم النطق pronouncing lexicon

المعجم يحتوي : الشكل السطحي surface form ، النطق  pronunciation   التحليل الصرفي   morphological analysis   تردد في ثلاث عينات من البيانات  frequency in .3 data sets ويوضح الجدول الذي ساقه البحث أيضا صور العينات اللغوية التي تقوم الدراسات عليها فنرى العينة الممثلة للغة العربية صوتية تليفونية. والشئ المؤسف فعلاً أن نجد محادثة تليفونية بين دارسة في الخارج وأبيها في مصر - في البحث -  فهل وافقا على تسجلها أم ماذا؟ ؟.

وربما قال البعض أن الجدول به عينات من دول مختلفة وأنا أقول له أن هناك مشروعات عالمية تجمع هذه الدول بينما يمثل اللغة العربية افراد مغتربين بالخارج. وأقول أن التقنيات المقابلة أي التي قامت على اللغات الأجنبية ليست متوفرة لدينا ونحن بأية حال نرفض التجسس علينا بأية حجة.

فهرس كيف تستغل لغتنا العربية

صورة من العينات اللغوية التي تقوم الدراسات
عينة لمحادثة أب وابنته باللغة المصرية العامة مع إظهار التوقيت !

المراجع

[*]محمد معموري، "مصادر عربية لمعالجة اللغة الطبيعية Resources for Arabic Natural Language Processing" ، الندوة العالمية لمعالجة العربية،  FLM، أبريل ، 2002.

الباحثة : د. سلوى حمادة
معهد بحوث الالكترونيات – القاهرة

مواضيع ذات صلة :

Aufzählung

الذرة & تطور النظرية الذريـة

Aufzählung

التيار الكهربائي

Aufzählung

 الضوء

Aufzählung

الأشعة تحت الحمراء

Aufzählung

الأشعة فوق البنفسجية

Aufzählung

الأشعة السينية

Aufzählung

أشعة الليزر

Aufzählung

الأمواج فوق الصوتية

Aufzählung

الألياف الضوئية

Aufzählung

نظرية الأوتار