
| تفاصيل البحث |
د. بشرى ساعد
ملخص
تحتل اللغة الإعلامية أهمية كبيرة في الصحافة خاصة في عصر المنصات الرقمية، حيث برزت صحافة المواطن بلغة هجينة غير رسمية تعتمد على اللهجة العامية، الإيموجي، والرموز...مما يعكس تطور أشكال التواصل الرقمي ومع ظهور تقنيات الذكاء الاصطناعي وخاصة تقنية معالجة اللغة الطبيعية (NLP)، ظهرت صحافة الروبوت وأصبحت قادرة على فهم الألفاظ وتحليل مشاعر الجمهور، مما يعزز قدرتها على أنسنة الأخبار.
تهدف ورقتنا البحثية إلى تسليط الضوء على مفهومي صحافة الروبوت وتقنية ال NLP وتأثيرهما على مستقبل اللغة الإعلامية بين الأجيال الرقمية في عصر الذكاء الاصطناعي، إضافة إلى كيفية اعتماد الروبوت على لغة المواطن المرمزة على المنصات الرقمية. ومنه نستنتج أن تقنيات الذكاء الاصطناعي خاصة ال NLP قد أحدثت تحولًا جذريًا في إنتاج المحتوى، لكنها تطرح تحديات تتعلق بمصداقية وأخلاقيات المهنة، مما يجعل دور الصحفي كخبير تحليل أمرًا ضروريًا لضمان موثوقية المحتوى الصحفي.
الكلمات المفتاحية: المواطن الصحفي، صحافة الروبوت، الروبوت الصحفي، اللغة الإعلامية، لغة المواطن، لغة الروبوت، تقنية ال NLP.
"Media Language in Robot Journalism : Natural Language Processing Technology (NLP) Between Citizen Journalist’s Language and Robot"
Abstract :
The language of media holds significant importance in journalism, particularly in the era of digital platforms, where citizen journalism has emerged with a hybrid, informal language that relies on colloquial dialects, emojis, and symbols that reflects the evolution of digital communication forms with the advent of artificial intelligence technologies, especially Natural Language Processing (NLP), robot journalism has emerged, enabling the understanding and analysis of emotions, thereby enhancing its ability to humanize news.
Our research paper aims to highlight the concepts of robot journalism and NLP technology, as well as their impact on the future of media language among digital generations in the age of Artificial Intelligence, it will also examine how robots rely on the encoded language of citizens on digital platforms. Consequently, we conclude that AI technologies, particularly NLP, have brought about a radical transformation in content production, but they also pose challenges related to credibility and professional ethics. This underscores the necessity of the journalist\'s role as an analytical expert to ensure the reliability of journalistic content.
Keywords: Citizen Journalist, Robot Journalism, Robotic Journalist, Media Language, Citizen Language, Robot Language, NLP Technology.
مقدمة
لقد أحدثت تقنيات الذكاء الاصطناعي ثورة في العديد من المجالات، وكان الإعلام والصحافة من أبرز القطاعات التي شهدت هذه التغيرات التكنولوجية، حيث تطورت الصحافة إلى ما يُعرف الآن بـ "صحافة الروبوت"، التي تعتمد بشكل أساسي على الخوارزميات وتقنيات معالجة اللغة الطبيعية (NLP) لإنتاج محتوى صحفي بشكل آلي، مما أتاح للأخبار أن تنتشر بسرعة قياسية وتغطي أحداثًا متعددة في وقت واحد. هذه التقنيات تتيح للروبوتات الصحفية توليد الأخبار استنادًا إلى البيانات الضخمة، مع القدرة على معالجة النصوص بشكل معقد يحاكي الأسلوب البشري، مما يغير من طبيعة الصحافة ويجعلها أكثر تفاعلية واستجابة للحظة.
في الوقت ذاته، شهدنا تحولًا مهمًا في دور المواطن الصحفي، الذي أصبح له القدرة على استخدام هذه الأدوات التكنولوجية لنشر الأخبار وتحليلها، سواء على منصات التواصل الاجتماعي أو في المواقع الإخبارية المتنوعة، وهنا تظهر أهمية "اللغة الإعلامية" التي يتبناها كل من المواطن الصحفي والروبوت الصحفي في تطوير لغة الإعلام، والتفاعل بين الإنسان والآلة في إنتاج الأخبار. فالمواطن الصحفي يعبّر عن آرائه وتجربته الشخصية باستخدام لغة محورية ومباشرة تنبع من وسطه المعاش، بينما يعتمد الروبوت على خوارزميات متطورة لتحليل البيانات وتحويلها إلى نصوص إعلامية تواكب المعايير المهنية، مما يشكل تحديا كبيرا في كيفية تأثيرها على أسلوب الكتابة الصحفية، ومدى قدرتها على نقل الرسالة الإعلامية بنفس العمق الإنساني والمهنية التي تميز الصحافة التقليدية.
وعليه، تعتبر دراسة العلاقة بين "لغة المواطن الصحفي" و"لغة الروبوت الصحفي" نقطة محورية لفهم تطور الصحافة في العصر الرقمي، فبينما يسهم الذكاء الاصطناعي عبر تقنية معالجة اللغة الطبيعية في تسريع وتيرة الصحافة وتحسين فاعليتها كونها تقدم إمكانيات هائلة في تحسين تجربة الجمهور، فإنها قد تواجه تحديات في التعبير عن القيم الإنسانية والعاطفية التي يتمتع بها الصحفي البشري وحتى القضايا المتعلقة بالمسؤولية المهنية، والرقابة على المحتوى، والأخلاقيات الصحفية، ومن هنا تتضح الحاجة إلى دراسة أعمق حول كيفية تأثير هذه التقنيات على لغة الإعلام، وتحديد مدى قدرتها على الحفاظ على المعايير الصحفية، من نزاهة ومصداقية، وضمان معالجة محتوى إعلامي يخدم الجمهور بطرق متعددة دون التأثير على استقلاليته وموضوعيته. وعليه نطرح السؤال التالي: كيف يتم التفاعل بين لغة المواطن الصحفي الذي يمتلك أدوات نشر غير محدودة ولغات متعددة ومتنوعة وسريعة التغير، مع لغة الروبوت الصحفي الذي يتمكن من صياغة المحتوى بناءً على تحليلات متقدمة للبيانات واللغات وتوليد محتوى مشابه لمحتوى البشر عبر تقنية معالجة اللغة الطبيعية؟
من صحافة المواطن إلى صحافة الروبوت:
يقصد بصحافة المواطن مشاركة المواطن العادي في صناعة الخبر ونشره عبر القنوات الاتصالية الحديثة المعروفة بالعالم الافتراضي، حيث تمثل ذلك النشاط الذي يلعب فيه المواطنون دور الصحفي بفعالية حيث يقوم فيه كفرد من أفراد جمهور وسائل الإعلام بإنتاج مضمون إعلامي مستعملا كافة الوسائل التكنولوجية المتاحة بحوزتهم عبر جمع وتحليل الأخبار ومعالجتها ومن ثم مشاركتها إما مع الوسائل الإعلامية نصيا كان أو سمعيا أو بصريا أو كلها معا، أو عبر تطبيقات الإنترنت كالمدونات، مواقع نشر الفيديوهات والمواقع الاجتماعية، مما يسمح بنقل صوتهم ورأيهم للعالم أجمع دون الحاجة للاحترافية أو حمل شهادة في الإعلام أو أن ينتمي هذا المواطن إلى أي مؤسسة إعلامية لإيصال صوته للعالم (بن لباد و حضري، 2020).
يسمى القائم بهذا النوع بالمواطن الصحفي الذي يعد صفة حديثة ومتطورة تمثل انعكاسا لحالة الانقلاب في أنظمة التواصل التي تعرف بالاندماج التكنولوجي الذي شهده مجتمع المعلوماتية، بانتقال أدوات الاتصال من قبضة المؤسسات إلى يد الجمهور، لتشكل هذه الظاهرة فيها رافدا أساسيا في تعزيز ثقافة الجمهور ووعيه وزيادة مستوى التفاعل والتبادل المعرفي والمعلوماتي بين أفراده، لتغدو قوة متصاعدة في أوساط الجمهور الذين أدركوا أن وسائل الإعلام التقليدية لم تعد قادرة على إشباع رغباتهم وحاجاتهم المعرفية (شنين، 2021) . وعليه فإن وصف المواطن بأنه صحفي جاء من دوره في نقل قصة أو خبر ما لجمهوره عبر وسائل التواصل الاجتماعي وهو ما نعتبره في الإعلام شكلا من أشكال الصحافة والنشر، ولأن لاعب هذا الدور ليس صحفيا بالأساس، بل ممارسا لفعل الصحفي فتمت تسميته مواطنا صحفيا دفعة واحدة (شحادة، 2018)
تعد صحافة المواطن تلك الصورة المتقدمة من صحافة الموجو التي عرفت رواجا مع ظهور تقنيات الموبايل المتقدمة ضمن الصحافة الرقمية، وما لبث التطور التكنولوجي مكانه حتى شهدنا ظهور ما يعرف بصحافة الروبوت التي تزامنت مع ظهور تقنيات الذكاء الاصطناعي، حيث تعرف صحافة الروبوت بأنها هي الصحافة التي تعتمد على استخدام الروبوت بديلا للعنصر البشري، وزرعه في مكان الحدث ليقوم بنقله بالصوت والصورة بدلا عن المراسل الصحفي خاصة في مناطق الحروب والكوارث مما يزيد من هاجس القضاء المحتمل على صحافة البشر وتغيير الكثير من الثوابت والقواعد الراسخة في المجتمع العالمي (عرام، 2021). وبالتالي هي عبارة عن نصوص في شكل أخبار وتقارير محررة من طرف روبوتات آلية تعتمد على خوارزميات مبرمجة لتحويل البيانات إلى نصوص، تعتمد في عملها على جيل من البرمجيات اللغوية المتطورة التي تفحص كل البيانات المتوصل إليها تفلترها وتبنيها بطريقة محددة وفي النهاية تهيكلها إلى لغة في غضون ثواني، كما أن لها العديد من المسميات منها: الصحافة الآلية، الصحافة الخوارزمية، وصحافة الذكاء الاصطناعي (زغنوف وعظيمي، 2023).
ما يميز هذا النوع الصحفي هو الروبوت الذي عوض العنصر البشري تحت اسم الروبوت الصحفي، حيث يتم تعريفه على أنه واحد من منجزات الذكاء الاصطناعي يحاكي تصرفات الصحفي البشري ويقلد حركاته، ويمتاز بأنه لا يخطئ ولا يتعب ولا يتقاضى راتبا (القبيلي، 2019) ، وبالتالي فهو تلك الآلة المبرمجة عبر خوارزميات قادرة على استخلاص المعلومات الإعلامية من مصادر مختلفة وتجميعها بأفضل طرق ممكنة في استقلالية تامة بسرعة ودقة (حقي، 2022). وعليه يمكننا القول بأن الروبوت الصحفي هو نظام يعتمد على تقنيات الذكاء الاصطناعي لأتمتة عملية جمع وتحليل المعلومات، وكتابة التقارير الصحفية آليا، تساهم في تحسين الكفاءة وزيادة سرعة إنتاج الأخبار الإعلامية منافسة بذلك الصحفي البشري.
اللغة الإعلامية بين لغة المواطن الصحفي والروبوت:
اللغة الإعلامية هي لغة بنيت على نسق اجتماعي علمي عادي فهي في مجملها فن يستخدم في الصحافة والإعلام بعيدا عن اللغة العلمية الموصوفة بالتجريد النظري، تتفرع إلى لغة الإعلام المقروءة ولغة الإعلام السمعي البصري لا تنزل إلى مستوى الأدب. وعليه فهي لغة مألوفة سهلة وبسيطة تستخدم في الخطاب الإعلامي لها قواعد وفنون تلتزم بها، وهي وسيلة اتصالية هدفها التأثير في الجمهور المتلقي وتنقسم إلى لغتين إعلاميتين : مقروءة وسمعية بصرية (قراد، 2017). وجدير بالذكر أن اللغة الإعلامية ذات علاقة تأثير وتأثر وطيدة جدا بعلم اللغة، فوسائل الإعلام تتجاوز ذاتها دائما وتساهم في نشأة كلمات وألفاظ جديدة واستخدامات لغوية مبتكرة لم تكن موجودة من قبل في اللغة، وفي هجر كلمات كانت مستخدمة فيها أو انقراضها انقراضا تاما، فوسائل الإعلام يمكن أن تعكس أهم العوامل التي تدعو إلى نشأة كلمات جديدة في اللغة اعتمادا على الاحتكاك مع اللهجات المحلية، وعلى المترجمات من الألفاظ والأساليب مما يجعلها تنقل رسالة إعلامية للجمهور بلغة يفهمها ويتفاعل معها (بوصابة، 2022).
ومع ظهور صحافة المواطن تزامنا مع التطورات التقنية والتكنولوجية والوسائط الإعلامية والاتصالية الرقمية وظهور منصات التواصل الاجتماعي، تغيرت كذلك مجريات اللغة الإعلامية فلغة المواطن الصحفي لا تتوافق مع لغة الصحفي المحترف في الكثير من الأوقات لأنه يمارس المهنة بحرية دون الانتماء إلى أي مؤسسة إعلامية تفرض عليه قيودا إعلامية لغوية محددة، فلغته متقاربة إلى حد بعيد مع لغة الجمهور وأبرز ما تتميز به لغة المواطن الصحفي هو اللغة الفصحى، العامية، والعربيزي أو كما يسمونها لغة الرموز، فاللغة جزء لا يتجزأ من العملية الاتصالية التي تتمحور كلها حولها كوسيلة رئيسية، لتتحول بهذا نحو الاختصارات والرموز التعبيرية وحتى الإيموجي كدلالة تعبيرية بين الأفراد مما يتطلب تدريبا عميقا ومكثفا على الشكل المستحدث من هذه اللغة لفهمها وفهم معانيها ودلالات استخدامها (مجاهد، 2022) . هذا من جهة، ومن جهة أخرى نجد كذلك أن المواطن الصحفي في محاولته لتقديم الخبر أو المعلومة الإعلامية يعتمد على ازدواجية اللغة ونعني بها ذلك الاستخدام المزدوج الذي يضم مستويين لغويين الفصيح والعامي معا والتي تتنوع بتنوع وظيفتها، مكانها، مجتمعها، السياق الثقافي لمستخدمها، وحتى كيفية اكتسابها (عمارة، 2018) . إضافة إلى لغة العربيزي التي تعني لغة الإنترنت السريعة كونها تمثل لغة التواصل عبر المنصات الرقمية حاليا وبرزت بقوة مع صحافة الموجو ثم صحافة المواطن والتي تقتضي الاختصار والسرعة عند استعمالها كالفيسبوك والواتساب وغيرهم، حيث تمثل تلك اللغة التي معناها عربي وظاهرها إنجليزي بدمج الأحرف مع الأرقام، ومع مرور الوقت أصبحت الأكثر شيوعا وانتشارا مع جيل الZ كلغة مشفرة تتضمن الكثير من المفاهيم والمعاني، لتتطور تدريجيا نحو إضافة الرموز والصور والايموجي كدلالة للتعبير العاطفي عن مشاعر الأفراد وأحاسيسهم وتفاعلاتهم مع الرسائل الإعلامية المختلفة (الخطيب، 2018).
وفيما يخص لغة الروبوت في المجال الإعلامي بما أنه ليس بشريا ولا يملك لغته الخاصة به، فسيعتمد أكيد على تقنيات الذكاء الاصطناعي في تشكيل لغة تخصه، وبالتالي فهو يعتمد بالدرجة الأولى على تقنية معالجة اللغة الطبيعية، فلكي تستطيع صناعة وهندسة الروبوتات عليك إتقان لغتهم التي يتحدثونها ويتواصلون بها مع العالم الخارجي وهنا يأتي دور لغات برمجة الروبوتات التي تمنحها القدرة والذكاء على إنجاز المهام بشكل مشابه للأسلوب البشري. لغة الروبوت البرمجية هي تعليمات محددة مدخلة إلى نظلم التحكم الخاص بالروبوت تحدد الطريقة التي يعمل بها وما يقدر على تنفيذه، ولتفعيل نشاط الروبوتات نستخدم العديد من اللغات البرمجية أهمها C أو C++ أو Python وJava وغيرها من اللغات Dakhel)، 2024( اعتمادًا على تقنية معالجة اللغة الطبيعية التي تضمن للروبوت التواصل مع الأنظمة الروبوتية وأنظمة التحكم ببروتوكولات الاتصال من إشارات ثنائية بسيطة إلى حزم بيانات معقدة يتم نقلها لاسلكيا (Proven Robotics، 2024 )
تعتبر لغة الروبوت لغة جافة غير رشيقة وغير حيوية ولا تتضمن صيغا لأنسنة المحتوى الإخباري، ويعود السبب وراء هذا إلى أن المفردات التي يستخدمها الروبوت تتضمن مفردات اللغة بالكامل، فالروبوت مجبر على استخدام أكثر الكلمات ملاءمة وأكثرها تقليدية وكذلك أكثرها تكرارا، وهذا يقود إلى جفاف أسلوبه في عرض الأخبار، فإن المفردات التي يستخدمها تكون محدودة بالتخصص الذي تدور حوله القصة الإخبارية، على العكس من ذلك يقابله الصحفي البشري الذي يمكنه استخدام مفردات نادرة أو ربما غير متكررة وجاذبة لتكون بذلك أكثر رشاقة مما يساعد على توسيع سياقها وتعزيز حيويتها أكثر من الروبوت الذي يكون سريعا ودقيقا في الكتابة الإعلامية لكن قريبا أكثر من اللغة الإعلامية التي يسودها النمط الإخباري بمستوى واحد، والعودة إلى الماضي بصيغة الإعلام ذو خاصية النمطية والصيغ التقليدية السردية البعيدة عن الإنسانية والمشاعر والأحاسيس (الصرايرة، 2018) .
الذكاء الاصطناعي وتقنية معالجة اللغة الطبيعية:
يعد الذكاء الاصطناعي أحد الركائز الأساسية التي تقوم عليها صناعة الصحافة والإعلام في العصر الحالي، حيث يعرف على أنه أحد مجالات علوم الكمبيوتر المعتمدة على تطوير أنظمة وبرامج قادرة على أداء مهام تتطلب ذكاء بشريا كالتعليم، التفكير، واتخاذ القرارات من خلال محاكاة عمليات التفكير البشري، عبر تطوير خوارزميات ونماذج رياضية تمكن الحواسيب من معالجة البيانات وتعلم الأنماط منها، وبهذا يكون مختلفا عن الذكاء التقليدي في اعتماده على تمكين الآلات من التعلم وتحسين أدائها بناءَ على تقنيات يحددها الذكاء الاصطناعي مثل التعلم الآلي، معالجة اللغة الطبيعية، والشبكات العصبية، مما يمكنها من تحسين أدائها بناءَ على الخبرة والتجربة. (Avni, 2022)
كما تعتبر تقنية معالجة اللغة الطبيعية NLP)) فرعا من فروع الذكاء الاصطناعي التي تتيح لأجهزة الكمبيوتر فهم اللغة البشرية وإنشائها ومعالجتها، حيث إن لديها القدرة على استجواب البيانات مع نص اللغة الطبيعية أو حتى الصوت ويطلق عليها أيضا اسم اللغة. تنطبق هذه التقنية على مختلف أنواع اللغات البشرية سواء على النص المكتوب أو على النص المنطوق (الكلام) من أهم الأدوات التي تدعمها هذه التقنية نجد: البحث على شبكة الانترنيت، تصفية البريد الإلكتروني العشوائي، الترجمة التلقائية( Eppright، 2021)
بدأ البحث عن معالجة اللغة الطبيعية بعد فترة وجيزة من اختراع أجهزة الكمبيوتر الرقمية في الخمسينيات، وتستند هذه التقنية على كل من اللغويات والذكاء الاصطناعي، ومع ذلك تم دعم الإنجازات الرئيسية في السنوات القليلة الماضية من خلال التعلم الآلي الذي يطور الأنظمة التي تتعلم وتعميم من البيانات، التعلم العميق وهو نوع من التعلم الآلي الذي يمكنه تعلم أنماط معقدة للغاية من مجموعات البيانات الكبيرة مما يعني أنه مناسب بشكل مثالي لتعلم تعقيدات اللغة الطبيعية من مجموعات البيانات التي يتم الحصول عليها من الويب (Eppright، 2021).
وبهذا تكون هذه التقنية وحدة ضرورية لاستخراج المعنى الحقيقي الكامن وراء مدخلات المستخدم، وباعتبارها مجموعة فرعية من البرمجة اللغوية العصبية، تركز وحدة معالجة اللغة الطبيعية على جانب الفهم في معالجة اللغة ليكون بهذا هدفها الأساسي هو تمكين الآلات من فهم لغة البشر وتفسيرها بطريقة مفيدة من خلال تحليل النص، تحديد القصد من وراء كلماته، التعرف على الكيانات، وفهم المعنى السياقي للغة Chudleigh)، 2024)
ولتحقيق مهام تقنية معالجة اللغة الطبيعية فإنه يتم استخدام التعلم الآلي والتعلم العميق كأدوات رئيسية لتدريب النماذج التي يمكنها فهم اللغة الطبيعية والتعامل معها، لأنه من الصعب معالجة البيانات غير الهيكلية التي يتم تجميعها لأنها لا تتناسب مع هياكل قواعد البيانات التقليدية الموجودة في قواعد البيانات العادية، فالآلة يجب عليها فهم اللغة العادية البشرية مثلما نفهمها نحن، فمثلا فهم المعاني والكلمات والتراكيب اللغوية ومضمون الكلام من السياق وغيرها، فاللغة الطبيعية تتكون من الصوتيات، الصرف والنحو، البراغماتيات، المعاني المتضمنة في الكلمات (MEGA Team MU، 2023)
وبالتالي فإن معالجة اللغة الطبيعية (NLP) تعني استخدام تقنيات الذكاء الاصطناعي لتحليل وفهم وتوليد النصوص الإعلامية التي يشاركها الجمهور على منصات التواصل الاجتماعي، حيث يتضمن هذا المحتوى كل من اللغة المكتوبة في نصوص، المنطوقة في أصوات ولهجات (الازدواجية والثنائية اللغوية)، والمرمزة في رموز وأشكال من إيموجي وأشكال مختلفة (لغة العربيزي) ثم ترجمتها من أجل اعتمادها في أتمتة المهام الروبوتية لاحقاً.
كيفية عمل تقنية معالجة اللغة الطبيعية: تعتمد هذه التقنية على مجموعة تطبيقات في القيام بها أبرزها ما يلي:
فهم اللغة الطبيعية NLU: هو مفهوم تقني ضمن معالجة اللغة الطبيعية، فهي العملية المسؤولة عن ترجمة الكلمات الطبيعية والبشرية إلى تنسيق يمكن لجهاز الكمبيوتر تفسيره، والغرض منها هو أن يصبح الكمبيوتر لديه فهم بديهي للغة وقادر على كتابتها وفهمها تماما كما الإنسان دون الرجوع إلى تعريفات الكلمات (نيلسون، 2022)، وتتم عبر:
المعالجة الأمامية: وتعتمد على: تقسيم النص إلى كلمات أو جمل فردية، تنقيته وإزالة العناصر غير الضرورية مثل الرموز والأرقام، ثم تحليل الجذور من خلال إرجاع الكلمات إلى جذورها الأصلية لتحليلها بسهولة (Haibco، 2024).
النمذجة والتحليل: وتتم من خلال تحليل القواعد النحوية والصرفية في هيكل الجمل لفهم العلاقات النحوية بين الكلمات في سياقها اللغوي الصحيح، وتحليل المعاني العميقة للنصوص في سياقها الصحيح (Haibco، 2024).
تحليل العواطف والمشاعر: وهي عملية تحديد الحالة المزاجية أو الرأي الموجود في النص( Haibco، 2024)، حيث تعد هذه الأخيرة فرعا من فروع التنقيب عن البيانات واللغويات الحاسوبية التي تقوم باستخراج، تصنيف، فهم ومقاومة الآراء التي يتم التعبير عنها في جزء من النص (سميع، 2022)، عبر الخطوات التالية: (أبو الحسن، 2024)
جمع البيانات: يبدأ تحليل المشاعر بجمع البيانات النصية من مصادر متعددة مثل وسائل التواصل الاجتماعي، استطلاعات الرأي والمقالات الإخبارية.
معالجة البيانات: وذلك من خلال تقسيم النصوص المجموعة إلى أجزاء وإزالة الكلمات التوقيفية وتحويل الكلمات إلى رموز وأشكالها الأساسية باستخدام التحليل الجذري أو الاشتقاقي.
استخراج الميزات: بعد تجهيز النص يتم تحويله إلى تمثيلات رقمية باستخدام تقنيات مثل حقيبة الكلمات، التردد العكسي للمصطلحات، أو تقنيات أكثر تعقيدا مثل تمثيل الكلمات مما يتيح للنموذج فهم العلاقات بين الكلمات ومعانيها.
تدريب النموذج: هنا يتم تدريب النموذج على مجموعة بيانات موسومة، حيث تكون المشاعر معروفة مسبقا، تستخدم هنا خوارزميات أبرزها تعلم الآلة والشبكات العصبية العميقة لتحليل النصوص وتصنيفها بناءَ على المشاعر المدروسة.
التنبؤ بالمشاعر: بعد تدريب النموذج يتم استخدامه لتحليل النصوص الجديدة غير الموسومة (غير المصنفة) وتحديد المشاعر الكامنة فيها، سواء كانت إيجابية، سلبية، أو محايدة.
التعرف على الكيانات المسماة: تهدف هذه الأخيرة إلى تحديد المعلومات المهمة والتعرف عليها مثل الأسماء، الأماكن، التواريخ في النصوص (Haibco، 2024)، وتعمل هذه الميزة على من خلال التمييز بين المفاهيم الأساسية والمراجع في مجموعات نصية ووضعها في فئات محددة.
توضيح معنى الكلمة: نعني به تحديد معنى المصطلح بناءَ على السياق الذي يظهر فيه، وغاليا ما يعتمد جزءا من أدوات تمييز الكلام من أجل وضع الكلمة المستهدفة في سياقها (نيلسون، 2022).
التعلم الآلي ML: تعتمد تقنية معالجة اللغة الطبيعية على ما يعرف بالتعلم الآلي، الذي يتعامل مع تطوير الخوارزميات التي يمكنها تعلم أداء المهام تلقائيا بناء على عدد كبير من الأمثلة دون الحاجة إلى قواعد مصنوعة يدويا (العوض، 2020)، حيث يتم تطبيق تقنيات تعلم الآلة على البيانات النصية تماما كما يتم استخدامها في أشكال أخرى من البيانات مثل الصور، تستخدم هذه التقنية الخاضعة للإشراف مثل التصنيف والانحدار بكثافة في مختلف مهام معالجة اللغة الطبيعية. يمكن وصف أي نهج لتعلم الآلة ل NLP تحت الإشراف أو غير خاضع للإشراف على أنه يتكون من ثلاث خطوات شائعة: استخراج السمات من النص، استخدام تمثيل السمات لتعليم نموذج وتقييم النموذج وتحسينه (العوض، 2020).
التعلم العميق DL: وهو فرع التعلم الآلي الذي يعتمد على بناء الشبكات العصبية الاصطناعية للتعامل مع البيانات المعقدة وغي المنظمة وهو ما تتسم به اللغة بطبيعة الحال، لذلك نحتاج إلى نماذج ذات تمثيل أفضل وقدرة على التعلم لفهم وحل المهام اللغوية (العوض، 2020).
توليد اللغة الطبيعية NLG: نعني بها إنتاج لغة طبيعية مشابهة للغة البشر عبر اعتماد معلومات وبيانات منظمة وتحولها إلى نص بلغة طبيعية مما يسمح للروبوتات بإنشاء تقارير ومقالات وملخصات إعلامية شبيهة بتلك التي يوفرها البشر بنفس المعنى وموافق لبيانات الإدخال لكتابة محتوى آلي أو نصوص محادثة دون تدخل العنصر البشري (سعد، 2023). وأبرز ما فيها ما يلي:
التلخيص الآلي التلقائي: يقوم التلخيص التلقائي بتوليد نسخة مختصرة من النص الطويل مع الاحتفاظ بالمعنى الأساسي.
الترجمة الآلية: هي عملية تحويل النصوص من لغة إلى لغة أخرى باستخدام خوارزميات محددة (Haibco، 2024.)
تحديات تطبيق تقنية معالجة اللغة الطبيعية:
على الرغم من التطبيقات والتطورات المتزايدة لتقنية معالجة اللغة الطبيعية إلا أن لديها تحديات وقيود قد تحول دون نجاحها الفعلي، وأحد التحديات الرئيسية نجد:
تعقيد وغموض اللغة البشرية فغالبا ما تعتمد اللغة على السياق الذي تكون فيه، حيث يمكن أن تتأثر بالعوامل الثقافية والاجتماعية مما يجعل من الصعب على الآلات فهم اللغة وتفسيرها بدقة.
الأخطاء الإملائية: فاللغات الطبيعية مليئة بالأخطاء الإملائية والمطبعية والتناقضات في المعاني والأسلوب، كما تتفاقم المشكلة عند إضافة علامات التشكيل أو الأحرف الأخرى.
اختلافات اللغة: وهنا نعني ازدواجية اللغة وثنائية اللغة مما يشكل عندها عائقا فعليا في فهم المعنى الحقيقي لهذه المدخلات من رموز وكلمات.
تعددية معاني الكلمات: تعتمد تقنية معالجة اللغة الطبيعية على افتراض أن اللغة دقيقة ولا لبس فيها لكن في الواقع اللغة ليست كذلك إطلاقا فالعديد من مفرداتها وكلماتها لها معان متعددة حسب موقعها من الجملة التي توضع فيها.
بيانات التدريب غير الدقيقة: وهذا من أكبر التحديات التي تواجه تقنية معالجة اللغة الطبيعية، فكلما زادت بيانات التدريب كانت النتائج أفضل والعكس صحيح، فإذا تم إعطاء البرنامج بيانات غير صحيحة أو متحيزة أو غير مفهومة فسوف يتعلم الأشياء الخاطئة أو يتعلم بطريقة غير فعالة (المحمادي، 2023)
ضعف الدقة واليقين: عدم اليقين والإجابات الكاذبة التي تحدث عندما تكتشف البرمجة اللغوية العصبية مصطلحا يجب أن يكون مفهوما، ولكن لا يمكن الرد عليه بشكل صحيح والهدف من هذا هو إنشاء نظام البرمجة اللغوية العصبية الذي يمكنه تحديد حدوده وتوضيح الالتباس باستخدام الأسئلة أو التلميحات، فاللغة الطبيعية ليست واضحة ومباشرة مثل اللغة الصناعية التي تفهمها الآلة، بل معقدة وملتبسة وتحتوي على الكثير من المتغيرات والغموض مما يجعل مهمة الحواسيب صعبة للغاية.
اللهجات واللغات العامية: اللغة الطبيعية تحتوي على الكثير من اللهجات المحلية، الثقافية، الاجتماعية، بل وأنها تنقسم للهجات أخرى تحكمها العديد من المتغيرات، هذا التعدد والتنوع يكون غامضا وصعبا للغاية على الآلة ولذا فإن العلماء يركزون اليوم على اللغات الفصحى أو ال Standard، ولكن هناك آمال كبيرة في المستقبل أن يتم برمجة الآلات على فهم اللغات البشرية الفصحى والعامية معا.
مشاكل تقسيم الجمل: اللغة الطبيعية تتميز بالغموض والالتباس حتى في ظل استخدام القواعد الإملائية والنحوية، فما بالك عند عدم استخدامها أو عند الاستخدام الخاطئ لها، ولذا فإن هناك الكثير من الحالات التي لا تستوعب فيها الآلة المعنى المقصود من الكلام أو تفهمه على وجه الخطأ، وتكرار هذه الجمل الغامضة أو الخاطئة للدرجة التي أطلقوا عليها مسمى ‘Crash Blossoms’.
التعبيرات المجازية: نحن كبشر نستخدم التعبيرات المجازية كثيرا في أحاديثنا اليومية، والتي نستطيع فهمها والتعامل معها، والرد عليها بالردود المناسبة، ولكن الآلات لا تستطيع فعل هذا بسهولة كما نفعله، ولذا أمام الحاسوب والآلة عموما جهود خرافية لجعلهم قادرين على فهم هذه التعبيرات المجازية كما نفهمها نحن.
الألفاظ المُستحدثة: تسمح لنا غالبية اللغات بالقدرة على خلق كلمات جديدة ذات معاني مفهومة من خلال عدد من الأدوات اللغوية والنحوية، فمثلًا نستطيع استخدام اللواحق suffixes والسوابق Prefixes من أجل خلق كلمة جديدة يستطيع فهمها الإنسان الذي يسمعها لأول مرة، ولكن الحاسوب سيواجه مشاكل كبيرة للغاية في التعامل معها وفهمها أولًا، ومن ثم الاستجابة لها والرد عليها باستخدام ردود مناسبة مما يستدعيه للكذب.
الكلمات ذات الدلالات: هناك العديد من الكلمات التي نستخدمها، والتي قد يكون لها معنى لغوي غير المعنى الشائع الذي نستخدمه به، وهذه الكلمات عادة ما تكون أسماء شخصيات، وأسماء دول ونطاقات جغرافية، وأسماء أحداث جغرافية، والعديد من الأمور الأخرى.
الغاية من الحديث: الكلمة الواحدة في اللغة قد يتم استخدامها عدة استخدامات، وهذا حسب لهجة الفرد والمواقف والطريقة الذي قيلت فيها، وهو ما قد يتسبب في تغيير ب 180 درجة بمعاني هذه الكلمات وبالتالي في الردود المناسبة لها، فمثلا كلمة “يا سلام” قد نستخدمها للانبهار، أو الاستهزاء، أو الغضب، أو العديد من المعاني الأخرى التي نفهمها ضمنيًا، ولكن الحاسوب لا يفعل المثل.
المزاح: الحواسيب والآلات ليس لديها نفس القدرة الرائعة الخاصة بنا على المزاح واستخدام الكلمات والتعبيرات، أو حتى الكلمات المتشابهة من أجل مزحة أو نكتة ما، وهذا ما يقلل من كفاءتها على إدارة حوار حقيقي مع البشر.
تطور اللغة: التحدي الأخير الذي يجب الالتفات إليه هو أن اللغة دائمة التطور والتغير، وأن على الآلة أن تجاري هذا التغير الكبير إذا أرادت أن تقوم بفهم الإنسان فهمًا صحيحًا والرد عليها ردودًا مناسبة (علي، 2024).
أهم نتائج الدراسة:
تتسم لغة المواطن الصحفي بأنها أكثر عفوية وأحيانا غير رسمية، متأثرة بالثقافة المحلية والسياق الشخصي، بينما لغة الروبوت تميل إلى الرسمية أكثر، محايدة وموحدة، تركز على توصيل المعلومات بدقة وموضوعية باستخدام خوارزميات المعالجة اللغوية معتمدة على القواعد المحددة لكتابة النصوص.
تقنية معالجة اللغة الطبيعية في الروبوتات الصحفية قادرة على إنتاج الأخبار بسرعة ودقة لكن قد تكون غير قادرة على فهم السياقات المعقدة أو الثقافات المتنوعة بشكل دقيق كونها متغيرة بتغير ظروف الإنسان التي تحكمه مما يعيق دقة المعالجة اللغوية والتأكد من المعلومات وتفاصيلها الخبرية.
تقلص صحافة الروبوت دور الصحفي التقليدي في بعض العمليات التحريرية، مما يخلق الحاجة إلى صحفيين قادرين على التفاعل مع التكنولوجيا وتوجيه الروبوتات، ما قد يقلل من مصداقية المصادر الآلية مقارنة بالبشر.
تستطيع الروبوتات الصحفية إنشاء محتوى لغوي مخصص يعتمد على تفاعل الجمهور واهتماماته الإعلامية، مما يعزز من تجربته في التلقي وزيادة تفاعله.
استخدام الروبوتات في جمع المعلومات يثير تساؤلات حول قضايا خصوصية الأفراد وحقوقهم في المجتمع الرقمي مما ينعكس سلبا على الوظيفة الأساسية لتقنية معالجة اللغة الطبيعية.
تعمل تقنية معالجة اللغة الطبيعية على التوازن بين الأتمتة والتفاعل البشري وفق تحديد كيفية إدارة التفاعل بين تقنيات الصحافة الروبوتية والصحفيين البشر لضمان الاحتفاظ بالأبعاد الإنسانية في الإنتاج الصحفي.
أهم توصيات الدراسة:
نجاح تقنية معالجة اللغة الطبيعية في الصحافة الآلية يتطلب التنسيق بين التطور التكنولوجي، الاحتياجات الصحفية العملية، وأخلاقيات المهنة، وأهم التوصيات المقترحة هي:
تطوير خوارزميات معالجة اللغة الطبيعية بشكل مستمر لتحسين دقتها في فهم النصوص المكتوبة، المصورة والمنطوقة من المواطنين الصحفيين للحد من الأخطاء اللغوية والترجمة غير الدقيقة التي قد تؤثر على مصداقية المعلومات.
يجب تدريب الخوارزميات على مجموعة بيانات متنوعة تشمل اللهجات المختلفة، الأساليب الصحفية غير الرسمية، وحتى الأساليب اللغوية التي يستخدمها المواطن الصحفي لمساعدة النظام على فهم التعبيرات العامية والمصطلحات المحلية التي قد تكون جزءًا من المحتوى الذي ينشئه المواطن الصحفي.
إضفاء الطابع الإنساني على الروبوتات الصحفية من خلال تعزيز التعاون التقني المتكامل بينه وبين المواطن الصحفي لتمكينه من استخدام أدوات معالجة اللغة الطبيعية بسهولة ومراعاة الجوانب الإنسانية، مثل مساعدات الكتابة التلقائية أو تصحيح الأخطاء اللغوية لتحقيق نتائج أفضل.
يجب تقييم التقنيات بشكل دوري عبر اختبارات عملية وتأثيراتها على جودة المحتوى الصحفي، وإجراء تعديلات دورية لضمان تحسين الأداء وتلبية احتياجات الجمهور والصحفي معاً.
مواكبة تطورات الذكاء العاطفي من خلال تقنيات الذكاء العاطفي (Affective Computing) لتحسين قدرة الروبوتات على تفسير السياقات العاطفية على اختلافها مما يحسن الجودة والتفاعل مع القراء.
يجب أن تتمكن أنظمة ال NLP من التحقق من صحة المحتوى الصحفي من خلال تقنيات تحليل المشاعر، تدقيق المصادر والتحقق من الحقائق تلقائيا لكشف الزيف وتحقيق مصداقية المحتوى.
يجب مواكبة التطور التكنولوجي بوضع سياسات تنظيمية وأخلاقية تضمن الاستخدام المسؤول لتقنيات معالجة اللغة الطبيعية في الصحافة، والالتزام بالمبادئ الأخلاقية مثل الحياد، الموضوعية، وضمان خصوصية وأمان البيانات الشخصية المجموعة من المواطنين الصحفيين التي يتم معالجتها.
يجب أن تكون تقنية المعالجة اللغوية قابلة للتطور المستمر بناءً على التغذية الراجعة من المستخدمين عبر التعلم الآلي لتحسين الأداء والتكيف مع الأسلوب الصحفي المتغير لزيادة الجودة والدقة.
في الختام، تُمثل تقنية معالجة اللغة الطبيعية نقطة تحوّل هامة في مجال الصحافة، حيث تتيح للروبوتات الصحفية القدرة على توليد محتوى إعلامي من خلال تحليل البيانات وفهم اللغة البشرية، مما يعزز من سرعة وسعة نشر الأخبار. هذه التقنية تُسهم في تحسين تجربة المواطن الصحفي، إذ تتيح له استخدام أدوات الذكاء الاصطناعي بسهولة لنقل الأحداث وتحليلها بشكل أوسع وأسرع من الطرق التقليدية. ومن خلال ذلك، تصبح الصحافة أكثر ديناميكية وقدرة على التفاعل مع الجمهور، بما يتناسب مع التطورات التكنولوجية السريعة.
ومع ذلك، لا يُمكن إغفال التحديات التي قد تطرأ نتيجة لانتشار الصحافة الروبوتية، فعلى الرغم من المزايا العديدة لهذه التقنية، إلا أنها تطرح العديد من الأسئلة المتعلقة بالمصداقية، والتحقق من صحة الأخبار، وكذلك دور الصحفيين البشريين في التحكم في القيم المهنية والأخلاقية. من هنا، يصبح من الضروري أن يترافق تطور الصحافة الآلية مع وضع إطار تنظيمي يضمن دقة المعلومات، ويحافظ على نزاهة الصحافة، ويُشجع على استخدام الذكاء الاصطناعي بشكل يعزز من فعالية الإعلام دون الإضرار بمصداقيته أو استقلاليته.
أولا: المراجع العربية
أبو الحسن، علي. (2024، 31 أغسطس). تحليل المشاعر البشرية: نحو فهم أعمق من خلال الذكاء الاصطناعي. تم الاسترداد في 27 نوفمبر، 2024، من https://www.alahednews.com.lb/article.php?id=73799&cid=181
أيمن، علي. (2024، 14 أبريل). مما هي معالجة اللغة الطبيعية وتطبيقاتها العملية (شرح مبسط). تم الاسترداد في 27 نوفمبر، 2024، من https://www.alrab7on.com/natural-language-processing/
بن لباد، سالم، و حضري، محمد الأمين. (2020). صحافة المواطن – النشأة والتطور. مجلة الفكر المتوسطي، 08(02)، 116127.
بوصابة، عبد النور. (2022). اللغة الإعلامية العربية في الوسائط الإلكترونية: دراسة تحليلية لعينة من المضامين الإعلامية الجزائرية على الإنترنت. مجلة المعيار، 26(05)، 458–482.
تكنولوجيز، Haibco. (2024، 14 مايو). مقدمة إلى معالجة اللغة الطبيعية. تم الاسترداد في 26 نوفمبر، 2024، من https://www.haibco.com/blog/introduction-to-natural-language-processing
الخطيب، رابعة. (2018، 18 أغسطس). تأثير "العربيزي" على مستقبل اللغة العربية. تم الاسترداد في 19 نوفمبر، 2024، من https://www.aljazeera.net/amp/blogs/2018/8/18
زغنوف، عبد الغني، و عظيمي، أحمد. (2023). مستقبل وسائل الإعلام في ظل صحافة الروبوت. مجلة الرسالة للدراسات والبحوث الإنسانية، 08(01)، 951–960.
سميع، ليلى سيد. (2022). تحليل المشاعر القائم على الذكاء الاصطناعي كأداة لتقييم فعالية خدمات المعلومات. مجلة بحوث ودراسات، 04(11)، 07–33.
شحادة، عميد. (2018، 23 يونيو). المواطن الصحفي والصحفي المواطن. تم الاسترداد في 25 نوفمبر، 2024، من https://institute.aljazeera.net/ar/ajr/article/524
شنين، علي عبد النبي. (2021). ظاهرة المواطن الصحفي: التعريف والنشأة عالميًا وعراقيًا. مجلة اتحاد الجامعات العربية لبحوث الإعلام وتكنولوجيا الاتصال، (07)، 241–266.
الصرايرة، محمد نجيب. (2018، 4 سبتمبر). صناعة صحافة الروبوت وتحدياتها المهنية والأخلاقية. تم الاسترداد في 26 نوفمبر، 2024، من https://studies.aljazeera.net/ar/mediastudies/2018/09/180904090616553.html
العوض، محمد. (2020، 15 أكتوبر). طرق معالجة اللغة الطبيعية. تم الاسترداد في 26 نوفمبر، 2024، من https://ai.malawad.com
عمارة، فوزية طيب. (2018، سبتمبر). الازدواجية اللغوية في اللغة العربية. تم الاسترداد في 19 نوفمبر، 2024، من https://www.aqlamalhind.com/?p=1050
عرام، أسماء. (2021). مستقبل الصحفيين في عصر الذكاء الاصطناعي (صحافة الروبوت نموذجا). مجلة البحوث الإعلامية، 58(04)، 1673–1704.
القبيلي، ذكرى يحيى. (2019، 6 أكتوبر). الروبوت الإعلامي. تم الاسترداد في 25 نوفمبر، 2024، من
https://gcc-grt.org/%D8%A7%D9%84%D8%B1%D9%88%D8%A8%D9%88%D8%AA-%D8%A7%D9%84%D8%A5%D8%B9%D9%84%D8%A7%D9%85%D9%8A/
كاظم، حسن سعد. (2023، 28 فبراير). استعمالات تقنيات الذكاء الاصطناعي في وسائل الإعلام الرقمية: تقنية توليد اللغة الطبيعية NLG أنموذجًا. تم الاسترداد في 29 نوفمبر، 2024، من
https://www.baytalhikma.iq/News_Details.php?ID=1708
محمد، العوض. (2020، 15 أكتوبر). طرق معالجة اللغة الطبيعية. تم الاسترداد في 26 نوفمبر، 2024، من https://ai.malawad.com
مجاهد. (2022، 12 ديسمبر). بين الفصحى والعامية: كيف نصيغ اللغة الأقرب إلى الجمهور؟ تم الاسترداد في 19 نوفمبر، 2024، من
https://menaeditors.com/2022/12/12/%D8%A8%D9%8A%D9%86-%D8%A7%D9%84%D9%81%D8%B5%D8%AD%D9%89-%D9%88%D8%A7%D9%84%D8%B9%D8%A7%D9%85%D9%8A%D8%A9-%D9%83%D9%8A%D9%81-%D9%86%D8%B5%D9%8A%D8%BA-%D8%A7%D9%84%D9%84%D8%BA%D8%A9-%D8%A7%D9%84%D8%A3/?amp=1
المحمادي، أنس. (2023، 8 مايو). معالجة اللغة الطبيعية (NLP): كسر الحواجز اللغوية وإحداث ثورة في التفاعل بين الإنسان والحاسوب. تم الاسترداد في 27 نوفمبر، 2024، من
https://arabcivil.com/nlp/
نيلسون، دانيال. (2022، 9 ديسمبر). ما هو NLU (فهم اللغة الطبيعية)؟ تم الاسترداد في 27 نوفمبر، 2024، من
https://www.unite.ai/ar/what-is-natural-language-understanding/
ثانياً: المراجع الأجنبية
Avni, S. (2022, June 06). What is Artificial Intelligence ? How does AI work ? ( AI types, history, and future). Retrieved August 11, 2024, from https://www.koenig-solutions.com/blog/what-is-artificial-intelligence-types-history-and-future?keyword=&device=m&utm_source=google&utm_medium=cpc&utm_device=m&utm_campaign=P-Max-Course-Auto-adgroup-&gad_source=1&gclid=Cj0KCQjwwuG1BhCnARIsAFWBUC2JP9r8aDIq2
Chudleigh, S. (2024, September 04). What is natural language processing (NLP) in AI ? Retrieved November 26, 2024, from https://botpress.com/blog/natural-language-processing-nlp
Dakhel, N. (2024, March 31). Best Robotics Programming Languages. Retrieved November 26, 2024, from https://academy.hsoub.com/programming/os-embedded-systems/%D8%A3%D9%81%D8%B6%D9%84-%D9%84%D8%BA%D8%A7%D8%AA-%D8%A8%D8%B1%D9%85%D8%AC%D8%A9-%D8%A7%D9%84%D8%B1%D9%88%D8%A8%D9%88%D8%AA%D8%A7%D8%AA-r2285/
Eppright, C. (2021, March 25). What is Natural Language Processing (NLP). Retrieved November 25, 2024, from https://www.oracle.com/ae-ar/artificial-intelligence/what-is-natural-language-processing/#:~:text=%D9%85%D8%B9%D8%A7%D9%84%D8%AC%D8%A9%20%D8%A7%D9%84%D9%84%D8%BA%D8%A9%20%D8%A7%D9%84%D8%B7%D8%A8%D9%8A%D8%B9%D9%8A%D8%A9%20(NLP)%20%D9%87%D9%8A,%D8%A7%D9%84%
MEGA Team MU. (2023, May 26). What is Natural Language Processing ? Retrieved November 26, 2024, from https://ai.malawad.com/%D8%B7%D8%B1%D9%82-%D9%85%D8%B9%D8%A7%D9%84%D8%AC%D8%A9-%D8%A7%D9%84%D9%84%D8%BA%D8%A9-%D8%A7%D9%84%D8%B7%D8%A8%D9%8A%D8%B9%D9%8A%D8%A9/
Proven Robotics. (2024, February 01). How Do Robots Talk? Full Analysis. Retrieved November 26, 2024, from https://provenrobotics.ai/how-do-robots-talk/
