Strategy 7 min2025-09-20

فجوة الذكاء الاصطناعي باللغة العربية: لماذا يكاد ينعدم هندسة الذكاء الاصطناعي عالية الجودة في الخليج؟

ينمو سوق الذكاء الاصطناعي في منطقة الشرق الأوسط وشمال أفريقيا بسرعة، ولكن لا يكاد يوجد استوديو ذكاء اصطناعي يقدم قدرات ثنائية اللغة (عربي/إنجليزي) بجودة عالية ونطاق واسع. ماذا تعني هذه الفجوة للشركات الخليجية والمطورين السبّاقين؟

ينفق الخليج المليارات على الذكاء الاصطناعي. فقد خصصت رؤية السعودية 2030 أكثر من 40 مليار دولار للتحول التقني. وتستهدف استراتيجية الإمارات للذكاء الاصطناعي تحقيق مساهمة بنسبة 13.6% في الناتج المحلي الإجمالي بحلول عام 2031. تبحث كل البنوك الكبرى، والمستشفيات، والجهات الحكومية، وسلاسل التجزئة في المنطقة عن حلول ذكاء اصطناعي تعمل باللغة العربية.

ومع ذلك: حاول البحث عن استوديو هندسة ذكاء اصطناعي متخصص (boutique AI studio) يبني أنظمة إنتاجية (production systems) باللغة العربية. ستجد عددًا قليلاً من الشركات الاستشارية الكبرى (مثل PwC و Accenture و Deloitte) التي تفرض تكاليف باهظة تناسب المؤسسات الضخمة فقط، أو ستجد مستقلين (freelancers) في الخارج بجودة متفاوتة. أما الفئة المتوسطة — هندسة ذكاء اصطناعي متقدمة (senior AI engineering) بأسعار معقولة وباللغة العربية — فهي شبه غائبة تمامًا.

هذه هي الفجوة التي تأسست Verel Systems لسدّها.

حجم السوق الذي لا يخدمه أحد

يمثل الإنترنت الناطق باللغة العربية 400 مليون مستخدم محتمل في 22 دولة. لكن الأرقام المهمة لقطاع الأعمال (B2B AI) أكثر تحديدًا:

السوق	الاستثمار في الذكاء الاصطناعي (المتوقع 2024–2030)
المملكة العربية السعودية	أكثر من 40 مليار دولار (صندوق الاستثمارات العامة)
دولة الإمارات	أكثر من 20 مليار دولار (الاستراتيجية الوطنية للذكاء الاصطناعي)
قطر	أكثر من 5 مليارات دولار (الصندوق القطري لرعاية البحث العلمي والبرامج الحكومية)
مصر، الأردن، الكويت	3-5 مليارات دولار مجتمعة

بعيدًا عن الاستثمار الحكومي، فإن الدافع الرئيسي للقطاع الخاص هو استبدال العمالة (labor substitution). يتميز الخليج بأعلى تكاليف عمالة في منطقة الشرق الأوسط وشمال أفريقيا، خاصة للوظائف المعرفية الماهرة. نظام الذكاء الاصطناعي الذي يؤتمت وظيفة براتب 150 ألف دولار سنويًا ويكلف بناؤه 20 ألف دولار يحقق استردادًا للاستثمار (payback period) في غضون 6 إلى 8 أسابيع فقط. الجدوى الاقتصادية هنا أوضح بكثير مما هي عليه في معظم الأسواق الأخرى.

لماذا توجد هذه الفجوة؟

العقبة التقنية: معالجة اللغة الطبيعية (NLP) للعربية أصعب بكثير

تتميز اللغة العربية بغناها الصرفي بطرق تجعل معالجة اللغة الطبيعية (NLP) أكثر تعقيدًا مقارنة باللغة الإنجليزية:

بنية الجذور والأوزان الصرفية. جذر عربي واحد (ك-ت-ب) يولد مئات الكلمات الصحيحة: كتَبَ، يكتب، كاتب، مكتوب، كتاب، مكتبة. يحمل كل تصريف معنى قواعديًا مدمجًا في الكلمة نفسها. إن أدوات التقطيع (tokenizers) في معالجة اللغة الطبيعية الإنجليزية المبنية على تقسيم الكلمات الفرعية (subword segmentation) تقدم أداءً ضعيفًا في هذا السياق.

ازدواجية اللغة (Diglossia). اللغة العربية الفصحى الحديثة (MSA) هي لغة الكتابة الرسمية. أما اللهجات العامية — الخليجية، المصرية، الشامية، المغربية — فهي ما يتحدث به الناس فعليًا. وعلى الرغم من أنها مفهومة بشكل متبادل، إلا أنها تختلف معجميًا ونحويًا بما يكفي لجعل النموذج المدرب على الفصحى يقدم أداءً أقل بشكل ملحوظ عند التعامل مع الكلام والنصوص باللهجة الخليجية.

الكتابة من اليمين إلى اليسار (RTL). هذه المشكلة بسيطة تقنيًا عند عزلها، ولكن عند دمجها مع محتوى مختلط من العربية والإنجليزية (وهو الأمر المعتاد في بيئات العمل الخليجية)، فإن التبديل بين اليمين إلى اليسار (RTL) واليسار إلى اليمين (LTR) يتسبب في أخطاء في التنسيق (layout bugs) في كل الطبقات: الواجهات الأمامية (frontend)، توليد ملفات PDF، قوالب البريد الإلكتروني، تحويل النص إلى كلام (TTS)، وتحويل الكلام إلى نص (STT).

ندرة بيانات التدريب. تمثل النصوص العربية عالية الجودة على الإنترنت حوالي 0.6% فقط من بيانات التدريب في معظم نماذج اللغات الكبيرة (LLMs) — مقارنة بنحو 46% للغة الإنجليزية. النماذج تعمل، لكنها تتطلب هندسة موجّهات (prompting) أكثر دقة، وسياقًا أكبر، وعمليات تحقق مكثفة للمخرجات العربية.

العقبة التجارية: متطلبات فهم السوق المحلي

يتطلب فهم حالات الاستخدام ذات الأولوية القصوى في الخليج معرفة عميقة بالسوق المحلي. تختلف أهم ثلاث حالات استخدام للذكاء الاصطناعي في المنطقة من حيث الأثر الاقتصادي عن تلك الموجودة في الولايات المتحدة:

▸
موظفو الاستقبال الافتراضيون وأتمتة مراكز الاتصال — تعمل الشركات الخليجية بمزيج من العربية والإنجليزية، والخلط بينهما (code-switching). مراكز الاتصال البشرية مكلفة. موظف استقبال ذكاء اصطناعي يتعامل مع المكالمات الواردة بالعربية والإنجليزية بزمن استجابة (latency) أقل من 500 ملي ثانية يقدم قيمة فورية.
▸
معالجة المستندات للمعاملات التنظيمية العربية — الامتثال لضريبة القيمة المضافة، عقود العمل، والتراخيص الحكومية. كلها باللغة العربية. وكلها تتطلب استخراج البيانات، وتصنيفها، وأحيانًا ترجمتها.
▸
قواعد المعرفة الداخلية للوثائق المؤسسية العربية — أدلة السياسات، إجراءات التشغيل القياسية (SOPs)، والتوجيهات التنظيمية. وهي غير منظمة (unstructured) بالكامل تقريبًا وباللغة العربية، ومستعصية على أدوات الـ RAG الغربية المصممة للتقطيع (chunking) باللغة الإنجليزية أولاً.

لا تتطلب أي من هذه الحالات تقنيات خارقة. بل تتطلب مهندسين يفهمون سياق اللغة العربية وأدوات الذكاء الاصطناعي بعمق كافٍ لبناء أنظمة موثوقة.

كيف تبدو البنية التقنية للذكاء الاصطناعي باللغة العربية؟

تتطلب أنظمة الذكاء الاصطناعي المصممة للعربية أولاً خيارات محددة للأدوات التقنية:

تحويل الكلام إلى نص (STT) للغة العربية

النموذج	معدل خطأ الكلمات (WER) للعربية	دعم اللهجات	ملاحظات
Deepgram Nova-3	~8% فصحى	الخليجية، المصرية	الأفضل للأنظمة الإنتاجية
Whisper large-v3	~12% فصحى	محدود	جيد للمعالجة الدفعية (batch)، وليس للوقت الفعلي
Azure Speech	~10%	الخليجية، المصرية	تكلفة أعلى، موثوق
Google STT	~11%	الخليجية، المصرية	مناسب للفصحى

بالنسبة لتطبيقات الصوت باللهجة الخليجية، يعد Deepgram Nova-3 حاليًا الخيار الإنتاجي الأقوى. راجع تحليلنا المفصل في مقال كيفية بناء ذكاء اصطناعي صوتي في أقل من 500 ملي ثانية.

نماذج اللغات الكبيرة (LLMs) للتوليد بالعربية

النموذج	جودة اللغة العربية	ملاحظات
GPT-4o	ممتازة	الأفضل في فئتها للعربية، مكلفة
Claude 3.5 Sonnet	جيدة جدًا	عربية قوية، موثوق
Qwen3.5 (7B+)	جيدة	أوزان مفتوحة، تدريب قوي على العربية
Jais 30B	جيدة جدًا	مصمم خصيصًا للعربية، مناسب للاستضافة المحلية (local deployment)
AraGPT2	قديم	لا تستخدمه للأنظمة الإنتاجية

بالنسبة للاستضافة المحلية (on-premise) للغة العربية، يعد Jais 30B (الذي طوره معهد الابتكار التكنولوجي في أبوظبي) حاليًا أقوى نموذج لغوي كبير مفتوح الأوزان للعربية. أما بالنسبة للاستضافة السحابية، فإن GPT-4o يتصدر من حيث جودة اللغة العربية.

نماذج التضمين (Embedding Models) للـ RAG العربي

النموذج	جودة اللغة العربية	الأبعاد	ملاحظات
multilingual-e5-large	ممتازة	1024	الأفضل للـ RAG العربي
nomic-embed-text	متوسطة	768	مصمم للإنجليزية أولاً، يعمل مع المحتوى المختلط
paraphrase-multilingual	جيدة	768	قديم ولكنه موثوق

لقواعد المعرفة باللغة العربية، استخدم multilingual-e5-large وليس nomic-embed-text. الفارق في جودة الاسترجاع (recall) بالعربية كبير جدًا — فقد رصدنا تحسنًا بنسبة ~15% في دقة الاسترجاع عند أول 5 نتائج (P@5 recall) على مجموعة مستندات طبية لعيادة خليجية.

تحويل النص إلى كلام (TTS) للغة العربية

الخدمة	الجودة	دعم اللهجات
ElevenLabs	ممتازة	تتوفر أصوات بالفصحى والخليجية
Azure Neural Voice	جيدة جدًا	الفصحى، الخليجية
Google Cloud TTS	جيدة	الفصحى
Resemble AI	جيدة	الفصحى، استنساخ مخصص للأصوات

تمتلك ElevenLabs نماذج صوتية خليجية أصلية يصعب حقًا تمييزها عن المتحدثين البشريين. بالنسبة للمشاريع في قطاعي العيادات والضيافة حيث يهمنا الصوت الطبيعي، فإن هذا هو الخيار الافتراضي.

الفرصة المتاحة للشركات الخليجية

إذا كنت شركة خليجية تقيم حلول الذكاء الاصطناعي في الوقت الحالي، فلديك نافذة زمنية قصيرة يكون فيها العائد على الاستثمار (ROI) مرتفعًا بشكل استثنائي:

▸
المنافسون لم يواكبوا الركب بعد. لا يزال معظم منافسيك في مرحءة تقييم جدوى الاستثمار. الشركات السبّاقة في أتمتة العمليات بالذكاء الاصطناعي في قطاعك ستؤسس لمزايا كفاءة تتراكم مع الوقت.
▸
أدوات الذكاء الاصطناعي العربي جاهزة للإنتاج الآن. قبل عامين، كان الذكاء الاصطناعي العربي ضعيفًا بالفعل — معدلات خطأ عالية، دعم رديء للهجات، وجودة صوت محدودة. أما النماذج المتاحة في عام 2025 فهي جاهزة تمامًا للاستخدام في الأنظمة الإنتاجية.
▸
معادلة توفير تكلفة العمالة مجدية للغاية. موظف استقبال ذكاء اصطناعي خليجي يكلف بناؤه 8 آلاف دولار وتشغيله 200 دولار شهريًا يحل محل عمل يكلف 120 ألف دولار سنويًا كعمالة بشرية. لا يوجد سوق آخر يمتلك هذه النسبة الجاذبة.
▸
ثنائية اللغة ميزة أساسية وليست مجرد إضافة. النظام الذي ينتقل بسلاسة بين العربية والإنجليزية في منتصف المحادثة هو شيء لا يمكن للمنافسين الذين بنوا أنظمتهم للأسواق الناطقة بالإنجليزية تقديمها بأي ثمن.

ماذا تبني أولاً؟

للشركات الخليجية التي تبدأ رحلتها في الذكاء الاصطناعي، إليك نقاط الدخول الأعلى عائدًا والأقل مخاطرة:

للعيادات والمكاتب الطبية: موظف استقبال ذكاء اصطناعي يتولى جدولة المواعيد، الإجابة على الأسئلة الشائعة، والاستفسارات التأمينية بالعربية والإنجليزية. التكلفة التقريبية للبناء: 8,000$ - 12,000$، مع استرداد التكلفة في غضون 4 إلى 6 أسابيع.

للعقارات وإدارة الممتلكات: ذكاء اصطناعي يجيب على استفسارات المستأجرين والمشترين بالعربية، ويصنف العملاء المحتملين (leads)، ويجدول مواعيد المعاينة. حجم مكالمات كبير، أسئلة متكررة، وتكلفة عمالة بشرية عالية.

للخدمات المالية: نظام RAG داخلي باللغة العربية للبحث في الوثائق التنظيمية، أدلة السياسات، وأدلة الامتثال. راجع محركات الـ RAG للمؤسسات.

للجهات الحكومية وشبه الحكومية: معالجة المستندات وأنظمة الأسئلة الشائعة العربية على مجموعات ضخمة من المستندات العربية — وهي حالة الاستخدام الأنسب لتطبيق Jais 30B محليًا (on-prem).

لنحدد نطاق مشروع الذكاء الاصطناعي الخاص بك →

نحن نتحدث اللغتين، ولدينا خبرة واسعة في الخليج، ومستعدون لمكالمات استكشافية بالعربية أو الإنجليزية. دون أي التزام مسبق.

لماذا يهم أن يتحدث مطورك اللغة العربية؟

قد يبدو هذا بديهيًا، لكن الأمر لا يتعلق باللغة فحسب. بل يتعلق بـ:

▸فهم اللهجة التي يتحدث بها مستخدموك وتهيئة نظام الـ STT بناءً على ذلك.
▸معرفة أن اللهجة الخليجية تستخدم كلمات مستعارة من الإنجليزية بشكل متكرر (مثل: وردات، باقة، اوردر) والتي لا تتعامل معها نماذج الفصحى بشكل جيد.
▸فهم التبديل بين اليمين واليسار (RTL/LTR) في واجهات المستخدم التي تخلط بين المحتوى العربي والإنجليزي.
▸تمييز متى تبدو الإجابة طبيعية للأذن الخليجية مقابل الإجابة بالفصحى الجافة التي قد تبدو ركيكة أو متكلفة.

نحن متحدثون أصليون بالعربية نبني أنظمة ذكاء اصطناعي للأسواق العربية. هذا ليس مجرد شعار تسويقي — بل هو ميزة هندسية في كل طبقة من طبقات البنية التقنية.

الأسئلة الشائعة

هل الذكاء الاصطناعي باللغة العربية موثوق بما يكفي للأنظمة الإنتاجية في عام 2025؟ نعم، لحالات الاستخدام المحددة بوضوح (مثل الإجابة على الأسئلة الشائعة، استرجاع المستندات، وجدولة المواعيد). النماذج جاهزة تمامًا للإنتاج. تختلف سيناريوهات الفشل هنا عنها في الإنجليزية — حيث يكمن المصدر الرئيسي للأخطاء في عدم تطابق اللهجات وحالات الخلط اللغوي (code-switching)، وليس في قصور النموذج نفسه.

ما هي اللهجة العربية التي يجب أن أقوم بالتحسين من أجلها؟ للمشاريع في الخليج: اللهجة الخليجية للصوت، والفصحى الحديثة للمستندات المكتوبة والاستفسارات الرسمية. من الأفضل بناء نظام ثنائي اللغة يتعامل مع الاثنين معًا. أما للمشاريع الموجهة لمصر، فإن اللهجة المصرية تحظى بأكبر تغطية في تقنيات الـ TTS/STT بعد الفصحى.

هل يمكنني البناء باللغة العربية فقط دون أي إنجليزية؟ نعم. بالنسبة لفئات مستهدفة معينة (مثل العيادات الريفية أو الخدمات الحكومية الموجهة للجمهور)، غالبًا ما تكون الواجهة العربية بالكامل تجربة مستخدم أفضل من النظام المختلط. يمكن أن تكون البنية التقنية بالكامل — STT، LLM، TTS، والواجهة — عربية بالكامل دون الحاجة للرجوع للإنجليزية.

كيف تتعاملون مع خلط العربية والإنجليزية في نفس الجملة؟ الخلط اللغوي (Code-switching) شائع جدًا في بيئات العمل الخليجية (مثل: "أنا بحاجة لـ invoice للـ Q3"). يجب أن يتعامل النظام مع هذا بسلاسة. نحن نقوم بتهيئة Deepgram للتعرف متعدد اللغات لكل عبارة، ونوجه النموذج (LLM) للرد باللغة السائدة في المدخلات، ونعالج تبديل اتجاه النص RTL/LTR في الواجهة الأمامية.

→ كيفية بناء ذكاء اصطناعي صوتي في أقل من 500 ملي ثانية من البداية للنهاية → نظام RAG إنتاجي على ذاكرة VRAM بحجم 6 جيجابايت: Qwen3.5 4B + nomic-embed

الخدمات ذات الصلة

الذكاء الاصطناعي الصوتي (عربي + إنجليزي) حول Verel Systems