CK editor plug-in تصريف تصريف الأفعال والأسماء تصريف مع الضمائر حول معجم التصريف تطبيقات تعليميّة حول التطبيقات النحو والصرف التطبيقات الذكيّة االخيارات المتعددة إعدادات المدرّسين دقِّقْ لِي مجالات التدقيق دليل الإستخدام مُدقّق "دال" الإملائي دقِّقْ لِي حول المدقّق مجالات التدقيق دليل الإستخدام الصفحة الرئيسية موارد "دال" العربية لغّـّة غنيّة ومعقّدة بواسطة "دال" استطعنا ان نُنجز حلولاً رقميّة تحقق موردًا متكاملاً دون إجتزائها أو تقليصٍ للمراحل أو تبسيطٍ للمخرجات اللغويّة، مما جعل نتائجنا متميّزة. المقاربة الإحصائيّة غير مؤهلة لبناء موارد لغويّة. أما مقاربة القواعد اللغويّة التي تعتمد نموذج الجذر- الوزن والتي إنطلقت في العام 1990 تحوي نسبًا كبيرةً من الأخطاء وتمّ سحب وإقصاء العديد من برامجها من التداول، وهي أصلًا تعتمد على القواعد اللغويّة، وهنا تكمن المُشكلة، فكلما تقدم البرنامج إزدادت القواعد وإزدادت معها البرامج والخوارزمية مما يضاعف التعقيدات فتولّد تسلسلًا من العوائق التشغيليّة للبرنامج كتصويب الأداء، التصحيح، التحديث.. ويتطلب أيّ منها وقتًا وتكلفة عالية كونها تحتاج لخبراء على مستوى عالٍ كما يتطلب ذلك إعادة تقييم الأداء العام للبرنامج بعد كل تحديث أو تعديل. موارد "دال" عالية الدقّة، مبنيّة على مقاربة: الوزن – الجذر مع أوليّة الوزن على حساب الجذر تتيح التعرّف سريعاً على المدخل المعجمي، وهو ترتيب مغاير لكلّ البرامج ومحركات البحث والقواميس الرقميّة التي تعتمد ترتيب الجذر- الوزن، مما يقلّص هامش الخطأ بنسب كبيرة خلال عمليّة توليد الكلمات والأفعال وتفادي برمجة مئات القواعد الصرفيّة، المورفوفنولوجيّة، والإملائيّة المرتبطة بالجذر لتصويب الخلل الناتج عنها ويسمح لنا بتحديد خوارزميّات لكلّ تصنيف بعيداً عن برمجة مئات القواعد الصرفيّة والنحويّة والتي يمكن أن تتضارب فيما بينها أو تشكّل ثقلاً عملانياً على البرنامج. ما هي موارد "دال"؟ Digital Arabic Language Resources أو الموارد الرقميّة للغة العربيّة هي مكتبة رقميّة مبنيّة على أسس ومرجعيات لغويّة عالية الدقّة تعتمد "التوليد والتحليل" في نفس الوقت للنصوص العربيّة. التوليد: توليد الكلمات من المصدر أو الجذر الى مخرجات مشكّلة مختلفة مثل الجذر، الأفعال، الأفعال المصرّفة، الإشتقاقات، الأسماء، المفرد، المثنى، الجمع، المذكر، المؤنث وجمع التكسير..) التحليل: موردنا يحوي محركًا رقمياً قادرًا على فصل الكلمة عن سوابقها ولواحقها والتعرّف على وزنها وجذرها وتصريفها مع أو بدون السوابق واللواحق، يفككها ثم يعيد تصريف الكلمة أو الفعل ويعيد السوابق واللواحق حسب الطلب. إستخدامات "دال" المتعددة بفضل دقّة مخرجاته، يُعتبر مورد "دال" أداة تعليميّة فعّالة ومدقّقًا إملائيّاً. يمكن توظيفه كأداة تعليمية للتلامذة بدءًا من الصف الثالث، أو في تدقيق النصوص الرقميّة للصحف ودور النشر أو الإستخدامات الحاسوبية المنزلية والصناعيّة. أما مجاله فهو اللّغة العربيّة الحديثة. قمنا بوضع تصوّر وتنفيذ تطبيقات لمخرّجات المورد منشور عدد منها على هذا الموقع ويتضمّن ست خدمات أساسية: تصريف الأفعال: يقوم مورد "دال" بتوليد كل التصريفات (ماضٍ، مضارع، وأمر، مبني، مرفوع، منصوب، مجزوم ومؤكّد) وعرضها مع أو بدون الضمائر المتصلة. يحتوي مصرّف الأفعال على قاموس من 15400 فعل، منجز ويمكن توسعته. توليد الأسماء: المورد مبني على قاموس الأفعال وجذر الكلمات، يستطيع "دال" أن يولّد إسمي الفاعل والمفعول واشتقاقاتهما (لا يقلّ عن 30 ألف اسم) ويصرفهما مع السوابق واللواحق (مذكر، مؤنث، مفرد، مثنى، جمع، معرّف، نكرة، معرّف بالإضافة، مرفوع، منصوب، مجرور). منجز ويمكن توسعته. توليد جموع التكسير: يحتوي المورد على 4200 كلمة جمعها تكسيري، منجز ونعمل على إضافة ما تبقى. التشكيل: المخرجات كلها مشكّلة وخيار الإظهار أو الإخفاء يعود للمشغل أو المستخدم، كما يمكن لموردنا التعرف على الكلمات المشكّلة جزئيّاً أو كليّاً المدقّق الإملائي: يغطي مدقّقنا 99% من اللّغة العربيّة الحديثة ويمكن استخدامه في الصناعة ومحركات البحث ودور النشر والمستخدم اليومي كما يُستخدم كأداة مساعدة في التعليم. محلّل: برنامج "دال" يتعرف على الكلمات المشكلة كليّاً أو جزئيّاً ويستطيع تحديد 6 ملايين شكل بسيط أي ما يفوق 500 مليون شكل مع السوابق واللواحق ومليارات الأشكال المشكولة جزئيّاً، يحدّد مدخلها المعجمي ويربطها بالوزن والجذر ويصنفها (فعل ناقص، أجوف، مهموز، مدغم، مقصور، اسم، جمع، مثنّى، ألخ) بناءً على الجذر. النظام التشغيلي للمورد موارد "دال" تعتمد نظام يوني تك UNITEX المعدّ أصلاً لمعالجة اللّغات الطبيعيّة، كلّ العقبات المتعلقة بإدارة الموارد تمّ تجاوزها بنظام UNITEX الذي يقدم معالجة أكثر دقّة للغة العربيّة. كما ان البنية البرمجيّة لموارد "دال" عالية التنظيم بفعل التزاوج بين المعرفة البرمجيّة والألسنيّة وهي ميزة نتمتع بها في مواردنا، حيث قمنا بتصنيفات أكثر دقّة للمفردات مما يسرّع عملية التوليد أو التحليل، وبفضل نظام يوني تكس، ضغطنا معاجمنا مما ضاعف من فعاليتها وسرعة أدائها. (توليد 6 مليون شكل من الأفعال يحتاج إلى دقيقة واحدة على كمبيوتر منزلي). مواردنا تعمل بنظام يوني تكس UNITEX مع نظام C/C++ و جافا JAVA ، حيث تمّ تصنيف 460 نموذج من الأفعال العربيّة تنتج 15400 فعل قابل لتوليد 2.43 مليون شكلاً صرفيّاً وإعرابيّاً، وتمّ إختبارها على 50000 فعل من نصوص حديثة، كما جرى إعداد قاموس رقمي لتوليد 4200 إسم جمعه مكسّر، مصنف في 300 نموذج. نظام يوني تكس طُبّق على لغات مختلفة ولكن ليس العربيّة، في العام 2010 تمّ تحديث النظام ليلائم اللّغة العربيّة وشملت التحديثات: الجذر/ السوابق واللواحق/ والتشكيل الجزئي والتي شارك ألكسي عميد نعمه في تحديثها، وموارد "دال" هي تطبيقات عمليّة للتحديثات على نظام يوني تك. تعريف بموارد "دال" الرقميّة مجموع الأسماء والأفعال والأحرف القابلة للتوليد حتى الآن في مواردنا أكثر من 75000 كلمة (15400 فعل وأكثر من 55000 إسم وصفة) سيتولّد منها ملايين الكلمات بتشكيلات مختلفة (تصريف الأفعال، الأسماء، التذكير والتأنيث، المفرد، المثنى والجمع، والمتغيّرات التشكيليّة). هذه التوليدات المقنّنة ينتج عنها لوائح معجميّة مرجعيّة يمكن تثميرها في العديد من المجالات مثل التدقيق الإملائي، التعليم، التشكيل وغيرها من المجالات والتطبيقات مثل محركات البحث في المعاجم و غيره. هذه التوليدات المقنّنة ينتج عنها لوائح معجميّة مرجعيّة في اللّغة العربيّة يمكن تثميرها في التعليم والتدقيق الإملائي وغيره من المجالات. حول معجم تصريف الأفعال يحتوي معجمنا 15400 فعل مقسمة الى: الأفعال الى 14500 فعل جذره ثلاثي و900 فعل رباعي الجذر، ومصنفة في 460 نوع، قادرة على توليد 2.43 مليون شكل، في كل حالات التصريف: الماضي، المضارع، الأمر، المعلوم والمجهول والمؤكد المرفوع والمبني والمنصوب والمجزوم. جمع التكسير يحوي موردنا 4200 إسم يطبّق عليهم جمع التكسير والذي يعتبره البعض خارجاً عن أي قاعدة خوارزميّة فيعتمد الكثيرون الإستنساب السمعي لجموع التكسير، ولكننا وفي إطار بحثنا وجدنا خوارزميات محدّدة لجمع التكسير وعددها 160 شكلاً، هذه الأشكال الخوارزميّة تضع قواعد لجموع التكسير. التصنيف الذي إعتمدناه لتوليد الأسماء وجموعها المكسّرة عالي التنظيم ومفصّل. الإشتقاقات من الجذور كما المتغيّرات الإملائيّة يتمّ تشفيرها بشكل مستقلّ عن الأنماط وبشكل فعّال وحقيقي، دون الإصرار على ربطها بالجذر أو بالتكوين السمعي أو القوانين الإملائيّة. الأسماء الثلاثيّة الجذر تمّ تصنيفها في 22 نمط مقسّمة الى 90 نوع، الأسماء الرباعيّة الجذر تمّ تصنيفها في 3 أنماط مقسّمة الى 70 نوع، أي 160 نوع يُشتق منها 300 نوع من الأسماء المفردة تطبّق على 4200 إسم مفرد قابل للتولّد الى جمع تكسير. لمزيد من المعلومات حول توليد جمع التكسير يمكن مراجعة المقال التالي بالإنكليزية، ألكسي عميد نعمه و إيريك لابورت، 2013 Pattern-and-root inflectional morphology: the Arabic broken plural تتفرّد مواردنا بقدرتها على توليد جموع التكسير، لم تقم أي من المؤسسات البحثيّة العربيّة والعالميّة بمحاولة إيجاد رابط بين الكلمة المفردة وجمعها التكسيري. خلاصة عامة مواردنا مجتمعة تغطي حالياً 99% من الكلمات التي تحتويها النصوص العربيّة الحديثة، ننتقل من خلال موقعنا الى مرحلة النشر والتسويق بعد إتمام المدقّق الإملائي بنسخته الأولى المنقحة. مواردنا مبنية على دراسات علميّة منشورة وموثّقة في عدد من المجلات العلمية كما في مختبرLIGM للأبحاث الألسنية والبرمجية مقال حول مورد "دال" لتوليد وتحليل الأفعال – إنكليزي مقال حول جمع التكسير –إنكليزي مقال حول المدقق الإملائي لبرامج أوفيس- إنكليزي Part 1. Why do computer scientists fail to produce an accurate Arabic lexical resource Part 2. Do computer scientists deeply understand traditional Arabic morphology Part 3: Can computer scientists think Arabic computational morphology out of the box مقالات في الصحف العربية الحياة- أتمتة اللغة العربيّة أمام منعطف لبناني- فرنسي الحياة- اللغة العربية ومشاكلها المتشابكة تحول دون صنع برامج رقمية لها النهار- المعالجة الرقمية للغة العربية: المجال الممكن المُدُن- دال المدقّق اللغوي المنافس الأخبار-مدقّق «دال» الإملائي: خدمة رقمية للغة العربية الأخبار- كلفة الريادة في التعليم