article cover image
التعلم التشاركي (Federated Learning) للمحافظة على خصوصية البيانات
الذكاء الصنعي 5 دقائق 0 تعليق 3543 مشاهدة
صورة المستخدم بانة عمر
بانة عمر
مهندسة برمجيات
تم النشر 2021-06-10 21:41:54 - آخر تحديث 2021-06-11 11:06:13

يميل الاتجاه العام لمختلف نواحي الحياة اليوم نحو الذكاء الصنعي وتقنيات التعلم العميق (deep learning)، الذي اثبت كفاءته وقدرته على حل المشاكل المعقدة، وبات اساسيا في العديد من التطبيقات من بينها تصنيف البيانات، التعرف على الصور، التعرف على الكلام، السيارات ذاتية القيادة وصولاً إلى التحليلات الطبية وغير ذلك.. متفوقا على الإنسان في كثير من الاحيان.

على أي حال، وعلى الرغم من كل فوائد التعلم العميق، فإنه لا يزال يعاني من بعض القصور، ومن أبرزها التبعية للبيانات، حيث أنه وبشكل عام تتطلب خوارزميات التعلم العميق كميات هائلة من بيانات التدريب للحصول على نتائج مرضية.

تخيل إمكانية الوصول إلى الرسائل النصية ورسائل البريد الإلكتروني ومحادثات WhatsApp ورسائل Facebook و LinkedIn من ملايين الحسابات المختلفة في جميع أنحاء العالم، في محاولة لبناء نظام للتنبؤ بالكلمة التالية على لوحة المفاتيح. أو الحصول على وصول غير محدود إلى مليارات السجلات الطبية عبر القارات لتوقع احتمال الإصابة بمرض السكري.

تؤكد هذه السيناريوهات الافتراضية على أهمية كمية البيانات وجودتها في التعلم الآلي، ولكننا لسوء الحظ لسنا قريبين من إمكانية تحقيقها في عالم اليوم، نظرا لقوانين حماية البيانات الصارمة المطبقة في العالم.

حيث أن جمع البيانات بشكل مركزي  قد يشكل انتهاكاً لخصوصية المستخدمين، إضافة إلى أنه لا يتم احتكار هذه البيانات فقط وإنما أيضاً نماذج التدريب والذكاء الصنعي المبنية عليها.

وكما نعلم فإن الهواتف المحمولة والأجهزة القابلة للارتداء والمركبات ذاتية القيادة ليست سوى جزء بسيط من الشبكات الموزعة الحديثة التي تولد يوميا ثروة هائلة من البيانات. لذا نظرًا للقوة الحسابية المتزايدة لهذه الأجهزة - إلى جانب المخاوف بشأن نقل معلومات ذات سرية او خصوصية - أصبح من المفضل تخزين البيانات محليًا على الأجهزة و نقل عبء الحسابات والعمليات إليها، وهنا ظهرت الحاجة للتعلم التشاركي.

ماهو التعلم التشاركي؟

تم تقديم مصطلح التعلم التشاركي (Federated Learning) لأول مرة بواسطة Google AI من خلال ورقة بحثية تم نشرها عام 2016 وسميت هذه التقنية بهذا الاسم لأن عملية التعلم تتم عبر اتحاد للأجهزة المشاركة (الذين يمثلون المشاركين في التدريب) يتم التنسيق بينهم بواسطة خادم مركزي.
كانت هذه الورقة البحثية الطريق الانطلاقة الفعلية لهذه المنهجية الجديدة، وفي غضون سنوات قليلة فقط خطت هذه المنهجية خطوات كبيرة إلى الأمام.

تطبيقات ممكنة للتعلم التشاركي

كان التطبيق الأساسي لـ FL هو المتنبئ بالكلمة التالية - Gboard من Google على Android ، أيضا من أبرز المجالات التي يعد التعلم التشاركي واعدا فيها مجالات الرعاية الصحية التنبؤية حيث أن المستشفيات تحتوي على الكثير من بيانات المرضى إلا أنها تعمل تحت قيود خصوصية صارمة جدّاً وقد تواجه قيودًا قانونية أو إدارية أو أخلاقية تتطلب أن تظل البيانات محلية ولا تغادر مراكزها.

تطبيق آخر مهم أيضا في مجال الأعمال في مزيج البنوك والمؤسسات التجارية التي تخدم نفس مجموعة العملاء، تحتوي البيانات المتاحة للبنك على معلومات مهمة مثل دخل العميل ونسبة الدفع ومعلوماته التأمينية والمالية بينما نجد في بيانات شركة التجارة الإلكترونية تفضيلات المنتجات والعناصر المتعقبة وسجلات الشراء. من الواضح أن الاستفادة من مزيج هذه البيانات ستنتج مؤشراً أفضل لشراء المنتج ويمكن للطرفين الاستفادة منه. لكن هاتين المؤسستين على الأرجح لن تستطيعا مشاركة بياناتهم لسريتها.


آلية عمله

تتكون البنية البسيطة من خادم يجلس في مركز العملية وينسق أنشطة التدريب بين العملاء.

العملاء هم في الأساس أجهزة متطورة يمكن أن يصل عددها إلى الملايين، تتواصل هذه الأجهزة مرتين على الأقل مع الخادم في كل جولة تدريب.

 في البداية ، يتلقى كل عميل منهم أوزان النموذج العام الحالي من الخادم، ثم يقوم بإجراء التدريب بناء على بياناته المحلية وانطلاقا من النموذج الذي تم استقباله من الخادم، لإنشاء بارامترات مُحدّثة، يتم تحميلها بعد ذلك مرة أخرى إلى الخادم، الذي يجمعها من كل العملاء ويقوم بتحديث بارمترات نموذجه وفقاً لها.

تستمر دورة الاتصال هذه حتى يتم الوصول إلى عدد جولات محدد مسبقًا أو إلى درجة دقة مطلوبة.

إذاً المبدأ الأساسي في العملية هو بدلاً من نقل البيانات الأولية (الخام) ، فإننا الآن ننقل بارمترات (أوزان) نموذج التدريب

aFhBYRf_Ce94N71KUKSCjpxW9j8ZH2rKs6Xgfuway2sp19oCU3pAC2XoVz2u1kaa0RMBeIF_8TxysQIOo3n-g1iudfaVPuTUVMkTGcWzSN1VfU_5Cmfutx342hUFv7ep8ub8fyJ3

 

في الختام

يُعد هذا المجال حديث نسبيّاً وهناك الكثير من  التحديات الممكنة الي تعترض طريقه، إلا أنه من المجالات الواعدة جدّاً لتحسين نماذج الذكاء الصنعي والاستفادة من تنوع وغنى البيانات مع المحافظة على خصوصيتها.

في هذه المقالة قدمت لمحة عامة مبسطة عن التعلم التشاركي وأهميته وآلية عمله إلا أنه هناك الكثير بعد من التفاصيل للراغبين بالتعرف على هذا المجال و سأسعى لنشر المزيد حوله وحول التحديات التي تواجهه في مقالات قادمة ان شاء الله.

التعليقات (0)
مقالات قد تعجبك