طور باحثون في مدرسة لوزان الاتحادية للعلوم بسويسرا EPFL، باستخدام الذكاء الاصطناعي نهجًا للتعلم الآلي لضغط بيانات الصور بدقة أكبر من طرق الحساب الخالية من التعلم، مع تطبيقات لزراعة الشبكية والأطراف الاصطناعية الحسية الأخرى.
وقال موقع scitechdaily إن أحد التحديات الرئيسية أمام تطوير أطراف اصطناعية عصبية أفضل هو التشفير الحسي، وتحويل المعلومات التي تم التقاطها من البيئة بواسطة أجهزة الاستشعار إلى إشارات عصبية يمكن تفسيرها بواسطة الجهاز العصبي.
ولكن نظرًا لأن عدد الأقطاب الكهربائية في الطرف الاصطناعي محدود، فيجب تقليل هذا المدخل البيئي بطريقة ما، مع الحفاظ على جودة البيانات التي يتم نقلها إلى الدماغ.
التقدم في ضغط البيانات لأطراف الشبكية الاصطناعية
تعاون ديميتري بسالتيس (مختبر البصريات) وكريستوف موسر (مختبر أجهزة الضوئيات التطبيقية) مع دييغو جيزي من مستشفى العيون جولز جونين – مؤسسة Asile des Aveugles (رئيس شركة Medtronic سابقًا للهندسة العصبية في EPFL) لتطبيق التعلم الآلي على مشكلة الضغط بيانات الصورة ذات أبعاد متعددة، مثل اللون والتباين وما إلى ذلك. في حالتهم، كان هدف الضغط هو الاختزال، أو تقليل عدد وحدات البكسل في الصورة التي سيتم نقلها عبر بدلة الشبكية.
يقول جيزي: “يتم حاليًا إجراء عملية الاختزال لزراعة الشبكية عن طريق متوسط البكسل، وهو ما تفعله برامج الرسومات بشكل أساسي عندما تريد تقليل حجم الملف. لكن في نهاية المطاف، هذه عملية رياضية؛ لا يوجد أي تعلم”.
يضيف: “لقد وجدنا أنه إذا طبقنا نهجًا قائمًا على التعلم، فقد حصلنا على نتائج أفضل من حيث التشفير الحسي الأمثل. ولكن الأمر الأكثر إثارة للدهشة هو أنه عندما استخدمنا شبكة عصبية غير مقيدة، تعلمت محاكاة جوانب معالجة الشبكية من تلقاء نفسها”.
على وجه التحديد، كان نهج التعلم الآلي الذي اتبعه الباحثون، والذي يسمى إطار نموذج الممثل، جيدًا بشكل خاص في العثور على “نقطة مناسبة” لتباين الصورة. يستخدم Ghezzi برنامج Photoshop كمثال. “إذا قمت بتحريك شريط تمرير التباين بعيدًا جدًا في اتجاه أو آخر، تصبح رؤية الصورة أكثر صعوبة. لقد طورت شبكتنا مرشحات لإعادة إنتاج بعض خصائص المعالجة الشبكية.
وقد نُشرت النتائج مؤخرًا في المجلة العلمية Nature CoRevolutionizing Vision Restoration Through Artificial Intelligencemmunications.
شبكية العين البيولوجية
في إطار نموذج الممثل، تعمل شبكتان عصبيتان بطريقة متكاملة. يعمل جزء النموذج، أو النموذج الأمامي، بمثابة توأم رقمي لشبكية العين: حيث يتم تدريبه أولاً لتلقي صورة عالية الدقة وإخراج كود عصبي ثنائي يشبه قدر الإمكان الكود العصبي الناتج عن شبكية العين البيولوجية. يتم بعد ذلك تدريب شبكة الممثلين على اختزال صورة عالية الدقة يمكنها استنباط كود عصبي من النموذج الأمامي الذي يكون أقرب ما يمكن إلى ذلك الذي تنتجه شبكية العين البيولوجية استجابةً للصورة الأصلية.
باستخدام هذا الإطار، اختبر الباحثون صورًا مختزلة على كل من التوأم الرقمي لشبكية العين وعلى شبكية عين جثة الفأر التي تمت إزالتها (المستأصلة) ووضعها في وسط استنباتي. كشفت كلتا التجربتين أن نهج نموذج الممثل أنتج صورًا تثير استجابة عصبية أقرب إلى استجابة الصورة الأصلية من الصورة الناتجة عن نهج حسابي خالٍ من التعلم، مثل حساب متوسط البكسل.
على الرغم من التحديات المنهجية والأخلاقية التي ينطوي عليها استخدام شبكية عين الفئران المزروعة، يقول جيزي إن التحقق من صحة نموذجهم خارج الجسم الحي هو ما يجعل دراستهم ابتكارًا حقيقيًا في هذا المجال.
وضيف: “لا يمكننا أن نثق فقط في النموذج الرقمي أو الداخلي. ولهذا السبب قمنا بهذه التجارب – للتحقق من صحة نهجنا”.
آفاق حسية أخرى
نظرًا لأن الفريق يتمتع بخبرة سابقة في العمل على الأطراف الاصطناعية للشبكية، فقد كان هذا أول استخدام لهم لإطار نموذج الممثل للتشفير الحسي. لكن غزي يرى إمكانية توسيع تطبيقات الإطار داخل وخارج مجال استعادة الرؤية. ويضيف أنه سيكون من المهم تحديد مدى قابلية تطبيق النموذج، الذي تم التحقق من صحته باستخدام شبكية عيون الفئران، على البشر.
وأضاف الباحث: “الخطوة التالية الواضحة هي معرفة كيف يمكننا ضغط الصورة على نطاق أوسع، بما يتجاوز تقليل البكسل، بحيث يمكن للإطار اللعب بأبعاد مرئية متعددة في نفس الوقت. والاحتمال الآخر هو نقل نموذج الشبكية هذا إلى مخرجات من مناطق أخرى من الدماغ. من الممكن أيضًا ربطه بأجهزة أخرى، مثل الأطراف الاصطناعية السمعية أو الأطراف الاصطناعية”، حسب قوله.
اقرأ أيضاً: