مدونة تقنية — 16 ديسمبر 2025
وراء كل تجربة ذكاء اصطناعي سلسة على الجهاز تكمن عملية خفية تجعل النماذج الضخمة المدربة على الخوادم تعمل بسلاسة على شريحة الهاتف الذكي.
Share with
بشكل عام، تتميز نماذج الذكاء الاصطناعي الخاصة بالعملاء، سواءً المدربة على الحوسبة السحابية أو الخوادم، بحجمها الكبير وتصميمها الأمثل للعمل على وحدات معالجة الرسومات (GPU). ولتشغيل هذه النماذج على وحدة معالجة الشبكات العصبية (NPU) من نوع Exynos، من الضروري تحويلها إلى نماذج ذكاء اصطناعي مُدمجة في الجهاز، وذلك من خلال عمليات مثل تحسين الرسم البياني، والتكميم، والتجميع.
تقوم مجموعة أدوات تطوير برامج الذكاء الاصطناعي المُدمجة في الجهاز بتحويل نموذج الذكاء الاصطناعي الأصلي الخاص بالعميل إلى نموذج مُدمج في بيئة وحدة معالجة الشبكات العصبية (NPU) الخاصة بالجهاز، وذلك عبر عملية تصغير. في النهاية، تُعد مجموعة أدوات تطوير برامج الذكاء الاصطناعي المُدمجة في الجهاز ضرورية لدعم نماذج الذكاء الاصطناعي الخاصة بالعملاء. ومع ذلك، يجب التغلب على العديد من التحديات التقنية لتحقيق ذلك:
[1] دعم مختلف نماذج الذكاء الاصطناعي
مع النمو السريع في عدد نماذج الذكاء الاصطناعي المدعومة وتعقيدها سنويًا، يجب أن تدعم مجموعة أدوات تطوير برامج الذكاء الاصطناعي المُدمجة في الجهاز مجموعة متنوعة من سيناريوهات الاستجابة. من خلال دعم مجموعة واسعة من نماذج الذكاء الاصطناعي، مثل PyTorch وONNX وTensorFlow وTFLite، تُمكّن حزمة تطوير البرمجيات (SDK) المطورين من التكرار بشكل أسرع والتكيف بمرونة. وهذا ما يُسهم في تطوير الذكاء الاصطناعي الرشيق حقًا.
[2] أساليب التحقق لكل مرحلة من مراحل سلسلة الأدوات
خلال عملية تحويل نموذج الذكاء الاصطناعي، يتحول النموذج الأصلي تدريجيًا إلى نموذج قابل للتنفيذ على الأجهزة من خلال تحسين الرسم البياني والتكميم. من الضروري تعزيز التحقق في كل مرحلة لضمان الحفاظ على دقة وأداء نموذج الذكاء الاصطناعي الأصلي قدر الإمكان.
[3] تطوير خوارزميات تحسين الرسم البياني والتكميم
لتحقيق أقصى أداء لنماذج الذكاء الاصطناعي على الأجهزة، من الضروري أيضًا التحسين المستمر لتقنيات تحسين الرسم البياني وخوارزميات التكميم المصممة خصيصًا للنماذج شديدة التعقيد مثل نماذج التعلم المحدود (LLMs).
لتحقيق هذه الغاية، يُعالج Exynos AI Studio، وهو حزمة تطوير برمجيات الذكاء الاصطناعي المدمجة من سامسونج، هذه التحديات التقنية الرئيسية ويُقدّم حلولًا فعّالة للعملاء.
استراتيجية تطوير Exynos AI Studio، حزمة تطوير برمجيات الذكاء الاصطناعي المدمجة من Exynos
طوّرت سامسونج حزمة تطوير برمجيات الذكاء الاصطناعي Exynos AI Studio ووزّعتها على عملائها لتصبح رائدة عالميًا في مجال الذكاء الاصطناعي المدمج، وهي تستعد للمستقبل من خلال مجموعة متنوعة من استراتيجيات التطوير.
يتألف Exynos AI Studio بشكل أساسي من مجموعة أدوات Exynos AI Studio عالية المستوى (EHT) ومجموعة أدوات Exynos AI Studio منخفضة المستوى (ELT). تُجري هاتان المجموعتان، على التوالي، تحسينًا متقدمًا للرسوم البيانية وتكميمًا على مستوى النموذج، بالإضافة إلى خوارزميات وتجميع مُخصصة لأنظمة SoC. تستخدم EHT ملفات IR مفتوحة المصدر مثل ONNX وTFlite كمدخلات، وتحولها إلى ملف IR داخلي من خلال مُحوّل IR، ثم تُعدّل بنية النموذج عبر تحسين الرسوم البيانية لجعله مناسبًا للتنفيذ على وحدة المعالجة العصبية (NPU). ومن خلال التكميم، تُقلل حجم النموذج إلى مستوى يُمكن تشغيله بكفاءة على الجهاز. تُجري ELT عمليات تقليل مُحسّنة لكل جيل من أجيال NPU، مُحوّلةً النموذج إلى شكل قابل للتنفيذ على الجهاز. أخيرًا، يمر النموذج عبر المُجمّع، مُولّدًا نموذج ذكاء اصطناعي على الجهاز يُمكن تشغيله على NPU.
... تصميم ميزات SDK للتعامل مع مختلف تنسيقات نماذج الذكاء الاصطناعي: لتعزيز قابلية التوسع في SDK، من الضروري دعم تنسيقات متعددة لنماذج الذكاء الاصطناعي. يدعم SDK من سامسونج حاليًا تنسيقات نماذج الذكاء الاصطناعي مفتوحة المصدر مثل ONNX وTFLite، ويعمل على تطوير استراتيجية لتعزيز دعم PyTorch. على وجه الخصوص، بالنسبة لنماذج الذكاء الاصطناعي التوليدية، يمكن أن يؤدي إجراء تحسين الرسم البياني والتكميم ضمن بيئة تطوير PyTorch إلى تقليل التحويلات غير الضرورية أثناء تصغير النموذج، مما يتيح تقديم SDK أكثر استقرارًا وكفاءة.
يمكن مقارنة مخرجات وحدة EHT في Exynos AI Studio مع النموذج الأصلي على أساس كل مُعامل باستخدام مقياس نسبة الإشارة إلى الضوضاء (SNR) من خلال وظيفة المحاكاة. في المحاكي، لمعالجة معلومات التكميم، يتم التعامل مع مُعاملات محددة من خلال عمليات فك التكميم والتكميم قبل وبعد الاستدلال، مما يتيح الحساب من خلال التكميم الوهمي. يتم التحقق من دقة نتائج وحدة ELT باستخدام وظيفة المحاكاة، بطريقة مشابهة للتحقق باستخدام EHT. ولأن المحاكي يُجري العمليات الحسابية من خلال كود محاكاة يُحاكي وحدة معالجة الشبكات العصبية (NPU)، فإنه يُتيح تحققًا أكثر دقة.
استراتيجيات خوارزميات تحسين الرسوم البيانية المتقدمة وخوارزميات التكميم: مع ازدياد تعقيد نماذج الذكاء الاصطناعي وكبر حجمها، يصبح تطوير خوارزميات تحسين الرسوم البيانية وخوارزميات التكميم التي يدعمها SDK أكثر أهمية.
في مرحلة تحسين الرسم البياني، يمكن تصنيف العمليات إلى نوعين: عمليات مستقلة عن نوع العتاد، وعمليات خاصة بنوع العتاد. بعد تطبيق التحسينات المناسبة لأجهزة الحوسبة العامة، تُنفَّذ خوارزميات مُخصصة لخصائص مُسرِّع الأجهزة NPU. تعمل خوارزمية التكميم على تقليل حجم نموذج الذكاء الاصطناعي المُدرَّب على خوادم ذات عرض بت fp32 إلى حجم يُمكن تشغيله على أجهزة NPU، مثل int8 أو int16 أو fp16. بفضل خوارزميات تحسين الرسم البياني والتكميم المتقدمة، يُصبح من الممكن إجراء تحسين NPU مع الحفاظ على دقة النموذج الأصلي قدر الإمكان.
قيادة مستقبل الذكاء على الأجهزة
تجاوز الذكاء الاصطناعي على الأجهزة قيوده التقنية، وأصبح الآن واقعًا عمليًا. مع حزمة تطوير البرمجيات Exynos AI Studio، تُقدِّم سامسونج السرعة والدقة وقابلية التوسع التي يتطلبها الذكاء الاصطناعي في المستقبل. هذا يضمن وجود الذكاء حيث يحتاجه الناس بشدة: بين أيديهم.
قيادة مستقبل الذكاء على الأجهزة
تجاوز الذكاء الاصطناعي على الأجهزة قيوده التقنية، وأصبح الآن واقعًا عمليًا. على الصعيد التقني، يعتمد برنامج Exynos AI Studio SDK من سامسونج على بنية سلسلة أدوات تطوير البرمجيات المدمجة في الجهاز، حيث يقوم بعمليات التحسين والتكميم والتجميع لضمان تشغيل نماذج الذكاء الاصطناعي الخاصة بالعملاء بكفاءة عالية على وحدة المعالجة العصبية (NPU). ومن خلال تنفيذ استراتيجيات تصميم وتطوير شاملة، ستواصل الشركة ترسيخ مكانتها كشركة رائدة عالميًا في مجال تقنية الذكاء الاصطناعي المدمجة في الأجهزة.