نماذج منشورة في بيئات إنتاج حقيقية
كل نتيجة مدرجة هنا مقاسة على المعالج المستهدف بعد التدريب والتحسين. لا بيئات اختبار معزولة، لا استنتاجات نظرية — أرقام مسجلة من عمليات نشر فعلية.
أداء قابل للقياس على المعالج المستهدف
"الاستدلال يعمل في الوقت الفعلي — لا تأخير، لا سحابة"
"دقة التعرف على الكلام تجاوزت ما حقق تحققه عبر الاتصال بالسحابة"
شركة تصنيع روبوتات صناعية. نموذج رؤية مُحسَّن على Sakura 2 لاكتشاف العيوب على خط التجميع بدون اتصال شبكي.
منصة أتمتة طبية. نموذج Whisper مُعاد تدريبه على Memorix لتفريغ الأوامر الصوتية في غرف العمليات بدون إنترنت.
زمن استجابة: 11 مللي ثانية / دقة: 97.3% / حجم النموذج: 4.2 ميغابايت
زمن استجابة: 18 مللي ثانية / دقة الكلمات: 96.1% / حجم النموذج: 6.8 ميغابايت
"استدلال LLM على الجهاز مباشرة — ما كنا نظنه مستحيلاً"
"نموذجان على معالج واحد — الاستجابة أسرع مما توقعنا"
شركة أنظمة مدمجة. نموذج LLM مضغوط ومُحسَّن على Sakura 2 لاتخاذ قرارات مستقلة في منظومة ملاحة طائرات مسيّرة.
شركة روبوتات لوجستية. نموذجا رؤية ولغة يعملان بالتوازي على Memorix لتصنيف الطرود وتوليد تعليمات التوجيه محلياً.
زمن استجابة: 34 مللي ثانية / معدل الضغط: 8.4× / حجم النموذج: 910 ميغابايت
زمن استجابة مشترك: 27 مللي ثانية / دقة التصنيف: 98.7% / بدون سحابة احتياطية
مهندسون يتحدثون عن نتائج فعلية
طلبنا نموذجاً يعمل على Sakura 2 دون أي اعتماد على الشبكة. ما حصلنا عليه تجاوز مواصفات الأداء التي حددناها.
لم نصدق أن نموذج Whisper يمكن ضغطه للعمل على Memorix بهذه الدقة. الفريق أثبت أن القيد هو المعالج وليس النموذج.
كانت متطلباتنا واضحة: استدلال في أقل من 30 مللي ثانية بلا سحابة احتياطية. Enfinitai وصلت للرقم وزادت عليه.
مدير هندسة الأنظمة المدمجة — شركة تصنيع روبوتات، ألمانيا
رئيس قسم الذكاء الاصطناعي — منصة أتمتة طبية، الإمارات
المهندس المعماري الأول — شركة أنظمة لوجستية مستقلة، سنغافورة
هل تريد التحدث مع أحد عملائنا مباشرة؟
يمكننا ترتيب محادثة مع مهندسين نشروا النماذج فعلياً على Sakura 2 أو Memorix. اتصل بنا لتحديد موعد.
