تقدم Amazon SageMaker ميزة Scale Down to Zero للاستدلال بالذكاء الاصطناعي لمساعدة العملاء على توفير التكاليف

:تاريخ النشر 25 نوفمبر 2024

نحن متحمسون للإعلان عن ميزة Scale Down to Zero، وهي قدرة جديدة في Amazon SageMaker Inference تسمح لنقاط النهاية بالتقليص إلى صفر من الكائنات خلال فترات عدم النشاط. يمكن لهذه الميزة أن تقلل بشكل كبير تكاليف تشغيل الاستدلال باستخدام نماذج الذكاء الاصطناعي، مما يجعلها مفيدة بشكل خاص للتطبيقات ذات أنماط حركة المرور المتغيرة مثل روبوتات المحادثة وأنظمة إدارة المحتوى وحالات استخدام الذكاء الاصطناعي المولّد الأخرى.

باستخدام ميزة التقليص Scale Down to Zero، يمكن للعملاء تكوين نقاط النهاية في SageMaker Inference لتقليص السعة إلى صفر من الكائنات تلقائيًا عندما لا تكون قيد الاستخدام، ثم يتم التوسع مرة أخرى بسرعة عند استئناف حركة المرور. هذه الإمكانية فعالة للسيناريوهات ذات أنماط حركة المرور التي يمكن التنبؤ بها وحركة الاستدلال المتقطعة وبيئات التطوير/الاختبار. يعد Scale Down to Zero أمرًا بسيطًا باستخدام مكونات استدلال SageMaker. يمكن للعملاء تكوين سياسات التوسع التلقائي من خلال AWS SDK for Python (Boto3) أو SageMaker Python SDK أو واجهة سطر الأمر من AWS‏ (AWS CLI). تتضمن العملية إعداد نقطة نهاية مع تمكين توسيع نطاق المثيلات المُدارة، وتكوين سياسات التحجيم، وإنشاء إنذارات CloudWatch لتشغيل إجراءات التحجيم.

ميزة التقليص (Scale Down to Zero) أصبحت الآن متوفرة بشكل عام في جميع مناطق AWS التي تدعم Amazon SageMaker. للتعرف على المزيد حول كيفية تنفيذ ميزة Scale Down to Zero وتحسين التكاليف لعمليات نشر الذكاء الاصطناعي المولّد، تفضل بزيارة صفحة الوثائق الخاصة بنا.