استخدم Apache Spark على Amazon EMR بلا خادم مباشرة من استوديو Amazon SageMaker
يمكنك الآن تشغيل تحليلات البيانات على نطاق البيتابايت وتعلّم الآلة على Amazon EMR بلا خادم مباشرة من دفاتر استوديو Amazon SageMaker. يقوم EMR بلا خادم تلقائيًا بتوفير الموارد المطلوبة وتوسيع نطاقها، مما يسمح لك بالتركيز على بياناتك ونماذجك دون الحاجة إلى تكوين الكتل أو تحسينها أو ضبطها أو إدارتها. يقوم EMR بلا خادم تلقائيًا بتثبيت وتكوين أطر عمل مفتوحة المصدر ويوفر وقت تشغيل محسّنًا للأداء متوافق مع المصدر المفتوح القياسي وأسرع منه.
باستخدام هذا الإصدار، يمكنك الآن إنشاء تطبيقات EMR بلا خادم وتصفحها بشكل مرئي مباشرةً من استوديو SageMaker والاتصال بها ببضع نقرات بسيطة. بمجرد الاتصال بتطبيق EMR بلا خادم، يمكنك استخدام Spark SQL وScala وPython للاستعلام عن البيانات واستكشافها وتصورها بشكل تفاعلي وتشغيل مهام Apache Spark لمعالجة البيانات مباشرة من دفاتر الاستوديو. تعمل الوظائف بسرعة لأنها تستخدم إصدارات EMR المحسّنة للأداء من Spark. على سبيل المثال، يعد Spark على EMR 7.1 أسرع 4.5 مرات من مكافئه مفتوح المصدر. يوفر EMR بلا خادم تحجيمًا تلقائيًا دقيقًا، والذي يوفر موارد الحوسبة والذاكرة ويوسع نطاقها بسرعة لتتناسب مع متطلبات التطبيق الخاص بك وتدفع مقابل ما تستخدمه فقط.
يتم دعم هذه الميزات على SageMaker Distribution 1.10 والإصدارات الأحدث، وهي متوفرة بشكل عام في جميع مناطق AWS حيث يتوفر استوديو SageMaker. لمعرفة المزيد، اقرأ المدونة استخدم LangChain مع PySpark لمعالجة المستندات على نطاق واسع باستخدام استوديو Amazon SageMaker وEMR بلا خادم، أو وثائق استوديو SageMaker هنا.