تتوفر الآن ميزة Paraphrase-multilingual-MiniLM-L12-v2 واكتشاف محوّل الجداول وBielik-11B-v3.0-Instruct في Amazon SageMaker JumpStart
أعلنت AWS اليوم عن توفر Paraphrase-multilingual-MiniLM-L12-v2 وتكنولوجيا اكتشاف محوّل الجداول من Microsoft وBielik-11B-v3.0-Instruct في Amazon SageMaker JumpStart.
Paraphrase-multilingual-MiniLM-L12-v2 من Sentence Transformers هو نموذج التشابه الدلالي خفيف الوزن الذي يقوم بربط الجمل والفقرات إلى مساحة متجهات ضخمة تبلغ 384 بُعدًا بأكثر من 50 لغة. هذا النموذج مناسب تمامًا للعثور على محتوى متشابه داخل اللغات وعبرها، مما يجعله مثاليًا للبحث الدلالي متعدد اللغات وتجميع المستندات متعددة اللغات وتسجيل تشابه الجمل دون الحاجة إلى تكوين خاص باللغة.
يُعد Microsoft Table Transformer Detection نموذجًا للكشف عن العناصر يعتمد على تقنية DETR، وقد تم تدريبه على مجموعة بيانات PubTables-1M، وهو مصمم خصيصًا لاكتشاف الجداول في المستندات غير المنظمة مثل ملفات PDF والصور الممسوحة ضوئيًا. وهو مناسب تمامًا لمسارات رقمنة المستندات وعمليات سير عمل استخراج البيانات المؤتمتة التي تتطلب تحديد موضع محتوى الجداول بشكل موثوق به على نطاق واسع عبر الأوراق البحثية والتقارير المالية وأنواع المستندات الأخرى.
Bielik-11B-v3.0-Instruct هو نموذج لغة توليدي مكون من 11 مليار معلمة تولى تطويره SpeakLeash وACK Cyfronet AGH، وتم تدريبه على مجموعات متعددة اللغات تغطي 32 لغة أوروبية مع التركيز على اللغة البولندية بدرجة أكبر. يتفوق هذا النموذج في الحوارات باللغة البولندية والأوروبية، والاستدلال في مجال العلوم والتكنولوجيا والهندسة والرياضيات ومهام المنطق واستخدام الأدوات وتطبيقات المؤسسات التي تتطلب فهمًا لغويًا عميقًا عبر اللغات الأوروبية.
من خلال SageMaker JumpStart، يمكن للعملاء نشر أي من هذه النماذج ببضع نقرات فقط لمعالجة حالات استخدام الذكاء الاصطناعي المحددة لديهم. لبدء استخدام هذه النماذج، انتقل إلى قسم "النماذج" في SageMaker Studio أو استخدم SageMaker Python SDK لنشر النماذج في حساب AWS الخاص بك. لمعرفة مزيد من المعلومات عن نشر نماذج التأسيس واستخدامها في SageMaker JumpStart، اطّلع على وثائق Amazon SageMaker JumpStart.