이제 Amazon SageMaker JumpStart에서 Paraphrase-multilingual-MiniLM-L12-v2, Table Transformer Detection, Bielik-11B-v3.0-Instruct 사용 가능
AWS는 오늘 Amazon SageMaker JumpStart에서 paraphrase-multilingual-MiniLM-L12-v2, Microsoft Table Transformer Detection, Bielik-11B-v3.0-Instruct를 출시한다고 발표했습니다.
Sentence Transformers의 Paraphrase-multilingual-MiniLM-L12-v2는 50개 이상의 언어에 걸쳐 문장 및 단락을 384차원의 고밀도 벡터 공간에 매핑하는 경량 의미 유사성 모델입니다. 이 모델은 언어 내 및 언어 간에 의미상 유사한 내용을 찾는 데 매우 적합하므로 언어별 구성 없이도 언어 간 시맨틱 검색, 다국어 문서 클러스터링, 문장 유사성 점수 계산에 이상적입니다.
Microsoft Table Transformer Detection 은 PubTables-1M 데이터세트로 훈련된 DETR 기반 객체 탐지 모델로, PDF 및 스캔 이미지와 같은 비정형 문서에서 표를 감지하도록 특별히 설계되었습니다. 연구 논문, 재무 보고서 및 기타 문서 유형에서 대규모로 표 형식 콘텐츠를 신뢰할 수 있게 찾아내야 하는 문서 디지털화 파이프라인 및 자동화된 데이터 추출 워크플로에 매우 적합합니다.
Bielik-11B-v3.0-Instruct는 SpeakLeash 및 ACK Cyfronet AGH에서 개발한 110억 개 파라미터 생성형 언어 모델로, 폴란드어를 중심으로 32개 유럽 언어를 아우르는 다국어 코퍼스를 사용하여 훈련되었습니다. 폴란드어 및 유럽 언어 대화, STEM 및 수학적 추론, 로직 및 도구 사용 작업, 유럽 언어 전반에 걸친 심층적 언어 이해가 필요한 엔터프라이즈 응용 분야에서 탁월합니다.
SageMaker JumpStart를 사용하면 고객은 몇 번의 클릭만으로 이러한 모델을 배포하여 특정 AI 사용 사례를 해결할 수 있습니다. 이러한 모델을 시작하려면 SageMaker Studio의 Models 섹션으로 이동하거나 SageMaker Python SDK를 사용하여 모델을 AWS 계정에 배포하세요. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 설명서를 참조하세요.