Paraphrase-multilingual-MiniLM-L12-v2、Table Transformer Detection、Bielik-11B-v3.0-Instruct が Amazon SageMaker JumpStart で利用可能に

投稿日: 2026年4月29日

AWS は本日、Amazon SageMaker JumpStart で paraphrase-multilingual-MiniLM-L12-v2、Microsoft Table Transformer Detection、および Bielik-11B-v3.0-Instruct が利用可能になったことを発表しました。

Sense Transformers の Paraphrase-multilingual-MiniLM-L12-v2 は、50 以上の言語で 384 次元の密度の高いベクトル空間に文と段落をマッピングする軽量セマンティック類似性モデルです。言語内および言語間で意味的に類似したコンテンツを見つけることに適しているため、言語固有の設定を必要とすることなく、言語間のセマンティック検索、多言語ドキュメントのクラスタリング、および文の類似性スコアリングに最適です。

Microsoft Table Transformer Detection は、PubTables-1M データセットでトレーニングされた DETR ベースのオブジェクト検出モデルで、PDF やスキャンされた画像などの非構造化ドキュメント内のテーブルを検出するために構築されています。研究論文、財務報告書、その他のドキュメントタイプにおいて表形式のコンテンツを大規模に確実に見つける必要がある、ドキュメントのデジタル化パイプラインや自動データ抽出ワークフローに最適です。

Bielik-11B-v3.0-Instruct は、SpeakLeash と ACK Cyfronet AGH によって開発された 110 億パラメータの生成言語モデルで、ポーランド語に重点を置いた 32 のヨーロッパ言語における多言語コーパスでトレーニングされています。ポーランド語とヨーロッパ言語の対話、STEM と数学的推論、論理およびツール使用タスク、ヨーロッパ言語間の深い言語理解を必要とするエンタープライズアプリケーションに最適です。

SageMaker JumpStart を使用すると、お客様は数回クリックするだけでこれらのモデルをデプロイし、特定の AI ユースケースに対応できます。これらのモデルを使い始めるには、SageMaker Studio の [Models] セクションにアクセスするか、SageMaker Python SDK を使用して AWS アカウントにモデルをデプロイしてください。SageMaker JumpStart での基盤モデルのデプロイと使用方法の詳細については、Amazon SageMaker JumpStart のドキュメントを参照してください。