โมเดลการแปลงจากข้อความเป็นเสียงพูด Cartesia Sonic 3 พร้อมใช้งานแล้ววันนี้บน Amazon SageMaker JumpStart
ขณะนี้โมเดล Sonic 3 ของ Cartesia พร้อมให้ใช้งานใน Amazon SageMaker JumpStart แล้ว ซึ่งช่วยขยายพอร์ตโฟลิโอของโมเดลพื้นฐานสำหรับลูกค้า AWS Sonic 3 เป็นโมเดล State Space Model (SSM) รุ่นล่าสุดของ Cartesia สำหรับการสตรีมการแปลงจากข้อความเป็นเสียงพูด (TTS) ที่มอบความเป็นธรรมชาติสูง ติดตามสคริปต์ได้แม่นยำ และมีเวลาแฝงระดับแนวหน้าของอุตสาหกรรม พร้อมการควบคุมระดับเสียง ความเร็ว และอารมณ์ได้อย่างละเอียด
Sonic 3 รองรับ 42 ภาษา และมีความสามารถในการควบคุมขั้นสูงผ่านพารามิเตอร์ของ API และแท็ก SSML สำหรับการปรับระดับเสียง ความเร็ว และอารมณ์ โมเดลนี้รองรับเสียงหัวเราะตามธรรมชาติ มีเสียงที่เสถียรซึ่งปรับให้เหมาะสำหรับ Agent เสียง และมีเสียงเชิงอารมณ์สำหรับตัวละครที่ต้องการการแสดงออก ด้วยเวลาแฝงต่ำกว่า 100 มิลลิวินาที Sonic 3 ช่วยให้ AI สำหรับการสนทนาแบบเรียลไทม์สามารถจับความละเอียดอ่อนของคำพูดมนุษย์ได้ รวมถึงอารมณ์และการเปลี่ยนแปลงของโทนเสียง
ด้วย SageMaker JumpStart ลูกค้าสามารถติดตั้งใช้งาน Sonic 3 ได้เพียงไม่กี่คลิก เพื่อตอบโจทย์การใช้งานด้าน AI เสียง ของตนเอง เริ่มต้นใช้งานโมเดลนี้ได้โดยไปที่ SageMaker JumpStart model catalog บน SageMaker Studio หรือปรับใช้โมเดลผ่าน SageMaker Python SDK ไปยังบัญชี AWS ของคุณ ดูข้อมูลเพิ่มเติมเกี่ยวกับการติดตั้งใช้งานและการใช้โมเดลพื้นฐานบน SageMaker JumpStart ได้ที่เอกสารประกอบของ Amazon SageMaker JumpStart