Amazon SageMaker Canvas รองรับการนำเข้าโฟลว์ข้อมูลและการเตรียมข้อมูลสำหรับ ML ที่เร็วขึ้นแล้ว
ตอนนี้ Amazon SageMaker Data Wrangler ใน Amazon SageMaker Canvas รองรับการนำเข้าโฟลว์ข้อมูลจาก Amazon SageMaker Studio Classic รวมถึงการเตรียมข้อมูลที่รวดเร็วและยืดหยุ่นยิ่งขึ้นสำหรับแมชชีนเลิร์นนิง (ML) แล้ว SageMaker Data Wrangler เวอร์ชันล่าสุดใน SageMaker Canvas ทำให้คุณสามารถนำเข้าข้อมูลจาก S3 ได้ง่ายขึ้นแล้วด้วยตัวคั่นแบบกำหนดเองและตัวเลือกการสุ่มตัวอย่างที่หลากหลายมากขึ้น รวมถึงเตรียมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น นอกจากนี้ คุณสามารถตรวจสอบการแปลงได้เร็วขึ้นและทำซ้ำ Recipe ข้อมูลได้อย่างง่ายดาย คุณยังสามารถนำเข้าโฟลว์ข้อมูลจาก SageMaker Studio Classic เพื่อใช้ประโยชน์จากฟีเจอร์การเตรียมข้อมูลและการปรับปรุงล่าสุดใน SageMaker Canvas ได้อีกด้วย
การรวบรวม วิเคราะห์ และแปลงข้อมูลจำนวนมากเป็นส่วนที่ใช้เวลานานที่สุดของโปรเจกต์ ML เนื่องจากเป็นกระบวนการที่ต้องทำวนซ้ำหลายครั้งมาก การปรับปรุงใหม่เหล่านี้จะทำให้คุณสามารถนำเข้าข้อมูลด้วยวิธีการสุ่มตัวอย่างแบบต่าง ๆ เช่น Top-k, แบบสุ่ม หรือแบบแบ่งชั้น แล้วปรับขนาดตัวอย่างและวิธีการสุ่มตัวอย่างตามต้องการเพื่อให้ได้ตัวอย่างที่เป็นตัวแทน คุณสามารถแปลงข้อมูลด้วยเวลาแฝงที่ต่ำกว่าเดิม รวมถึงตรวจสอบผลกระทบของการแปลงต่อขนาดข้อมูลได้อย่างรวดเร็ว และเรียงลำดับขั้นตอนใหม่ตามต้องการ นอกจากนี้ คุณยังสามารถคัดลอก Recipe ข้อมูลและแทนที่แหล่งที่มาของข้อมูลเพื่อนำมาใช้ซ้ำสำหรับชุดข้อมูลและโมเดลที่แตกต่างกันได้เช่นกัน สุดท้ายแต่ไม่ท้ายสุด คุณสามารถนำเข้าโฟลว์ข้อมูลที่มีอยู่ทั้งหมดจาก SageMaker Data Wrangler ใน SageMaker Studio Classic ไปยัง SageMaker Canvas ได้ด้วยการคลิกเพียงครั้งเดียว หรือจะนำเข้าโฟลว์ข้อมูลเฉพาะด้วยตนเองผ่าน S3 หรือการอัปโหลดไฟล์ในเครื่องก็ได้
ความสามารถในการเตรียมข้อมูลที่ได้รับการปรับปรุงเหล่านี้พร้อมให้ใช้งานใน AWS Region ทุกแห่งที่รองรับ SageMaker Canvas ดูข้อมูลเพิ่มเติมได้ที่บล็อกและเอกสารประกอบทางเทคนิคของ AWS