ทั่วไป

หากต้องการทราบฟังก์ชันใหม่ๆ ใน Amazon Redshift ให้ไปที่หน้ามีอะไรใหม่
หากต้องการดูข้อมูลโดยละเอียดเพิ่มเติมและคำแนะนำการใช้งาน โปรดดูเอกสารประกอบ

ถาม: Amazon Redshift คืออะไร

ลูกค้าหลายหมื่นรายใช้ Amazon Redshift ทุกวันเพื่อเรียกใช้การวิเคราะห์ SQL ในระบบคลาวด์ในการประมวลผลข้อมูลระดับเอกซะไบต์เพื่อให้ได้ข้อมูลเชิงลึกทางธุรกิจ ไม่ว่าข้อมูลที่มีปริมาณมากขึ้นเรื่อยๆ ของคุณจะถูกจัดเก็บไว้ในที่เก็บข้อมูลการดำเนินงาน, Data Lake, บริการข้อมูลสตรีม หรือชุดข้อมูลของบริษัทอื่น Amazon Redshift ก็สามารถช่วยคุณเข้าถึง ผสานรวม และแชร์ข้อมูลอย่างปลอดภัยโดยมีการโอนย้ายหรือคัดลอกน้อยที่สุด Amazon Redshift จะผสานการทำงานกับฐานข้อมูล AWS, การวิเคราะห์ และบริการแมชชีนเลิร์นนิงอย่างล้ำลึกเพื่อนำวิธีการ Zero-ETL มาใช้ หรือช่วยคุณเข้าถึงข้อมูลที่มีอยู่เพื่อใช้ในการวิเคราะห์ในแบบเกือบเรียลไทม์ สร้างโมเดลแมชชีนเลิร์นนิงใน SQL และเปิดใช้การวิเคราะห์ของ Apache Spark โดยใช้ข้อมูลใน Redshift Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้วิศวกร นักพัฒนา นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์สามารถเริ่มต้นทำงานได้ง่ายๆ และปรับขนาดการวิเคราะห์ได้อย่างรวดเร็วในสภาพแวดล้อมที่ไม่ต้องมีการบริหารจัดการ ด้วยกลไก Massively Parallel Processing (MPP) และสถาปัตยกรรมที่แยกการประมวลผลและการจัดเก็บข้อมูลออกจากกันเพื่อให้ได้นวัตกรรมการทำงานที่มีประสิทธิภาพ ปรับขนาดได้ และขับเคลื่อนด้วยแมชชีนเลิร์นนิง (ตัวอย่างเช่น AutoMaterialized Views) Amazon Redshift สร้างขึ้นมาเพื่อการปรับขนาดและมอบประสิทธิภาพการทำงานในราคาคุ้มค่ากว่าถึง 5 เท่าเมื่อเทียบกับคลังข้อมูลบนระบบคลาวด์อื่นๆ

ถาม: เหตุผลหลักที่ลูกค้าเลือกใช้ Amazon Redshift มีอะไรบ้าง

ลูกค้าหลายพันรายเลือกใช้ Amazon Redshift เพื่อเร่งเวลารับข้อมูลเชิงลึก เนื่องจากเป็นระบบการวิเคราะห์ที่มีประสิทธิภาพที่ผสานการทำงานได้ดีกับฐานข้อมูลและบริการแมชชีนเลิร์นนิง จึงทำให้การใช้งานดียิ่งขึ้น และสามารถใช้เป็นบริการศูนย์กลางในการส่งมอบผลลัพธ์ตามความต้องการด้านการวิเคราะห์ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติเพื่อมอบประสิทธิภาพระดับสูงสำหรับเวิร์กโหลดที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ Amazon Redshift มอบประสิทธิภาพชั้นนำที่คุ้มกับราคาสำหรับเวิร์กโหลดการวิเคราะห์ที่หลากหลาย ไม่ว่าจะเป็นการทำแดชบอร์ด การพัฒนาแอปพลิเคชัน การแชร์ข้อมูล งาน ETL (Extract, Transform, Load) และอื่นๆ อีกมากมาย เนื่องจากมีลูกค้าหลายหมื่นรายที่เรียกใช้การวิเคราะห์ข้อมูลในระดับเทระไบต์ไปจนถึงเพตะไบต์ Amazon Redshift จึงช่วยเพิ่มประสิทธิภาพเวิร์กโหลดให้กับลูกค้าในสภาพแวดล้อมจริงโดยอิงจากการตรวจวัดประสิทธิภาพระยะไกลของกลุ่มอินสแตนซ์ และส่งมอบการทำงานที่ปรับขนาดเวิร์กโหลดได้ในเชิงเส้นในขณะควบคุมต้นทุนให้ต่ำอยู่เสมอ นวัตกรรมการทำงานที่ทันสมัยนี้มีให้บริการลูกค้าโดยไม่มีค่าใช้จ่ายเพิ่มเติม Amazon Redshift ช่วยให้คุณได้รับข้อมูลเชิงลึกจากการเรียกใช้การวิเคราะห์เชิงคาดการณ์แบบเรียลไทม์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ, Data Lake, คลังข้อมูล, ข้อมูลการสตรีม และชุดข้อมูลของบุคคลภายนอก Amazon Redshift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท, Amazon Virtual Private Cloud (Amazon VPC) และการปรับขนาดคลัสเตอร์ที่เร็วขึ้น

ถาม: Amazon Redshift ช่วยให้การจัดการคลังข้อมูลและการวิเคราะห์เป็นเรื่องง่ายขึ้นได้อย่างไร

Amazon Redshift ได้รับการจัดการอย่างเต็มรูปแบบโดย AWS ดังนั้นคุณจึงไม่ต้องกังวลไปกับงานการจัดการคลังข้อมูลอีกต่อไป เช่น การจัดเตรียมฮาร์ดแวร์ การแพตช์ซอฟต์แวร์ การตั้งค่า การกำหนดค่า การตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากความล้มเหลว หรือการสำรองข้อมูล AWS จะคอยจัดการงานที่จำเป็นในการตั้งค่า ดำเนินการ และปรับขนาดคลังข้อมูลในนามของคุณ ช่วยให้คุณให้ความสำคัญกับการสร้างแอปพลิเคชันของคุณได้เต็มที่ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น Amazon Redshift ยังมีความสามารถในการปรับค่าอัตโนมัติและแสดงคำแนะนำสำหรับการจัดการคลังเก็บข้อมูลของคุณใน Redshift Advisor อีกด้วย สำหรับ Redshift Spectrum นั้น Amazon Redshift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด การปรับสมดุลโหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3 Amazon Redshift ช่วยให้คุณสามารถวิเคราะห์ข้อมูลทั้งหมดได้ด้วยการผสานการทำงานอย่างราบรื่นในบริการฐานข้อมูล พร้อมมีคุณสมบัติต่างๆ เช่น Amazon Aurora Zero-ETL ไปจนถึง Amazon Redshift และการสืบค้นแบบรวมไปจนถึงการเข้าถึงข้อมูลที่มีอยู่จากฐานข้อมูลเชิงปฏิบัติการอย่าง Amazon RDS และ Data Lake ของ Amazon S3 Redshift ช่วยให้สามารถนำข้อมูลเข้าอย่างมีประสิทธิภาพโดยไม่ต้องใช้โค้ด เป็นไปป์ไลน์ข้อมูลแบบอัตโนมัติที่นำเข้าข้อมูลการสตรีมหรือไฟล์จาก Amazon S3 โดยอัตโนมัติ Redshift ยังผสานการทำงานกับ AWS Data Exchange ช่วยให้ผู้ใช้สามารถค้นหา สมัครรับข้อมูล และสืบค้นชุดข้อมูลของบุคคลภายนอก และผสานรวมเข้ากับข้อมูลของตนเพื่อให้ได้ข้อมูลเชิงลึกที่ครบถ้วนครอบคลุม การผสานรวมการทำงานในตัวลงใน Amazon SageMaker ช่วยให้ลูกค้าสามารถดำเนินการได้จากคลังข้อมูลของตน และสร้าง ฝึกฝน และออกแบบโมเดลแมชชีนเลิร์นนิงใน SQL Amazon Redshift ตอบสนองความต้องการด้านการวิเคราะห์ SQL ทั้งหมดซึ่งมีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า

ถาม: มีตัวเลือกการนำไปใช้จริงใดบ้างสำหรับ Amazon Redshift

Amazon Redshift เป็นบริการที่มีการจัดการเต็มรูปแบบและมีตัวเลือกทั้งแบบเตรียมใช้งานและแบบไม่ต้องใช้เซิร์ฟเวอร์ ซึ่งช่วยให้การเรียกใช้และการปรับขนาดการวิเคราะห์มีประสิทธิภาพยิ่งขึ้นโดยไม่ต้องจัดการคลังข้อมูลของคุณ คุณสามารถเรียกใช้งานตำแหน่งข้อมูล Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์โฉมใหม่เพื่อเตรียมใช้งานคลังข้อมูลโดยอัตโนมัติในไม่กี่วินาที หรือคุณสามารถเลือกตัวเลือกที่มีการเตรียมใช้งานสำหรับเวิร์กโหลดที่คาดเดาได้ก็ได้

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Redshift ได้อย่างไร

คุณสามารถเริ่มสืบค้นข้อมูลได้เพียงไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า ซึ่งรวมถึงชุดข้อมูลวัดประสิทธิภาพ TPC-H, TPC-DS และตัวอย่างการสืบค้นอื่นๆ เพื่อเริ่มการวิเคราะห์ได้ทันที หากต้องการเริ่มต้นใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ให้เลือก “ลองใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์” และเริ่มสืบค้นข้อมูล เริ่มต้นที่นี่

ถาม: ประสิทธิภาพของ Amazon Redshift กับคลังข้อมูลอื่นๆ แตกต่างกันอย่างไร

ผลการวัดประสิทธิภาพ TPC-DS แสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่าที่สุดตั้งแต่แรกเริ่ม แม้จะใช้ชุดข้อมูลขนาด 3 TB ที่ค่อนข้างเล็กก็ตาม Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากความคุ้มค่าระดับชั้นนำของ Amazon Redshift นี้ตั้งแต่แรกเริ่มโดยไม่ต้องปรับแต่งอะไรเองเลย จากประสิทธิภาพการตรวจวัดระยะไกลในกลุ่มอินสแตนซ์ของเรา เรายังทราบอีกว่าเวิร์กโหลดส่วนใหญ่นั้นเป็นเวิร์กโหลดการสืบค้นระยะสั้น (เวิร์กโหลดที่ทำงานน้อยกว่า 1 วินาที) สำหรับเวิร์กโหลดเหล่านี้ เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 7 เท่า ทั้งด้านการทำงานพร้อมกันในระดับสูงและเวิร์กโหลดที่มีเวลาแฝงต่ำ เรียนรู้เพิ่มเติมที่นี่

ถาม: ฉันสามารถรับความช่วยเหลือเพื่อเรียนรู้เพิ่มเติมและเริ่มต้นใช้งาน Amazon Redshift ได้หรือไม่

ได้ ผู้เชี่ยวชาญของ Amazon Redshift พร้อมตอบคำถามต่างๆ และให้การสนับสนุน โปรดติดต่อเรา แล้วคุณจะได้รับการติดต่อกลับจากเราภายในหนึ่งวันทำการเพื่อพูดคุยว่า AWS สามารถช่วยเหลือองค์กรของคุณอย่างไรได้บ้าง

<t1>ถาม: Amazon Redshift Managed Storage คืออะไร

Amazon Redshift Managed Storage มีให้เลือกใช้แบบไร้เซิร์ฟเวอร์และมาพร้อมกับประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บแยกกันได้ ซึ่งทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง Amazon S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ

ถาม: ฉันจะใช้พื้นที่จัดเก็บที่มีการจัดการของ Amazon Redshift อย่างไร

หากคุณใช้โหนด Amazon Redshift Dense Storage หรือ Dense Compute อยู่แล้ว คุณสามารถใช้ Elastic Resize เพื่ออัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่ได้ Amazon Redshift Serverless และคลัสเตอร์ที่ใช้อินสแตนซ์ RA3 จะใช้พื้นที่จัดเก็บที่มีการจัดการโดย Redshift โดยอัตโนมัติเพื่อจัดเก็บข้อมูล โดยไม่จำเป็นต้องดำเนินการอื่นใดนอกเหนือจากการใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ หรืออินสแตนซ์ RA3 เพื่อใช้คุณสมบัตินี้

ถาม: ฉันจะเรียกใช้การสืบค้นจาก Redshift สำหรับข้อมูลที่จัดเก็บไว้ใน AWS Data Lake ได้อย่างไร

Amazon Redshift Spectrum เป็นคุณสมบัติหนึ่งของ Amazon Redshift ที่ให้คุณสามารถเรียกใช้การสืบค้นกับ Data Lake ใน Amazon S3 ได้โดยไม่ต้องมีการโหลดข้อมูลหรือ ETL เมื่อสร้างการสืบค้น SQL ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ Amazon Redshift ซึ่งจะสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 แล้วสร้างแผนในการลดจำนวนข้อมูล S3 ที่ต้องอ่านให้น้อยที่สุด จากนั้นส่งคำขอโปรแกรมทำงานของ Amazon Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3

ถาม: ฉันควรพิจารณาใช้อินสแตนซ์ RA3 เมื่อใด

พิจารณาเลือกใช้โหนด RA3 ในกรณีต่อไปนี้

  • คุณต้องการความยืดหยุ่นในการปรับขนาดและจ่ายค่าบริการประมวลผลแยกกับพื้นที่จัดเก็บ
  • คุณสืบค้นข้อมูลเพียงส่วนหนึ่งของข้อมูลทั้งหมด
  • ปริมาณข้อมูลของคุณเพิ่มขึ้นอย่างรวดเร็วหรือคาดว่าจะเพิ่มขึ้นอย่างรวดเร็ว
  • คุณต้องการความยืดหยุ่นในการปรับขนาดคลัสเตอร์ตามความต้องการด้านประสิทธิภาพของคุณเท่านั้น

เมื่อข้อมูลเพิ่มขึ้นเรื่อยๆ ไปจนถึงระดับเพตะไบต์ ปริมาณข้อมูลที่คุณนำเข้าไปยังคลังข้อมูล Amazon Redshift ของคุณก็จะเพิ่มขึ้นด้วยเช่นกัน คุณอาจกำลังมองหาวิธีที่จะวิเคราะห์ข้อมูลทั้งหมดของคุณอย่างคุ้มค่า

อินสแตนซ์ RA3 ของ Amazon Redshift โฉมใหม่พร้อมพื้นที่จัดเก็บที่มีการจัดการ ช่วยให้คุณสามารถเลือกจำนวนโหนดโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายค่าบริการเฉพาะพื้นที่จัดเก็บข้อมูลที่มีการจัดการซึ่งคุณใช้งานเท่านั้น ซึ่งช่วยให้คุณมีความยืดหยุ่นในการกำหนดขนาดคลัสเตอร์ RA3 ของคุณตามปริมาณข้อมูลที่คุณประมวลผลในแต่ละวันโดยไม่เพิ่มค่าใช้จ่ายด้านพื้นที่จัดเก็บข้อมูลแต่อย่างใด อินสแตนซ์ RA3 ที่สร้างขึ้นบน AWS Nitro System พร้อมพื้นที่จัดเก็บที่มีการจัดการจะใช้ SSD ประสิทธิภาพสูงสำหรับข้อมูล Hot (ข้อมูลที่เข้าถึงบ่อย) และใช้ Amazon S3 สำหรับข้อมูล Cold (ข้อมูลที่เข้าถึงไม่บ่อย) ซึ่งใช้งานได้ง่าย จัดเก็บข้อมูลได้คุ้มค่า และสืบค้นได้รวดเร็ว

ถาม: คุณสมบัติใดบ้างที่ฉันสามารถใช้เพื่อการวิเคราะห์ตามตำแหน่งได้

Amazon Redshift Spatial มีการวิเคราะห์ข้อมูลเชิงลึกจำนวนมากตามตำแหน่งกับข้อมูลของคุณ ซึ่งรวมข้อมูลเชิงพื้นที่และข้อมูลธุรกิจได้อย่างราบรื่นในการวิเคราะห์เพื่อการตัดสินใจ Amazon Redshift เปิดตัวการสนับสนุนการประมวลผลข้อมูลเชิงพื้นที่แบบเนทีฟในเดือนพฤศจิกายน 2019 โดยมีประเภทข้อมูลพหุสันฐาน GEOMETRY และฟังก์ชันเชิงพื้นที่ SQL ที่สำคัญหลายรายการ ขณะนี้เรารองรับประเภทข้อมูล GEOGRAPHY และไลบรารีฟังก์ชันเชิงพื้นที่ SQL ของเราได้เติบโตขึ้นเป็น 80 เรารองรับประเภทข้อมูลและมาตรฐานเชิงพื้นที่ทั่วไปทั้งหมด รวมถึง Shapefiles, GeoJSON, WKT, WKB, eWKT และ eWKB หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้าเอกสารประกอบหรือหน้าบทแนะนำสอนการใช้งาน Amazon Redshift Spatial

ถาม: SQL ของ Athena มีการรองรับการใช้งานอย่างไรเทียบกับ Redshift และฉันควรจะเลือกอะไรระหว่างบริการทั้งสองนี้

Amazon Athena และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ตอบสนองความต้องการและกรณีการใช้งานที่แตกต่างกันแม้ว่าทั้งสองบริการจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์และให้บริการแก่ผู้ใช้ SQL ก็ตาม 

ด้วยสถาปัตยกรรม Massively Parallel Processing (MPP) ที่แยกที่จัดเก็บและการประมวลผลออกจากกัน รวมถึงความสามารถในการปรับประสิทธิภาพอัตโนมัติที่สนับสนุนโดยแมชชีนเลิร์นนิง คลังข้อมูลอย่าง Amazon Redshift ไม่ว่าจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์หรือแบบเตรียมใช้งาน ก็ล้วนเป็นตัวเลือกที่ยอดเยี่ยมสำหรับลูกค้าที่ต้องการประสิทธิภาพการทำงานที่คุ้มราคาในทุกขนาดการใช้งานสำหรับเวิร์กโหลด BI และการวิเคราะห์ข้อมูลที่ซับซ้อน ลูกค้าสามารถใช้ Amazon Redshift เป็นองค์ประกอบศูนย์กลางของสถาปัตยกรรมข้อมูลที่มีการผสานการทำงานขั้นละเอียดพร้อมให้เข้าถึงข้อมูลที่มีอยู่ หรือนำเข้าหรือย้ายข้อมูลลงในคลังข้อมูลได้ง่ายๆ เพื่อการวิเคราะห์ข้อมูลที่มีประสิทธิภาพสูงผ่าน ZeroETL และไม่ต้องใช้โค้ด ลูกค้าสามารถเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon S3, ฐานข้อมูลเชิงปฏิบัติการอย่าง Aurora และ Amazon RDS, คลังข้อมูลของบุคคลภายนอกผ่านการผสานการทำงานกับ AWS Data Exchange และผสานรวมกับข้อมูลที่จัดเก็บไว้ในคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์ข้อมูล ผู้ใช้สามารถเริ่มต้นการจัดทำคลังข้อมูลได้ง่ายๆ และดำเนินการแมชชีนเลิร์นนิงเพิ่มเติมจากข้อมูลทั้งหมดนี้ด้วย 

Amazon Athena เหมาะสำหรับใช้ในการวิเคราะห์เชิงโต้ตอบและการสำรวจข้อมูลที่อยู่ใน Data Lake หรือแหล่งที่มาของข้อมูลใดๆ ผ่านเฟรมเวิร์กส่วนเชื่อมต่อแบบขยายได้ (รวมถึงตัวเชื่อมต่อที่ใช้งานได้ฟรีทันทีกว่า 30 รายการสำหรับแอปพลิเคชันและระบบการวิเคราะห์ข้อมูลในสถานที่หรือบนระบบคลาวด์อื่นๆ) โดยไม่ต้องกังวลถึงการนำเข้าหรือประมวลผลข้อมูล Amazon Athena สร้างขึ้นบนเครื่องมือและเฟรมเวิร์กแบบโอเพนซอร์ส เช่น Spark, Presto และ Apache Iceberg ลูกค้าจึงมีความยืดหยุ่นในการใช้ Python หรือ SQL หรือทำงานกับข้อมูลรูปแบบเปิด หากลูกค้าต้องการวิเคราะห์ข้อมูลเชิงโต้ตอบโดยใช้เฟรมเวิร์กและข้อมูลรูปแบบโอเพนซอร์ส Amazon Athena ถือเป็นการเริ่มต้นที่ยอดเยี่ยม 

ไม่ต้องใช้เซิร์ฟเวอร์

ถาม: Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์คืออะไร

Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ คือตัวเลือกแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Amazon Redshift ที่ช่วยให้เรียกใช้และปรับขนาดการวิเคราะห์ได้อย่างมีประสิทธิภาพยิ่งขึ้นภายในเวลาไม่กี่วินาทีโดยไม่จำเป็นต้องตั้งค่าและจัดการโครงสร้างพื้นฐานคลังข้อมูล Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้ผู้ใช้ทุกคน รวมถึงนักวิเคราะห์ข้อมูล นักพัฒนา นักธุรกิจ และนักวิทยาศาสตร์ข้อมูล ได้รับข้อมูลเชิงลึกจากข้อมูลเพียงแค่โหลดและสืบค้นข้อมูลในคลังข้อมูล

ถาม: ฉันจะเริ่มใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้อย่างไร

คุณสามารถเลือก "กำหนดค่า Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์" และเริ่มสืบค้นข้อมูลได้เพียงทำไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า เช่น ข้อมูลสภาพอากาศ ข้อมูลสำมะโน และชุดข้อมูลวัดประสิทธิภาพ พร้อมกับการสืบค้นตัวอย่างเพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก Amazon S3, แชร์ข้อมูลของ Amazon Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด (เช่น Parquet หรือ ORC) ใน Data Lake ของ Amazon S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น Amazon Aurora และ Amazon RDS PostgreSQL และ MySQL ดูคู่มือเริ่มต้นใช้งาน

ถาม: การใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์มีข้อดีอย่างไรบ้าง

หากคุณไม่มีประสบการณ์ในการจัดการคลังข้อมูล คุณก็ไม่ต้องกังวลกับการตั้งค่า การกำหนดค่า การจัดการคลัสเตอร์ หรือการปรับแต่งคลังข้อมูล คุณสามารถให้ความสำคัญกับการรับข้อมูลเชิงลึกที่สำคัญจากข้อมูลของคุณ หรือการนำเสนอผลลัพธ์ทางธุรกิจหลักของคุณผ่านข้อมูล และจ่ายค่าบริการเฉพาะส่วนที่คุณใช้เท่านั้น ช่วยให้ดูแลจัดการต้นทุนได้ตลอด โดยคุณยังคงได้รับประโยชน์จากประสิทธิภาพชั้นยอดทั้งหมดของ Amazon Redshift, คุณสมบัติ SQL ที่หลากหลาย, การผสานรวมกับที่เก็บข้อมูลดิบและคลังข้อมูลปฏิบัติการอย่างราบรื่น และคุณสมบัติวิเคราะห์เชิงคาดการณ์ในตัวและการแชร์ข้อมูล หากคุณต้องการควบคุมคลังข้อมูลอย่างละเอียด คุณสามารถจัดเตรียมคลัสเตอร์ Redshift ได้

ถาม: Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้งานร่วมกับบริการอื่นๆ ของ AWS ได้อย่างไรบ้าง

คุณสามารถใช้ฟังก์ชันการวิเคราะห์ที่หลากหลายทั้งหมดของ Amazon Redshift ได้ต่อไป เช่น การรวบรวมที่ซับซ้อน การสืบค้นโดยตรงไปยังข้อมูลใน Data Lake ของ Amazon S3 และฐานข้อมูลเชิงปฏิบัติการ, มุมมองผลการสืบค้น, ขั้นตอนกระบวนการที่จัดเก็บไว้, การสนับสนุนข้อมูลกึ่งมีโครงสร้าง และ ML อีกทั้งยังมีประสิทธิภาพสูงในทุกระดับขนาดอีกด้วย บริการที่เกี่ยวข้องทั้งหมดที่ Amazon Redshift ใช้งานร่วมกันได้ (เช่น Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation และ AWS Glue) ยังคงใช้งานกับ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ต่อไปได้

ถาม: มีกรณีใช้งานใดบ้างที่ฉันสามารถจัดการด้วย Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ได้

คุณสามารถเรียกใช้กรณีการใช้งานการวิเคราะห์ทั้งหมดต่อไปได้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ พร้อมเวิร์กโฟลว์การเริ่มต้นใช้งานที่เรียบง่าย การปรับขนาดอัตโนมัติ และการจ่ายค่าบริการตามที่ใช้งานช่วยให้การเรียกใช้การพัฒนาและการทดสอบสภาพแวดล้อมที่ต้องเริ่มต้นอย่างรวดเร็ว การวิเคราะห์ธุรกิจเฉพาะทาง เวิร์กโหลดที่มีความต้องการด้านการประมวลผลที่แตกต่างกันและคาดเดาไม่ได้ และเวิร์กโหลดที่ไม่ต่อเนื่องหรือไม่สม่ำเสมอมีประสิทธิภาพและคุ้มค่ายิ่งขึ้น

การนำข้อมูลเข้าและการโหลดข้อมูล

ถาม: ฉันจะโหลดข้อมูลเข้าคลังข้อมูล Amazon Redshift ได้อย่างไร

คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon Redshift ได้จากแหล่งที่มาของข้อมูลต่างๆ มากมาย ได้แก่ Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline และ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในองค์กร Amazon Redshift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'insert' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่ง ‘insert’ ของ SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ถาม: การคัดลอกอัตโนมัติของ Redshift แตกต่างจากคำสั่งคัดลอกอย่างไร

การคัดลอกอัตโนมัติของ Redshift ช่วยให้สามารถใช้คำสั่งคัดลอกอัตโนมัติโดยการติดตามโฟลเดอร์ใน Amazon S3 และนำเข้าไฟล์ใหม่ๆ โดยที่ลูกค้าไม่ต้องดำเนินการเอง หากไม่ใช้ฟังก์ชันการคัดลอกอัตโนมัติ คำสั่งคัดลอกจะเริ่มต้นขั้นตอนการนำเข้าไฟล์สำหรับไฟล์ที่มีอยู่ทันที การคัดลอกอัตโนมัติจะส่งคำสั่งคัดลอกที่มีอยู่และสามารถ 1/ ทำให้ขั้นตอนการนำเข้าไฟล์เป็นแบบอัตโนมัติ โดยตรวจติดตามเส้นทางต่างๆ ใน Amazon S3 ที่ระบุสำหรับไฟล์ใหม่ๆ 2/ ใช้การกำหนดค่าการคัดลอกซ้ำ ลดความต้องการในการสร้างและเรียกใช้คำสั่งคัดลอกใหม่ๆ สำหรับงานการนำเข้าซ้ำๆ และ 3/ ติดตามไฟล์ที่โหลดมาเพื่อหลีกเลี่ยงการคัดลอกข้อมูลซ้ำ

ถาม: ฉันจะเริ่มต้นใช้การคัดลอกอัตโนมัติของ Redshift ได้อย่างไร

ในการเริ่มต้น ลูกค้าควรมีโฟลเดอร์ใน Amazon S3 ซึ่งสามารถเข้าถึงได้โดยคลัสเตอร์/ตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Redshift โดยใช้บทบาทใน IAM ที่เกี่ยวข้อง และสร้างตาราง Redshift ที่จะใช้เป็นเป้าหมาย หลังจากที่เส้นทาง Amazon S3 และตาราง Redshift พร้อมแล้ว ลูกค้าสามารถสร้างงานคัดลอกโดยใช้คำสั่งคัดลอกได้ หลังจากสร้างงานคัดลอกแล้ว Redshift จะเริ่มติดตามเส้นทาง Amazon S3 ที่ระบุในการทำงานเบื้องหลัง และเริ่มคำสั่งคัดลอกที่ผู้ใช้กำหนดเพื่อคัดลอกไฟล์ใหม่ๆ ลงในตารางเป้าหมายโดยอัตโนมัติ

ถาม: การผสานการทำงาน Amazon Redshift สำหรับ Apache Spark มีกรณีการใช้งานใดบ้าง

กรณีการใช้งานที่สำคัญมีดังนี้: 1/ ลูกค้าที่ใช้ Amazon EMR และ AWS Glue เพื่อเรียกใช้งาน Apache Spark ที่จะเข้าถึงและโหลดข้อมูลลงใน Amazon Redshift อันเป็นส่วนหนึ่งของไปป์ไลน์การนำข้อมูลเข้าและการแปลงข้อมูล (แบตช์และการสตรีม) 2/ ลูกค้าที่ใช้ Amazon SageMaker ในการดำเนินงานแมชชีนเลิร์นนิงโดยใช้ Apache Spark และจะต้องเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon Redshift สำหรับกระบวนการสร้างฟีเจอร์ใหม่และการแปลงข้อมูล 3/ ลูกค้า Amazon Athena ที่ใช้ Apache Spark ในการวิเคราะห์เชิงโต้ตอบกับข้อมูลที่อยู่ใน Amazon Redshift

ถาม: การผสานการทำงาน Amazon Redshift สำหรับ Apache Spark มีข้อดีอย่างไรบ้าง

Baikal มีข้อดีดังต่อไปนี้: 1/ เริ่มต้นและเรียกใช้งานแอปพลิเคชัน Apache Spark ได้ง่ายๆ สำหรับข้อมูลใน Amazon Redshift โดยไม่ต้องกังวลกับขั้นตอนที่ต้องลงมือทำเองในการตั้งค่าและคงใช้งาน Spark เวอร์ชันที่ไม่ได้รับการรับรอง 2/ การใช้งาน Apache Spark ที่สะดวกง่ายดายจากบริการต่างๆ ของ AWS เช่น Amazon EMR, AWS Glue, Amazon Athena และ Amazon SageMaker ร่วมกับ Amazon Redshift โดยมีขั้นตอนการกำหนดค่าที่น้อยมาก 3/ เพิ่มประสิทธิภาพการทำงานให้ดีขึ้นไปพร้อมกับเรียกใช้แอปพลิเคชัน Apache Spark บน Amazon Redshift

ถาม: ฉันควรใช้ Amazon Aurora Zero-ETL เพื่อเชื่อมข้อมูลไปยัง Amazon Redshift แทนการสืบค้นข้อมูลจากส่วนกลางเมื่อใด

การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าของ Amazon Aurora และ Amazon Redshift สามารถเรียกใช้การวิเคราะห์ในแบบเกือบเรียลไทม์และแมชชีนเลิร์นนิงสำหรับข้อมูลการดำเนินการในระดับเพตะไบต์ได้ โดยเสนอโซลูชันที่มีการจัดการเต็มรูปแบบเพื่อจัดทำข้อมูลการดำเนินการจาก Amazon Aurora ที่มีอยู่ใน Amazon Redshift หลังจากเขียนออกมาได้ภายในไม่กี่วินาที ด้วยการเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ลูกค้าเพียงแค่ต้องเลือกตาราง Amazon Aurora ที่มีข้อมูลที่ตนต้องการเพื่อวิเคราะห์โดยใช้ Amazon Redshift และคุณสมบัตินี้จะทำซ้ำสคีมาและข้อมูลลงใน Amazon Redshift อย่างราบรื่น ซึ่งจะช่วยลดความจำเป็นที่ลูกค้าจะต้องสร้างและจัดการไปป์ไลน์ข้อมูลที่ซับซ้อน และมีเวลาให้ความสำคัญกับการพัฒนาแอปพลิเคชันของตนแทน การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถทำซ้ำข้อมูลจากคลัสเตอร์ฐานข้อมูล Amazon Aurora หลายแหล่งลงในอินสแตนซ์ Amazon Redshift เดียวกันเพื่อรับข้อมูลเชิงลึกที่ครบถ้วนทั่วแอปพลิเคชันต่างๆ ไปพร้อมกับรวบรวมสินทรัพย์การวิเคราะห์หลัก ประหยัดต้นทุนอย่างมาก และดำเนินงานได้อย่างมีประสิทธิภาพ การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถเข้าถึงการวิเคราะห์หลักและความสามารถด้านแมชชีนเลิร์นนิงของ Amazon Redshift ได้ด้วย เช่น มุมมองผลการสืบค้น การแชร์ข้อมูล และการเข้าถึงแหล่งเก็บข้อมูลและ Data Lake หลายแหล่งจากส่วนกลาง ซึ่งช่วยให้ลูกค้าสามารถรวมการวิเคราะห์หลักในแบบเกือบเรียลไทม์เพื่อรับข้อมูลเชิงลึกสุดรวดเร็วที่จะช่วยในการตัดสินใจทางธุรกิจอย่างมีข้อมูล นอกจากนี้ ลูกค้าจะใช้ Amazon Aurora สำหรับธุรกรรมและ Amazon Redshift สำหรับการวิเคราะห์ จึงไม่จำเป็นต้องใช้แหล่งข้อมูลการประมวลผลร่วมกัน ทำให้ได้โซลูชันที่มีประสิทธิภาพการทำงานและการดำเนินงานที่เสถียร

ถาม: การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift สัมพันธ์กับ/ทำงานร่วมกับบริการอื่นๆ ของ AWS อย่างไร

Tidal เป็นขีดความสามารถของ Amazon Aurora และ Amazon Redshift ที่มอบการผสานการทำงานที่ราบรื่นระหว่างสองบริการเพื่อการวิเคราะห์ข้อมูลการทำธุรกรรม

ถาม: การนำเข้าข้อมูลการสตรีมทำงานอย่างไร

ข้อมูลการสตรีมแตกต่างจากตารางฐานข้อมูลแบบเดิมตรงที่เมื่อคุณสืบค้นการสตรีม คุณกำลังได้รับวิวัฒนาการความสัมพันธ์ที่แปรเปลี่ยนตามเวลา ในขณะที่ตารางจะบันทึกสแนปช็อต ณ จุดเวลาใดเวลาหนึ่งของความสัมพันธ์ที่แปรเปลี่ยนตามเวลานี้ ลูกค้าของ Amazon Redshift คุ้นเคยกับการทำงานกับตารางทั่วไปและดำเนินการประมวลผลขั้นปลาย (เช่น การแปลงข้อมูล) ของข้อมูลโดยใช้โมเดลแบตช์แบบเดิม เช่น “ELT” เรามอบวิธีการใช้มุมมองผลการสืบค้น (MV) ของ Redshift เพื่อให้ลูกค้าสามารถเห็นมุมมองผลการสืบค้น ณ จุดเวลาใดเวลาหนึ่งของการสตรีมได้ง่ายๆ ซึ่งรวมกันเป็นเวลาที่ใช้ในการสืบค้น และรวดเร็วพอที่จะรองรับเวิร์กโฟลว์ ELT

การแชร์ข้อมูล

ถาม: กรณีการใช้งานสำหรับการแชร์ข้อมูลมีอะไรบ้าง

กรณีการใช้งานที่สำคัญมีดังนี้

  • การแชร์ข้อมูลของคลัสเตอร์ ETL ส่วนกลางกับคลัสเตอร์ BI/การวิเคราะห์จำนวนมาก เพื่อแยกปริมาณงานในการอ่านและดูแลควบคุมเพิ่มเติม
  • ผู้ให้บริการข้อมูลแชร์ข้อมูลกับผู้บริโภคภายนอก
  • การแชร์ชุดข้อมูลทั่วไป เช่น ลูกค้า ผลิตภัณฑ์ในกลุ่มธุรกิจต่างๆ และการทำงานร่วมกันเพื่อการวิเคราะห์ในวงกว้างและวิทยาศาสตร์ข้อมูล
  • การกระจายศูนย์ข้อมูลเพื่อให้จัดการได้ง่ายขึ้น
  • การแชร์ข้อมูลระหว่างสภาพแวดล้อมการพัฒนา การทดสอบ และการผลิต
  • การเข้าถึงข้อมูล Redshift จากบริการวิเคราะห์อื่นๆ ของ AWS

ถาม: การสืบค้นข้ามฐานข้อมูลใน Amazon Redshift คืออะไร

การสืบค้นข้ามฐานข้อมูลทำให้คุณสามารถสืบค้นและรวมข้อมูลจากฐานข้อมูล Redshift ต่างๆ ที่คุณมีสิทธิ์เข้าถึงเข้าด้วยกันได้อย่างราบรื่น ไม่ว่าคุณกำลังเชื่อมต่อกับฐานข้อมูลใดอยู่ก็ตาม ซึ่งรวมถึงฐานข้อมูลที่อยู่ในคลัสเตอร์ และชุดข้อมูลสำหรับแชร์ที่มีให้จากคลัสเตอร์ระยะไกล การสืบค้นข้ามฐานข้อมูลช่วยให้คุณสามารถจัดระเบียบข้อมูลเป็นฐานข้อมูลที่แยกกันได้อย่างยืดหยุ่นเพื่อให้รองรับการกำหนดค่าแบบหลายผู้ใช้ได้

ถาม: ใครใช้งาน AWS Data Exchange เป็นหลัก

AWS Data Exchange ช่วยให้ลูกค้า AWS สามารถแลกเปลี่ยนและใช้ข้อมูลของบุคคลภายนอกใน AWS ได้อย่างปลอดภัยและมีประสิทธิภาพมากขึ้น นักวิเคราะห์ข้อมูล ผู้จัดการผลิตภัณฑ์ ผู้จัดการพอร์ตโฟลิโอ นักวิทยาศาสตร์ข้อมูล นักวิจัยเชิงปริมาณ ช่างเทคนิคด้านการทดลองทางคลินิก และนักพัฒนาในเกือบทุกอุตสาหกรรมต่างต้องการเข้าถึงข้อมูลจำนวนมากขึ้นเพื่อดำเนินการวิเคราะห์ ฝึกฝนโมเดล ML และตัดสินใจโดยใช้ข้อมูลเป็นหลัก แต่ไม่มีอะไรที่สามารถค้นหาข้อมูลจากผู้ให้บริการหลายรายได้ อีกทั้งผู้ให้บริการแต่ละรายยังส่งมอบข้อมูลแตกต่างกัน ทำให้ต้องเจอกับสื่อทางกายภาพ, ข้อมูล FTP และการเรียก API ตามความต้องการแบบต่างๆ มากมาย ในทางกลับกัน องค์กรจำนวนมากต้องการให้ข้อมูลของตนพร้อมสำหรับวัตถุประสงค์ด้านการวิจัยหรือการค้า แต่การสร้างและการดูแลการส่งข้อมูล การให้สิทธิ์ และเทคโนโลยีการเรียกเก็บเงินนั้นยากและมีต้นทุนสูง ซึ่งลดการให้ข้อมูลที่มีค่าให้ต่ำลงไปอีก

ความสามารถในการเพิ่มทรัพยากรและการทำงานพร้อมกัน

ถาม: ฉันสามารถเพิ่มทรัพยากรตามขนาดและประสิทธิภาพของคลัสเตอร์คลังข้อมูล Amazon Redshift ได้อย่างไร

Amazon Redshift Serverless จะจัดเตรียมความจุของคลังข้อมูลโดยอัตโนมัติ และปรับทรัพยากรพื้นฐานอย่างชาญฉลาด Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์จะปรับความจุในไม่กี่วินาทีเพื่อมอบประสิทธิภาพที่สูงอย่างสม่ำเสมอ และลดความยุ่งยากในการปฏิบัติงานสำหรับเวิร์กโหลดที่มีความต้องการสูงและผันผวนมากที่สุด คุณสมบัติการปรับขนาดพร้อมกันเปิดโอกาสให้คุณสนับสนุนผู้ใช้และการสืบค้นพร้อมกันได้อย่างไม่จำกัดจำนวน โดยมีประสิทธิภาพการสืบค้นที่รวดเร็วสม่ำเสมอ เมื่อมีการเปิดใช้งานการปรับขนาดพร้อมกัน Amazon Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อประสบการณ์คลัสเตอร์ของคุณเพิ่มขึ้นในคิวการสืบค้น

สำหรับการเพิ่มทรัพยากรด้วยตนเอง หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังข้อมูลได้โดยใช้ Elastic Resize ผ่านคอนโซลการจัดการของ AWS หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Redshift สามารถใช้งานได้ฟรีผ่านคอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch นอกจากนี้ คุณยังสามารถเพิ่มตัวชี้วัดที่ผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้เช่นกัน

Amazon Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้คลัสเตอร์ Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ Redshift เพื่อการประมวลผลใดๆ ที่เหลืออยู่

ถาม: ฉันจะยังสามารถใช้งานคลัสเตอร์คลังข้อมูลของฉันในระหว่างการปรับขนาดได้หรือไม่

ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ Redshift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ

คำถาม: Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร

Elastic Resize จะเพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการกับอัตราการโอนถ่ายข้อมูลการสืบค้น ตัวอย่างเช่น เวิร์กโหลด ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Amazon Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันจะเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มความสามารถในการทำงานพร้อมกันของการสืบค้นโดยรวม

คำถาม: ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่

ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ Amazon Redshift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง

การรักษาความปลอดภัย

ถาม: Amazon Redshift รักษาความปลอดภัยให้กับข้อมูลของฉันอย่างไร

Amazon Redshift รองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท และ Amazon Virtual Private Cloud (Amazon VPC) Amazon Redshift ช่วยเข้ารหัสข้อมูลของคุณในขณะที่ถ่ายโอนและจัดเก็บ คุณสมบัติด้านการรักษาความปลอดภัยทั้งหมดของ Amazon Redshift พร้อมใช้งานได้ทันทีโดยไม่ต้องมีค่าใช้จ่ายเพิ่มเติมเพื่อตอบสนองความต้องการด้านการรักษาความปลอดภัย ความเป็นส่วนตัว และการปฏิบัติตามข้อกำหนดที่เข้มงวดที่สุด คุณจะได้สัมผัสข้อดีจาก AWS ที่สนับสนุนมาตรฐานความปลอดภัยและใบรับรองการปฏิบัติตามข้อกำหนดมากกว่าผู้ให้บริการรายอื่นๆ รวมถึง ISO 27001, SOC, HIPAA/HITECH และ FedRAMP

ถาม: Redshift รองรับการควบคุมการเข้าถึงแบบละเอียดหรือไม่

ใช่ Amazon Redshift รองรับการควบคุมการเข้าถึงตามบทบาท การควบคุมการเข้าถึงในระดับแถวจะช่วยให้คุณกำหนดอย่างน้อยหนึ่งบทบาทให้แก่ผู้ใช้ได้ และกำหนดสิทธิ์อนุญาตของระบบและอ็อบเจกต์ตามบทบาท คุณสามารถใช้บทบาทของระบบได้ทันที ไม่ว่าจะเป็นผู้ใช้ที่มีสิทธิ์ใช้งานสูงสุด, DBA, ผู้ปฏิบัติงาน และผู้ดูแลระบบความปลอดภัย หรือจะสร้างบทบาทของคุณเองก็ได้

ถาม: Amazon Redshift รองรับการมาสก์ข้อมูลหรือการเปลี่ยนแปลงข้อมูลให้เป็นโทเค็นหรือไม่

ฟังก์ชันที่กำหนดโดยผู้ใช้ของ AWS Lambda (UDF) ช่วยให้คุณสามารถใช้ฟังก์ชัน AWS Lambda เป็น UDF ใน Amazon Redshift และเรียกใช้จากการสืบค้นบน Redshift SQL ได้ ฟังก์ชันนี้ช่วยให้คุณสามารถเขียนส่วนขยายแบบกำหนดเองสำหรับการสืบค้น SQL ของคุณ เพื่อให้สามารถผสานรวมเข้ากับบริการอื่นๆ หรือผลิตภัณฑ์จากบุคคลภายนอกได้ดียิ่งขึ้น คุณสามารถเขียน Lambda UDF เพื่อเปิดใช้งานการสร้างโทเค็นภายนอก การมาสก์ข้อมูล การระบุตัวตนหรือการไม่ระบุตัวตนของข้อมูลโดยการผสานรวมกับผู้จัดจำหน่าย เช่น Protegrity และปกป้องหรือยกเลิกการปกป้องข้อมูลที่ละเอียดอ่อนตามสิทธิ์และกลุ่มของผู้ใช้ในระหว่างเวลาสืบค้น

การรองรับการมาสก์ข้อมูลแบบไดนามิกช่วยให้ลูกค้าปกป้องข้อมูลที่ละเอียดอ่อนได้อย่างง่ายดายและควบคุมการเข้าถึงอย่างละเอียดด้วยการจัดการนโยบายการมาสก์ข้อมูล สมมติว่าคุณมีแอปพลิเคชันที่มีผู้ใช้และอ็อบเจกต์หลายรายซึ่งมีข้อมูลที่ละเอียดอ่อนที่ไม่สามารถเปิดเผยต่อผู้ใช้ทั้งหมดได้ คุณมีข้อกำหนดในการจัดเตรียมระดับความปลอดภัยอย่างละเอียดที่แตกต่างกัน ซึ่งคุณต้องการใช้กับผู้ใช้กลุ่มต่างๆ Redshift Dynamic Data Masking สามารถกำหนดค่าได้เพื่ออนุญาตให้ลูกค้ากำหนดค่าข้อมูลที่มาสก์ในแบบที่สอดคล้องกัน รักษารูปแบบ และเปลี่ยนกลับไม่ได้ เมื่อคุณสมบัตินี้เป็น GA คุณจะเริ่มใช้งานได้ทันที ผู้ดูแลระบบด้านการรักษาความปลอดภัยสามารถสร้างและใช้นโยบายด้วยคำสั่งเพียงเล็กน้อย

ถาม: Amazon Redshift รองรับการเข้าสู่ระบบครั้งเดียวหรือไม่

ใช่ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร เช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า Amazon Redshift ให้รองรับการเข้าสู่ระบบครั้งเดียวได้ คุณสามารถเข้าสู่ระบบคลัสเตอร์ Amazon Redshift ได้ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถเข้าสู่ระบบ RedShift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน RedShift

ถาม: Amazon Redshift รองรับการยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) หรือไม่

ใช่ คุณสามารถใช้การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ Amazon Redshift

ความพร้อมใช้งานและความคงทน

ถาม: ในกรณีที่โหนดบางตัวหยุดทำงาน จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล

Amazon Redshift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณโดยอัตโนมัติ บนคลัสเตอร์ Dense Compute (DC) และ Dense Storage (DS2) ข้อมูลจะถูกเก็บไว้ในโหนดประมวลผลเพื่อให้แน่ใจว่าข้อมูลจะมีความทนทานสูง เมื่อเปลี่ยนโหนดแล้ว ระบบจะรีเฟรชข้อมูลจากสำเนาบนโหนดอื่น คลัสเตอร์ RA3 และ Redshift ที่ไม่ต้องใช้เซิร์ฟเวอร์จะไม่ได้รับผลกระทบในลักษณะเดียวกันนี้ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน Amazon S3 และไดรฟ์ในเครื่องเป็นเพียงแคชข้อมูลเท่านั้น คลัสเตอร์คลังข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก Amazon S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วที่สุด คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์หยุดทำงาน คุณต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล

ถาม: หาก Availability Zone (AZ) ของคลัสเตอร์คลังข้อมูลเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความคงทนของข้อมูล

หากคลังข้อมูล Amazon Redshift ของ Availability Zone เป็นการนำไปใช้แบบ Single-AZ และ Availability Zone ของคลัสเตอร์ไม่พร้อมใช้งาน Amazon Redshift จะย้ายคลัสเตอร์ของคุณไปยัง AWS Availability Zone (AZ) อื่นโดยอัตโนมัติโดยไม่มีการสูญเสียข้อมูลหรือเปลี่ยนแปลงแอปพลิเคชัน โดยคุณต้องเปิดใช้งานความสามารถในการย้ายระบบในการตั้งค่าคลัสเตอร์เพื่อเปิดใช้ฟังก์ชันนี้

ถาม: ทำไมฉันจึงควรใช้การใช้งานอินสแตนซ์แบบ Multi-AZ

ตอนนี้ลูกค้าสามารถปรับปรุงความพร้อมใช้งานของ Redshift ได้โดยเรียกใช้คลังข้อมูลในการใช้งานอินสแตนซ์แบบ Multi-AZ ซึ่งแตกต่างจากการนำไปใช้แบบ Single-AZ การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยให้คุณเรียกใช้คลังข้อมูลได้ในหลาย AWS Availability Zones (AZ) พร้อมกัน และปฏิบัติงานต่อไปเมื่อเกิดสถานการณ์ที่ต้องหยุดทำงานโดยไม่คาดคิด ไม่ต้องเปลี่ยนแปลงแอปพลิเคชันเพื่อรักษาความต่อเนื่องทางธุรกิจเนื่องจากการใช้งานอินสแตนซ์แบบ Multi-AZ ได้รับการจัดการเป็นคลังข้อมูลเดียวที่มีตำแหน่งข้อมูลเดียว การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยลดเวลาการกู้คืนโดยรับประกันความสามารถในการกู้คืนโดยอัตโนมัติ และเหมาะสำหรับลูกค้าที่มีแอปพลิเคชันการวิเคราะห์ที่สำคัญต่อธุรกิจ ซึ่งต้องการความพร้อมใช้งานและความสามารถในการฟื้นตัวต่อการหยุดทำงานของ AZ ในระดับสูง ซึ่งยังช่วยให้ลูกค้าสามารถใช้โซลูชันที่สอดคล้องกับคำแนะนำของ Reliability Pillar ของเฟรมเวิร์ก AWS Well-Architected ได้มากขึ้น หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Amazon Redshift Multi-AZ โปรดดูที่นี่

ถาม: RPO และ RTO คืออะไร RPO และ RTO ใดบ้างที่รองรับการใช้งานอินสแตนซ์แบบ Multi-AZ

RPO ย่อมาจาก Recovery Point Objective และเป็นคำที่ใช้อธิบายการรับประกันความใหม่ของข้อมูลในกรณีที่หยุดทำงาน RPO คือระยะเวลาสูงสุดที่ยอมรับได้ นับจากจุดกู้คืนข้อมูลล่าสุด ซึ่งจะกำหนดสิ่งที่พิจารณาว่าเป็นการสูญหายของข้อมูลที่ยอมรับได้ระหว่างจุดกู้คืนล่าสุดและการหยุดชะงักของบริการ Redshift Multi-AZ รองรับ RPO = 0 หมายความว่าข้อมูลจะรับประกันว่าเป็นข้อมูลล่าสุดและเป็นปัจจุบันในกรณีที่หยุดทำงาน RTO มีค่าต่ำกว่าหนึ่งนาที

ถาม: Redshift Multi-AZ ต่างจากคุณสมบัติ Redshift Relocation อย่างไร

Redshift Relocation จะเปิดใช้งานเป็นค่าเริ่มต้นบนคลัสเตอร์ RA3 ใหม่และตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ทั้งหมด ซึ่งช่วยให้คลังข้อมูลสามารถเริ่มต้นใหม่ใน AZ อื่นได้ในกรณีที่เกิดการหยุดทำงานขนาดใหญ่ โดยไม่สูญเสียข้อมูลหรือค่าใช้จ่ายเพิ่มเติม แม้ว่าการใช้คุณสมบัติย้ายระบบจะไม่มีค่าใช้จ่าย แต่ก็มีข้อจำกัด เพราะเป็นวิธีที่พยายามอย่างเต็มที่โดยขึ้นอยู่กับความพร้อมใช้งานของทรัพยากรใน AZ ที่กู้คืน และระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) อาจได้รับผลกระทบจากปัญหาอื่นที่เกี่ยวข้องกับการเริ่มต้นคลัสเตอร์ใหม่ ซึ่งอาจส่งผลให้ใช้เวลากู้คืนตั้งแต่ 10 ถึง 60 นาที Redshift Multi-AZ รองรับความต้องการความพร้อมใช้งานในระดับสูงโดยมอบ RTO ที่วัดได้ในระดับสิบวินาทีและรับประกันการทำงานต่อเนื่อง เนื่องจากไม่อยู่ภายใต้ข้อจำกัดด้านความจุหรือปัญหาอื่นๆ ที่อาจเกิดขึ้นในการสร้างคลัสเตอร์ใหม่

การสืบค้นและการวิเคราะห์

ถาม: Amazon Redshift ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ได้หรือไม่

ได้ Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานการทำงานที่ได้รับการตรวจสอบแล้วกับผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยบางรายเสนอช่วงทดลองใช้งานฟรีเพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที
Amazon Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ
คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้

ถาม: Amazon Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดประเภทใด

ปัจจุบัน Amazon Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV
Amazon Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy แล้วในตอนนี้

ถาม: จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก

คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน

ถาม: ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake ของ S3 ฉันสามารถใช้ Redshift Spectrum ได้หรือไม่

ใช่ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้

ถาม: ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร

คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้

ถาม: Redshift รองรับความสามารถในการใช้ Machine Learning ด้วย SQL หรือไม่

ใช่ คุณสมบัติ Amazon Redshift ML ช่วยให้ผู้ใช้ SQL สามารถสร้าง ฝึกอบรม และติดตั้งใช้งานโมเดลแมชชีนเลิร์นนิง (ML) ได้อย่างง่ายดายด้วยการใช้คำสั่ง SQL ที่คุ้นเคย Amazon Redshift ML ช่วยให้คุณสามารถใช้ประโยชน์จากข้อมูลของคุณใน Amazon Redshift ด้วย Amazon SageMaker ซึ่งเป็นบริการ ML ที่มีการจัดการอย่างเต็มรูปแบบ Amazon Redshift รองรับทั้งการเรียนรู้แบบไม่มีผู้ดูแล (K-Means) และการเรียนรู้แบบมีผู้ดูแล (อัลกอริทึม Autopilot, XGBoost, MLP) คุณยังสามารถใช้บริการ AI ด้านภาษาของ AWS เพื่อแปล ตรวจทาน และวิเคราะห์ช่องข้อความในการสืบค้น SQL ด้วยฟังก์ชัน Lambda UDF ที่สร้างไว้ล่วงหน้าได้ด้วย ดูบล็อกโพสต์

ถาม: Amazon Redshift มี API เพื่อสืบค้นข้อมูลหรือไม่

Amazon Redshift มี Data API ที่คุณสามารถเข้าถึงข้อมูลได้อย่างสะดวกจาก Amazon Redshift ด้วยแอปพลิเคชัน Cloud-Native แบบดั้งเดิมทุกประเภท บริการบนเว็บแบบไม่ต้องใช้เซิร์ฟเวอร์และอยู่ในคอนเทนเนอร์ รวมถึงแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ Data API ช่วยลดความซับซ้อนในการเข้าถึง Amazon Redshift เนื่องจากคุณไม่จำเป็นต้องกำหนดค่าไดรฟ์เวอร์และจัดการการเชื่อมต่อฐานข้อมูล คุณสามารถเรียกใช้คำสั่ง SQL ไปยังคลัสเตอร์ Amazon Redshift ได้อย่างง่ายดายเพียงแค่เรียกตำแหน่งข้อมูล API ที่ปลอดภัยซึ่งได้รับจาก Data API Data API ดูแลในส่วนของการจัดการการเชื่อมต่อฐานข้อมูลและการบัฟเฟอร์ข้อมูล และ Data API เป็นแบบอะซิงโครนัส คุณจึงสามารถดึงผลลัพธ์ได้ในภายหลัง ผลการสืบค้นของคุณจะถูกจัดเก็บไว้เป็นเวลา 24 ชั่วโมง

ถาม: ฉันสามารถใช้ข้อมูลประจำตัวประเภทใดบ้างกับ Data API ของ Amazon Redshift

Data API รองรับทั้งข้อมูลประจำตัว IAM และข้อมูลประจำตัวที่ใช้คีย์ลับจาก AWS Secrets Manager Data API รวมเข้ากับข้อมูลประจำตัว AWS Identity and Access Management (IAM) ดังนั้นคุณจึงสามารถใช้งานผู้ให้บริการข้อมูลประตัวอย่าง Okta หรือ Azure Active Directory หรือข้อมูลประจำตัวฐานข้อมูลที่จัดเก็บใน Secrets Manager โดยไม่ต้องผ่านข้อมูลประจำตัวฐานข้อมูลในการเรียกใช้ API

ถาม: ฉันสามารถใช้ Data API ของ Amazon Redshift จาก AWS CLI ได้หรือไม่

ได้ คุณสามารถใช้ Data API จาก AWS CLI โดยใช้ตัวเลือกบรรทัดคำสั่งที่เป็นข้อมูลของ AWS Redshift ได้

ถาม: Data API ของ Redshift ผสานการทำงานกับบริการของ AWS อื่นหรือไม่

คุณสามารถใช้ Data API จากบริการอื่น เช่น AWS Lambda, AWS Cloud9, AWS AppSync และ Amazon EventBridge ได้

ถาม: ฉันต้องจ่ายค่าบริการการใช้งาน Data API ของ Amazon Redshift แยกต่างหากหรือไม่

ไม่ Data API ไม่มีค่าบริการแยกต่างหาก

การสำรองและการกู้คืนข้อมูล

ถาม: Amazon Redshift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร

คลัสเตอร์ Amazon Redshift RA3 และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้ Redshift Managed Storage ซึ่งมีสำเนาล่าสุดของข้อมูลอยู่เสมอ คลัสเตอร์ DS2 และ DC2 ทำสำเนาข้อมูลบนคลัสเตอร์เพื่อให้แน่ใจว่าสำเนาล่าสุดจะพร้อมใช้งานในกรณีที่เกิดการหยุดทำงาน ระบบจะสร้างการสำรองข้อมูลขึ้นโดยอัตโนมัติในคลัสเตอร์ Redshift ทุกประเภทและจะคงไว้เป็นเวลา 24 ชั่วโมง และจุดกู้คืนแบบไร้เซิร์ฟเวอร์จะสำรองข้อมูลไว้ในช่วง 24 ชั่วโมงที่ผ่านมา

และคุณยังสามารถสร้างข้อมูลสำรองของคุณเองที่สามารถเก็บไว้ได้อย่างไม่มีกำหนดด้วยเช่นกัน ข้อมูลสำรองเหล่านี้สร้างขึ้นได้ทุกเมื่อและสามารถแปลงข้อมูลสำรองอัตโนมัติจากจุดกู้คืนของ Amazon Redshift หรือ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์เป็นข้อมูลสำรองของผู้ใช้ได้เพื่อเก็บรักษาให้ยาวนานขึ้น

Amazon Redshift ยังสามารถจำลองสแนปช็อตหรือจุดกู้คืนของคุณแบบไม่พร้อมกันไปยัง Amazon S3 ใน Region อื่นสำหรับกระบวนการกู้คืนจากความเสียหาย

บนคลัสเตอร์ DS2 หรือ DC2 ระบบจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น

ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8 TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8 TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้คอนโซลการจัดการของ AWS หรือ API ของ Amazon Redshift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon Redshift

Amazon Redshift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้นสแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว

ถาม: ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร

คุณสามารถใช้คอนโซลการจัดการของ AWS หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้ได้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)

ถาม: หากฉันลบคลัสเตอร์คลังข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน

หากคุณลบคลัสเตอร์คลังข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่คุณเลือกที่จะลบออก

การเฝ้าติดตามและการบำรุงรักษา

ถาม: ฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังข้อมูล Amazon Redshift ได้อย่างไร

ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่านคอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch และคุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดเพิ่มเติมผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้อีกด้วย คอนโซลการจัดการของ AWS มีแดชบอร์ดการติดตามสำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ Amazon Redshift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่านคอนโซลการจัดการของ AWS อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่

ถาม: ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่

Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราวเพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยการแก้ไขคลัสเตอร์ทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon Redshift ในการทำงานทั่วไปได้ระหว่างระยะเวลาการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตาม Region โปรดดูที่ระยะเวลาบำรุงรักษาในคู่มือการจัดการ Amazon Redshift

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Redshift

ไปที่หน้าราคา
พร้อมสร้างหรือยัง
เริ่มต้นใช้งาน Amazon Redshift
มีคำถามเพิ่มเติมหรือไม่
ติดต่อเรา