ทั่วไป

หากต้องการทราบฟังก์ชันใหม่ๆ ใน Amazon RedShift ให้ไปที่หน้ามีอะไรใหม่
หากต้องการดูข้อมูลโดยละเอียดเพิ่มเติมและคำแนะนำการใช้งาน ให้ไปที่เอกสารประกอบ

ถาม: Amazon RedShift คืออะไร

Amazon RedShift เป็นคลังข้อมูลบนระบบคลาวด์ที่มีการจัดการแบบเต็มรูปแบบอย่างรวดเร็ว ซึ่งทำให้วิเคราะห์ข้อมูลทั้งหมดของคุณได้ง่ายและประหยัดค่าใช้จ่าย โดยใช้ SQL มาตรฐานและเครื่องมือ Business Intelligence (BI) ที่มีอยู่ของคุณ โดย Amazon RedShift จะทำให้คุณสามารถรันการสืบค้นการวิเคราะห์ข้อมูลที่มีการจัดโครงสร้างระดับเทระไบต์ที่มีความซับซ้อนได้ โดยใช้การปรับประสิทธิภาพการสืบค้นที่ซับซ้อนให้เหมาะสม พื้นที่จัดเก็บแบบคอลัมน์บนพื้นที่จัดเก็บที่มีประสิทธิภาพสูง และการดำเนินการสืบค้นแบบคู่ขนานจำนวนมาก ได้รับผลลัพธ์ส่วนใหญ่กลับมาในเวลาไม่กี่วินาที RedShift ช่วยให้คุณสามารถเริ่มจากเพียง 0.25 USD ต่อชั่วโมง โดยไม่มีข้อผูกมัดใดๆ และปรับขนาดเป็นข้อมูลระดับเพตะไบต์ได้ที่ 1,000 USD ต่อเทระไบต์ต่อปี ซึ่งมีค่าใช้จ่ายน้อยกว่าหนึ่งในสิบของโซลูชันในองค์กรแบบเดิม Amazon RedShift ยังมี Amazon Redshift Spectrum ซึ่งทำให้คุณสามารถดำเนินการสืบค้น SQL สำหรับข้อมูลระดับเอกซะไบต์แบบไม่มีโครงสร้างใน Data Lake ของ Amazon S3 ได้โดยตรง โดยไม่จำเป็นต้องโหลดหรือแปลงข้อมูล และคุณสามารถใช้รูปแบบข้อมูลแบบเปิดได้ ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV Redshift Spectrum ปรับขนาดความสามารถในการประมวลผลการสืบค้นได้โดยอัตโนมัติตามข้อมูลที่เรียกดู ดังนั้นจึงสามารถดำเนินการสืบค้นใน Amazon S3 ได้อย่างรวดเร็ว ไม่ว่าชุดข้อมูลจะมีขนาดเท่าใดก็ตาม

Amazon RedShift มีความสามารถในการสืบค้นข้อมูลที่มีการจัดโครงสร้างที่รวดเร็วโดยใช้ไคลเอนต์และเครื่องมือ Business Intelligence (BI) บน SQL โดยใช้การเชื่อมต่อ ODBC และ JDBC มาตรฐาน การสืบค้นจะถูกกระจายออกไปและประมวลผลพร้อมกันตามทรัพยากรทั้งหลาย คุณสามารถเพิ่มหรือลดขนาดคลังข้อมูล Amazon RedShift ได้อย่างง่ายดายโดยการคลิกเพียงไม่กี่ครั้งใน AWS Management Console หรือการเรียกใช้ API ครั้งเดียว Amazon RedShift จะติดตั้งแพทช์และสำรองข้อมูลในคลังเก็บข้อมูลของคุณโดยอัตโนมัติ ซึ่งจะจัดเก็บข้อมูลสำรองตามระยะเวลาเก็บรักษาที่ผู้ใช้กำหนด Amazon RedShift ใช้การสำรองข้อมูลแบบจำลองอย่างต่อเนื่อง เพื่อปรับปรุงความพร้อมใช้งานและพัฒนาความคงทนของข้อมูล และสามารถกู้คืนข้อมูลได้โดยอัตโนมัติจากการทำงานล้มเหลวของส่วนประกอบและโหนด นอกจากนี้ Amazon RedShift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวม AWS IAM, การเชื่อมโยงข้อมูลประจำตัว, การควบคุมการเข้าถึงระดับคอลัมน์, Amazon Virtual Private Cloud (Amazon VPC), SSL, การเข้ารหัส AES-256 และการผสานรวม AWS KMS ในตัวเพื่อปกป้องข้อมูลของคุณทั้งในระหว่างการส่งและการพักเก็บ คุณสมบัติด้านความปลอดภัยทั้งหมดของ Amazon RedShift รวมให้มาอย่างเบ็ดเสร็จโดยไม่มีค่าใช้จ่ายเพิ่มเติม

Amazon RedShift รวมระบบกับ AWS CloudTrail เพื่อให้คุณสามารถตรวจสอบการเรียกใช้ RedShift API ทั้งหมด RedShift ทำรายการบันทึกการดำเนินการ SQL ทั้งหมด รวมถึงการพยายามเชื่อมต่อ การสืบค้น และการเปลี่ยนแปลงต่างๆ ในคลังข้อมูลของคุณด้วย คุณสามารถเข้าถึงรายการบันทึกเหล่านี้โดยใช้การสืบค้น SQL ในตารางระบบ หรือเลือกที่จะบันทึกไปยังตำแหน่งที่ปลอดภัยบน Amazon S3 ได้ Amazon RedShift ปฏิบัติตามข้อกำหนดระดับที่ 1 ของ SOC1, SOC2, SOC3 และ PCI DSS

บริการนี้จะเหมือนกับ Amazon Web Services ทั้งหมด นั่นคือจะไม่มีการเรียกเก็บเงินล่วงหน้า และคุณจ่ายเพียงแค่ค่าทรัพยากรที่คุณใช้เท่านั้น Amazon RedShift ให้คุณจ่ายเฉพาะที่คุณใช้เท่านั้น คุณสามารถทดลองใช้งาน Amazon RedShift ได้ฟรี

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความพร้อมใช้งานตามเขตของ Amazon RedShift โปรดดูที่ตารางเขตของ AWS

ถาม: ทำไมฉันจึงควรเลือกใช้ Amazon RedShift แทนคลังข้อมูลในองค์กร

คลังข้อมูลในองค์กรต้องใช้เวลาและทรัพยากรเป็นจำนวนมากในการดูแลจัดการ โดยเฉพาะกับชุดข้อมูลขนาดใหญ่ นอกจากนั้น ต้นทุนทางการเงินที่เกี่ยวกับการสร้าง การบำรุงรักษา และการขยายคลังข้อมูลภายในองค์กรแบบจัดการเองยังสูงมากอีกด้วย เมื่อข้อมูลขยายมากขึ้น คุณจำเป็นต้องเลือกว่าจะโหลดข้อมูลใดลงในคลังข้อมูลหรือจัดเก็บข้อมูลใดลงในพื้นที่จัดเก็บ เพื่อให้คุณสามารถจัดการต้นทุน รักษาความซับซ้อนของ ETL ให้อยู่ในระดับต่ำ และมีประสิทธิภาพการทำงานที่ดี Amazon RedShift ไม่เพียงแค่ช่วยลดต้นทุนและค่าใช้จ่ายในการดำเนินงานของคลังข้อมูลได้อย่างมาก แต่ Redshift Spectrum ยังช่วยให้สามารถวิเคราะห์ข้อมูลขนาดใหญ่ในรูปแบบดั้งเดิมได้อย่างง่ายดายโดยไม่ต้องโหลดข้อมูลอีกด้วย

ถาม: AQUA (Advanced Query Accelerator) สำหรับ Amazon RedShift คืออะไร

AQUA คือแคชแบบเร่งความเร็วฮาร์ดแวร์ที่เผยแพร่ใหม่ล่าสุด ซึ่งช่วยให้ RedShift สามารถทำงานได้รวดเร็วกว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ สูงสุดถึง 10 เท่า สถาปัตยกรรมคลังข้อมูลที่มีอยู่เดิมพร้อมพื้นที่จัดเก็บแบบรวมศูนย์จำเป็นต้องย้ายข้อมูลไปยังคลัสเตอร์การประมวลผลเพื่อประมวลผล ในขณะที่คลังข้อมูลยังคงเติบโตขึ้นเรื่อยๆ ในช่วงสองสามปีถัดไป แบนด์วิดท์ของเครือข่ายที่จำเป็นต้องใช้สำหรับการย้ายข้อมูลทั้งหมดนี้จะกลายเป็นปัญหาคอขวดสำหรับประสิทธิภาพการสืบค้น

AQUA ใช้วิธีการใหม่ในการเก็บข้อมูลไว้ในคลังข้อมูลบนระบบคลาวด์ AQUA นำการประมวลผลไปสู่พื้นที่จัดเก็บด้วยการแชร์การประมวลผลข้อมูลจำนวนมากที่พร้อมใช้งานบนแคชที่ล้ำสมัย นอกจากนี้ AQUA ยังใช้ตัวประมวลผลที่ออกแบบโดย AWS และปรับขนาดสถาปัตยกรรมเพื่อเร่งการประมวลผลข้อมูลได้รวดเร็วกว่าที่ CPU แบบดั้งเดิมจะสามารถทำได้ในปัจจุบัน เรียนรู้เพิ่มเติมและลงทะเบียนเพื่อรับโอกาสดูตัวอย่าง

ถาม: Redshift Spectrum คืออะไร

Redshift Spectrum เป็นคุณสมบัติของ Amazon Redshift ที่ให้คุณสามารถรันการสืบค้นกับข้อมูลไร้โครงสร้างที่มากถึงระดับเอกซะไบต์ในAmazon S3 ได้โดยไม่ต้องโหลดหรือใช้ ETL เมื่อสร้างการสืบค้น ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ SQL ของ Amazon Redshift ซึ่งสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 สร้างแผนในการลดจำนวนข้อมูลของ Amazon S3 ที่ต้องอ่านให้น้อยที่สุด ส่งคำขอโปรแกรมทำงานของ Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3

Redshift Spectrum จะใช้อินสแตนซ์เพิ่มขึ้นถึงหลักพันหากจำเป็น ดังนั้น การสืบค้นจะทำงานได้รวดเร็วไม่ว่าข้อมูลจะมีขนาดเท่าใด นอกจากนี้ คุณสามารถนำ SQL เดียวกันกับที่ใช้สำหรับสืบค้น Amazon RedShift ไปใช้กับข้อมูล Amazon S3 และเชื่อมต่อตำแหน่งข้อมูล Amazon RedShift เดียวกันโดยใช้เครื่องมือ BI เดียวกันได้ Redshift Spectrum ช่วยให้คุณสามารถแยกพื้นที่จัดเก็บและการประมวลผลออกจากกัน ทำให้คุณสามารถปรับขนาดได้อย่างอิสระ คุณสามารถตั้งค่า Amazon Redshift ได้หลายคลัสเตอร์ตามที่คุณต้องการ เพื่อสืบค้น Data Lake ของ Amazon S3 โดยมีความพร้อมใช้งานสูงและใช้งานพร้อมกันได้อย่างไม่จำกัด Redshift Spectrum ให้คุณมีอิสระในการจัดเก็บข้อมูลในที่ที่คุณต้องการ ในรูปแบบที่คุณต้องการ และพร้อมประมวลผลข้อมูลเมื่อคุณต้องการ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความพร้อมใช้งานตามเขตของ Redshift Spectrum โปรดไปที่หน้าราคาของ Amazon RedShift

ถาม: พื้นที่จัดเก็บที่มีการจัดการของ Amazon RedShift คืออะไร

พื้นที่จัดเก็บที่มีการจัดการของ Amazon RedShift มาพร้อมกับประเภทโหนด RA3 และช่วยให้คุณสามารถปรับขนาดและแยกค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บออกจากกัน ทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง Amazon S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ

ถาม: ฉันจะใช้พื้นที่จัดเก็บที่มีการจัดการของ Amazon RedShift อย่างไร

หากคุณใช้โหนด Amazon RedShift DS หรือโหนด DC อยู่แล้ว คุณสามารถอัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่เพื่อใช้พื้นที่จัดเก็บที่มีการจัดการ นอกจากนี้ คุณยังสามารถสร้างคลัสเตอร์ใหม่ได้จากอินสแตนซ์ RA3 และรวมพื้นที่จัดเก็บที่มีการจัดการไว้ในคลัสเตอร์ได้โดยอัตโนมัติ ไม่จำเป็นต้องดำเนินการใดๆ เพื่อใช้ความสามารถนี้

ถาม: Amazon RedShift ช่วยให้การจัดการคลังข้อมูลเป็นเรื่องง่ายได้อย่างไร

Amazon RedShift จะจัดการงานที่จำเป็นเพื่อตั้งค่า ปฏิบัติการ และปรับขนาดคลังข้อมูล ตัวอย่างเช่น การจัดเตรียมความจุของโครงสร้างพื้นฐาน การทำให้งานด้านการจัดการที่กำลังทำอยู่เป็นไปโดยอัตโนมัติ เช่น การสำรองข้อมูล และการแพทช์ และติดตามตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากการทำงานล้มเหลว สำหรับ Redshift Spectrum, Amazon RedShift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด, Load Balancing, การวางแผน, การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3

ถาม: ประสิทธิภาพการทำงานในส่วนของคลังข้อมูลและการวิเคราะห์ของ Amazon RedShift เป็นอย่างไรเมื่อเปรียบเทียบกับฐานข้อมูลในองค์กร

Amazon RedShift ใช้นวัตกรรมหลายอย่างเพื่อให้การทำงานในส่วนของคลังข้อมูลและการวิเคราะห์ข้อมูลมีประสิทธิภาพที่ดีกว่าฐานข้อมูลแบบดั้งเดิมถึงสิบเท่า ซึ่งได้แก่:

  • พื้นที่จัดเก็บข้อมูลแบบคอลัมน์: แทนที่จะจัดเก็บข้อมูลเป็นแถว แต่ Amazon RedShift จะเลือกจัดเก็บข้อมูลเป็นคอลัมน์แทน ระบบจัดเก็บแบบคอลัมน์เหมาะสำหรับคลังเก็บข้อมูลและการวิเคราะห์ข้อมูลที่การสืบค้นมักมีส่วนเกี่ยวข้องกับการรวบรวมชุดข้อมูลขนาดใหญ่ ซึ่งไม่เหมือนกันระบบจัดเก็บแบบแถวซึ่งเหมาะสำหรับการประมวลผลธุรกรรม ระบบจัดเก็บแบบคอลัมน์ใช้ I/O ที่ค่อนข้างน้อยกว่ามาก เนื่องจากระบบจะประมวลผลเฉพาะคอลัมน์ที่มีส่วนเกี่ยวข้องในการสืบค้นเท่านั้นและจะจัดเก็บข้อมูลแบบคอลัมน์ไว้บนพื้นที่จัดเก็บตามลำดับ ซึ่งช่วยให้มีประสิทธิภาพในการสืบค้นเพิ่มขึ้นมาก
  • การบีบอัดขั้นสูง: การจัดเก็บข้อมูลแบบคอลัมน์สามารถบีบอัดได้มากกว่าการจัดเก็บข้อมูลแบบแถว เนื่องจากระบบจะจัดเก็บข้อมูลที่คล้ายกันไว้เป็นลำดับบนดิสก์ Amazon RedShift ใช้เทคนิคการบีบอัดมากมายหลายเทคนิคและสามารถบีบอัดได้อย่างมากเมื่อเทียบกับการจัดเก็บข้อมูลเชิงสัมพันธ์แบบดั้งเดิม ขณะโหลดข้อมูลลงในตารางเปล่า Amazon RedShift จะสุ่มตัวอย่างข้อมูลของคุณและเลือกรูปแบบการบีบอัดที่เหมาะสมที่สุดโดยอัตโนมัติ
  • การประมวลผลแบบขนาดปริมาณมาก (MPP): Amazon Redshift จะกระจายข้อมูลและโหลดการสืบค้นบนโหนดทั้งหมดโดยอัตโนมัติ Amazon RedShift ช่วยให้สามารถเพิ่มโหนดไปยังคลังเก็บข้อมูลได้อย่างง่ายดาย และช่วยให้คุณสามารถรักษาประสิทธิภาพในการสืบค้นที่รวดเร็วขณะที่คลังเก็บข้อมูลขยายออกไปไว้ได้
  • Redshift Spectrum: Redshift Spectrum ช่วยให้คุณสามารถรันการสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 โดยไม่จำเป็นต้องโหลดหรือ ETL ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้ เมื่อสร้างการสืบค้น ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ SQL ของ Amazon Redshift ซึ่งสร้างแผนการสืบค้นขึ้นมา Amazon RedShift จะระบุว่าข้อมูลใดเป็นข้อมูลเฉพาะที่ และข้อมูลใดอยู่ใน Amazon S3 สร้างแผนเพื่อลดจำนวนข้อมูล Amazon S3 ที่ต้องอ่าน ขอโปรแกรมทำงาน Redshift Spectrum จากกลุ่มทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับเข้าไปในคลัสเตอร์ Amazon RedShift เพื่อการประมวลผลใดๆ ที่เหลืออยู่
  • การดูแบบมิติ: การดูแบบมิติทำให้ประสิทธิภาพในการสืบค้นเร็วขึ้นเป็นอย่างมากสำหรับปริมาณงานการวิเคราะห์ที่มีการทำซ้ำและคาดการณ์ได้ อย่างเช่น แดชบอร์ด การสืบค้นจากเครื่องมือ Business Intelligence (BI) และการประมวลผลข้อมูลแบบ ELT (Extract, Load, Transform) คุณสามารถจัดเก็บผลลัพธ์ที่ประมวลผลไว้ล่วงหน้าของการสืบค้นและดูแลรักษาผลลัพธ์เหล่านั้นได้อย่างมีประสิทธิภาพ โดยการประมวลผลการเปลี่ยนแปลงล่าสุดที่เกิดขึ้นกับตารางทรัพยากรเพิ่มขึ้นโดยใช้การดูแบบมิติ การสืบค้นถัดๆ ไปที่อ้างอิงกับการดูแบบมิติจะใช้ผลลัพธ์ที่ประมวลผลไว้ล่วงหน้าเพื่อดำเนินการสืบค้นที่รวดยิ่งขึ้นกว่าเดิมมาก สามารถสร้างการดูแบบมิติได้จากตารางทรัพยากรตั้งแต่หนึ่งตารางขึ้นไปโดยใช้ตัวกรอง การคาดการณ์, Inner Join, การรวม การจัดกลุ่ม ฟังก์ชัน และการสร้าง SQL อื่นๆ
  • ความสามารถในการปรับขนาด: ความสามารถในการประมวลผลและความจุของพื้นที่จัดเก็บของคลังข้อมูลในองค์กรถูกจำกัดโดยข้อจำกัดของฮาร์ดแวร์ในองค์กร RedShift ช่วยให้คุณสามารถปรับขนาดการประมวลผลและพื้นที่จัดเก็บตามที่ต้องการเพื่อตอบสนองปริมาณงานที่มีการเปลี่ยนแปลงอยู่ตลอดเวลา

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon RedShift ได้อย่างไร

คุณสามารถลงทะเบียนและเริ่มใช้งานได้ภายในไม่กี่นาทีจากหน้ารายละเอียดของ Amazon RedShift หรือผ่าน AWS Management Console หากคุณยังไม่มีบัญชี AWS ระบบจะแจ้งเตือนให้คุณสร้างบัญชี โปรดดูที่หน้าการเริ่มใช้งานเพื่อดูวิธีทดลองใช้งาน Amazon RedShift ฟรี

ถาม: ฉันสามารถสร้างและเข้าถึงคลัสเตอร์คลังข้อมูล Amazon RedShift ได้อย่างไร

คุณสามารถสร้างคลัสเตอร์คลังข้อมูล Amazon RedShift ได้อย่างง่ายดายโดยใช้ AWS Management Console หรือ API ของ Amazon RedShift คุณสามารถเริ่มจากคลังข้อมูลแบบโหนดเดียวขนาด 160 GB และปรับขนาดเพิ่มเป็นระดับเพตะไบต์ขึ้นไปได้ในไม่กี่คลิกผ่านคอนโซล AWS หรือการเรียกใช้ API ครั้งเดียว

การกำหนดค่าแบบโหนดเดียวซึ่งเหมาะที่สุดสำหรับการประเมินผลหรือการพัฒนา/ทดสอบปริมาณงาน ช่วยให้คุณสามารถเริ่มใช้งาน Amazon RedShift ได้อย่างรวดเร็วและคุ้มค่า และสามารถปรับเป็นการกำหนดค่าแบบหลายโหนดได้ตามความต้องการในการใช้งานที่เพิ่มมากขึ้น คลัสเตอร์คลังข้อมูล RedShift สามารถมีโหนดประมวลผลได้ 1-128 โหนด โดยขึ้นอยู่กับประเภทโหนด สำหรับรายละเอียด โปรดดูเอกสารประกอบของเรา

การกำหนดค่าแบบหลายโหนดจำเป็นต้องมีโหนดนำที่คอยดูแลการเชื่อมต่อไคลเอนต์และรับการสืบค้น และโหนดประมวลผลสองโหนดที่จัดเก็บข้อมูลและดำเนินการสืบค้นกับการประมวลผล โดยระบบจะจัดเตรียมโหนดนำซึ่งมีขนาดเท่ากับโหนดประมวลผลให้คุณโดยอัตโนมัติและไม่ต้องเสียค่าบริการ

เพียงแค่ระบุ Availability Zone (ไม่บังคับ), จำนวนโหนด, ประเภทโหนด, ชื่อหลักและรหัสผ่าน, กลุ่มความปลอดภัย, การกำหนดค่าระยะเวลาจัดเก็บข้อมูลสำรอง และการตั้งค่าระบบอื่นๆ ที่คุณต้องการ เมื่อคุณเลือกการกำหนดค่าที่ต้องการได้แล้ว Amazon RedShift จะจัดเตรียมทรัพยากรที่จำเป็นต้องใช้ให้และตั้งค่าคลัสเตอร์คลังเก็บข้อมูลของคุณ

เมื่อคลัสเตอร์คลังข้อมูลของคุณพร้อมใช้งานแล้ว คุณสามารถเรียกใช้ตำแหน่งข้อมูลและสตริงการเชื่อมต่อ JDBC และ ODBC ได้จาก AWS Management Console หรือโดยใช้ API ของ RedShift จากนั้น คุณสามารถใช้สตริงการเชื่อมต่อนี้กับเครื่องมือจัดการฐานข้อมูล ภาษาการเขียนโปรแกรม หรือเครื่องมือธุรกิจอัจฉริยะ (BI) ของคุณได้ คุณจะต้องอนุญาตคำขอเครือข่ายสำหรับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่ สำหรับคำอธิบายโดยละเอียด โปรดดูที่ คู่มือการเริ่มใช้งาน ของเรา

ถาม: ความจุพื้นที่จัดเก็บสูงสุดต่อโหนดประมวลผลคือเท่าใด ปริมาณข้อมูลที่แนะนำต่อโหนดประมวลผลสำหรับประสิทธิภาพสูงสุดคือเท่าใด

คุณสามารถสร้างคลัสเตอร์โดยใช้ประเภทโหนด RA3, DC หรือ DS ประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายเงินสำหรับการประมวลผลและพื้นที่จัดเก็บแบบแยกจากกันได้ คุณสามารถเลือกจำนวนอินสแตนซ์ที่คุณต้องการโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายเฉพาะพื้นที่จัดเก็บที่มีการจัดการที่คุณใช้งาน

ทั้งนี้ ประเภทโหนด RA3 จะมีอยู่ด้วยกันสองขนาดคือ RA3.16XL และ RA3.4XL โหนด RA3.16XL แต่ละโหนดมี 48 vCPU, หน่วยความจำ 384 GiB และรองรับ IO ที่ 8 GB/วินาที ทั้งคลัสเตอร์ RA3.16XL และ RA3.4XL จะทำงานด้วยโหนดอย่างน้อยสองโหนด และคลัสเตอร์ RA3.16XL หรือ RA3.4XL ที่มีโหนดขนาดขั้นต่ำสองโหนดจะมีพื้นที่จัดเก็บที่มีการจัดการ 128 TB โควต้าพื้นที่จัดเก็บที่มีการจัดการสำหรับทั้ง RA3.16XL และ RA3.4XL ต่อโหนดคือ 64 TB คลัสเตอร์ RA3.16XL สามารถปรับขนาดได้สูงสุดถึง 128 โหนด ซึ่งจะทำให้สามารถสร้างคลัสเตอร์ที่มีพื้นที่จัดเก็บที่มีการจัดการสูงสุดถึง 8 เพตะไบต์ โหนด RA3.4XL มี 12 vCPU, หน่วยความจำ 96 GiB และรองรับ IO ที่ 2 GB/วินาที คลัสเตอร์ RA3.4XL สามารถปรับขนาดได้สูงสุดถึง 64 โหนด ซึ่งจะทำให้สามารถสร้างคลัสเตอร์ที่มีพื้นที่จัดเก็บที่มีการจัดการสูงสุดถึง 4 เพตะไบต์ หมายเหตุ: ขนาดของพื้นที่จัดเก็บที่มีการจัดการทั้งหมดที่ระบุในที่นี้มีไว้สำหรับจัดเก็บข้อมูลบีบอัด RedShift สามารถบีบอัดข้อมูลให้เล็กลงได้ 3-4 เท่า ดังนั้น ขนาดของข้อมูลที่ยังไม่ได้บีบอัดจะมากกว่าที่ระบุในที่นี้ 3-4 เท่า

นอกจากนี้ ประเภทโหนด DC ยังมีอยู่ด้วยกันสองขนาด Large มีพื้นที่จัดเก็บ SSD ขนาด 160 GB, คอร์เสมือน Intel Xeon E5-2670v2 (Ivy Bridge) สองตัว และ RAM 15 GiB Eight Extra Large มีพื้นที่จัดเก็บ SSD ขนาด 2.56TB, คอร์เสมือน Intel Xeon E5-2670v2 32 ตัว และ RAM 244GiB ซึ่งมากกว่าขนาด Large ถึง 16 เท่า คุณสามารถเริ่มใช้งานโหนด DC2.Large ได้โดยมีค่าบริการ 0.25 USD ต่อชั่วโมง และสามารถเพิ่มเป็นโหนด 128 8XL ได้โดยมีพื้นที่จัดเก็บ SSD ขนาด 326 TB, คอร์เสมือน 3,200 ตัว และ RAM 24TiB

ประเภทโหนด DS มีให้ใช้งานอยู่ด้วยกันสองขนาด ได้แก่ Extra Large และ Eight Extra Large Extra Large (XL) มีพื้นที่จัดเก็บ HDD แบบแม่เหล็กขนาด 2 TB ทั้งหมด 3 ลูก ขณะที่ Eight Extra Large (8XL) มีพื้นที่จัดเก็บ HDD แบบแม่เหล็กขนาด 16 TB ทั้งหมด 24 ลูก DS2.8XLarge มีคอร์เสมือน Intel Xeon E5-2676 v3 (Haswell) 36 ตัว และ RAM 244GiB ส่วน DS2.XL มีคอร์เสมือน Intel Xeon E5-2676 v3 (Haswell) 4 ตัว และ RAM 31GiB

โปรดดูที่หน้าราคาของเราสำหรับรายละเอียดเพิ่มเติม

ถาม: ฉันควรเลือกใช้ Amazon RedShift หรือ Amazon RDS

ทั้ง Amazon RedShift และ Amazon RDS ช่วยให้คุณสามารถรันฐานข้อมูลเชิงสัมพันธ์แบบดั้งเดิมในระบบคลาวด์ได้ในขณะที่ลดภาระในการดูแลจัดการฐานข้อมูล ลูกค้าจะใช้ฐานข้อมูล Amazon RDS เป็นหลักสำหรับปริมาณงานการประมวลผลธุรกรรมทางออนไลน์ (OLTP) ในขณะที่ใช้ RedShift สำหรับการรายงานและการวิเคราะห์เป็นหลัก ปริมาณงาน OLTP จำเป็นจะต้องดำเนินการสืบค้นข้อมูลเฉพาะและสนับสนุนธุรกรรมต่างๆ เช่น การแทรก การอัปเดต และการลบ ได้อย่างรวดเร็ว ซึ่งเป็นสิ่งที่ Amazon RDS สามารถจัดการได้ดีที่สุด Amazon RedShift จะควบคุมดูแลขนาดและทรัพยากรของโหนดทั้งหลายและใช้การปรับประสิทธิภาพให้เหมาะสมหลากหลายรูปแบบ จึงช่วยปรับปรุงให้เหนือกว่าฐานข้อมูลแบบเดิมอย่างมหาศาลในด้านการวิเคราะห์และการรายงานปริมาณงานต่อชุดข้อมูลขนาดใหญ่ Amazon RedShift มีตัวเลือกที่ยอดเยี่ยมในการปรับขยายตามข้อมูลและความซับซ้อนในการสืบค้น หรือหากคุณต้องการป้องกันไม่ให้กระบวนการรายงานและวิเคราะห์ของคุณไปแทรกแซงประสิทธิภาพของปริมาณงาน OLTP ของคุณ ขณะนี้ ด้วยคุณสมบัติคิวรีภายนอกแบบใหม่ คุณจะสามารถสืบค้นข้อมูลใน Amazon RDS ของคุณ หรือบริการฐานข้อมูล Aurora ด้วย Amazon RedShift ได้อย่างง่ายดาย

ถาม: ฉันควรเลือกใช้ Amazon RedShift (Redshift Spectrum) หรือ Amazon EMR

คุณควรใช้ Amazon EMR หากคุณใช้โค้ดแบบกำหนดเองเพื่อประมวลผลและวิเคราะห์ชุดข้อมูลที่มีขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่ เช่น Apache Spark, Hadoop, Presto หรือ Hbase Amazon EMR ช่วยให้คุณสามารถควบคุมการกำหนดค่าคลัสเตอร์และซอฟต์แวร์ที่คุณติดตั้งไว้บนนั้นได้อย่างครบถ้วน

คลังเก็บข้อมูล อาทิ Amazon RedShift ได้รับการออกแบบมาเพื่อดำเนินการวิเคราะห์ประเภทต่างๆ โดยพร้อมกัน คลังเก็บข้อมูลได้รับการออกแบบมาเพื่อรวบรวมข้อมูลจากแหล่งต่างๆ มากมายเอาไว้ด้วยกัน เช่น ระบบสินค้าคงคลัง ระบบการเงิน และระบบการขายปลีก คลังเก็บข้อมูลต้องจัดเก็บข้อมูลในโครงสร้างอย่างดี เพื่อให้แน่ใจว่าการรายงานจะมีความถูกต้องทั่วทั้งบริษัทอยู่เสมอ โครงสร้างนี้กำหนดกฎด้านความสอดคล้องของข้อมูลโดยตรงในตารางฐานข้อมูล Amazon RedShift คือสุดยอดบริการ หากคุณต้องการดำเนินการสืบค้นอันซับซ้อนสำหรับชุดข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างจำนวนมาก และต้องการประสิทธิภาพการทำงานที่รวดเร็วอย่างมาก

ถึงแม้คุณสมบัติ Redshift Spectrum จะเป็นตัวเลือกที่ยอดเยี่ยมในการรันการสืบค้นข้อมูลใน Amazon RedShift และ S3 แต่ก็ไม่ได้เหมาะกับกรณีใช้งานทุกรูปแบบที่องค์กรมักต้องการจากเฟรมเวิร์กการประมวลผลอย่าง Amazon EMR Amazon EMR คือบริการที่เป็นมากกว่าการเปิดใช้การสืบค้น SQL Amazon EMR คือบริการที่มีการจัดการซึ่งจะช่วยให้คุณสามารถประมวลผลและวิเคราะห์ชุดข้อมูลขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่เวอร์ชันล่าสุด เช่น Spark, Hadoop และ Presto กับคลัสเตอร์แบบกำหนดเองเต็มรูปแบบ Amazon EMR ช่วยให้คุณสามารถรันการประมวลผลข้อมูลขนาดใหญ่แบบต่างๆ สำหรับแอปพลิเคชันได้ เช่น แมชชีนเลิร์นนิ่ง การวิเคราะห์กราฟ การแปลงข้อมูล ข้อมูลการสตรีม และอะไรก็ตามที่คุณสามารถเขียนโค้ดได้

คุณสามารถใช้ Redshift Spectrum กับ EMR ได้ Redshift Spectrum ใช้วิธีเดียวกันกับ Amazon EMR ในการจัดเก็บข้อกำหนดตาราง Redshift Spectrum รองรับ Apache Hive Metastore เดียวกันกับที่ Amazon EMR ใช้ในการระบุตำแหน่งข้อมูลและข้อกำหนดตาราง หากคุณใช้งาน Amazon EMR อยู่และมี Hive Metastore แล้ว คุณแค่เพียงกำหนดค่าคลัสเตอร์ Amazon Redshift เท่านั้น หากต้องการใช้งาน จากนั้น คุณสามารถเริ่มการสืบค้นข้อมูลได้ทันทีพร้อมกับงานของ Amazon EMR ดังนั้น หากคุณใช้งาน EMR ในการประมวลผลข้อมูลขนาดใหญ่อยู่แล้ว คุณสามารถใช้งาน Redshift Spectrum ในการสืบค้นข้อมูลได้พร้อมกันโดยไม่แทรกแซงการทำงานของ Amazon EMR

บริการสืบค้น คลังข้อมูล และเฟรมเวิร์กการประมวลผลข้อมูลอันซับซ้อนล้วนแต่มีจุดประสงค์ในการใช้งานที่แตกต่างกันไป คุณแค่เพียงต้องเลือกเครื่องมือที่เหมาะสมกับงานของคุณ

ถาม: ฉันควรใช้ Amazon Athena หรือ Redshift Spectrum

Amazon Athena คือวิธีที่ง่ายที่สุดในการช่วยให้พนักงานสามารถรันการสืบค้นเฉพาะสำหรับข้อมูลใน Amazon S3 เนื่องจาก Athena ไม่ใช้เซิร์ฟเวอร์ จึงไม่มีโครงสร้างพื้นฐานที่ต้องตั้งค่าหรือจัดการ คุณสามารถเริ่มการวิเคราะห์ข้อมูลของคุณได้ทันที

หากคุณเข้าถึงข้อมูลบ่อยครั้งซึ่งเป็นข้อมูลที่ต้องได้รับการจัดเก็บในรูปแบบที่มีโครงสร้างอย่างดีและสอดคล้อง คุณควรใช้คลังข้อมูลอย่าง Amazon RedShift ซึ่งช่วยให้คุณมีความยืดหยุ่นในการจัดเก็บข้อมูลที่มีโครงสร้างและมีการเข้าถึงบ่อยครั้งใน Amazon RedShift และใช้ Redshift Spectrum ในการขยายการสืบค้นของ Amazon RedShift ไปสู่ชุดข้อมูลใน Data Lake ของ Amazon S3 และช่วยให้คุณมีอิสระในการจัดเก็บข้อมูลในที่ที่คุณต้องการ ในรูปแบบที่คุณต้องการ และพร้อมประมวลผลข้อมูลเมื่อคุณต้องการ

ถาม: เหตุใดฉันจึงควรใช้ Amazon RedShift แทนการรันคลัสเตอร์คลังข้อมูล MPP ของฉันเองบน Amazon EC2

Amazon RedShift จะช่วยจัดการงานต่างๆ ที่ใช้เวลานานโดยอัตโนมัติซึ่งเกี่ยวข้องกับการจัดการคลังข้อมูลของคุณเอง ได้แก่:
  • การตั้งค่า: Amazon RedShift ช่วยให้คุณสามารถสร้างคลัสเตอร์คลังข้อมูล กำหนดสคีมาของคุณ และเริ่มโหลดและสืบค้นข้อมูลของคุณได้อย่างง่ายดาย คุณไม่จำเป็นต้องจัดการการจัดเตรียม การกำหนดค่า หรือการแพทช์
  • ความคงทนของข้อมูล: Amazon RedShift จะทำสำเนาข้อมูลของคุณไว้ในคลัสเตอร์คลังข้อมูลและจะสำรองข้อมูลของคุณอย่างต่อเนื่องไปยัง Amazon S3 ซึ่งได้รับการออกแบบมาให้มีความคงทนสูงถึง 99.999999999% Amazon RedShift จะสะท้อนข้อมูลของแต่ละไดรฟ์ไปยังโหนดอื่นๆ ภายในคลัสเตอร์ของคุณ หากไดรฟ์ทำงานล้มเหลว การสืบค้นของคุณจะดำเนินการต่อไปโดยมีเวลาแฝงเพิ่มขึ้นเล็กน้อยในขณะที่ Redshift สร้างไดรฟ์ของคุณขึ้นใหม่จากตัวสำเนา ในกรณีที่โหนดทำงานล้มเหลว Amazon Redshift จะจัดเตรียมโหนดใหม่โดยอัตโนมัติและเริ่มกู้คืนข้อมูลจากไดรฟ์อื่นๆ ภายในคลัสเตอร์หรือจาก Amazon S3 ระบบจะให้ความสำคัญในการกู้คืนข้อมูลที่มีการสืบค้นบ่อยที่สุด การสืบค้นที่มีการดำเนินการบ่อยที่สุดจึงสามารถทำงานได้อย่างรวดเร็ว
  • การปรับขนาด: คุณสามารถเพิ่มหรือลบโหนดจากคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้ด้วยการเรียก API ครั้งเดียวหรือการคลิกไม่กี่ครั้งใน AWS Management Console หากความจุและประสิทธิภาพต้องมีการเปลี่ยนแปลง นอกจากนี้ คุณยังสามารถกำหนดเวลาในการดำเนินงานปรับขนาดและปรับขยายได้โดยใช้ความสามารถตัวกำหนดเวลาใน Redshift ได้อีกด้วย
  • การอัปเดตและการติดตั้งแพทช์โดยอัตโนมัติ: Amazon Redshift จะอัปเกรดและติดตั้งแพทช์สำหรับคลังเก็บข้อมูลของคุณโดยอัตโนมัติ คุณจึงสามารถโฟกัสกับแอปพลิเคชันของคุณได้และไม่ต้องกังวลเรื่องการดูแลจัดการ
  • ความสามารถในการสืบค้นระดับเอกซะไบต์: Redshift Spectrum ช่วยให้คุณสามารถรันการสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 โดยไม่จำเป็นต้องโหลดหรือ ETL ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้

การเก็บค่าบริการ

ถาม: ระบบจะคิดค่าบริการและเรียกเก็บเงินสำหรับการใช้ Amazon Redshift ของฉันอย่างไร

คุณจ่ายเท่าที่คุณใช้ และไม่มีค่าใช้จ่ายขั้นต่ำหรือค่าธรรมเนียมการติดตั้งใดๆ Amazon RedShift รองรับความสามารถในการหยุดชั่วคราวและดำเนินการต่อของคลัสเตอร์ ซึ่งทำให้ง่ายสำหรับคุณในการระงับการเรียกเก็บค่าบริการได้ตามความต้องการในช่วงเวลาที่ไม่มีการใช้งานคลัสเตอร์ ตัวอย่างเช่น คลัสเตอร์ที่ใช้สำหรับการพัฒนาสามารถระงับการเรียกเก็บค่าบริการสำหรับการประมวลผลเมื่อไม่ได้ใช้งาน ในขณะที่หยุดใช้งานคลัสเตอร์ชั่วคราว คุณจะจ่ายเพียงแค่ค่าพื้นที่จัดเก็บของคลัสเตอร์เท่านั้น สำหรับปริมาณงานการผลิตที่มีสถานะคงที่ คุณสามารถรับส่วนลดจำนวนมากเมื่อเทียบกับราคาแบบตามความต้องการ โดยการเปลี่ยนไปใช้อินสแตนซ์แบบเหมาจ่าย

การเรียกเก็บเงินสำหรับคลัสเตอร์คลังข้อมูลจะเริ่มขึ้นต่อเมื่อสามารถใช้งานคลัสเตอร์คลังข้อมูลได้ การเรียกเก็บเงินจะดำเนินต่อไปจนกว่าคลัสเตอร์คลังข้อมูลจะหยุดทำงาน ซึ่งอาจเกิดจากการลบหรืออินสแตนซ์ขัดข้อง โดยระบบจะเรียกเก็บเงินโดยคิดจากสิ่งต่อไปนี้:

  • ชั่วโมงใช้งานโหนดประมวลผล: ชั่วโมงใช้งานโหนดประมวลผลคือจำนวนชั่วโมงรวมที่คุณรันโหนดประมวลผลทั้งหมดตามระยะเวลาการเรียกเก็บเงิน ชั่วโมงใช้งานโหนดจะคิดค่าบริการตามชั่วโมงที่คลัสเตอร์คลังเก็บข้อมูลของคุณกำลังทำงานอยู่ในสถานะพร้อมใช้งาน หากคุณไม่ต้องการให้มีการเรียกเก็บเงินคลัสเตอร์คลังเก็บข้อมูล คุณต้องยกเลิกใช้งานคลัสเตอร์คลังเก็บข้อมูล เพื่อป้องกันไม่ให้มีการเรียกเก็บเงินชั่วโมงใช้งานโหนดเพิ่มเติม ชั่วโมงใช้งานโหนดที่ไม่เต็มชั่วโมงจะคิดค่าบริการเต็มชั่วโมง ระบบจะเรียกเก็บเงิน 1 หน่วยต่อโหนดต่อชั่วโมง ดังนั้น คลัสเตอร์คลังเก็บข้อมูลแบบ 3 โหนดที่ทำงานอยู่ตลอดเวลาเป็นเวลาหนึ่งเดือนเต็มจะมีชั่วโมงใช้งานอินสแตนซ์ทั้งหมด 2,160 ชั่วโมง ระบบจะไม่เรียกเก็บเงินในส่วนของชั่วโมงใช้งานโหนดนำ แต่จะเรียกเก็บเงินเฉพาะโหนดประมวลผลเท่านั้น
  • พื้นที่จัดเก็บที่มีการจัดการ: คุณเสียค่าใช้จ่ายสำหรับข้อมูลที่จัดเก็บในพื้นที่จัดเก็บที่มีการจัดการในอัตรา GB แบบคงที่ต่อเดือนในเขตของคุณ พื้นที่จัดเก็บที่มีการจัดการมาพร้อมกับประเภทโหนด RA3 โดยเฉพาะ และคุณจะจ่ายในราคาเดียวกันกับพื้นที่จัดเก็บที่มีการจัดการของ RedShift ไม่ว่าจะมีขนาดข้อมูลเท่าใดก็ตาม การใช้พื้นที่จัดเก็บที่มีการจัดการจะคิดเป็นรายชั่วโมงตามข้อมูลทั้งหมดที่มีอยู่ในพื้นที่จัดเก็บที่มีการจัดการ คุณสามารถตรวจสอบปริมาณข้อมูลในคลัสเตอร์ RA3 ของคุณผ่าน Amazon CloudWatch หรือ AWS Management Console คุณไม่ต้องเสียค่าธรรมเนียมการถ่ายโอนข้อมูลระหว่างโหนด RA3 และพื้นที่จัดเก็บที่มีการจัดการ ค่าใช้จ่ายสำหรับพื้นที่จัดเก็บที่มีการจัดการไม่ได้รวมค่าใช้จ่ายในการจัดเก็บข้อมูลสำรองเนื่องจากสแน็ปช็อตแบบอัตโนมัติและแบบด้วยตนเอง เมื่อคลัสเตอร์ถูกยกเลิก คุณจะยังคงถูกเรียกเก็บเงินสำหรับการสำรองข้อมูลด้วยตนเองของคุณ
  • พื้นที่จัดเก็บข้อมูลสำรอง: พื้นที่จัดเก็บข้อมูลสำรองคือ พื้นที่จัดเก็บที่เกี่ยวข้องกับสแน็ปช็อตแบบอัตโนมัติและแบบด้วยตัวเองสำหรับคลังข้อมูลของคุณ การเพิ่มระยะเวลาการเก็บข้อมูลสำรองหรือการรับสแน็ปช็อตเพิ่มจะช่วยเพิ่มพื้นที่จัดเก็บข้อมูลสำรองที่คลังข้อมูลของคุณใช้ ไม่เสียค่าใช้จ่ายเพิ่มเติมสำหรับพื้นที่จัดเก็บข้อมูลสำรองสูงสุด 100% ของพื้นที่จัดเก็บที่จัดเตรียมไว้ให้สำหรับคลัสเตอร์คลังข้อมูลที่ใช้งานอยู่ ตัวอย่างเช่น หากคุณมีคลัสเตอร์คลังข้อมูลโหนด XL เดี่ยวที่ใช้งานอยู่ซึ่งมีพื้นที่จัดเก็บอินสแตนซ์เฉพาะที่ขนาด 2 TB เราจะมอบพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 2 TB ต่อเดือน โดยไม่คิดค่าบริการเพิ่มเติม พื้นที่จัดเก็บข้อมูลสำรองที่เกินกว่าขนาดของพื้นที่จัดเก็บที่จัดเตรียมไว้ให้และข้อมูลสำรองที่จัดเก็บหลังจากที่คลัสเตอร์ของคุณสิ้นสุดลงจะถูกเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3
  • การถ่ายโอนข้อมูล: ไม่มีค่าบริการถ่ายโอนข้อมูลสำหรับข้อมูลที่ถ่ายโอนไปยังและออกจาก Amazon Redshift และ Amazon S3 ในภูมิภาคของ AWS เดียวกัน สำหรับการถ่ายโอนข้อมูลอื่นใดทั้งเข้าและออกจาก Amazon RedShift ระบบจะเรียกเก็บเงินตามอัตราค่าบริการถ่ายโอนข้อมูลมาตรฐานของ AWS
  • ข้อมูลที่สแกน: Redshift Spectrum จะเรียกเก็บเงินตามปริมาณข้อมูลของ Amazon S3 ที่สแกนเพื่อดำเนินการสืบค้นของคุณ ไม่มีค่าบริการสำหรับ Redshift Spectrum หากคุณไม่รันการสืบค้น หากคุณจัดเก็บข้อมูลในรูปแบบคอลัมน์ เช่น Parquet หรือ RC ค่าบริการของคุณจะลดลง เนื่องจาก Redshift Spectrum จะสแกนเฉพาะคอลัมน์ที่จำเป็นในการสืบค้นแทนการประมวลผลทั้งแถว ในทำนองเดียวกัน หากคุณบีบอัดข้อมูลโดยใช้หนึ่งในรูปแบบที่ Redshift Spectrum รองรับ ต้นทุนจะลดลง คุณต้องจ่ายเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 สำหรับพื้นที่จัดเก็บข้อมูลและอัตราค่าบริการอินสแตนซ์ Amazon Redshift สำหรับคลัสเตอร์ที่ใช้งาน

ราคาของเราไม่รวมภาษีและอากร ซึ่งรวมถึง VAT และภาษีการขายที่เกี่ยวข้อง เว้นแต่ระบุไว้เป็นอย่างอื่น สำหรับลูกค้าที่มีที่อยู่สำหรับเรียกเก็บเงินในประเทศญี่ปุ่น การใช้บริการของ AWS จะต้องเสียภาษีการบริโภคของประเทศญี่ปุ่น เรียนรู้เพิ่มเติม

สำหรับข้อมูลเกี่ยวกับราคาของ Amazon Redshift โปรดดูที่หน้าราคาของ Amazon Redshift

การผสานรวมและการโหลดข้อมูล

ถาม: ฉันจะโหลดข้อมูลเข้าคลังข้อมูล Amazon RedShift ได้อย่างไร

คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon RedShift ได้จากแหล่งข้อมูลต่างๆ มากมาย ได้แก่ Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue AWS Data Pipelineและ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในองค์กร Amazon RedShift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังเก็บข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'แทรก' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่งแทรก SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ถาม: ฉันจะโหลดข้อมูลจากแหล่งข้อมูล Amazon RDS, Amazon EMR, Amazon DynamoDB และ Amazon EC2 ที่ฉันมีอยู่ไปยัง Amazon RedShift ได้อย่างไร

คุณสามารถใช้คำสั่ง COPY เพื่อโหลดข้อมูลโดยพร้อมกันไปยัง Amazon Redshift โดยตรงจาก Amazon EMR, Amazon DynamoDB หรือโฮสต์ที่เปิดใช้ SSH นอกจากนั้น Redshift Spectrum ยังช่วยให้คุณสามารถโหลดข้อมูลจาก Amazon S3 ไปยังคลัสเตอร์ของคุณได้โดยใช้คำสั่ง INSERT INTO ซึ่งทำให้คุณสามารถโหลดข้อมูลจากรูปแบบต่างๆ เช่น Parquet และ RC ไปยังคลัสเตอร์ของคุณได้ โปรดทราบว่า หากคุณใช้วิธีนี้ ระบบจะคิดค่าบริการสำหรับ Redshift Spectrum เพิ่มขึ้นสำหรับข้อมูลที่สแกนมาจาก Amazon S3 

นอกจากนั้น บริษัท ETL หลายๆ แห่งต่างให้การรับรอง Amazon RedShift ในด้านการใช้งานร่วมกับเครื่องมือของตนเอง และอีกหลายบริษัทยังเสนอช่วงทดลองใช้งานฟรีที่จะช่วยให้คุณเริ่มโหลดข้อมูลของคุณได้อีกด้วย AWS Data Pipeline มีโซลูชันที่ทนต่อข้อผิดพลาด น่าเชื่อถือ และมีประสิทธิภาพสูงในการโหลดข้อมูลจากแหล่งข้อมูลต่างๆ ของ AWS อย่าง Amazon RDS ไปยัง RedShift คุณสามารถใช้ AWS Data Pipeline ในการระบุแหล่งข้อมูลที่ต้องมีการแปลงข้อมูล และเปิดใช้งานสคริปต์นำเข้าที่เขียนไว้ล่วงหน้าเพื่อโหลดข้อมูลไปยัง Amazon RedShift อีกทั้ง AWS Glue ยังเป็นบริการดึง แปลง และโหลดข้อมูล (ETL) ที่มีการจัดการเต็มรูปแบบอีกด้วย ซึ่งช่วยให้สามารถจัดเตรียมและโหลดข้อมูลเพื่อการวิเคราะห์ได้อย่างง่ายดาย คุณสามารถสร้างและรันงาน ETL ของ AWS Glue ได้ด้วยการคลิกไม่กี่ครั้งใน AWS Management Console

ถาม: ฉันมีข้อมูลจำนวนมากที่ต้องโหลดไปยัง Amazon Redshift เป็นครั้งแรก ซึ่งการถ่ายโอนผ่านอินเทอร์เน็ตอาจใช้เวลานาน ฉันจะโหลดข้อมูลนี้อย่างไร

คุณสามารถใช้ AWS Import/Export ในการถ่ายโอนข้อมูลไปยัง Amazon S3 ได้โดยใช้อุปกรณ์จัดเก็บข้อมูลแบบพกพา นอกจากนั้น คุณสามารถใช้ AWS Direct Connect ในการสร้างการเชื่อมต่อเครือข่ายส่วนตัวระหว่างเครือข่ายหรือศูนย์ข้อมูลของคุณกับ AWS ได้ คุณสามารถเลือกพอร์ตการเชื่อมต่อแบบ 1Gbit/วินาที หรือแบบ 10 Gbit/วินาที ในการถ่ายโอนข้อมูลได้

การรักษาความปลอดภัย

ถาม: Amazon RedShift รักษาความปลอดภัยให้กับข้อมูลของฉันอย่างไร

Amazon RedShift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวม AWS IAM ในตัว, การเชื่อมโยงข้อมูลประจำตัวสำหรับการตรวจสอบสิทธิ์แบบ Single-Sign On (SSO), Multi-Factor Authentication, การควบคุมการเข้าถึงระดับคอลัมน์, Amazon Virtual Private Cloud (Amazon VPC) และมอบการผสานรวม AWS KMS ในตัวเพื่อปกป้องข้อมูลของคุณทั้งในระหว่างการส่งและการพักเก็บ Amazon RedShift จะเข้ารหัสและรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอนและข้อมูลที่จัดเก็บโดยใช้เทคนิคการเข้ารหัสตามมาตรฐานอุตสาหกรรม Amazon Redshift รองรับการเชื่อมต่อแบบเปิดใช้ SSL ระหว่างแอปพลิเคชันไคลเอ็นต์และคลัสเตอร์คลังเก็บข้อมูล Redshift ของคุณ เพื่อรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอน Amazon Redshift จะเข้ารหัสแต่ละบล็อกโดยใช้ AES-256 ที่มีการเร่งฮาร์ดแวร์ขณะที่เขียนข้อมูลลงดิสก์ เพื่อรักษาความปลอดภัยให้กับข้อมูลที่จัดเก็บ โดยจะดำเนินการในระดับต่ำภายในระบบย่อย I/O ซึ่งเข้ารหัสทุกข้อมูลที่เขียนลงในดิสก์ รวมถึงผลลัพธ์การสืบค้นระยะกลาง ระบบจะสำรองข้อมูลบล็อกตามเดิม ซึ่งหมายความว่าข้อมูลสำรองจะได้รับการเข้ารหัสด้วยเช่นกัน ตามค่าเริ่มต้น Amazon RedShift จะดูแลการจัดการคีย์ให้ แต่คุณสามารถเลือกที่จะจัดการคีย์ของคุณเองโดยผ่าน AWS Key Management Service มีการมอบคุณสมบัติด้านความปลอดภัยทั้งหมดของ Amazon RedShift ให้มาด้วยโดยไม่มีค่าใช้จ่ายเพิ่มเติม Redshift Spectrum รองรับการเข้ารหัสฝั่งเซิร์ฟเวอร์ (SSE) ของ Amazon S3 โดยใช้คีย์เริ่มต้นของบัญชีผู้ใช้ที่จัดการโดย AWS Key Management Service (KMS)

ถาม: RedShift รองรับการควบคุมการเข้าถึงแบบละเอียด อย่างเช่น ความปลอดภัยระดับคอลัมน์หรือไม่

รองรับ การควบคุมความปลอดภัยระดับคอลัมน์แบบละเอียดช่วยให้ผู้ใช้เห็นเฉพาะข้อมูลที่ควรเข้าถึง Amazon RedShift รองรับการควบคุมการเข้าถึงระดับคอลัมน์สำหรับตารางเฉพาะที่ ดังนั้นคุณจึงสามารถควบคุมการเข้าถึงคอลัมน์แต่ละคอลัมน์ของตาราง หรือดูตามการมอบ/การเพิกถอนสิทธิ์ระดับคอลัมน์แก่ผู้ใช้หรือกลุ่มของผู้ใช้ RedShift ได้รับการผสานรวมเข้ากับ AWS Lake Formation ซึ่งช่วยสร้างความมั่นใจว่าการควบคุมการเข้าถึงระดับคอลัมน์ของ Lake Formation จะถูกบังคับใช้สำหรับการสืบค้น RedShift กับข้อมูลใน Data Lake

ถาม: RedShift รองรับการตรวจสอบสิทธิ์แบบ Single Sign-On หรือไม่

รองรับ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร อย่างเช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า Amazon RedShift ให้รองรับการตรวจสอบสิทธิ์แบบ Single-Sign On ได้

ถาม: RedShift รองรับการตรวจสอบสิทธิ์แบบ Single-Sign On ด้วย Microsoft Azure Active Directory ได้อย่างไร

คุณสามารถลงชื่อเข้าใช้คลัสเตอร์ Amazon RedShift ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถลงชื่อเข้าใช้ RedShift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน RedShift

ถาม: Amazon RedShift รองรับ Multi-Factor Authentication (MFA) หรือไม่

รองรับ คุณสามารถใช้ Multi-Factor Authentication (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ Amazon RedShift

ถาม: ฉันสามารถใช้ Amazon RedShift ใน Amazon Virtual Private Cloud (Amazon VPC) ได้หรือไม่

ได้ คุณสามารถใช้ Amazon RedShift เป็นส่วนหนึ่งในการกำหนดค่า VPC ของคุณได้ คุณสามารถกำหนดโครงสร้างเครือข่ายเสมือนที่มีความคล้ายกับเครือข่ายแบบเดิมที่คุณอาจใช้งานได้ในศูนย์ข้อมูลของคุณเองด้วย Amazon VPC ซึ่งจะช่วยให้คุณสามารถควบคุมได้ว่าใครบ้างที่สามารถเข้าถึงคลัสเตอร์คลังเก็บข้อมูล Amazon RedShift ของคุณได้ คุณสามารถใช้ Redshift Spectrum ร่วมกับคลัสเตอร์ Amazon Redshift ที่เป็นส่วนหนึ่งของ VPC ได้

ถาม: ฉันสามารถเข้าถึงโหนดประมวลผล Amazon Redshift ได้โดยตรงหรือไม่

ไม่ได้ โหนดประมวลผล Amazon Redshift ของคุณจะอยู่ในเครือข่ายส่วนตัวและสามารถเข้าถึงได้จากโหนดนำของคลัสเตอร์คลังเก็บข้อมูลของคุณเท่านั้น ซึ่งจะช่วยเพิ่มระดับความปลอดภัยให้ข้อมูลของคุณ

ความพร้อมใช้งานและความคงทน

ถาม: ถ้าไดรฟ์บนโหนดตัวใดตัวหนึ่งของฉันล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความทนทานของข้อมูลของฉัน

Amazon RedShift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณในอัตโนมัติ คลัสเตอร์คลังเก็บข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้ คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล

ถาม: ในกรณีที่โหนดบางตัวทำงานล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

Amazon RedShift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณในอัตโนมัติ คลัสเตอร์คลังเก็บข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้ คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล

ถาม: หาก Availability Zone (AZ) ของคลัสเตอร์คลังเก็บข้อมูลเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

หากไม่สามารถใช้งาน Availability Zone ของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ของคุณได้ คุณจะไม่สามารถใช้งานคลัสเตอร์ของคุณได้จนกว่าจะสามารถกู้คืนพลังงานและการเข้าถึงเครือข่าย AZ ได้ ระบบจะจัดเก็บข้อมูลของคลัสเตอร์คลังเก็บข้อมูลเอาไว้ คุณจึงสามารถเริ่มใช้งานคลังเก็บข้อมูล Amazon Redshift ได้ทันทีที่สามารถใช้งาน AZ ได้อีกครั้ง นอกจากนั้น คุณยังสามารถเลือกที่จะกู้คืนสแนปช็อตที่มีอยู่ไปยัง AZ ใหม่ในภูมิภาคเดียวกันได้อีกด้วย Amazon RedShift จะกู้คืนข้อมูลที่มีการเข้าถึงบ่อยที่สุดก่อน คุณจึงสามารถดำเนินการสืบค้นต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้

ถาม: Amazon Redshift รองรับการปรับใช้หลาย AZ หรือไม่

Amazon Redshift รองรับเฉพาะการปรับใช้ AZ เดียวเท่านั้นในตอนนี้ คุณสามารถรันคลัสเตอร์คลังเก็บข้อมูลในหลาย AZ ได้ด้วยการโหลดข้อมูลไปยังคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ทั้งสองตัวใน AZ ต่างกันจากชุดไฟล์อินพุต Amazon S3 เดียวกัน Redshift Spectrum ช่วยให้คุณสามารถเปิดใช้คลัสเตอร์ตาม AZ ต่างๆ ได้หลายตัว และสามารถเข้าถึงข้อมูลใน Amazon S3 โดยไม่ต้องโหลดไปยังคลัสเตอร์ของคุณ นอกจากนี้ คุณยังสามารถกู้คืนคลัสเตอร์คลังเก็บข้อมูลไปยัง AZ อื่นได้จากสแนปช็อตคลัสเตอร์คลังเก็บข้อมูลของคุณ

การสำรองและการกู้คืนข้อมูล

ถาม: Amazon RedShift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร

Amazon RedShift จะทำสำเนาข้อมูลทั้งหมดภายในคลัสเตอร์คลังข้อมูลหากมีการโหลดเอาไว้ และจะสำรองข้อมูลของคุณไปยัง Amazon S3 อยู่เสมอด้วยเช่นกัน Amazon RedShift จะจัดเก็บสำเนาข้อมูลไว้อย่างน้อยสามชุดเสมอ (ข้อมูลต้นฉบับและสำเนาข้อมูลบนโหนดประมวลผลและข้อมูลสำรองใน Amazon S3) RedShift ยังสามารถทำสำเนาสแน็ปช็อตของคุณแบบไม่พร้อมกันไปยัง S3 ในเขตอื่นได้อีกด้วย เพื่อการกู้ข้อมูลคืนกรณีเกิดภัยพิบัติ

ตามค่าเริ่มต้น Amazon Redshift จะเปิดใช้การสำรองข้อมูลคลัสเตอร์คลังเก็บข้อมูลแบบอัตโนมัติโดยมีระยะเวลาเก็บรักษา 1 วัน คุณสามารถกำหนดให้มีระยะเวลานานถึง 35 วันได้

โดยจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้ AWS Management Console หรือ API ของ Amazon RedShift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแน็ปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon RedShift Amazon RedShift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้น สแน็ปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย

หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังเก็บข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว

ถาม: ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร

คุณสามารถใช้ AWS Management Console หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)

ถาม: หากฉันลบคลัสเตอร์คลังเก็บข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน

หากคุณลบคลัสเตอร์คลังเก็บข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังเก็บข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังเก็บข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่ว่าคุณเลือกที่จะลบออก

ความสามารถในการปรับขนาด

ถาม: ฉันสามารถปรับขนาดและประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังเก็บข้อมูลได้โดยใช้ Elastic Resize ผ่าน AWS Management Console หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังเก็บข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลไปยังคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนั้น คุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้

คุณสมบัติปรับขนาดจำนวนผู้ใช้พร้อมกันเปิดโอกาสให้คุณสามารถสนับสนุนผู้ใช้และการสืบค้นได้แทบไม่จำกัดจำนวนด้วยประสิทธิภาพการสืบค้นที่รวดเร็วอย่างต่อเนื่อง เมื่อมีการเปิดใช้งานการปรับขนาดจำนวนผู้ใช้พร้อมกัน Amazon Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อคุณต้องใช้ในการประมวลผลการเพิ่มขึ้นของคำสั่งการอ่านพร้อมกัน

Redshift Spectrum ช่วยให้คุณสามารถรันคลัสเตอร์ Amazon Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกัน เพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ Amazon RedShift เพื่อการประมวลผลใดๆ ที่เหลืออยู่

ถาม: ฉันจะยังสามารถใช้งานคลัสเตอร์คลังข้อมูลของฉันในระหว่างการปรับขนาดได้หรือไม่

ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ RedShift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ

กระบวนการทำงานพร้อมกัน

คำถาม: ฉันจะจัดการทรัพยากรอย่างไรเพื่อให้แน่ใจว่าคลัสเตอร์ Redshift ของฉันจะสามารถให้ประสิทธิภาพที่รวดเร็วอย่างต่อเนื่องในช่วงที่มีการทำงานพร้อมกันสูงได้

คลังข้อมูลทั่วไปมีความแปรปรวนอย่างมากในการใช้การสืบค้นพร้อมกันตลอดทั้งวัน การเพิ่มทรัพยากรในช่วงเวลาที่ต้องการจึงประหยัดคุ้มค่ากว่าการจัดเตรียมให้กับช่วงที่มีความต้องการสูง Amazon Redshift จัดการดำเนินการนี้ในนามของคุณโดยอัตโนมัติ

การปรับขนาดพร้อมกันเป็นคุณสมบัติใน Amazon Redshift ที่จะให้ประสิทธิภาพการสืบค้นที่รวดเร็วอย่างต่อเนื่องแม้ว่าจะมีการสืบค้นเกิดขึ้นพร้อมกันหลายพันรายการ ด้วยคุณสมบัตินี้ Amazon Redshift จะเพิ่มความจุคลัสเตอร์ชั่วคราวโดยอัตโนมัติเมื่อจำเป็นต้องรองรับความต้องการใช้งานจำนวนมาก Amazon Redshift จะกำหนดเส้นทางการสืบค้นโดยอัตโนมัติเพื่อปรับขนาดคลัสเตอร์ซึ่งได้รับการจัดเตรียมในไม่กี่วินาทีและเริ่มการประมวลผลสืบค้นในทันที

คุณสมบัตินี้ฟรีสำหรับลูกค้าส่วนใหญ่ แต่ละคลัสเตอร์ Amazon Redshift ได้รับเครดิตการปรับขนาดพร้อมกันสูงสุดหนึ่งชั่วโมงต่อวัน ซึ่งจะช่วยให้คุณสามารถคาดการณ์ค่าใช้จ่ายแบบรายเดือนได้แม้ในช่วงที่ความต้องการวิเคราะห์มีความผันผวน

คำถาม: Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร

Elastic Resize เพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการปริมาณงานสืบค้น ตัวอย่างเช่น ปริมาณงาน ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มการทำงานพร้อมกันของการสืบค้นโดยรวม

คำถาม: ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่

ไม่ได้ การปรับขนาดข้อมูลพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ RedShift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง

การสืบค้นและการวิเคราะห์

ถาม: Amazon Redshift และ Redshift Spectrum ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ได้หรือไม่

Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานรวมที่ได้รับการตรวจสอบแล้วกับผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยแต่ละรายมีช่วงทดลองใช้งานฟรีเพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อปรับใช้และกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที

Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ

คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้

ถาม: Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดประเภทใด

ในปัจจุบัน Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV

Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy แล้วในตอนนี้

ถาม: จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก

คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน

ถาม: ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake ของ S3 แล้วฉันสามารถใช้ Redshift Spectrum ได้หรือไม่

ได้ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้

ถาม: ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร

คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้

การตรวจสอบ

ถาม: ฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนั้น คุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้ AWS Management Console มี monitoring dashboard สำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ Amazon RedShift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่าน AWS Management Console อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่

การบำรุงรักษา

ถาม: ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังเก็บข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่

Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราว เพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยแก้ไขคลัสเตอร์โดยทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon RedShift ในการทำงานทั่วไปได้ระหว่างการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตามภูมิภาค โปรดดูที่ระยะเวลาบำรุงรักษาในคู่มือการจัดการ Amazon Redshift

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Redshift

ไปที่หน้าราคา
พร้อมสร้างหรือยัง
เริ่มต้นใช้งาน Amazon Redshift
มีคำถามเพิ่มเติมหรือไม่
ติดต่อเรา