ข้อมูลทั่วไป

ถาม: Amazon RedShift คืออะไร

Amazon Redshift เป็นคลังข้อมูลที่มีการจัดการแบบเต็มรูปแบบอย่างรวดเร็วซึ่งทำให้วิเคราะห์ข้อมูลทั้งหมดของคุณได้ง่ายและประหยัดค่าใช้จ่าย โดยใช้ SQL มาตรฐานและเครื่องมือ Business Intelligence (BI) ที่มีอยู่ของคุณ ซึ่งทำให้คุณสามารถรันการสืบค้นการวิเคราะห์ข้อมูลที่มีการจัดโครงสร้างระดับเพตะไบต์ที่มีความซับซ้อนได้ โดยใช้การปรับการสืบค้นที่ซับซ้อนให้เหมาะสม พื้นที่จัดเก็บแบบคอลัมน์บนดิสก์เฉพาะที่มีประสิทธิภาพสูง และการดำเนินการสืบค้นแบบคู่ขนานจำนวนมาก ได้รับผลลัพธ์ส่วนใหญ่กลับมาในเวลาไม่กี่วินาที Redshift ช่วยให้คุณสามารถเริ่มจาก 0.25 USD ต่อชั่วโมง โดยไม่มีข้อผูกมัดใดๆ และปรับขนาดเป็นข้อมูลระดับเพตะไบต์ได้ที่ 1,000 USD ต่อเทราไบต์ต่อปี ซึ่งมีค่าใช้จ่ายน้อยกว่าหนึ่งในสิบของโซลูชันแบบเดิม Amazon Redshift ยังมี Amazon Redshift Spectrum ซึ่งทำให้คุณสามารถรันการสืบค้น SQL สำหรับข้อมูลระดับเอกซะไบต์แบบไม่มีโครงสร้างใน Amazon S3 ได้โดยตรง โดยไม่จำเป็นต้องโหลดหรือแปลงข้อมูล และคุณสามารถใช้รูปแบบข้อมูลแบบเปิดได้ ได้แก่ Avro, CSV, Grok, Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile และ TSV Redshift Spectrum ปรับขนาดความสามารถในการประมวลผลการสืบค้นได้โดยอัตโนมัติตามข้อมูลที่กำลังเรียกดู ดังนั้นจึงสามารถรันการสืบค้นใน Amazon S3 ได้อย่างรวดเร็ว ไม่ว่าชุดข้อมูลจะมีขนาดเท่าใดก็ตาม

คลังเก็บข้อมูลแบบเดิมต้องใช้เวลาและทรัพยากรมากในการดูแลจัดการ โดยเฉพาะกับชุดข้อมูลขนาดใหญ่ นอกจากนั้น ต้นทุนทางการเงินที่เกี่ยวกับการสร้าง การบำรุงรักษา และการขยายคลังเก็บข้อมูลภายในแบบจัดการตนเองยังสูงมากอีกด้วย เมื่อข้อมูลขยายมากขึ้น คุณจำเป็นต้องเลือกว่าจะโหลดข้อมูลใดลงในคลังเก็บข้อมูลหรือจัดเก็บข้อมูลใดลงในพื้นที่จัดเก็บ เพื่อให้คุณสามารถจัดการต้นทุน รักษาให้ความซับซ้อนของ ETL อยู่ในระดับต่ำ และมีประสิทธิภาพการทำงานที่ดี Amazon Redshift ไม่เพียงแค่ช่วยลดต้นทุนและค่าใช้จ่ายในการดำเนินงานของคลังเก็บข้อมูลได้อย่างมาก แต่ Redshift Spectrum ยังช่วยให้สามารถวิเคราะห์ข้อมูลขนาดใหญ่ในรูปแบบดั้งเดิมได้อย่างง่ายดายโดยไม่ต้องโหลดข้อมูล

Amazon Redshift มีความสามารถในการสืบค้นข้อมูลที่มีการจัดโครงสร้างที่รวดเร็วโดยใช้ไคลเอ็นต์และระบบธุรกิจอัจฉริยะ (BI) บน SQL โดยใช้การเชื่อมต่อ ODBC และ JDBC มาตรฐาน การสืบค้นจะถูกกระจายออกไปและประมวลผลพร้อมกันตามทรัพยากรทั้งหลาย คุณสามารถเพิ่มหรือลดขนาดคลังเก็บข้อมูล Amazon Redshift ได้อย่างง่ายดายโดยการคลิกเพียงไม่กี่ครั้งใน AWS Management Console หรือการเรียก API ครั้งเดียว Amazon RedShift จะติดตั้งแพทช์และสำรองข้อมูลในคลังเก็บข้อมูลของคุณโดยอัตโนมัติ ซึ่งจะจัดเก็บข้อมูลสำรองตามระยะเวลาเก็บรักษาที่ผู้ใช้กำหนด Amazon RedShift ใช้การสำรองข้อมูลแบบจำลองอย่างต่อเนื่อง เพื่อปรับปรุงความพร้อมใช้งานและพัฒนาความคงทนของข้อมูล และสามารถกู้คืนข้อมูลได้โดยอัตโนมัติจากการทำงานล้มเหลวของส่วนประกอบและโหนด นอกจากนั้น Amazon Redshift ยังรองรับ Amazon Virtual Private Cloud (Amazon VPC), SSL, การเข้ารหัส AES-256 และ Hardware Security Modules (HSMs) เพื่อปกป้องข้อมูลระหว่างการถ่ายโอนและข้อมูลในพื้นที่จัดเก็บ

บริการนี้จะเหมือนกันกับ Amazon Web Services ทั้งหมดคือ จะไม่มีการเรียกเก็บเงินล่วงหน้า และคุณจ่ายเพียงแค่ค่าทรัพยากรเท่าที่ใช้เท่านั้น Amazon RedShift ให้คุณจ่ายเฉพาะที่คุณใช้เท่านั้น คุณสามารถทดลองใช้งาน Amazon Redshift ได้ฟรี

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความพร้อมใช้งานตามภูมิภาคของ Amazon Redshift โปรดดูที่ตารางภูมิภาคของ AWS

ถาม: Redshift Spectrum คืออะไร

Redshift Spectrum เป็นคุณสมบัติของ Amazon Redshift ที่ให้คุณสามารถรันการสืบค้นกับข้อมูลไร้โครงสร้างที่มากถึงระดับเอกซะไบต์ใน Amazon S3 ได้โดยไม่ต้องโหลดหรือ ETL เมื่อสร้างการสืบค้น ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ SQL ของ Amazon Redshift ซึ่งสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 สร้างแผนในการลดจำนวนข้อมูลของ Amazon S3 ที่ต้องอ่านให้น้อยที่สุด ส่งคำขอโปรแกรมทำงานของ Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3

Redshift Spectrum จะใช้อินสแตนซ์เพิ่มขึ้นถึงหลักพันหากจำเป็น ดังนั้นการสืบค้นจะทำงานได้รวดเร็วไม่ว่าข้อมูลจะมีขนาดเท่าใด และคุณสามารถนำ SQL เดียวกันกับที่ใช้สำหรับสืบค้น Amazon Redshift ในวันนี้ ไปใช้กับข้อมูล Amazon S3 และเชื่อมต่อจุดปลายทาง Amazon Redshift เดียวกันโดยใช้เครื่องมือ BI เดิมได้ Redshift Spectrum ช่วยให้คุณสามารถแยกพื้นที่จัดเก็บและประมวลผลได้ ซึ่งคุณจะสามารถปรับขนาดได้อย่างอิสระ คุณสามารถตั้งค่า Amazon Redshift ได้หลายคลัสเตอร์ตามที่คุณต้องการ เพื่อสืบค้น Data Lake ของ Amazon S3 โดยมีความพร้อมใช้งานสูงและใช้งานพร้อมกันได้อย่างไม่จำกัด Redshift Spectrum ให้คุณมีอิสระในการจัดเก็บข้อมูลในที่ที่คุณต้องการ ในรูปแบบที่คุณต้องการ และพร้อมประมวลผลข้อมูลเมื่อคุณต้องการ

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับความพร้อมใช้งานตามภูมิภาคของ Redshift Spectrum โปรดไปที่หน้าราคาของ Amazon Redshift

ถาม: Amazon Redshift จะจัดการอะไรแทนฉันบ้าง

Amazon Redshift ช่วยจัดการงานที่จำเป็นต้องตั้งค่า ประมวลผล และปรับขนาดคลังเก็บข้อมูล ตั้งแต่การจัดเตรียมความจุไร้โครงสร้างไปจนถึงการดำเนินการงานบริหารจัดการโดยอัตโนมัติ เช่น การสำรองข้อมูล และการติดตั้งแพทช์ Amazon Redshift จะคอยตรวจสอบโหนดและไดรฟ์ของคุณโดยอัตโนมัติ เพื่อช่วยคุณกู้คืนข้อมูลจากการทำงานผิดพลาดได้ สำหรับ Redshift Spectrum Amazon Redshift ช่วยจัดการทุกโครงสร้างการประมวล การบาลานซ์โหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3

ถาม: ประสิทธิภาพการทำงานของ Amazon Redshift เปรียบเทียบกับฐานข้อมูลแบบดั้งเดิมในส่วนคลังเก็บข้อมูลและการวิเคราะห์เป็นอย่างไรบ้าง

Amazon RedShift ใช้นวัตกรรมมากมายเพื่อให้มีประสิทธิภาพสูงกว่าฐานข้อมูลแบบดั้งเดิมในส่วนคลังเก็บข้อมูลและการวิเคราะห์ข้อมูลถึง 10 เท่า:

  • พื้นที่จัดเก็บข้อมูลแบบคอลัมน์: แทนที่จะจัดเก็บข้อมูลเป็นแถว แต่ Amazon Redshift จะเลือกจัดเก็บข้อมูลเป็นคอลัมน์แทน ระบบจัดเก็บแบบคอลัมน์เหมาะสำหรับคลังเก็บข้อมูลและการวิเคราะห์ข้อมูลที่การสืบค้นมักมีส่วนเกี่ยวข้องกับการรวบรวมชุดข้อมูลขนาดใหญ่ ซึ่งไม่เหมือนกันระบบจัดเก็บแบบแถวซึ่งเหมาะสำหรับการประมวลผลธุรกรรม ระบบจัดเก็บแบบคอลัมน์ใช้ I/O ที่ค่อนข้างน้อยกว่ามาก เนื่องจากระบบจะประมวลผลเฉพาะคอลัมน์ที่มีส่วนเกี่ยวข้องในการสืบค้นเท่านั้นและจะจัดเก็บข้อมูลแบบคอลัมน์ไว้บนพื้นที่จัดเก็บตามลำดับ ซึ่งช่วยให้มีประสิทธิภาพในการสืบค้นเพิ่มขึ้นมาก
  • การบีบอัดขั้นสูง: การจัดเก็บข้อมูลแบบคอลัมน์สามารถบีบอัดได้มากกว่าการจัดเก็บข้อมูลแบบแถว เนื่องจากระบบจะจัดเก็บข้อมูลที่คล้ายกันไว้เป็นลำดับบนดิสก์ Amazon Redshift ใช้เทคนิคการบีบอัดมากมายและมีการบีบอัดที่สำคัญต่อการจัดเก็บข้อมูลสัมพันธ์แบบดั้งเดิม นอกจากนั้น Amazon RedShift ยังไม่จำเป็นต้องมีดัชนีหรือมุมมองจริงอีกด้วย อีกทั้งยังใช้พื้นที่น้อยกว่าระบบฐานข้อมูลสัมพันธ์แบบดั้งเดิม ขณะโหลดข้อมูลลงในตารางเปล่า Amazon RedShift จะสุ่มตัวอย่างข้อมูลของคุณและเลือกรูปแบบการบีบอัดที่เหมาะสมที่สุดโดยอัตโนมัติ
  • การประมวลผลแบบขนาดปริมาณมาก (MPP): Amazon Redshift จะกระจายข้อมูลและโหลดการสืบค้นบนโหนดทั้งหมดโดยอัตโนมัติ Amazon RedShift ช่วยให้สามารถเพิ่มโหนดไปยังคลังเก็บข้อมูลได้อย่างง่ายดาย และช่วยให้คุณสามารถรักษาประสิทธิภาพในการสืบค้นที่รวดเร็วขณะที่คลังเก็บข้อมูลขยายออกไปไว้ได้
  • Redshift Spectrum: Redshift Spectrum ช่วยให้คุณสามารถรันการสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 โดยไม่จำเป็นต้องโหลดหรือ ETL ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้ เมื่อสร้างการสืบค้น ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ SQL ของ Amazon Redshift ซึ่งสร้างแผนการสืบค้นขึ้นมา Amazon Redshift จะระบุว่าข้อมูลใดเป็นข้อมูลเฉพาะที่ และข้อมูลใดอยู่ใน Amazon S3 สร้างแผนเพื่อลดจำนวนข้อมูล Amazon S3 ที่ต้องอ่าน ขอโปรแกรมทำงาน Redshift Spectrum จากกลุ่มทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับเข้าไปในคลัสเตอร์ Amazon Redshift เพื่อการประมวลผลที่เหลืออยู่ใดๆ

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Redshift ได้อย่างไร

คุณสามารถลงชื่อสมัครใช้งานและเริ่มใช้งานได้ภายในไม่กี่นาทีจากหน้ารายละเอียดของ Amazon Redshift หรือผ่าน AWS Management Console หากคุณยังไม่มีบัญชี AWS ระบบจะแจ้งเตือนให้คุณสร้างบัญชี

หากต้องการใช้ Redshift Spectrum คุณต้องจัดเก็บข้อมูลของคุณไว้ใน Amazon S3 ก่อน จากนั้น คุณจะสามารถกำหนดข้อมูลเมตาสำหรับข้อมูลในคลัสเตอร์ Amazon Redshift ของคุณหรือลงทะเบียนข้อมูลเมตาที่คุณอาจมีอยู่แล้วในพื้นที่จัดเก็บเมตา Hive กับคลัสเตอร์ของคุณ คุณสามารถออกคำสั่ง CREATE EXTERNAL SCHEMA SQL ในคลัสเตอร์ Amazon Redshift ของคุณได้ เพื่อกำหนดหรือลงทะเบียนฐานข้อมูลในแค็ตตาล็อกของคุณเป็นสคีมาภายนอกใน Amazon Redshift คุณสามารถดำเนินการสืบค้นใน Amazon S3 โดยใช้ SQL เดียวกันที่คุณใช้สำหรับตารางภายในและเครื่องมือ BI ใดๆ ที่รองรับ Amazon Redshift ในปัจจุบัน การกำหนดฐานข้อมูลภายนอกที่คุณสร้างโดยใช้ SQL ของ Amazon Redshift จะได้รับการลงทะเบียนในแค็ตตาล็อกข้อมูลเดียวกันที่ Amazon Athena ใช้ คุณสามารถจัดการการกำหนดฐานข้อมูลภายนอกจากแค็ตตาล็อก Amazon Athena ได้เช่นกัน

โปรดดูที่หน้าการเริ่มใช้งานของเรา เพื่อดูวิธีทดลองใช้งาน Amazon Redshift ฟรี

ถาม: ฉันสามารถสร้างและเข้าถึงคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

คุณสามารถสร้างคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้โดยใช้ AWS Management Console หรือ API ของ Amazon Redshift คุณสามารถเริ่มจากคลังเก็บข้อมูลแบบโหนดเดียวขนาด 160GB และปรับขนาดเพิ่มเป็นระดับเพตะไบต์ขึ้นไปได้ในไม่กี่คลิกผ่าน AWS Console หรือการเรียก API ครั้งเดียว

การกำหนดค่าแบบโหนดเดียวช่วยให้คุณสามารถเริ่มใช้งาน Amazon RedShift ได้อย่างรวดเร็วและคุ้มค่า และสามารถปรับเป็นการกำหนดค่าแบบหลายโหนดได้ตามความต้องการของคุณที่เพิ่มมากขึ้น คลัสเตอร์คลังเก็บข้อมูล Redshift สามารถมีโหนดประมวลผลได้ 1-128 โหนด โดยขึ้นอยู่กับประเภทโหนด สำหรับรายละเอียด โปรดดูเอกสารประกอบของเรา

การกำหนดค่าแบบหลายโหนดจำเป็นต้องมีโหนดนำที่คอยดูแลการเชื่อมต่อไคลเอ็นต์และรับการสืบค้น และโหนดประมวลผล 2 โหนดที่จัดเก็บข้อมูลและดำเนินการสืบค้นกับประมวลผล โดยระบบจะจัดเตรียมโหนดนำให้คุณโดยอัตโนมัติและไม่ต้องเสียค่าบริการ

เพียงแค่ระบุ Availability Zone (ไม่บังคับ), จำนวนโหนด, ประเภทโหนด, ชื่อหลักและรหัสผ่าน, กลุ่มรักษาความปลอดภัย, การกำหนดค่าระยะเวลาจัดเก็บข้อมูลสำรอง และการตั้งค่าระบบอื่นๆ ที่คุณต้องการ เมื่อคุณเลือกการกำหนดค่าที่ต้องการได้แล้ว Amazon RedShift จะจัดเตรียมทรัพยากรที่จำเป็นต้องใช้ให้และตั้งค่าคลัสเตอร์คลังเก็บข้อมูลของคุณ

เมื่อคลัสเตอร์คลังเก็บข้อมูลของคุณพร้อมใช้งานแล้ว คุณสามารถเรียกใช้ตำแหน่งข้อมูลและสตริงการเชื่อมต่อ JDBC และ ODBC ได้จาก AWS Management Console หรือโดยใช้ API ของ Redshift จากนั้น คุณสามารถใช้สตริงการเชื่อมต่อนี้กับเครื่องมือจัดการฐานข้อมูล ภาษาการเขียนโปรแกรม หรือเครื่องมือธุรกิจอัจฉริยะ (BI) ของคุณได้ คุณจะต้องอนุญาตคำขอเครือข่ายสำหรับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่ สำหรับคำอธิบายโดยละเอียด โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ถาม: โหนดนำสามารถทำอะไรได้บ้าง โหนดประมวลผลสามารถทำอะไรได้บ้าง

โหนดนำจะรับการสืบค้นจากแอปพลิเคชันของไคลเอ็นต์ แยกวิเคราะห์การสืบค้นต่างๆ และพัฒนาแผนดำเนินการ ซึ่งเป็นชุดขั้นตอนตามสั่งในการประมวลผลการสืบค้นเหล่านี้ จากนั้นโหนดนำจะประสานงานแผนการดำเนินการแบบขนานเหล่านี้เข้ากับโหนดประมวลผล รวบรวมผลลัพธ์กลางจากโหนดเหล่านี้ และส่งผลลัพธ์กลับไปยังแอปพลิเคชันของไคลเอ็นต์

โหนดประมวลผลจะดำเนินขั้นตอนตามที่ระบุไว้ในแผนดำเนินการและส่งผ่านข้อมูลภายในโหนดเพื่อดำเนินการสืบค้น โดยจะส่งผลลัพธ์กลางกลับไปยังโหนดนำเพื่อดำเนินการรวบรวมก่อนที่จะส่งกลับไปยังแอปพลิเคชันของไคลเอ็นต์

ถาม: ความจุพื้นที่จัดเก็บสูงสุดต่อโหนดประมวลผลคือเท่าใด ปริมาณข้อมูลที่แนะนำต่อโหนดประมวลผลสำหรับประสิทธิภาพสูงสุดคือเท่าใด

คุณสามารถสร้างคลัสเตอร์โดยใช้ประเภทโหนด Dense Storage (DS) หรือประเภทโหนด Dense Compute (DC) ประเภทโหนด Dense Storage ช่วยให้คุณสามารถสร้างคลังข้อมูลขนาดใหญ่โดยใช้ฮาร์ดดิสก์ไดรฟ์ (HDD) โดยมีราคาต่ำมาก ประเภทโหนด Dense Compute ช่วยให้คุณสามารถสร้างคลังข้อมูลที่มีประสิทธิภาพสูงมากโดยใช้ CPU ที่ทำงานได้รวดเร็ว, RAM จำนวนมาก และโซลิดสเตทดิสก์ (SSD)

ประเภทโหนด Dense Storage (DS) มีให้ใช้งานอยู่ด้วยกัน 2 ขนาด ได้แก่ Extra Large และ Eight Extra Large Extra Large (XL) มี HDD แบบแม่เหล็กขนาด 2TB ทั้งหมด 3 ตัว ขณะที่ Eight Extra Large (8XL) มี HDD แบบแม่เหล็กขนาด 16TB ทั้งหมด 24 ตัว DS2.8XLarge มีคอร์เสมือน Intel Xeon E5-2676 v3 (Haswell) 36 ตัว และ RAM 244GiB ส่วน DS2.XL มีคอร์เสมือน Intel Xeon E5-2676 v3 (Haswell) 4 ตัว และ RAM 31GiB โปรดดูที่หน้าราคาของเราสำหรับรายละเอียดเพิ่มเติม คุณสามารถเริ่มใช้งานคลังเก็บข้อมูลขนาด 2TB แบบโหนด Extra Large เดี่ยวได้โดยมีค่าบริการที่ 0.85 USD ต่อชั่วโมง และสามารถเพิ่มเป็นระดับเพตะไบต์ขึ้นไปได้ คุณสามารถจ่ายค่าบริการเป็นรายชั่วโมงได้หรือใช้ราคาอินสแตนซ์แบบเหมาจ่ายเพื่อลดค่าบริการลงให้ไม่เกิน 1,000 USD ต่อ TB ต่อปี

นอกจากนั้น ประเภทโหนด Dense Compute (DC) ก็มีอยู่ 2 ขนาดเช่นกัน Large มี SSD ขนาด 160GB , คอร์เสมือน Intel Xeon E5-2670v2 (Ivy Bridge) 2 ตัว และ RAM 15GiB Eight Extra Large มี SSD ขนาด 2.56TB, คอร์เสมือน Intel Xeon E5-2670v2 32 ตัว และ RAM 244GiB ซึ่งมากกว่าขนาด Large ถึง 16 เท่า คุณสามารถเริ่มใช้งานโหนด DC2.Large ได้โดยมีค่าบริการ 0.25 USD ต่อชั่วโมง และสามารถเพิ่มเป็นโหนด 128 8XL ได้โดยมี SSD ขนาด 326TB, คอร์เสมือน 3,200 ตัว และ RAM 24TiB

สถาปัตยกรรม MPP ของ Amazon Redshift ช่วยให้คุณสามารถเพิ่มประสิทธิภาพของคุณได้โดยเพิ่มจำนวนโหนดในคลัสเตอร์คลังเก็บข้อมูลของคุณ ปริมาณข้อมูลต่อโหนดประมวลผลที่เหมาะสมที่สุดขึ้นอยู่กับลักษณะของแอปพลิเคชันและความต้องการด้านประสิทธิภาพในการสืบค้นของคุณ คลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถมีโหนดประมวลผลได้ 1-128 โหนด โดยขึ้นอยู่กับประเภทโหนด สำหรับรายละเอียด โปรดดูเอกสารประกอบของเรา

ถาม: ฉันควรเลือกใช้ Amazon RedShift หรือ Amazon RDS

ทั้ง Amazon Redshift และ Amazon RDS ช่วยให้คุณสามารถรันฐานข้อมูลสัมพันธ์แบบดั้งเดิมในระบบคลาวด์ได้ในขณะที่ลดภาระในการดูแลจัดการฐานข้อมูล ลูกค้าใช้งานฐานข้อมูล Amazon RDS ทั้งสำหรับการประมวลผลธุรกรรมออนไลน์ (OLTP) และสำหรับการรายงานและการวิเคราะห์ Amazon RedShift จะควบคุมดูแลขนาดและทรัพยากรของโหนดทั้งหลายและใช้การปรับประสิทธิภาพให้เหมาะสมหลากหลายรูปแบบ จึงช่วยปรับปรุงให้เหนือกว่าฐานข้อมูลแบบเดิมอย่างมหาศาลในด้านการวิเคราะห์และการรายงานปริมาณงานต่อชุดข้อมูลขนาดใหญ่ Amazon RedShift มีตัวเลือกที่ยอดเยี่ยมในการปรับขยายตามข้อมูลและความซับซ้อนในการสืบค้น หรือหากคุณต้องการป้องกันไม่ให้กระบวนการรายงานและวิเคราะห์ของคุณส่งผลแทรกแซงประสิทธิภาพของปริมาณงาน OLTP ของคุณ

ถาม: ฉันควรเลือกใช้ Amazon RedShift (Redshift Spectrum) หรือ Amazon EMR

คุณควรใช้ Amazon EMR หากคุณใช้โค้ดแบบกำหนดเองเพื่อประมวลผลและวิเคราะห์ชุดข้อมูลที่มีขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่ เช่น Apache Spark, Hadoop, Presto หรือ Hbase Amazon EMR ช่วยให้คุณสามารถควบคุมการกำหนดค่าคลัสเตอร์ของคุณและซอฟต์แวร์ที่คุณติดตั้งไว้บนคลัสเตอร์ได้อย่างเต็มรูปแบบ

คลังเก็บข้อมูล อาทิ Amazon RedShift ได้รับการออกแบบมาเพื่อดำเนินการวิเคราะห์ประเภทต่างๆ โดยพร้อมกัน คลังเก็บข้อมูลได้รับการออกแบบมาเพื่อรวบรวมข้อมูลจากแหล่งต่างๆ มากมายเอาไว้ด้วยกัน เช่น ระบบสินค้าคงคลัง ระบบการเงิน และระบบการขายปลีก คลังเก็บข้อมูลต้องจัดเก็บข้อมูลในโครงสร้างอย่างดี เพื่อให้แน่ใจว่าการรายงานจะมีความถูกต้องทั่วทั้งบริษัทอยู่เสมอ โครงสร้างนี้กำหนดกฎด้านความสอดคล้องของข้อมูลโดยตรงในตารางฐานข้อมูล Amazon RedShift คือสุดยอดบริการ หากคุณต้องการดำเนินการสืบค้นอันซับซ้อนสำหรับชุดข้อมูลที่มีโครงสร้างจำนวนมากและต้องการประสิทธิภาพการทำงานที่รวดเร็วอย่างมาก

ถึงแม้ Redshift Spectrum จะเป็นตัวเลือกที่ยอดเยี่ยมในการเปิดใช้การสืบค้นข้อมูลใน Amazon Redshift และ S3 แต่ก็ไม่ได้เหมาะกับกรณีใช้งานทุกรูปแบบที่องค์กรมักต้องการจากเฟรมเวิร์กการประมวลผล เช่น Amazon EMR Amazon EMR คือบริการที่เป็นมากกว่าการเปิดใช้การสืบค้น SQL Amazon EMR คือบริการที่มีการจัดการซึ่งจะช่วยให้คุณสามารถประมวลผลและวิเคราะห์ชุดข้อมูลขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่เวอร์ชันล่าสุด เช่น Spark, Hadoop และ Presto กับคลัสเตอร์แบบกำหนดเองเต็มรูปแบบ Amazon EMR ช่วยให้คุณสามารถรันการประมวลผลข้อมูลขนาดใหญ่แบบต่างๆ สำหรับแอปพลิเคชันได้ เช่น Machine Learning, การวิเคราะห์กราฟ, การแปลงข้อมูล, ข้อมูลการสตรีม และอะไรก็ตามที่คุณสามารถเขียนโค้ดได้

คุณสามารถใช้ Redshift Spectrum ร่วมกับ EMR ได้ Redshift Spectrum ใช้วิธีเดียวกันกับ Amazon EMR ในการจัดเก็บข้อกำหนดตาราง Redshift Spectrum รองรับ Apache Hive Metastore เดียวกันกับที่ Amazon EMR ใช้ในการระบุตำแหน่งข้อมูลและข้อกำหนดตาราง หากคุณใช้งาน Amazon EMR อยู่และมี Hive Metastore แล้ว คุณแค่เพียงกำหนดค่าคลัสเตอร์ Amazon Redshift เท่านั้น หากต้องการใช้งาน จากนั้น คุณสามารถเริ่มการสืบค้นข้อมูลได้ทันทีพร้อมกับงานของ Amazon EMR ดังนั้น หากคุณใช้งาน EMR ในการประมวลผลข้อมูลขนาดใหญ่อยู่แล้ว คุณสามารถใช้งาน Redshift Spectrum ในการสืบค้นข้อมูลได้พร้อมกันโดยไม่แทรกแซงการทำงานของ Amazon EMR

บริการสืบค้น คลังเก็บข้อมูล และเฟรมเวิร์กการประมวลผลข้อมูลอันซับซ้อนล้วนแต่มีจุดประสงค์ในการใช้งานแตกต่างกันไป คุณเพียงแค่ต้องเลือกเครื่องมือที่เหมาะสมกับงานของคุณ

 

ถาม: ฉันควรใช้อะไรระหว่าง Amazon Athena หรือ Redshift Spectrum

Amazon Athena คือวิธีที่ง่ายที่สุดในการช่วยให้พนักงานสามารถรันการสืบค้นเฉพาะสำหรับข้อมูลใน Amazon S3 Athena ไม่ใช้เซิร์ฟเวอร์ ดังนั้นจึงไม่มีโครงสร้างพื้นฐานที่ต้องตั้งค่าหรือจัดการ คุณสามารถเริ่มการวิเคราะห์ข้อมูลของคุณได้ทันที

หากคุณเข้าถึงข้อมูลบ่อยครั้งซึ่งเป็นข้อมูลที่ต้องได้รับการจัดเก็บในรูปแบบที่มีโครงสร้างอย่างดีและสอดคล้อง คุณควรใช้คลังเก็บข้อมูล เช่น Amazon Redshift ซึ่งช่วยให้คุณมีความยืดหยุ่นในการจัดเก็บข้อมูลที่มีโครงสร้างและมีการเข้าถึงบ่อยครั้งใน Amazon Redshift และใช้ Redshift Spectrum ในการขยายการสืบค้นของ Amazon Redshift ไปสู่ชุดข้อมูลทั้งหมดใน Data Lake ของ Amazon S3 และช่วยให้คุณมีอิสระในการจัดเก็บข้อมูลในที่ที่คุณต้องการ ในรูปแบบที่คุณต้องการ และพร้อมประมวลผลข้อมูลเมื่อคุณต้องการ

ถาม: เหตุใดฉันจึงควรใช้ Amazon Redshift แทนการรันคลัสเตอร์คลังเก็บข้อมูล MPP ของฉันเองบน Amazon EC2

Amazon Redshift จะช่วยจัดการงานต่างๆ ที่ใช้เวลานานโดยอัตโนมัติซึ่งเกี่ยวข้องกับการจัดการคลังข้อมูลของคุณเอง ได้แก่

  • การตั้งค่า: Amazon Redshift ช่วยให้คุณสามารถสร้างคลัสเตอร์คลังเก็บข้อมูล กำหนดสคีมาของคุณ และเริ่มโหลดและสืบค้นข้อมูลของคุณได้อย่างง่ายดาย การจัดเตรียม การกำหนดค่า และการติดตั้งแพทช์ล้วนได้รับการจัดการเพื่อคุณ
  • ความคงทนของข้อมูล: Amazon Redshift จะทำสำเนาข้อมูลของคุณไว้ในคลัสเตอร์คลังเก็บข้อมูลและจะสำรองข้อมูลของคุณอย่างต่อเนื่องไปยัง Amazon S3 ซึ่งได้รับการออกแบบมาให้มีความคงทนสูงถึง 99.999999999% Amazon RedShift จะสะท้อนข้อมูลของแต่ละไดรฟ์ไปยังโหนดอื่นๆ ภายในคลัสเตอร์ของคุณ หากไดรฟ์ทำงานล้มเหลว การสืบค้นของคุณจะดำเนินการต่อไปโดยมีเวลาแฝงเพิ่มขึ้นเล็กน้อยในขณะที่ Redshift สร้างไดรฟ์ของคุณขึ้นใหม่จากตัวสำเนา ในกรณีที่โหนดทำงานล้มเหลว Amazon Redshift จะจัดเตรียมโหนดใหม่โดยอัตโนมัติและเริ่มกู้คืนข้อมูลจากไดรฟ์อื่นๆ ภายในคลัสเตอร์หรือจาก Amazon S3 ระบบจะให้ความสำคัญในการกู้คืนข้อมูลที่มีการสืบค้นบ่อยที่สุด การสืบค้นที่มีการดำเนินการบ่อยที่สุดจึงสามารถทำงานได้อย่างรวดเร็ว
  • การปรับขนาด: คุณสามารถเพิ่มหรือลบโหนดจากคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้ด้วยการเรียก API ครั้งเดียวหรือการคลิกไม่กี่ครั้งใน AWS Management Console หากความจุและประสิทธิภาพต้องมีการเปลี่ยนแปลง
  • การอัปเดตและการติดตั้งแพทช์โดยอัตโนมัติ: Amazon Redshift จะอัปเกรดและติดตั้งแพทช์สำหรับคลังเก็บข้อมูลของคุณโดยอัตโนมัติ คุณจึงสามารถโฟกัสกับแอปพลิเคชันของคุณได้และไม่ต้องกังวลเรื่องการดูแลจัดการ
  • ความสามารถในการสืบค้นระดับเอกซะไบต์: Redshift Spectrum ช่วยให้คุณสามารถรันการสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 โดยไม่จำเป็นต้องโหลดหรือ ETL ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้

การเรียกเก็บเงิน

ถาม: ระบบจะคิดค่าบริการและเรียกเก็บเงินสำหรับการใช้ Amazon Redshift ของฉันอย่างไร

คุณจ่ายเท่าที่คุณใช้ และไม่มีค่าใช้จ่ายขั้นต่ำหรือค่าธรรมเนียมการติดตั้งใดๆ การเรียกเก็บเงินสำหรับคลัสเตอร์คลังเก็บข้อมูลจะเริ่มขึ้นต่อเมื่อสามารถใช้งานคลัสเตอร์คลังเก็บข้อมูลได้ การเรียกเก็บเงินจะดำเนินต่อไปจนกว่าคลัสเตอร์คลังเก็บข้อมูลจะหยุดทำงาน ซึ่งอาจเกิดจากการลบหรืออินสแตนซ์ขัดข้อง โดยระบบจะเรียกเก็บเงินตาม:

  • ชั่วโมงใช้งานโหนดประมวลผล: ชั่วโมงใช้งานโหนดประมวลผลคือจำนวนชั่วโมงรวมที่คุณรันโหนดประมวลผลทั้งหมดตามระยะเวลาการเรียกเก็บเงิน ชั่วโมงใช้งานโหนดจะคิดค่าบริการตามชั่วโมงที่คลัสเตอร์คลังเก็บข้อมูลของคุณกำลังทำงานอยู่ในสถานะพร้อมใช้งาน หากคุณไม่ต้องการให้มีการเรียกเก็บเงินคลัสเตอร์คลังเก็บข้อมูล คุณต้องยกเลิกใช้งานคลัสเตอร์คลังเก็บข้อมูล เพื่อป้องกันไม่ให้มีการเรียกเก็บเงินชั่วโมงใช้งานโหนดเพิ่มเติม ชั่วโมงใช้งานโหนดที่ไม่เต็มชั่วโมงจะคิดค่าบริการเต็มชั่วโมง ระบบจะเรียกเก็บเงิน 1 หน่วยต่อโหนดต่อชั่วโมง ดังนั้น คลัสเตอร์คลังเก็บข้อมูลแบบ 3 โหนดที่ทำงานอยู่ตลอดเวลาเป็นเวลาหนึ่งเดือนเต็มจะมีชั่วโมงใช้งานอินสแตนซ์ทั้งหมด 2,160 ชั่วโมง ระบบจะไม่เรียกเก็บเงินในส่วนของชั่วโมงใช้งานโหนดนำ เฉพาะโหนดประมวลผลเท่านั้นที่มีการเรียกเก็บเงิน
  • พื้นที่จัดเก็บข้อมูลสำรอง: พื้นที่จัดเก็บข้อมูลสำรองคือ พื้นที่จัดเก็บข้อมูลที่เกี่ยวข้องกับสแนปช็อตแบบอัตโนมัติและแบบแมนนวลสำหรับคลังเก็บข้อมูลของคุณ การเพิ่มระยะเวลาการเก็บข้อมูลสำรองหรือการรับสแนปช็อตเพิ่มจะช่วยเพิ่มพื้นที่จัดเก็บข้อมูลสำรองที่คลังเก็บข้อมูลของคุณใช้ ไม่มีค่าบริการเพิ่มเติมสำหรับพื้นที่จัดเก็บข้อมูลสำรองสูงสุด 100% ของพื้นที่จัดเก็บข้อมูลที่จัดเตรียมไว้ให้สำหรับคลัสเตอร์คลังเก็บข้อมูลที่ใช้งานอยู่ ตัวอย่างเช่น หากคุณมีคลัสเตอร์คลังเก็บข้อมูลโหนด XL เดี่ยวที่ใช้งานอยู่ซึ่งมีพื้นที่จัดเก็บอินสแตนซ์ขนาด 2TB เราจะมอบพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 2TB ต่อเดือน โดยไม่คิดค่าบริการเพิ่มเติม พื้นที่จัดเก็บข้อมูลสำรองที่เกินกว่าขนาดของพื้นที่จัดเก็บข้อมูลที่จัดเตรียมไว้ให้และข้อมูลสำรองที่จัดเก็บหลังจากที่คลัสเตอร์ของคุณสิ้นสุดลงจะถูกเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3
  • การถ่ายโอนข้อมูล: ไม่มีค่าบริการถ่ายโอนข้อมูลสำหรับข้อมูลที่ถ่ายโอนไปยังและออกจาก Amazon Redshift และ Amazon S3 ในภูมิภาคของ AWS เดียวกัน สำหรับการถ่ายโอนข้อมูลอื่นใดทั้งเข้าและออก Amazon Redshift ระบบจะเรียกเก็บเงินตามอัตราค่าบริการถ่ายโอนข้อมูลมาตรฐานของ AWS
  • ข้อมูลที่สแกน: Redshift Spectrum จะเรียกเก็บเงินตามปริมาณข้อมูลของ Amazon S3 ที่สแกนเพื่อดำเนินการสืบค้นของคุณ ไม่มีค่าบริการสำหรับ Redshift Spectrum หากคุณไม่รันการสืบค้น หากคุณจัดเก็บข้อมูลในรูปแบบคอลัมน์ เช่น Parquet หรือ RC ค่าบริการของคุณจะลดลง เนื่องจาก Redshift Spectrum จะสแกนเฉพาะคอลัมน์ที่จำเป็นในการสืบค้นแทนการประมวลผลทั้งแถว ในทำนองเดียวกัน หากคุณบีบอัดข้อมูลโดยใช้หนึ่งในรูปแบบที่ Redshift Spectrum รองรับ ต้นทุนจะลดลง คุณต้องจ่ายเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 สำหรับพื้นที่จัดเก็บข้อมูลและอัตราค่าบริการอินสแตนซ์ Amazon Redshift สำหรับคลัสเตอร์ที่ใช้งาน

ราคาของเราไม่รวมภาษีและอากร ซึ่งรวมถึง VAT และภาษีการขายที่เกี่ยวข้อง เว้นแต่ระบุไว้เป็นอย่างอื่น สำหรับลูกค้าที่มีที่อยู่สำหรับเรียกเก็บเงินในประเทศญี่ปุ่น การใช้บริการของ AWS จะต้องเสียภาษีการบริโภคของประเทศญี่ปุ่น เรียนรู้เพิ่มเติม

สำหรับข้อมูลเกี่ยวกับราคาของ Amazon Redshift โปรดดูที่หน้าราคาของ Amazon Redshift

การผสานรวมและการโหลดข้อมูล

ถาม: ฉันจะโหลดข้อมูลเข้าคลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon Redshift ได้จากแหล่งข้อมูลต่างๆ มากมาย ได้แก่ Amazon S3, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline และ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในระบบภายใน Amazon RedShift จะโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังเก็บข้อมูลของคุณได้ สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ใช่ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'insert' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่งแทรก SQL จะโหลดผ่านโหนดนำตัวเดียว

ถาม: ฉันจะโหลดข้อมูลจากแหล่งข้อมูล Amazon RDS, Amazon EMR, Amazon DynamoDB และ Amazon EC2 ที่ฉันมีอยู่ไปยัง Amazon Redshift ได้อย่างไร

คุณสามารถใช้คำสั่ง COPY เพื่อโหลดข้อมูลโดยพร้อมกันไปยัง Amazon Redshift โดยตรงจาก Amazon EMR, Amazon DynamoDB หรือโฮสต์ที่เปิดใช้ SSH นอกจากนั้น Redshift Spectrum ยังช่วยให้คุณสามารถโหลดข้อมูลจาก Amazon S3 ไปยังคลัสเตอร์ของคุณได้โดยใช้คำสั่ง INSERT INTO ซึ่งทำให้คุณสามารถโหลดข้อมูลจากรูปแบบต่างๆ เช่น Parquet และ RC ไปยังคลัสเตอร์ของคุณได้ โปรดทราบว่า หากคุณใช้วิธีนี้ ระบบจะคิดค่าบริการสำหรับ Redshift Spectrum เพิ่มขึ้นสำหรับข้อมูลที่สแกนมาจาก Amazon S3

นอกจากนั้น บริษัท ETL หลายๆ แห่งต่างให้การรับรอง Amazon Redshift ในด้านการใช้งานร่วมกับเครื่องมือของตนเอง และอีกหลายบริษัทยังเสนอช่วงทดลองใช้งานฟรีที่จะช่วยให้คุณเริ่มโหลดข้อมูลของคุณได้อีกด้วย AWS Data Pipeline มีโซลูชันที่ทนต่อข้อผิดพลาด น่าเชื่อถือ และมีประสิทธิภาพสูงในการโหลดข้อมูลจากแหล่งข้อมูลต่างๆ ของ AWS คุณสามารถใช้ AWS Data Pipeline ในการระบุแหล่งข้อมูลที่ต้องมีการแปลงข้อมูล และเปิดใช้งานสคริปต์นำเข้าที่เขียนไว้ล่วงหน้าเพื่อโหลดข้อมูลไปยัง Amazon Redshift อีกทั้ง AWS Glue ยังเป็นบริการดึง แปลง และโหลดข้อมูล (ETL) ที่มีการจัดการเต็มรูปแบบอีกด้วย ซึ่งช่วยให้สามารถจัดเตรียมและโหลดข้อมูลเพื่อการวิเคราะห์ได้อย่างง่ายดาย คุณสามารถสร้างและรันงาน ETL ของ AWS Glue ได้ด้วยการคลิกไม่กี่ครั้งใน AWS Management Console

ถาม: ฉันมีข้อมูลจำนวนมากที่ต้องโหลดไปยัง Amazon Redshift เป็นครั้งแรก ซึ่งการถ่ายโอนผ่านอินเทอร์เน็ตอาจใช้เวลานาน ฉันจะโหลดข้อมูลนี้อย่างไร

คุณสามารถใช้ AWS Import/Export ในการถ่ายโอนข้อมูลไปยัง Amazon S3 ได้โดยใช้อุปกรณ์จัดเก็บข้อมูลแบบพกพา นอกจากนั้น คุณสามารถใช้ AWS Direct Connect ในการสร้างการเชื่อมต่อเครือข่ายส่วนตัวระหว่างเครือข่ายหรือศูนย์ข้อมูลของคุณกับ AWS ได้ คุณสามารถเลือกพอร์ตการเชื่อมต่อแบบ 1Gbit/วินาที หรือแบบ 10Gbit/วินาที ในการถ่ายโอนข้อมูลได้

การรักษาความปลอดภัย

ถาม: Amazon Redshift รักษาความปลอดภัยให้กับข้อมูลฉันอย่างไร

Amazon Redshift จะเข้ารหัสและรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอนและข้อมูลที่จัดเก็บโดยใช้เทคนิคการเข้ารหัสตามมาตรฐานอุตสาหกรรม Amazon Redshift รองรับการเชื่อมต่อแบบเปิดใช้ SSL ระหว่างแอปพลิเคชันไคลเอ็นต์และคลัสเตอร์คลังเก็บข้อมูล Redshift ของคุณ เพื่อรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอน Amazon Redshift จะเข้ารหัสแต่ละบล็อกโดยใช้ AES-256 ที่มีการเร่งฮาร์ดแวร์ขณะที่เขียนข้อมูลลงดิสก์ เพื่อรักษาความปลอดภัยให้กับข้อมูลที่จัดเก็บ โดยจะดำเนินการในระดับต่ำภายในระบบย่อย I/O ซึ่งเข้ารหัสทุกข้อมูลที่เขียนลงในดิสก์ รวมถึงผลลัพธ์การสืบค้นระยะกลาง ระบบจะสำรองข้อมูลบล็อกตามที่เป็นอยู่ ซึ่งหมายความว่าข้อมูลสำรองจะได้รับการเข้ารหัสด้วยเช่นกัน ตามค่าเริ่มต้น Amazon Redshift จะดูแลการจัดการคีย์ให้ แต่คุณสามารถเลือกที่จะจัดการคีย์ของคุณเองโดยใช้โมดูลการรักษาความปลอดภัยฮาร์ดแวร์ (HSM) ของคุณเองหรือจัดการคีย์ของคุณผ่าน AWS Key Management Service

Redshift Spectrum รองรับการเข้ารหัสฝั่งเซิร์ฟเวอร์ (SSE) ของ Amazon S3 โดยใช้คีย์เริ่มต้นของบัญชีผู้ใช้ที่จัดการโดย AWS Key Management Service (KMS)

ถาม: ฉันสามารถใช้ Amazon RedShift ใน Amazon Virtual Private Cloud (Amazon VPC) ได้หรือไม่

ได้ คุณสามารถใช้ Amazon Redshift เป็นส่วนหนึ่งในการกำหนดค่า VPC ของคุณได้ คุณสามารถกำหนดโครงสร้างเครือข่ายเสมือนที่มีความคล้ายกับเครือข่ายแบบเดิมที่คุณอาจใช้งานได้ในศูนย์ข้อมูลของคุณเองด้วย Amazon VPC ซึ่งจะช่วยให้คุณสามารถควบคุมได้ว่าใครบ้างที่สามารถเข้าถึงคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ของคุณได้

คุณสามารถใช้ Redshift Spectrum ร่วมกับคลัสเตอร์ Amazon Redshift ที่เป็นส่วนหนึ่งของ VPC ได้ โปรดทราบว่า Redshift Spectrum ยังไม่รองรับ Enhanced VPC Routing ในตอนนี้

ถาม: ฉันสามารถเข้าถึงโหนดประมวลผล Amazon Redshift ได้โดยตรงหรือไม่

ไม่ได้ โหนดประมวลผล Amazon Redshift ของคุณจะอยู่ในเครือข่ายส่วนตัวและสามารถเข้าถึงได้จากโหนดนำของคลัสเตอร์คลังเก็บข้อมูลของคุณเท่านั้น ซึ่งช่วยเพิ่มระดับความปลอดภัยให้ข้อมูลของคุณ

ความพร้อมใช้งานและความคงทน

ถาม: หากไดรฟ์บนหนึ่งในโหนดของฉันทำงานล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

คลัสเตอร์คลังเก็บข้อมูล Amazon Redshift จะยังคงสามารถใช้งานได้ แม้ในกรณีที่ไดรฟ์ทำงานล้มเหลว แต่ประสิทธิภาพภาพในการสืบค้นอาจลดลงเล็กน้อย ในกรณีที่ไดรฟ์ทำงานล้มเหลว Amazon Redshift จะใช้สำเนาข้อมูลกับไดรฟ์ที่จัดเก็บข้อมูลบนไดรฟ์อื่นๆ ภายในโหนดดังกล่าว นอกจากนั้น Amazon RedShift จะพยายามย้ายข้อมูลของคุณไปยังไดรฟ์ที่สามารถทำงานได้ดีหรือจะเปลี่ยนโหนดของคุณแทนหากไม่สามารถย้ายข้อมูลได้ คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อย 2 โหนดสำหรับการทำสำเนาข้อมูล

ถาม: ในกรณีที่โหนดบางตัวทำงานล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

Amazon Redshift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังเก็บข้อมูลของคุณในอัตโนมัติ คลัสเตอร์คลังเก็บข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้ คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อย 2 โหนดสำหรับการทำสำเนาข้อมูล

ถาม: หาก Availability Zone (AZ) ของคลัสเตอร์คลังเก็บข้อมูลเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

หากไม่สามารถใช้งาน Availability Zone ของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ของคุณได้ คุณจะไม่สามารถใช้งานคลัสเตอร์ของคุณได้จนกว่าจะสามารถกู้คืนพลังงานและการเข้าถึงเครือข่าย AZ ได้ ระบบจะจัดเก็บข้อมูลของคลัสเตอร์คลังเก็บข้อมูลเอาไว้ คุณจึงสามารถเริ่มใช้งานคลังเก็บข้อมูล Amazon Redshift ได้ทันทีที่สามารถใช้งาน AZ ได้อีกครั้ง นอกจากนั้น คุณยังสามารถเลือกที่จะกู้คืนสแนปช็อตที่มีอยู่ไปยัง AZ ใหม่ในภูมิภาคเดียวกันได้อีกด้วย Amazon RedShift จะกู้คืนข้อมูลที่มีการเข้าถึงบ่อยที่สุดก่อน คุณจึงสามารถดำเนินการสืบค้นต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้

ถาม: Amazon Redshift รองรับการปรับใช้หลาย AZ หรือไม่

Amazon Redshift รองรับเฉพาะการปรับใช้ AZ เดียวเท่านั้นในตอนนี้ คุณสามารถรันคลัสเตอร์คลังเก็บข้อมูลในหลาย AZ ได้ด้วยการโหลดข้อมูลไปยังคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ทั้งสองตัวใน AZ ต่างกันจากชุดไฟล์อินพุต Amazon S3 เดียวกัน Redshift Spectrum ช่วยให้คุณสามารถเปิดใช้คลัสเตอร์ตาม AZ ต่างๆ ได้หลายตัว และสามารถเข้าถึงข้อมูลใน Amazon S3 โดยไม่ต้องโหลดไปยังคลัสเตอร์ของคุณ นอกจากนั้น คุณยังสามารถกู้คืนคลัสเตอร์คลังเก็บข้อมูลไปยัง AZ ต่างๆ ได้จากสแนปช็อตคลัสเตอร์คลังเก็บข้อมูลของคุณ

การสำรองและการกู้คืนข้อมูล

ถาม: Amazon Redshift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร

Amazon Redshift จะทำสำเนาข้อมูลทั้งหมดภายในคลัสเตอร์คลังเก็บข้อมูลหากมีการโหลดเอาไว้ และจะสำรองข้อมูลของคุณไปยัง S3 อยู่เสมอด้วยเช่นกัน Amazon Redshift จะจัดเก็บสำเนาข้อมูลไว้อย่างน้อย 3 ชุดเสมอ (ข้อมูลต้นฉบับและสำเนาข้อมูลบนโหนดประมวลผลและข้อมูลสำรองใน Amazon S3) Redshift ยังสามารถทำสำเนาสแนปช็อตของคุณแบบไม่พร้อมกันไปยัง S3 ในภูมิภาคอื่นได้อีกด้วย เพื่อการกู้ข้อมูลคืนกรณีเกิดภัยพิบัติ

ตามค่าเริ่มต้น Amazon Redshift จะเปิดใช้การสำรองข้อมูลคลัสเตอร์คลังเก็บข้อมูลแบบอัตโนมัติโดยมีระยะเวลาเก็บรักษา 1 วัน คุณสามารถกำหนดให้มีระยะเวลานานถึง 35 วันได้

โดยจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปอีก 1 วัน คุณสามารถขยายระยะเวลาได้โดยใช้ AWS Management Console หรือ API ของ Amazon Redshift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon Redshift Amazon RedShift จะสำรองข้อมูลเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น สแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย

หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังเก็บข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว

ถาม: ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร

คุณสามารถใช้ AWS Management Console หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)

ถาม: หากฉันลบคลัสเตอร์คลังเก็บข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน

หากคุณลบคลัสเตอร์คลังเก็บข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังเก็บข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังเก็บข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่ว่าคุณเลือกที่จะลบออก

ความสามารถในการปรับขนาด

ถาม: ฉันสามารถปรับขนาดและประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังเก็บข้อมูลได้ผ่าน AWS Management Console หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังเก็บข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนั้น คุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้

Redshift Spectrum ช่วยให้คุณสามารถรันคลัสเตอร์ Amazon Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกัน เพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และส่งผลลัพธ์กลับไปยังคลัสเตอร์ Amazon Redshift ในส่วนการประมวลผลที่หลงเหลืออยู่ โดยขึ้นอยู่กับประเภทและจำนวนโหนดในคลัสเตอร์ภายในของคุณ รวมถึงจำนวนไฟล์ที่ต้องได้รับการประมวลผลในการสืบค้น

ถาม: ฉันจะสามารถใช้งานคลัสเตอร์คลังเก็บข้อมูลของระหว่างการปรับขนาดได้หรือไม่

คลัสเตอร์คลังเก็บข้อมูลที่มีอยู่จะยังคงสามารถอ่านข้อมูลได้ในขณะที่กำลังสร้างคลัสเตอร์คลังเก็บข้อมูลใหม่ขึ้นระหว่างการปรับขนาด เมื่อคลัสเตอร์คลังเก็บข้อมูลใหม่พร้อมใช้งานแล้ว คลัสเตอร์คลังเก็บข้อมูลที่มีอยู่จะไม่สามารถใช้งานได้ชั่วคราวขณะที่พลิกระเบียนชื่อมาตรฐานของคลัสเตอร์คลังเก็บข้อมูลที่มีอยู่เพื่อระบุถึงคลัสเตอร์คลังเก็บข้อมูลใหม่ ช่วงเวลาที่ไม่มีให้บริการนี้มักใช้เวลาเพียงไม่กี่นาทีและจะเกิดขึ้นในระหว่างช่วงระยะเวลาการบำรุงรักษาสำหรับคลัสเตอร์คลังเก็บข้อมูลของคุณ เว้นแต่คุณจะระบุว่าควรใช้การปรับเปลี่ยนทันที Amazon RedShift จะย้ายข้อมูลโดยพร้อมกันจากโหนดประมวลผลในคลัสเตอร์คลังเก็บข้อมูลที่มีอยู่ไปยังโหนดประมวลผลในคลัสเตอร์คลังเก็บข้อมูลใหม่ ซึ่งช่วยให้การทำงานของคุณสามารถดำเนินการให้แล้วเสร็จได้อย่างรวดเร็วที่สุด

กระบวนการทำงานพร้อมกัน

คำถาม: ฉันจะจัดการทรัพยากรอย่างไรเพื่อให้แน่ใจว่าคลัสเตอร์ Redshift ของฉันจะสามารถให้ประสิทธิภาพที่รวดเร็วอย่างต่อเนื่องในช่วงที่มีการทำงานพร้อมกันสูงได้

คลังข้อมูลทั่วไปมีความแปรปรวนอย่างมากในการใช้การสืบค้นพร้อมกันตลอดทั้งวัน การเพิ่มทรัพยากรในช่วงเวลาที่ต้องการจึงประหยัดคุ้มค่ากว่าการจัดเตรียมให้กับช่วงที่มีความต้องการสูง Amazon Redshift จัดการดำเนินการนี้ในนามของคุณโดยอัตโนมัติ 

การปรับขนาดพร้อมกันเป็นคุณสมบัติใน Amazon Redshift ที่จะให้ประสิทธิภาพการสืบค้นที่รวดเร็วอย่างต่อเนื่องแม้ว่าจะมีการสืบค้นเกิดขึ้นพร้อมกันหลายพันรายการ ด้วยคุณสมบัตินี้ Amazon Redshift จะเพิ่มความจุคลัสเตอร์ชั่วคราวโดยอัตโนมัติเมื่อจำเป็นต้องรองรับความต้องการใช้งานจำนวนมาก Amazon Redshift จะกำหนดเส้นทางการสืบค้นโดยอัตโนมัติเพื่อปรับขนาดคลัสเตอร์ซึ่งได้รับการจัดเตรียมในไม่กี่วินาทีและเริ่มการประมวลผลสืบค้นในทันที

คุณสมบัตินี้ฟรีสำหรับลูกค้าส่วนใหญ่ แต่ละคลัสเตอร์ Amazon Redshift ได้รับเครดิตการปรับขนาดพร้อมกันสูงสุดหนึ่งชั่วโมงต่อวัน ซึ่งจะช่วยให้คุณสามารถคาดการณ์ค่าใช้จ่ายแบบรายเดือนได้แม้ในช่วงที่ความต้องการวิเคราะห์มีความผันผวน

คำถาม: Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร

Elastic Resize เพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการปริมาณงานสืบค้น ตัวอย่างเช่น ปริมาณงาน ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มการทำงานพร้อมกันของการสืบค้นโดยรวม

คำถาม: ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่

ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งทรัพยากรของ Redshift ที่ปรับขนาดได้อย่างมากสำหรับลูกค้าที่ไม่สามารถเข้าถึงได้โดยตรง

การสืบค้นและการวิเคราะห์

ถาม: Amazon Redshift และ Redshift Spectrum ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ได้หรือไม่

Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานรวมที่ได้รับการตรวจสอบแล้วกับผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยแต่ละรายมีช่วงทดลองใช้งานฟรีเพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อปรับใช้และกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที

Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ

คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้

ถาม: Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดใด

ในปัจจุบัน Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile และ TSV

Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy แล้วในตอนนี้

ถาม: จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก

คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น โดยเหมือนกับตารางภายใน

ถาม: ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake ของ S3 แล้วฉันสามารถใช้ Redshift Spectrum ได้หรือไม่

ได้ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้

ถาม: ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร

คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้

การตรวจสอบ

ถาม: ฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนั้น คุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้ นอกจากตัวชี้วัดของ CloudWatch แล้ว Amazon Redshift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่าน AWS Management Console อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่ใช้งานทรัพยากรระบบมากที่สุดและดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่

ถาม: ฉันสังเกตเห็นว่าการสืบค้นบางรูปแบบที่เข้าถึงข้อมูลในคลัสเตอร์ของฉันทำงานได้ช้ากว่าการสืบค้น Redshift Spectrum เพราะเหตุใดจึงเป็นเช่นนั้น

การสืบค้น Amazon Redshift จะทำงานบนทรัพยากรคลัสเตอร์ของคุณสำหรับดิสก์ภายใน การสืบค้น Redshift Spectrum จะทำงานโดยใช้ทรัพยากรแบบปรับขยายตามการสืบค้นสำหรับข้อมูลใน S3 การสืบค้นโดยส่วนใหญ่จะทำงานได้เร็วกว่าในดิสก์ภายใน แต่สำหรับการสืบค้นที่สแกนข้อมูลจำนวนมากและประมวลผลเพียงเล็กน้อย เราสามารถใช้โปรแกรมทำงานต่างๆ มากมายของ Redshift Spectrum เพื่อดำเนินการให้เสร็จได้โดยเร็ว

การบำรุงรักษา

ถาม: ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังเก็บข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่

Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราว เพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยแก้ไขคลัสเตอร์โดยทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon RedShift ในการทำงานทั่วไปได้ระหว่างการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตามภูมิภาค โปรดดูที่ระยะเวลาบำรุงรักษาในคู่มือการจัดการ Amazon Redshift

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Redshift

ไปที่หน้าราคา
พร้อมสร้างหรือยัง
เริ่มต้นใช้งาน Amazon Redshift
มีคำถามเพิ่มเติมหรือไม่
ติดต่อเรา