ทั่วไป

หากต้องการทราบฟังก์ชันใหม่ๆ ใน Amazon RedShift ให้ไปที่หน้ามีอะไรใหม่
หากต้องการดูข้อมูลโดยละเอียดเพิ่มเติมและคำแนะนำการใช้งาน ให้ไปที่เอกสารประกอบ

ถาม: Amazon Redshift คืออะไร

Amazon Redshift คือคลังข้อมูลบนระบบคลาวด์ที่มีการจัดการเต็มรูปแบบและปรับขนาดได้ ซึ่งจะช่วยเร่งเวลาในการเข้าถึงข้อมูลเชิงลึกด้วยการวิเคราะห์ที่รวดเร็ว ง่ายดาย และปลอดภัยในทุกระดับ ลูกค้าหลายพันรายใช้ Amazon Redshift ในการวิเคราะห์ข้อมูลตั้งแต่ระดับเทราไบต์ไปจนถึงระดับเพตะไบต์ และเรียกใช้การสืบค้นเชิงวิเคราะห์ที่ซับซ้อน คุณสามารถรับข้อมูลเชิงลึกแบบเรียลไทม์และการวิเคราะห์เชิงคาดการณ์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ ที่เก็บข้อมูลดิบ คลังข้อมูล และชุดข้อมูลของบุคคลภายนอก Amazon Redshift มอบทั้งหมดนี้ในราคาที่คุ้มค่าซึ่งดีกว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 3 เท่า ช่วยให้คุณคาดการณ์ค่าใช้จ่ายได้เสมอ

Amazon Redshift Serverless ช่วยให้คุณเรียกใช้การวิเคราะห์ขนาดเพตะไบต์ได้ในไม่กี่วินาที เพื่อรับข้อมูลเชิงลึกอย่างรวดเร็วโดยไม่ต้องกำหนดค่าและจัดการคลัสเตอร์คลังข้อมูลของคุณ Amazon Redshift Serverless ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น

ถาม: เหตุผลหลักที่ลูกค้าเลือกใช้ Amazon Redshift มีอะไรบ้าง

ลูกค้าหลายพันรายเลือกใช้ Amazon Redshift เพื่อเร่งเวลาในการเข้าถึงข้อมูลเชิงลึก เพราะใช้งานได้ง่าย ใช้ได้ดีในทุกระดับขนาด และช่วยให้คุณวิเคราะห์ข้อมูลทั้งหมดได้ Amazon Redshift เป็นบริการที่มีการจัดการเต็มรูปแบบและมีตัวเลือกทั้งแบบเตรียมใช้งานและแบบไร้เซิร์ฟเวอร์ ซึ่งช่วยให้ง่ายต่อการเรียกใช้และการปรับขนาดการวิเคราะห์โดยไม่ต้องจัดการคลังข้อมูลของคุณ คุณสามารถเลือกตัวเลือกแบบเตรียมใช้งานสำหรับปริมาณงานที่คาดการณ์ได้ หรือจะเลือกใช้ตัวเลือก Amazon Redshift Serverless เพื่อจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติเพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ โดยใช้ได้ดีในทุกระดับขนาด ซึ่งคุ้มค้ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 3 เท่า ช่วยให้คุณคาดการณ์ค่าใช้จ่ายได้เสมอ Amazon Redshift ช่วยให้คุณได้รับข้อมูลเชิงลึกจากการเรียกใช้การวิเคราะห์เชิงคาดการณ์แบบเรียลไทม์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ ที่เก็บข้อมูลดิบ คลังข้อมูล และชุดข้อมูลของบุคคลภายนอกกว่าพันรายการ Amazon Redshift ช่วยรักษาข้อมูลของคุณให้ปลอดภัยทั้งระหว่างจัดเก็บและระหว่างโอนถ่าย อีกทั้งยังเป็นไปตามปฏิบัติตามข้อกำหนดทั้งภายในและภายนอกด้วย ซึ่งรองรับการรักษาความปลอดภัยระดับแนวหน้าของอุตสาหกรรมเพื่อปกป้องข้อมูลของคุณในระหว่างการโอนถ่ายและระหว่างจัดเก็บ และเป็นไปตามข้อกำหนด SOC1, SOC2, SOC3 และ PCI DSS ระดับ 1 คุณสมบัติด้านการรักษาความปลอดภัยและการปฏิบัติตามข้อกำหนดทั้งหมดของ RedShift รวมให้มาอย่างเบ็ดเสร็จโดยไม่มีค่าใช้จ่ายเพิ่มเติม

ถาม: Amazon RedShift ช่วยให้การจัดการคลังข้อมูลเป็นเรื่องง่ายได้อย่างไร

Amazon Redshift ได้รับการจัดการอย่างเต็มรูปแบบโดย AWS ดังนั้นคุณจึงไม่ต้องกังวลไปกับงานการจัดการคลังข้อมูลอีกต่อไป เช่น การจัดเตรียมฮาร์ดแวร์ การแพตช์ซอฟต์แวร์ การตั้งค่า การกำหนดค่า การตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากความล้มเหลว หรือการสำรองข้อมูล AWS จะคอยจัดการงานที่จำเป็นในการตั้งค่า ดำเนินการ และปรับขนาดคลังข้อมูลในนามของคุณ ช่วยให้คุณให้ความสำคัญกับการสร้างแอปพลิเคชันของคุณได้เต็มที่ Amazon Redshift ยังมีความสามารถในการปรับค่าอัตโนมัติและแสดงคำแนะนำสำหรับการจัดการคลังเก็บข้อมูลของคุณใน Redshift Advisor อีกด้วย สำหรับ Redshift Spectrum นั้น Amazon RedShift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด การปรับสมดุลโหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3 ตัวเลือกแบบไร้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น

ถาม: ประสิทธิภาพของ Amazon Redshift กับคลังข้อมูลอื่นๆ แตกต่างกันอย่างไร

ผลการวัดประสิทธิภาพ TPC-DS แสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่าที่สุดตั้งแต่แรกเริ่ม แม้จะใช้ชุดข้อมูลขนาด 3 TB ที่ค่อนข้างเล็ก Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 3 เท่า ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากความคุ้มค่าระดับชั้นนำของ Amazon Redshift นี้ตั้งแต่แรกเริ่มโดยไม่ต้องปรับแต่งอะไรเลย เพิ่มความคุ้มค่าที่มากกว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ สูงสุด 3 เท่าด้วย Amazon Redshift | บล็อก AWS Big Data

Amazon Redshift ใช้นวัตกรรมมากมายเพื่อให้ได้ประสิทธิภาพที่ดีกว่าฐานข้อมูลแบบเดิมถึง 10 เท่าสำหรับคลังข้อมูลและปริมาณงานด้านการวิเคราะห์ รวมถึงการจัดเก็บข้อมูลบีบอัดแบบคอลัมน์ที่เหมาะสำหรับการอ่านอย่างมีประสิทธิภาพด้วยคลัสเตอร์การประมวลผลแบบขนานขนาดใหญ่ (MPP) ที่ปรับขนาดเชิงเส้นเป็นหลายร้อยโหนด Amazon RedShift จะเลือกจัดเก็บข้อมูลแบบเป็นคอลัมน์แทนที่จะจัดเก็บข้อมูลเป็นแถว ขณะโหลดข้อมูลลงในตารางเปล่า Amazon RedShift จะสุ่มตัวอย่างข้อมูลของคุณและเลือกรูปแบบการบีบอัดที่เหมาะสมที่สุดโดยอัตโนมัติ

Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้การสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 คุณไม่จำเป็นต้องโหลด รวมถึงไม่จำเป็นต้องแยก แปลง และโหลดข้อมูล (ETL) ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้ การดูแบบมิติทำให้ประสิทธิภาพในการสืบค้นเร็วขึ้นเป็นอย่างมากสำหรับปริมาณงานเชิงวิเคราะห์ที่มีการทำซ้ำและคาดการณ์ได้ เช่น แดชบอร์ด การสืบค้นจากเครื่องมือระบบธุรกิจอัฉริยะ (BI) และการประมวลผลข้อมูลแบบ ETL คุณสามารถจัดเก็บผลลัพธ์ที่ประมวลผลไว้ล่วงหน้าของการสืบค้นและดูแลรักษาผลลัพธ์เหล่านั้นได้อย่างมีประสิทธิภาพ โดยการประมวลผลการเปลี่ยนแปลงล่าสุดที่เกิดขึ้นกับตารางทรัพยากรเพิ่มขึ้นโดยใช้การดูแบบมิติ การสืบค้นถัดๆ ไปที่อ้างอิงจากการดูแบบมิติจะใช้ผลลัพธ์ที่ประมวลผลไว้ล่วงหน้าเพื่อดำเนินการสืบค้นที่รวดยิ่งขึ้นกว่าเดิมมาก และสามารถรีเฟรชโดยอัตโนมัติและเขียนการสืบค้นใหม่เพื่อทำให้การใช้การดูแบบมิติทำได้ง่ายขึ้นและทำงานโดยอัตโนมัติ

ความสามารถในการประมวลผลและความจุของพื้นที่จัดเก็บของคลังข้อมูลในองค์กรถูกจำกัดโดยข้อจำกัดของฮาร์ดแวร์ในองค์กร Amazon RedShift ช่วยให้คุณสามารถปรับขนาดการประมวลผลและพื้นที่จัดเก็บแยกกันตามที่ต้องการเพื่อตอบสนองปริมาณงานที่มีการเปลี่ยนแปลงอยู่ตลอดเวลา Redshift Managed Storage (RMS) ช่วยให้คุณสามารถปรับขนาดพื้นที่จัดเก็บของคุณระดับเพตะไบต์โดยใช้พื้นที่จัดเก็บ Amazon S3

การเพิ่มประสิทธิภาพตารางอัตโนมัติ (ATO) คือความสามารถในการปรับค่าด้วยตนเองที่ช่วยให้คุณได้รับประโยชน์ด้านประสิทธิภาพจากคีย์การจัดเรียงและการเผยแพร่ที่ดีที่สุดโดยไม่ต้องลงมือทำด้วยตนเอง ATO จะสังเกตการณ์ว่าการสืบค้นมีการตอบสนองกับตารางอย่างไรบ้าง และใช้แมชชีนเลิร์นนิง (ML) ในการเลือกคีย์การจัดเรียงและการเผยแพร่ที่ดีที่สุดเพื่อเพิ่มประสิทธิภาพให้กับปริมาณงานของคลัสเตอร์ การเพิ่มประสิทธิภาพของ ATO ได้แสดงให้เห็นว่าประสิทธิภาพของคลัสเตอร์เพิ่มขึ้น 24% และ 34% โดยใช้เกณฑ์มาตรฐาน 3 TB และ 30 TB TPC-DS ตามลำดับ เมื่อเทียบกับคลัสเตอร์ที่ไม่มี ATO คุณสมบัติอื่นๆ อย่าง Automatic Vacuum Delete, Automatic Table Sort และ Automatic Analyze ช่วยลดความจำเป็นในการบำรุงรักษาและการปรับแต่งคลัสเตอร์ของ Redshift ด้วยตนเอง เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดสำหรับคลัสเตอร์ใหม่และปริมาณงานการผลิต

การจัดการปริมาณงานช่วยให้คุณสามารถกำหนดเส้นทางการสืบค้นไปยังชุดการสืบค้นที่กำหนดไว้ได้เพื่อจัดการการทำงานพร้อมกันและการใช้ทรัพยากรของคลัสเตอร์ ปัจจุบัน Amazon Redshift มีการกำหนดค่าทั้งแบบอัตโนมัติและแบบดำเนินการด้วยตนเอง ในการกำหนดค่า WLM ด้วยตนเอง คุณมีหน้าที่กำหนดจำนวนหน่วยความจำที่จัดสรรให้กับแต่ละคิวและจำนวนสูงสุดของการสืบค้น โดยแต่ละรายการจะได้รับหน่วยความจำนั้นส่วนหนึ่ง ซึ่งสามารถเรียกใช้ในแต่ละคิวได้ การกำหนดค่า WLM ด้วยตนเองไม่ได้ปรับให้เข้ากับการเปลี่ยนแปลงปริมาณงานของคุณ และต้องมีความรู้เชิงลึกเกี่ยวกับการใช้ทรัพยากรของการสืบค้นเพื่อที่จะดำเนินการให้ถูกต้อง ส่วน Auto WLM ของ Amazon Redshift นั้นไม่ได้กำหนดให้คุณต้องกำหนดการใช้งานหน่วยความจำหรือการทำงานพร้อมกันของคิว แต่จะปรับการทำงานพร้อมกันแบบไดนามิกเพื่อเพิ่มประสิทธิภาพสำหรับปริมาณงาน และคุณยังสามารถเลือกกำหนดลำดับความสำคัญของการสืบค้นเพื่อเตรียมการจัดสรรทรัพยากรพิเศษของการสืบค้นตามลำดับความสำคัญทางธุรกิจของคุณได้อีกด้วย นอกจากนั้น Auto WLM ยังมีเครื่องมืออันทรงพลังที่จะช่วยให้คุณจัดการปริมาณงานของคุณได้เช่นกัน ลำดับความสำคัญของการสืบค้นช่วยให้คุณกำหนดลำดับความสำคัญของปริมาณงานเพื่อดำเนินการเฉพาะทางใน Amazon Redshift รวมถึงเพิ่มจำนวนทรัพยากรในช่วงเวลาที่มีการใช้งานสูงเพื่อประสิทธิภาพการสืบค้นที่สม่ำเสมอ และกฎการตรวจสอบการสืบค้นช่วยจัดการสถานการณ์ที่ไม่คาดคิดต่างๆ ได้ เช่น การตรวจจับและป้องกันการเรียกใช้งานหรือการสืบค้นที่มีต้นทุนสูงจากการใช้ทรัพยากรระบบ ส่วนสำคัญของ Auto WLM ที่มีการปรับปรุงประสิทธิภาพการทำงานพร้อมกันแบบแปรผัน ได้แก่ การจัดสรรหน่วยความจำอย่างเหมาะสม การกำจัดการแบ่งพาร์ติชันหน่วยความจำแบบคงที่ระหว่างคิว และปริมาณงานที่ได้รับการปรับปรุง

Amazon Redshift Advisor พัฒนาคำแนะนำที่สามารถปรับแต่งได้เพื่อเพิ่มประสิทธิภาพและจัดการค่าใช้จ่ายอย่างเหมาะสมโดยการวิเคราะห์ปริมาณงานและเกณฑ์การใช้งานสำหรับคลัสเตอร์ของคุณ เข้าสู่ระบบ Amazon Redshift Console เพื่อดูคำแนะนำจากผู้ให้คำปรึกษา ดูข้อมูลเพิ่มเติมได้จากหัวข้อการทำงานด้วยคำแนะนำจาก Amazon Redshift Advisor

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon RedShift ได้อย่างไร

คุณสามารถเริ่มสืบค้นข้อมูลได้เพียงไม่กี่คลิกใน AWS Management Console คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า ซึ่งรวมถึงชุดข้อมูลวัดประสิทธิภาพ TPC-H, TPC-DS และการสืบค้นตัวอย่างอื่นๆ เพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก Amazon S3, แชร์ข้อมูลของ Amazon Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Amazon Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด เช่น Parquet หรือ ORC ในที่เก็บข้อมูลดิบของ Amazon S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น Amazon Aurora, Amazon RDS PostgreSQL และ MySQL

หากต้องการเริ่มต้นใช้งาน Amazon Redshift Serverless ให้เลือก “ลองใช้ Amazon Redshift Serverless” และเริ่มสืบค้นข้อมูล Amazon Redshift Serverless จะปรับขนาดโดยอัตโนมัติเพื่อตอบสนองปริมาณงานที่เพิ่มขึ้น

ถาม: Advanced Query Accelerator (AQUA) สำหรับ Amazon RedShift คืออะไร

Advanced Query Accelerator (AQUA) คือแคชที่ได้รับการเร่งความเร็วด้านฮาร์ดแวร์ซึ่งเผยแพร่ใหม่ล่าสุด ซึ่งช่วยให้ Amazon Redshift สามารถทำงานได้รวดเร็วกว่าคลังเก็บข้อมูลบนระบบคลาวด์องค์กรอื่นๆ สูงสุดถึง 10 เท่าด้วยการเพิ่มการสืบค้นบางประเภทโดยอัตโนมัติ AQUA ใช้งานได้กับโหนด RA3.16xlarge, RA3.4xlarge หรือ RA3.xlplus โดยไม่มีค่าใช้จ่ายเพิ่มเติมและไม่ต้องทำการเปลี่ยนแปลงโค้ดใดๆ

ถาม: ฉันจะเปิดใช้งาน/ปิดใช้งาน AQUA สำหรับคลังข้อมูล Redshift ของฉันได้อย่างไร

สำหรับคลัสเตอร์ Redshift ที่ทำงานบนโหนด RA3 คุณสามารถเปิดใช้งาน/ปิดใช้งาน AQUA ในระดับคลัสเตอร์ได้โดยใช้ Redshift Console, AWS Command Line Interface (CLI) หรือ API สำหรับคลัสเตอร์ Redshift ที่ทำงานบน DC, DS หรือโหนดรุ่นเก่า คุณต้องอัปเกรดเป็นโหนด RA3 ก่อนและเปิดใช้งาน/ปิดใช้งาน AQUA

ถาม: AQUA ช่วยเร่งความเร็วในการสืบค้นประเภทใดได้บ้าง

AQUA ช่วยเร่งความเร็วในการสืบค้นการวิเคราะห์โดยเรียกใช้งานที่ใช้ข้อมูลมาก เช่น การสแกน การคัดกรอง และการรวมที่ใกล้เคียงชั้นการจัดเก็บ คุณจะพบการปรับปรุงประสิทธิภาพที่เห็นผลได้ชัดที่สุดในการสืบค้นที่ต้องใช้การสแกนในปริมาณมาก โดยเฉพาะการสรุปแบบ LIKE และ SIMILAR_TO โดยประเภทของการสืบค้นที่ถูกเร่งความเร็วโดย AQUA จะเพิ่มขึ้นตามระยะเวลา

ถาม: ฉันจะทราบได้อย่างไรว่าการสืบค้นใดบนคลัสเตอร์ Redshift ของฉันได้รับการเร่งความเร็วโดย AQUA

คุณสามารถสืบค้นดูตารางของระบบเพื่อดูการสืบค้นที่ได้รับการเร่งความเร็วโดย AQUA

ถาม: Amazon RedShift Managed Storageคืออะไร

Amazon Redshift Managed Storage มีให้เลือกใช้แบบไร้เซิร์ฟเวอร์และมาพร้อมกับประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บแยกกันได้ ซึ่งทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง Amazon S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ

ถาม: ฉันจะใช้พื้นที่จัดเก็บที่มีการจัดการของ Amazon RedShift อย่างไร

หากคุณใช้โหนด Amazon RedShift Dense Storage หรือ Dense Compute อยู่แล้ว คุณสามารถใช้ Elastic Resize เพื่ออัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่ได้ Amazon Redshift Serverless และคลัสเตอร์ที่ใช้อินสแตนซ์ RA3 จะใช้พื้นที่จัดเก็บที่มีการจัดการโดย Redshift โดยอัตโนมัติเพื่อจัดเก็บข้อมูล ไม่จำเป็นต้องดำเนินการอื่นใดนอกเหนือจากการใช้ Amazon Redshift Serverless หรืออินสแตนซ์ RA3 เพื่อใช้คุณสมบัตินี้

ถาม: Amazon Redshift Spectrum คืออะไร

Amazon Redshift Spectrum เป็นคุณสมบัติหนึ่งของ Amazon Redshift ที่ให้คุณสามารถเรียกใช้การสืบค้นกับขที่เก็บข้อมูลดิบใน Amazon S3 โดยไม่ต้องมีการโหลดข้อมูลหรือ ETL เมื่อสร้างการสืบค้น SQL ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ Amazon Redshift ซึ่งสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 แล้วสร้างแผนในการลดจำนวนข้อมูล S3 ที่ต้องอ่านให้น้อยที่สุด จากนั้นส่งคำขอโปรแกรมทำงานของ Amazon Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก S3

ถาม: ฉันควรพิจารณาใช้อินสแตนซ์ RA3 เมื่อใด

พิจารณาเลือกใช้โหนด RA3 ในกรณีต่อไปนี้

  • คุณต้องการความยืดหยุ่นในการปรับขนาดและจ่ายค่าบริการประมวลผลแยกกับพื้นที่จัดเก็บ
  • คุณสืบค้นข้อมูลเพียงส่วนหนึ่งของข้อมูลทั้งหมด
  • ปริมาณข้อมูลของคุณเพิ่มขึ้นอย่างรวดเร็วหรือคาดว่าจะเพิ่มขึ้นอย่างรวดเร็ว
  • คุณต้องการความยืดหยุ่นในการปรับขนาดคลัสเตอร์ตามความต้องการด้านประสิทธิภาพของคุณเท่านั้น

หากข้อมูลเพิ่มขึ้นเรื่อยๆ ไปจนถึงระดับเพตะไบต์ ปริมาณข้อมูลที่คุณนำเข้าไปยังคลังข้อมูล Amazon Redshift ของคุณก็จะเพิ่มขึ้นด้วยเช่นกัน คุณอาจกำลังมองหาวิธีที่จะวิเคราะห์ข้อมูลทั้งหมดของคุณอย่างคุ้มค่า

อินสแตนซ์ RA3 ของ Amazon Redshift พร้อมพื้นที่จัดเก็บที่มีการจัดการช่วยให้คุณสามารถเลือกจำนวนโหนดโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายค่าบริการเฉพาะพื้นที่จัดเก็บข้อมูลที่มีการจัดการซึ่งคุณใช้งานเท่านั้น ซึ่งช่วยให้คุณมีความยืดหยุ่นในการกำหนดขนาดคลัสเตอร์ RA3 ของคุณตามปริมาณข้อมูลที่คุณประมวลผลในแต่ละวันโดยไม่เพิ่มค่าใช้จ่ายด้านพื้นที่จัดเก็บข้อมูลแต่อย่างใด อินสแตนซ์ RA3 ที่สร้างขึ้นบน AWS Nitro System พร้อมพื้นที่จัดเก็บที่มีการจัดการจะใช้ SSD ประสิทธิภาพสูงสำหรับข้อมูล Hot (ข้อมูลที่เข้าถึงบ่อย) และใช้ Amazon S3 สำหรับข้อมูล Cold (ข้อมูลที่เข้าถึงไม่บ่อย) ซึ่งใช้งานได้ง่าย จัดเก็บข้อมูลได้คุ้มค่า และสืบค้นได้รวดเร็ว

ถาม: ฉันควรเลือกใช้ Amazon RedShift หรือ Amazon RDS 

ทั้ง Amazon RedShift และ Amazon Relational Database Service (RDS) ช่วยให้คุณสามารถเรียกใช้ฐานข้อมูลเชิงสัมพันธ์แบบดั้งเดิมในระบบคลาวด์ได้พร้อมๆ กับลดภาระในการดูแลจัดการฐานข้อมูล ลูกค้าจะใช้ฐานข้อมูล Amazon RDS เป็นหลักสำหรับปริมาณงานด้านการประมวลผลธุรกรรมทางออนไลน์ (OLTP) ในขณะที่ใช้ Amazon RedShift สำหรับการรายงานและการวิเคราะห์เป็นหลัก ปริมาณงาน OLTP จำเป็นจะต้องดำเนินการสืบค้นข้อมูลเฉพาะอย่างรวดเร็ว และต้องการการสนับสนุนสำหรับธุรกรรมต่างๆ เช่น การแทรก การอัปเดต และการลบ ซึ่งเป็นสิ่งที่ Amazon RDS สามารถจัดการได้ดีที่สุด Amazon RedShift จะควบคุมดูแลขนาดและทรัพยากรของโหนดทั้งหลายและใช้การปรับประสิทธิภาพให้เหมาะสมหลากหลายรูปแบบ จึงช่วยปรับปรุงให้เหนือกว่าฐานข้อมูลแบบเดิมอย่างมหาศาลในด้านการวิเคราะห์และการรายงานปริมาณงานต่อชุดข้อมูลขนาดใหญ่ Amazon RedShift มีตัวเลือกที่ยอดเยี่ยมในการปรับขยายตามข้อมูลและความซับซ้อนในการสืบค้น หรือหากคุณต้องการป้องกันไม่ให้กระบวนการรายงานและวิเคราะห์ของคุณไปแทรกแซงประสิทธิภาพของปริมาณงาน OLTP ของคุณ ขณะนี้ ด้วยคุณสมบัติคิวรีภายนอกแบบใหม่ คุณจะสามารถสืบค้นข้อมูลใน Amazon RDS ของคุณ หรือบริการฐานข้อมูล Aurora ด้วย Amazon RedShift ได้อย่างง่ายดาย

ถาม: ฉันควรเลือกใช้ Amazon RedShift (Redshift Spectrum) หรือ Amazon EMR

คุณควรใช้ Amazon EMR หากคุณใช้โค้ดแบบกำหนดเองเพื่อประมวลผลและวิเคราะห์ชุดข้อมูลที่มีขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่ เช่น Apache Spark, Hadoop, Presto หรือ Hbase Amazon EMR ช่วยให้คุณสามารถควบคุมการกำหนดค่าคลัสเตอร์และซอฟต์แวร์ที่คุณติดตั้งไว้บนนั้นได้อย่างครบถ้วน

คลังเก็บข้อมูล อาทิ Amazon RedShift ได้รับการออกแบบมาเพื่อดำเนินการวิเคราะห์ประเภทต่างๆ โดยพร้อมกัน คลังเก็บข้อมูลได้รับการออกแบบมาเพื่อรวบรวมข้อมูลจากแหล่งต่างๆ มากมายเอาไว้ด้วยกัน เช่น ระบบสินค้าคงคลัง ระบบการเงิน และระบบการขายปลีก คลังเก็บข้อมูลต้องจัดเก็บข้อมูลในโครงสร้างอย่างดี เพื่อให้แน่ใจว่าการรายงานจะมีความถูกต้องทั่วทั้งบริษัทอยู่เสมอ โครงสร้างนี้กำหนดกฎด้านความสอดคล้องของข้อมูลโดยตรงในตารางฐานข้อมูล Amazon RedShift คือสุดยอดบริการ หากคุณต้องการดำเนินการสืบค้นอันซับซ้อนสำหรับชุดข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างจำนวนมาก และต้องการประสิทธิภาพการทำงานที่รวดเร็วอย่างมาก

ถึงแม้คุณสมบัติ Redshift Spectrum จะเป็นตัวเลือกที่ยอดเยี่ยมในการรันการสืบค้นข้อมูลใน Amazon RedShift และ S3 แต่ก็ไม่ได้เหมาะกับกรณีใช้งานทุกรูปแบบที่องค์กรมักต้องการจากเฟรมเวิร์กการประมวลผลอย่าง Amazon EMR Amazon EMR คือบริการที่เป็นมากกว่าการเปิดใช้การสืบค้น SQL Amazon EMR คือบริการที่มีการจัดการซึ่งจะช่วยให้คุณสามารถประมวลผลและวิเคราะห์ชุดข้อมูลขนาดใหญ่มากโดยใช้เฟรมเวิร์กการประมวลผลข้อมูลขนาดใหญ่เวอร์ชันล่าสุด เช่น Spark, Hadoop และ Presto กับคลัสเตอร์แบบกำหนดเองเต็มรูปแบบ Amazon EMR ช่วยให้คุณสามารถรันการประมวลผลข้อมูลขนาดใหญ่แบบต่างๆ สำหรับแอปพลิเคชันได้ เช่น แมชชีนเลิร์นนิ่ง การวิเคราะห์กราฟ การแปลงข้อมูล ข้อมูลการสตรีม และอะไรก็ตามที่คุณสามารถเขียนโค้ดได้

คุณสามารถใช้ Redshift Spectrum กับ EMR ได้ Redshift Spectrum ใช้วิธีเดียวกันกับ Amazon EMR ในการจัดเก็บข้อกำหนดตาราง Redshift Spectrum รองรับ Apache Hive Metastore เดียวกันกับที่ Amazon EMR ใช้ในการระบุตำแหน่งข้อมูลและข้อกำหนดตาราง หากคุณใช้งาน Amazon EMR อยู่และมี Hive Metastore แล้ว คุณแค่เพียงกำหนดค่าคลัสเตอร์ Amazon Redshift เท่านั้น หากต้องการใช้งาน จากนั้น คุณสามารถเริ่มการสืบค้นข้อมูลได้ทันทีพร้อมกับงานของ Amazon EMR ดังนั้น หากคุณใช้งาน EMR ในการประมวลผลข้อมูลขนาดใหญ่อยู่แล้ว คุณสามารถใช้งาน Redshift Spectrum ในการสืบค้นข้อมูลได้พร้อมกันโดยไม่แทรกแซงการทำงานของ Amazon EMR

บริการสืบค้น คลังข้อมูล และเฟรมเวิร์กการประมวลผลข้อมูลอันซับซ้อนล้วนแต่มีจุดประสงค์ในการใช้งานที่แตกต่างกันไป คุณแค่เพียงต้องเลือกเครื่องมือที่เหมาะสมกับงานของคุณ

ถาม: ฉันควรใช้ Amazon Athena หรือ Amazon Redshift Spectrum

Amazon Athena เป็นบริการสืบค้นแบบโต้ตอบที่ช่วยให้ง่ายต่อการวิเคราะห์ข้อมูลใน Amazon S3 โดยใช้ SQL มาตรฐาน Athena ใช้งานง่าย เพียงแค่ชี้ไปที่ข้อมูลของคุณใน S3 กำหนดแบบแผน และเริ่มสืบค้นโดยใช้ SQL มาตรฐาน

Redshift Spectrum คือคุณสมบัติหนึ่งของ Amazon Redshift หากคุณต้องการวิเคราะห์ข้อมูลที่เข้าถึงบ่อยตามข้อตกลงระดับการให้บริการ (SLA) ที่เข้มงวดและประสิทธิภาพสูงสุด คุณควรใช้ Amazon Redshift คุณสามารถใช้ Redshift Spectrum เพื่อขยายการสืบค้น Amazon Redshift ของคุณไปยังข้อมูลที่เข้าถึงไม่บ่อยในที่เก็บข้อมูลดิบของ Amazon S3 ของคุณ และช่วยให้คุณมีอิสระในการจัดเก็บข้อมูลในที่ที่คุณต้องการ ในรูปแบบที่คุณต้องการ และพร้อมประมวลผลข้อมูลเมื่อคุณต้องการ

ถาม: เหตุใดฉันจึงควรใช้ Amazon RedShift แทนการเรียกใช้คลัสเตอร์คลังข้อมูล MPP ของฉันเองบน Amazon EC2

Amazon RedShift จะช่วยจัดการงานต่างๆ ที่ใช้เวลานานโดยอัตโนมัติซึ่งเกี่ยวข้องกับการจัดการคลังข้อมูลของคุณเอง ได้แก่:
  • การตั้งค่า: Amazon RedShift ช่วยให้คุณสามารถสร้างคลัสเตอร์คลังข้อมูล กำหนดสคีมาของคุณ และเริ่มโหลดและสืบค้นข้อมูลของคุณได้อย่างง่ายดาย คุณไม่จำเป็นต้องจัดการการจัดเตรียม การกำหนดค่า หรือการแพทช์
  • ความคงทนของข้อมูล: Amazon RedShift จะทำสำเนาข้อมูลของคุณไว้ในคลัสเตอร์คลังข้อมูลและจะสำรองข้อมูลของคุณอย่างต่อเนื่องไปยัง Amazon S3 ซึ่งได้รับการออกแบบมาให้มีความคงทนสูงถึง 99.999999999% Amazon RedShift จะสะท้อนข้อมูลของแต่ละไดรฟ์ไปยังโหนดอื่นๆ ภายในคลัสเตอร์ของคุณ หากไดรฟ์ทำงานล้มเหลว การสืบค้นของคุณจะดำเนินการต่อไปโดยมีเวลาแฝงเพิ่มขึ้นเล็กน้อยในขณะที่ Redshift สร้างไดรฟ์ของคุณขึ้นใหม่จากตัวสำเนา ในกรณีที่โหนดทำงานล้มเหลว Amazon Redshift จะจัดเตรียมโหนดใหม่โดยอัตโนมัติและเริ่มกู้คืนข้อมูลจากไดรฟ์อื่นๆ ภายในคลัสเตอร์หรือจาก Amazon S3 ระบบจะให้ความสำคัญในการกู้คืนข้อมูลที่มีการสืบค้นบ่อยที่สุด การสืบค้นที่มีการดำเนินการบ่อยที่สุดจึงสามารถทำงานได้อย่างรวดเร็ว
  • การปรับขนาด: คุณสามารถเพิ่มหรือลบโหนดจากคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้ด้วยการเรียก API ครั้งเดียวหรือการคลิกไม่กี่ครั้งใน AWS Management Console หากความจุและประสิทธิภาพต้องมีการเปลี่ยนแปลง นอกจากนี้ คุณยังสามารถกำหนดเวลาในการดำเนินงานปรับขนาดและปรับขยายได้โดยใช้ความสามารถตัวกำหนดเวลาใน Amazon Redshift ได้อีกด้วย
  • การอัปเดตและการติดตั้งแพตช์โดยอัตโนมัติ: Amazon Redshift จะอัปเกรดและติดตั้งแพตช์สำหรับคลังเก็บข้อมูลของคุณโดยอัตโนมัติ คุณจึงสามารถโฟกัสกับแอปพลิเคชันของคุณได้และไม่ต้องกังวลเรื่องการดูแลจัดการ
  • ความสามารถในการสืบค้นระดับเอกซะไบต์: Amazon Redshift Spectrum ช่วยให้คุณสามารถรันการสืบค้นข้อมูลระดับเอกซะไบต์ได้ใน Amazon S3 โดยไม่จำเป็นต้องโหลดหรือ ETL ถึงแม้ว่าคุณไม่ได้จัดเก็บข้อมูลของคุณไว้ใน Amazon Redshift แต่คุณยังสามารถใช้ Redshift Spectrum ในการสืบค้นชุดข้อมูลระดับเอกซะไบต์ใน Amazon S3 ได้

ถาม: ฉันสามารถสร้างและเข้าถึงคลัสเตอร์คลังข้อมูล Amazon RedShift ได้อย่างไร

คุณสามารถสร้างคลัสเตอร์คลังข้อมูล Amazon RedShift ได้อย่างง่ายดายโดยใช้ AWS Management Console หรือ API ของ Amazon RedShift คุณสามารถเริ่มจากคลังข้อมูลแบบโหนดเดียวขนาด 160 GB และปรับขนาดเพิ่มเป็นระดับเพตะไบต์ขึ้นไปได้ในไม่กี่คลิกผ่าน AWS Console หรือการเรียกใช้ API ครั้งเดียว

การกำหนดค่าแบบโหนดเดียวซึ่งเหมาะที่สุดสำหรับปริมาณงานด้านการประเมินผลหรือการพัฒนา/การทดสอบ ช่วยให้คุณสามารถเริ่มใช้งาน Amazon RedShift ได้อย่างรวดเร็วและคุ้มค่า และสามารถปรับเป็นการกำหนดค่าแบบหลายโหนดได้ตามความต้องการในการใช้งานที่เพิ่มมากขึ้น คลัสเตอร์คลังข้อมูล RedShift สามารถมีโหนดประมวลผลได้ 1-128 โหนด ทั้งนี้ขึ้นอยู่กับประเภทโหนด สำหรับ RA3 ซึ่งเป็นประเภทโหนดรุ่นล่าสุด จะมีจำนวนโหนดขั้นต่ำ 2 โหนด ดูรายละเอียดได้ที่เอกสารประกอบ

การกำหนดค่าแบบหลายโหนดจำเป็นต้องมีโหนดนำที่คอยดูแลการเชื่อมต่อไคลเอนต์และรับการสืบค้น และโหนดประมวลผลสองโหนดที่จัดเก็บข้อมูลและดำเนินการสืบค้นกับการประมวลผล โดยระบบจะจัดเตรียมโหนดนำซึ่งมีขนาดเท่ากับโหนดประมวลผลให้คุณโดยอัตโนมัติและไม่ต้องเสียค่าบริการ

เพียงแค่ระบุ Availability Zone (ไม่บังคับ), จำนวนโหนด, ประเภทโหนด, ชื่อหลักและรหัสผ่าน, กลุ่มความปลอดภัย, การกำหนดค่าระยะเวลาจัดเก็บข้อมูลสำรอง และการตั้งค่าระบบอื่นๆ ที่คุณต้องการ เมื่อคุณเลือกการกำหนดค่าที่ต้องการได้แล้ว Amazon RedShift จะจัดเตรียมทรัพยากรที่จำเป็นต้องใช้ให้และตั้งค่าคลัสเตอร์คลังเก็บข้อมูลของคุณ

เมื่อคลัสเตอร์คลังข้อมูลของคุณพร้อมใช้งานแล้ว คุณสามารถเรียกใช้ตำแหน่งข้อมูลและสตริงการเชื่อมต่อ JDBC และ ODBC ได้จาก AWS Management Console หรือโดยใช้ API ของ RedShift จากนั้น คุณสามารถใช้สตริงการเชื่อมต่อนี้กับเครื่องมือจัดการฐานข้อมูล ภาษาการเขียนโปรแกรม หรือเครื่องมือธุรกิจอัจฉริยะ (BI) ของคุณได้ คุณจะต้องอนุญาตคำขอเครือข่ายสำหรับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่ ดูคำอธิบายโดยละเอียดได้ที่คู่มือการเริ่มใช้งานของเรา

ถาม: เหตุใดฉันจึงควรใช้ Amazon Redshift Spatial

Amazon Redshift Spatial มีการวิเคราะห์ข้อมูลเชิงลึกจำนวนมากตามตำแหน่งกับข้อมูลของคุณ ซึ่งรวมข้อมูลเชิงพื้นที่และข้อมูลธุรกิจได้อย่างราบรื่นในการวิเคราะห์เพื่อการตัดสินใจ Amazon Redshift เปิดตัวการสนับสนุนการประมวลผลข้อมูลเชิงพื้นที่แบบเนทีฟในเดือนพฤศจิกายน 2019 โดยมีประเภทข้อมูลพหุสันฐาน GEOMETRY และฟังก์ชันเชิงพื้นที่ SQL ที่สำคัญหลายรายการ ตอนนี้ เรารองรับประเภทข้อมูล GEOGRAPHY และไลบรารีฟังก์ชันเชิงพื้นที่ SQL ของเราได้เติบโตขึ้นเป็น 80 เรารองรับประเภทข้อมูลและมาตรฐานเชิงพื้นที่ทั่วไปทั้งหมด รวมถึง Shapefiles, GeoJSON, WKT, WKB, eWKT และ eWKB หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้าเอกสารประกอบหรือหน้าบทแนะนำสอนการใช้งาน Amazon Redshift Spatial

ถาม: การปรับปรุงประสิทธิภาพการสืบค้นข้อมูล Cold คืออะไร และ Amazon Redshift ทำอะไรเพื่อปรับปรุงประสิทธิภาพการสืบค้นข้อมูล Cold

Amazon Redshift สามารถประมวลผลการสืบค้นได้เร็วขึ้นถึง 2 เท่าเมื่อจำเป็นต้องคอมไพล์ การปรับปรุงนี้ช่วยให้คุณดำเนินการสืบค้นได้ดียิ่งขึ้นเมื่อคุณสร้างคลัสเตอร์ Redshift ใหม่ เตรียมความพร้อมปริมาณงานใหม่ในคลัสเตอร์ที่มีอยู่ หรือหลังการอัปเดตซอฟต์แวร์ของคลัสเตอร์ที่มีอยู่ การปรับปรุงประสิทธิภาพการสืบค้นนี้ไม่มีค่าใช้จ่ายเพิ่มเติม และไม่ต้องดำเนินการใดๆ เพื่อเปิดใช้งานบนคลัสเตอร์ของคุณ

การเพิ่มประสิทธิภาพการสืบค้นข้อมูล Cold ช่วยปรับขนาดการคอมไพล์การสืบค้นให้เป็นบริการคอมไพล์แบบไร้เซิร์ฟเวอร์นอกเหนือจากทรัพยากรการประมวลผลของโหนดผู้นำของคลัสเตอร์คุณ Amazon Redshift รองรับแคชไม่จำกัดเพื่อจัดเก็บอ็อบเจ็กต์ที่คอมไพล์แล้วเพื่อเพิ่มแคชฮิตจาก 99.60% เป็น 99.95% เมื่อส่งการสืบค้นที่สำคัญกับเป้าหมายของคุณไปยัง Amazon Redshift

เมื่อส่งการสืบค้นไปยัง Amazon Redshift กลไกการสืบค้นจะคอมไพล์การสืบค้นเป็นรหัสเครื่องและกระจายไปยังโหนดคลัสเตอร์ โค้ดที่คอมไพล์แล้วจะทำงานเร็วขึ้น เพราะช่วยขจัดค่าใช้จ่ายในการใช้ล่าม สำหรับคลัสเตอร์ใหม่ที่ไม่มีแคชรหัสหรือหลังจากที่อัปเกรดคลัสเตอร์เดิมเป็นรุ่นล่าสุด แคชรหัสจะถูกล้าง และต้องทำการคอมไพล์การสืบค้น ด้วยเหตุนี้ เวลาแฝงของการสืบค้นอาจแตกต่างกันไป ซึ่งอาจไม่เป็นไปตามข้อกำหนดของปริมาณงานบางอย่าง แต่ในการอัปเดตนี้ แคชไม่จำกัดจะช่วยลดความจำเป็นในการคอมไพล์โค้ด และหากจำเป็นต้องคอมไพล์ ฟาร์มการคอมไพล์ที่ปรับขนาดได้จะคอมไพล์โค้ดพร้อมกันเพื่อเพิ่มความเร็วให้กับปริมาณงานของคุณ โดยความเร็วที่เพิ่มขึ้นนั้นขึ้นอยู่กับความซับซ้อนและการทำงานพร้อมกันของปริมาณงานดังกล่าว หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการคอมไพล์โค้ด โปรดดูที่การประมวลผลการสืบค้นในคู่มือนักพัฒนาฐานข้อมูล

ไร้เซิร์ฟเวอร์

ถาม: Amazon Redshift Serverless (ตัวอย่าง) คืออะไร

Amazon Redshift Serverless (ตัวอย่าง) คือตัวเลือกแบบไร้เซิร์ฟเวอร์ของ Amazon Redshift ที่ช่วยให้เรียกใช้และปรับขนาดการวิเคราะห์ได้ง่ายในไม่กี่วินาทีโดยไม่จำเป็นต้องตั้งค่าและจัดการโครงสร้างพื้นฐานคลังข้อมูล Redshift Serverless ช่วยให้ผู้ใช้ทุกคน รวมถึงนักวิเคราะห์ข้อมูล นักพัฒนา นักธุรกิจ และนักวิทยาศาสตร์ข้อมูล ได้รับข้อมูลเชิงลึกจากคลังข้อมูลเพียงแค่โหลดและสืบค้นข้อมูลในคลังข้อมูล

ถาม: ฉันจะเริ่มใช้งาน Amazon Redshift Serverless (ตัวอย่าง) ได้อย่างไร

คุณสามารถเลือก "กำหนดค่า Amazon Redshift Serverless" และเริ่มสืบค้นข้อมูลได้ด้วยการคลิกเพียงไม่กี่ครั้งใน AWS Management Console คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า เช่น ข้อมูลสภาพอากาศ ข้อมูลสำมะโน และชุดข้อมูลวัดประสิทธิภาพ พร้อมกับการสืบค้นตัวอย่างเพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก Amazon S3, แชร์ข้อมูลของ Amazon Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด (เช่น Parquet หรือ ORC) ในที่เก็บข้อมูลดิบของ Amazon S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น Amazon Aurora และ Amazon RDS PostgreSQL และ MySQL

ถาม: Amazon Redshift Serverless (ตัวอย่าง) ทำอะไรได้บ้าง

Amazon Redshift Serverless มีประโยชน์มากมาย ดังนี้

  • รับข้อมูลเชิงลึกอย่างรวดเร็วโดยไม่ต้องจัดเตรียมและจัดการคลัสเตอร์
  • ปรับขนาดตามความต้องการของปริมาณงานอย่างชาญฉลาดโดยอัตโนมัติ โดยไม่ต้องเตรียมทรัพยากรเผื่อไว้
  • ปรับขนาดและอัปเดตเวอร์ชันได้เรื่อยๆ
  • สืบค้นได้อย่างรวดเร็วทันทีสำหรับทั้งข้อมูลในคลังข้อมูล รูปแบบเปิดในที่เก็บข้อมูลดิบของ Amazon S3 และข้อมูลในฐานข้อมูลปฏิบัติการโดยไม่ต้องปรับฐานข้อมูล
  • วิเคราะห์ SQL ได้อย่างครบถ้วน พร้อมความทนทานและการรับประกันการทำธุรกรรมของ Amazon Redshift
  • ประหยัดค่าใช้จ่ายโดยจ่ายเฉพาะความจุที่ใช้และลดความซับซ้อนของคลังข้อมูล

ถาม: การใช้งาน Amazon Redshift Serverless (ตัวอย่าง) มีประโยชน์อะไรบ้าง

หากคุณไม่มีประสบการณ์ในการจัดการคลังข้อมูล คุณก็ไม่ต้องกังวลกับการตั้งค่า การกำหนดค่า การจัดการคลัสเตอร์ หรือการปรับแต่งคลังข้อมูล คุณสามารถให้ความสำคัญกับการรับข้อมูลเชิงลึกที่สำคัญจากข้อมูลของคุณ หรือการนำเสนอผลลัพธ์ทางธุรกิจหลักของคุณผ่านข้อมูล และจ่ายค่าบริการเฉพาะส่วนที่คุณใช้เท่านั้น ช่วยให้ดูแลจัดการต้นทุนได้ตลอด โดยคุณยังคงได้รับประโยชน์จากประสิทธิภาพชั้นยอดทั้งหมดของ Amazon Redshift, คุณสมบัติ SQL ที่หลากหลาย, การผสานรวมกับที่เก็บข้อมูลดิบและคลังข้อมูลปฏิบัติการอย่างราบรื่น และคุณสมบัติวิเคราะห์เชิงคาดการณ์ในตัวและการแชร์ข้อมูล หากคุณต้องใช้การควบคุมคลังข้อมูลอย่างละเอียด คุณสามารถจัดเตรียมคลัสเตอร์ Redshift ได้

ถาม: Amazon Redshift Serverless (ตัวอย่าง) ใช้งานร่วมกับบริการอื่นๆ ของ AWS เป็นอย่างไรบ้าง

คุณสามารถใช้ฟังก์ชันการวิเคราะห์ที่หลากหลายทั้งหมดของ Amazon Redshift ได้ต่อไป เช่น การรวบรวมที่ซับซ้อน การสืบค้นโดยตรงไปยังข้อมูลในที่เก็บข้อมูลดิบของ Amazon S3 และฐานข้อมูลเชิงปฏิบัติการ, การดูแบบมิติ, ขั้นตอนกระบวนการที่จัดเก็บไว้, การสนับสนุนข้อมูลกึ่งโครงสร้าง และ ML อีกทั้งยังมีประสิทธิภาพสูงในทุกระดับขนาดอีกด้วย บริการที่เกี่ยวข้องทั้งหมดที่ Amazon Redshift ใช้งานร่วมกันได้ (เช่น Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation และ AWS Glue) ยังคงใช้งานกับ Amazon Redshift Serverless ได้

ถาม: กรณีใช้งานใดบ้างที่ฉันสามารถจัดการด้วย Amazon Redshift Serverless (ตัวอย่าง) ได้

คุณสามารถเรียกใช้กรณีการใช้งานการวิเคราะห์ทั้งหมดต่อไปได้ Amazon Redshift Serverless พร้อมเวิร์กโฟลว์การเริ่มต้นใช้งานที่เรียบง่าย การปรับขนาดอัตโนมัติ และการจ่ายค่าบริการตามที่ใช้งาน ช่วยให้ง่ายและคุ้มค่าต่อการเรียกใช้การพัฒนาและการทดสอบสภาพแวดล้อมที่ต้องเริ่มต้นอย่างรวดเร็ว ต้องมีการวิเคราะห์ธุรกิจเฉพาะทาง ต้องมีปริมาณงานที่มีความต้องการด้านการประมวลผลที่แตกต่างกันและคาดเดาไม่ได้ และต้องมีปริมาณงานที่ไม่ต่อเนื่องหรือไม่สม่ำเสมอ

ถาม: Amazon Athena แตกต่างจาก Amazon Redshift Serverless อย่างไร

Amazon Athena และ Amazon Redshift ตอบสนองความต้องการและกรณีการใช้งานที่แตกต่างกัน แม้ว่าทั้งสองบริการจะเป็นแบบไร้เซิร์ฟเวอร์ก็ตาม คลังข้อมูล เช่น Amazon Redshift เป็นตัวเลือกที่ดีที่สุด หากคุณต้องการความคุ้มค่าที่สุดสำหรับ BI ที่ซับซ้อนและปริมาณงานการวิเคราะห์ที่ต้องการประสิทธิภาพสูงในทุกระดับขนาด และ Amazon Redshift ยังสามารถสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3 และรวมเข้ากับข้อมูลที่จัดเก็บไว้ในคลังข้อมูลได้อีกด้วย เมื่อเปรียบเทียบแล้ว Athena เหมาะสมกับการวิเคราะห์เชิงโต้ตอบในที่เก็บข้อมูลใดๆ ก็ตามที่ไม่เคร่งเรื่องการนำเข้าและการจัดรูปแบบข้อมูล การวิเคราะห์ของ Athena จะดำเนินนอกพื้นที่จัดเก็บข้อมูล ดังนั้นคุณจึงมีความยืดหยุ่นในการใช้เครื่องมือและบริการอื่นๆ เช่น Spark, Flink และ Kafka เพื่อปรับปรุงการวิเคราะห์และการประมวลผลข้อมูลบนข้อมูลเดียวกันที่วิเคราะห์โดย Athena

การแชร์ข้อมูล

ถาม: การแชร์ข้อมูลของ Amazon Redshift คืออะไร

การแชร์ข้อมูลของ Amazon Redshift ช่วยให้คุณสามารถแชร์ข้อมูลสดใน Amazon Redshift เพื่อแชร์ข้อมูลอย่างปลอดภัยและง่ายดายสำหรับอ่านกับคลัสเตอร์ Redshift อื่นๆ ทั้งภายในและระหว่างบัญชี AWS และกับบริการวิเคราะห์ของ AWS ที่ใช้ที่เก็บข้อมูลดิบ การแชร์ข้อมูลช่วยให้คุณสามารถสืบค้นข้อมูลสดได้ทันทีจากทุกคลัสเตอร์ Redshift ตราบใดที่คลัสเตอร์นั้นมีสิทธิ์ในการเข้าถึงโดยไม่มีความซับซ้อนและความล่าช้าที่เกี่ยวข้องกับการคัดลอกข้อมูลและการเคลื่อนย้ายข้อมูล Amazon Redshift ให้คุณแชร์และสืบค้นข้อมูลสดข้ามองค์กร ข้ามบัญชี และแม้แต่ข้ามรีเจี้ยน

ถาม: กรณีการใช้งานสำหรับการแชร์ข้อมูลมีอะไรบ้าง

กรณีการใช้งานที่สำคัญ ได้แก่

  • การแชร์ข้อมูลของคลัสเตอร์ ETL ส่วนกลางกับคลัสเตอร์ BI/การวิเคราะห์จำนวนมาก เพื่อแยกปริมาณงานในการอ่านและดูแลควบคุมเพิ่มเติม
  • ผู้ให้บริการข้อมูลแชร์ข้อมูลกับผู้บริโภคภายนอก
  • การแชร์ชุดข้อมูลทั่วไป เช่น ลูกค้า ผลิตภัณฑ์ในกลุ่มธุรกิจต่างๆ และการทำงานร่วมกันเพื่อการวิเคราะห์ในวงกว้างและวิทยาศาสตร์ข้อมูล
  • การกระจายศูนย์ข้อมูลเพื่อให้จัดการได้ง่ายขึ้น
  • การแชร์ข้อมูลระหว่างสภาพแวดล้อมการพัฒนา การทดสอบ และการผลิต
  • การเข้าถึงข้อมูล Redshift จากบริการวิเคราะห์อื่นๆ ของ AWS

ถาม: การสืบค้นข้ามฐานข้อมูลใน Amazon Redshift คืออะไร

การสืบค้นข้ามฐานข้อมูลทำให้คุณสามารถสืบค้นและรวมข้อมูลจากฐานข้อมูล Redshift ต่างๆ ที่คุณมีสิทธิ์เข้าถึงเข้าด้วยกันได้อย่างราบรื่น ไม่ว่าคุณกำลังเชื่อมต่อกับฐานข้อมูลใดอยู่ก็ตาม ซึ่งรวมถึงฐานข้อมูลที่อยู่ในคลัสเตอร์ และชุดข้อมูลสำหรับแชร์ที่มีให้จากคลัสเตอร์ระยะไกล การสืบค้นข้ามฐานข้อมูลช่วยให้คุณสามารถจัดระเบียบข้อมูลเป็นฐานข้อมูลที่แยกกันได้อย่างยืดหยุ่นเพื่อให้รองรับการกำหนดค่าแบบหลายผู้ใช้ได้

ถาม: AWS Data Exchange สำหรับ Amazon Redshift คืออะไร

AWS Data Exchange สำหรับ Amazon Redshift ช่วยให้คุณสามารถค้นหาและสมัครรับข้อมูลของบุคคลภายนอกใน AWS Data Exchange ที่คุณสามารถสืบค้นในคลังข้อมูล Redshift ได้ในเวลาไม่กี่นาที และคุณยังสามารถให้สิทธิ์ข้อมูลของคุณใน Amazon Redshift ผ่าน AWS Data Exchange ได้อย่างง่ายดายอีกด้วย ระบบจะมอบสิทธิ์การเข้าถึงให้โดยอัตโนมัติหากลูกค้าสมัครรับข้อมูลของคุณ และจะเพิกถอนโดยอัตโนมัติหากลูกค้าเลิกรับสมัครข้อมูล โดยจะสร้างใบแจ้งหนี้ขึ้นโดยอัตโนมัติและรวบรวมการชำระเงินและจ่ายผ่าน AWS โดยอัตโนมัติ คุณสมบัตินี้ช่วยให้คุณสืบค้น วิเคราะห์ และสร้างแอปพลิเคชันด้วยข้อมูลของบุคคลภายนอกได้อย่างรวดเร็ว

ถาม: ใครใช้งาน AWS Data Exchange เป็นหลัก

AWS Data Exchange ช่วยให้ลูกค้า AWS สามารถแลกเปลี่ยนและใช้ข้อมูลของบุคคลภายนอกใน AWS อย่างปลอดภัยได้ง่ายขึ้น นักวิเคราะห์ข้อมูล ผู้จัดการผลิตภัณฑ์ ผู้จัดการพอร์ตโฟลิโอ นักวิทยาศาสตร์ข้อมูล นักวิจัยเชิงปริมาณ ช่างเทคนิคด้านการทดลองทางคลินิก และนักพัฒนาในเกือบทุกอุตสาหกรรมต่างต้องการเข้าถึงข้อมูลจำนวนมากเพื่อดำเนินการวิเคราะห์ ฝึกฝนโมเดล ML และตัดสินใจโดยใช้ข้อมูลเป็นหลัก แต่ไม่มีอะไรที่สามารถค้นหาข้อมูลจากผู้ให้บริการหลายรายได้ อีกทั้งผู้ให้บริการแต่ละรายยังส่งมอบข้อมูลแตกต่างกัน ทำให้ต้องเจอกับสื่อทางกายภาพ, ข้อมูล FTP และการเรียก API ตามความต้องการแบบต่างๆ มากมาย ในทางกลับกัน หลายๆ องค์กรต้องการให้ข้อมูลของตนพร้อมสำหรับการวิจัยหรือวัตถุประสงค์ทางการค้า แต่การสร้างและการดูแลการส่งข้อมูล การให้สิทธิ์ และเทคโนโลยีการเรียกเก็บเงินนั้นยากและมีต้นทุนสูง ซึ่งส่งผลให้การให้ข้อมูลที่มีค่าลดลงไปอีก

ถาม: รีเจี้ยน AWS ใดบ้างที่ใช้งาน AWS Data Exchange ได้

AWS Data Exchange มีแค็ตตาล็อกผลิตภัณฑ์เดียวที่พร้อมใช้งานทั่วโลกจากผู้ให้บริการต่างๆ คุณสามารถดูแค็ตตาล็อกเดียวกันนี้ได้ไม่ว่าคุณจะใช้รีเจี้ยนใด ทรัพยากรในแต่ละผลิตภัณฑ์ (ชุดข้อมูล การแก้ไข และสินทรัพย์) เป็นทรัพยากรระดับรีเจี้ยนที่คุณจัดการทางโปรแกรมหรือผ่าน AWS Data Exchange Console ในรีเจี้ยน AWS เฉพาะ ดูรีเจี้ยน AWS ที่รองรับ AWS Data Exchange ได้ที่ตารางความพร้อมใช้งานระดับรีเจี้ยน AWS

ถาม: AWS Data Exchange และ Registry of Open Data on AWS แตกต่างกันอย่างไร

AWS Data Exchange และ Registry of Open Data on AWS แตกต่างกันหลักๆ อยู่ห้าประการ ดังนี้

  • ประการแรก AWS Data Exchange รองรับทั้งผลิตภัณฑ์ข้อมูลฟรีและข้อมูลเชิงพาณิชย์ โดยมีค่าธรรมเนียมเชิงพาณิชย์ที่เกี่ยวข้องกับใบแจ้งหนี้ AWS ของคุณ ส่วน Registry of Open Data on AWS ให้คุณเข้าถึงรายการชุดข้อมูลแบบเปิดฟรีที่คัดสรรมาแล้ว 
  • ประการที่สอง AWS Data Exchange กำหนดให้คุณต้องยอมรับข้อตกลงการสมัครใช้งานข้อมูลอย่างชัดเจนโดยสรุปข้อกำหนดที่ผู้ให้บริการข้อมูลกำหนดไว้ขณะเผยแพร่ผลิตภัณฑ์ของตน ส่วนข้อมูลใน Registry of Open Data on AWS ไม่มีข้อกำหนดการใช้งาน 
  • ประการที่สาม คุณต้องใช้ AWS Data Exchange API ในการคัดลอกข้อมูลจาก AWS Data Exchange ไปยังตำแหน่ง Amazon S3 ที่คุณต้องการ ส่วนชุดข้อมูลของ Registry of Open Data on AWS สามารถเข้าถึงได้ผ่าน S3 API 
  • ประการที่สี่ AWS Data Exchange มอบสิทธิ์ให้ผู้ให้บริการข้อมูลเข้าถึงรายงานรายวัน รายสัปดาห์ และรายเดือนที่มีรายละเอียดกิจกรรมการสมัครรับข้อมูล ส่วน Registry of Open Data on AWS กำหนดให้ผู้ให้บริการข้อมูลต้องวิเคราะห์บันทึกของตนเองเพื่อติดตามการใช้ข้อมูล 
  • ประการสุดท้าย ในการเป็นผู้ให้บริการข้อมูลบน AWS Data Exchange ลูกค้าที่มีเงื่อนไขตรงตามเกณฑ์จะต้องลงทะเบียนเป็นผู้ให้บริการข้อมูลใน AWS Marketplace เพื่อให้มีสิทธิ์แสดงรายการผลิตภัณฑ์ทั้งแบบฟรีและเชิงพาณิชย์ แต่ลูกค้าทุกคนสามารถเพิ่มข้อมูลฟรีไปยัง Registry of Open Data on AWS ผ่าน GitHub และนำไปใช้กับ AWS Public Dataset Program for AWS เพื่อสนับสนุนค่าใช้จ่ายในส่วนพื้นที่จัดเก็บและแบนด์วิดท์สำหรับชุดข้อมูลเปิดที่เลือก

ถาม: Query Editor V2 ของ Amazon Redshift คืออะไร

Amazon Redshift Query Editor v2 เป็นแอปพลิเคชันไคลเอ็นต์ SQL บนเว็บที่คุณสามารถใช้สร้างและเรียกใช้การสืบค้นในคลังข้อมูล Redshift ของคุณได้ คุณสามารถดูผลลัพธ์การสืบค้นจากตารางต่างๆ และแชร์การสืบค้นนั้นกับสมาชิกในทีมของคุณ Query Editor v2 มีความสามารถหลายอย่าง เช่น ความสามารถในการเรียกดูและสำรวจหลายฐานข้อมูล ตารางภายนอก มุมมองแบบต่างๆ ขั้นตอนกระบวนการที่จัดเก็บไว้ และฟังก์ชันที่ผู้ใช้กำหนดเอง ซึ่งมีตัวช่วยสำหรับสร้างสคีมา ตาราง และฟังก์ชันที่ผู้ใช้กำหนดเอง และคุณยังสามารถโหลดข้อมูลใน Amazon Redshift จาก Amazon S3 ได้โดยใช้ตัวช่วยแสดงภาพได้อีกด้วย ซึ่งช่วยลดความยุ่งยากในการจัดการและการทำงานร่วมกันของการสืบค้นที่บันทึกไว้ นอกจากนั้น คุณยังสามารถรับข้อมูลเชิงลึกได้เร็วขึ้นด้วยการแสดงภาพผลลัพธ์ด้วยการคลิกเพียงครั้งเดียว รุ่นตัวอย่างล่าสุดช่วยให้นักวิเคราะห์ข้อมูลสามารถแชร์การสืบค้นและทำงานร่วมกันผ่านอินเทอร์เฟซทั่วไปที่เรียกว่า Query Doc ซึ่งช่วยให้พวกเขาสามารถฝังการสืบค้นโค้ด/SQL คำอธิบายประกอบ ผลลัพธ์ และการแสดงภาพได้

ถาม: เหตุใดฉันจึงควรใช้ Query Editor V2

หากคุณเป็นนักวิเคราะห์ข้อมูล นักวิทยาศาสตร์ข้อมูล หรือวิศวกรข้อมูล ตอนนี้คุณสามารถใช้ Query Editor V2 เพื่อเรียกดู สร้างสคีมาและตาราง โหลดข้อมูล และเขียนการสืบค้น SQL ขั้นตอนกระบวนการที่จัดเก็บไว้ และ UDF ผ่านอินเทอร์เฟซบนเว็บได้ และสามารถทำการวิเคราะห์ข้อมูลด้วยภาพโดยไม่ต้องออกจากเครื่องมือได้อีกด้วย นอกจากนั้น คุณยังสามารถกำหนดเวลาการสืบค้นหรือการสืบค้นที่ใช้เวลานานสำหรับการรายงานง่ายๆ เช่น การรายงานรายวัน

ถาม: Query Editor v2 มีคุณสมบัติอะไรบ้าง

Query Editor v2 ช่วยให้คุณสามารถ:

  • สร้างภาพสคีมา ตาราง และโหลดข้อมูลจาก Amazon S3
  • เขียนการสืบค้นและรับข้อมูลเชิงลึกเร็วขึ้นด้วยตัวแก้ไขที่ใช้งานง่ายสำหรับการเขียนการสืบค้น SQL
  • วิเคราะห์และดาวน์โหลดผลลัพธ์ในรูปแบบ JSON/CSV ไปยังเดสก์ท็อปของคุณ
  • จัดการการสืบค้นเวอร์ชันต่างๆ โดยอัตโนมัติ
  • ทำงานร่วมกับผู้ใช้รายอื่นเพื่อแชร์การสืบค้น การวิเคราะห์ และผลลัพธ์ต่างๆ
  • เรียกใช้การสืบค้นในพื้นหลังแม้ว่าเบราว์เซอร์จะปิดอยู่

ความสามารถในการปรับขนาดและการทำงานพร้อมกัน

ถาม: ฉันสามารถปรับขนาดและประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังเก็บข้อมูลได้โดยใช้ Elastic Resize ผ่าน AWS Management Console หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังเก็บข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังเก็บข้อมูล Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนี้ คุณยังสามารถเพิ่มตัวชี้วัดที่ผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้เช่นกัน

คุณสมบัติด้านการปรับขนาดจำนวนผู้ใช้พร้อมกันเปิดโอกาสให้คุณสนับสนุนผู้ใช้และการสืบค้นพร้อมกันได้แทบไม่จำกัดจำนวน โดยมีประสิทธิภาพการสืบค้นที่รวดเร็วอย่างสม่ำเสมอ เมื่อมีการเปิดใช้งานการปรับขนาดจำนวนผู้ใช้พร้อมกัน Amazon Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อประสบการณ์คลัสเตอร์ของคุณเพิ่มขึ้นในคิวการสืบค้น

Amazon Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้คลัสเตอร์ Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกัน เพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ RedShift เพื่อการประมวลผลใดๆ ที่เหลืออยู่

ถาม: ฉันจะยังสามารถใช้งานคลัสเตอร์คลังข้อมูลของฉันในระหว่างการปรับขนาดได้หรือไม่

ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ RedShift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ

ถาม: ฉันควรใช้คุณสมบัติการปรับขนาดพร้อมกันเมื่อใด และควรใช้คุณสมบัติการแชร์ข้อมูลเมื่อใด

การแชร์ข้อมูลและการปรับขนาดพร้อมกันเป็นคุณสมบัติเสริม คุณสมบัติการปรับขนาดพร้อมกันของ Amazon Redshift ช่วยให้คุณสามารถปรับขนาดปริมาณงานจำนวนหนึ่งรายการขึ้นไปในคลัสเตอร์เดียวได้โดยอัตโนมัติ เพื่อจัดการกับการทำงานพร้อมกันและการสืบค้นที่เพิ่มขึ้นอย่างรวดเร็ว Amazon Redshift จะสร้างความจุขึ้นมาโดยอัตโนมัติและยืดหยุ่นภายในเวลาเพียงไม่กี่วินาทีเพื่อรับมือกับกิจกรรมของผู้ใช้ที่หลั่งไหลเข้ามาอย่างรวดเร็ว และจะลดความจุลงเมื่อกิจกรรมลดลง แอปพลิเคชันจะยังคงโต้ตอบกับ Amazon Redshift ต่อไปโดยใช้ตำแหน่งข้อมูลแอปพลิเคชันเดียว คุณสมบัติการแชร์ข้อมูลช่วยให้คุณสามารถปรับขนาดให้เหมาะกับปริมาณงานที่มีหลายคลัสเตอร์และการติดตั้งใช้งานแบบหลายบัญชี ซึ่งช่วยให้เกิดการแยกปริมาณงานและความสามารถในการดูแล การทำงานร่วมกันระหว่างกลุ่มในสภาพการทำงานแบบกระจายอำนาจ และความสามารถในการนำเสนอข้อมูลในฐานะบริการต่อผู้ที่มีส่วนเกี่ยวข้องทั้งภายในและภายนอก คุณสามารถเปิดใช้คุณสมบัติการปรับขนาดพร้อมกันได้ทั้งในคลัสเตอร์ผู้ผลิตและคลัสเตอร์ผู้บริโภคที่มีการแชร์ข้อมูล

ถาม: ฉันจะจัดการทรัพยากรอย่างไรเพื่อให้แน่ใจว่าคลัสเตอร์ Amazon Redshift ของฉันจะสามารถให้ประสิทธิภาพที่รวดเร็วอย่างต่อเนื่องในช่วงที่มีการทำงานพร้อมกันสูงได้

คลังข้อมูลทั่วไปมีความแปรปรวนอย่างมากในการใช้การสืบค้นพร้อมกันตลอดทั้งวัน การเพิ่มทรัพยากรในช่วงเวลาที่ต้องการจึงประหยัดคุ้มค่ากว่าการจัดเตรียมให้กับช่วงที่มีความต้องการสูง Amazon Redshift จัดการดำเนินการนี้ในนามของคุณโดยอัตโนมัติ

การปรับขนาดพร้อมกันเป็นคุณสมบัติใน Amazon Redshift ที่จะให้ประสิทธิภาพการสืบค้นที่รวดเร็วอย่างต่อเนื่องแม้ว่าจะมีการสืบค้นเกิดขึ้นพร้อมกันหลายพันรายการ ด้วยคุณสมบัตินี้ Amazon Redshift จะเพิ่มความจุคลัสเตอร์ชั่วคราวโดยอัตโนมัติเมื่อจำเป็นต้องรองรับความต้องการใช้งานจำนวนมาก Amazon Redshift จะกำหนดเส้นทางการสืบค้นโดยอัตโนมัติเพื่อปรับขนาดคลัสเตอร์ซึ่งได้รับการจัดเตรียมในไม่กี่วินาทีและเริ่มการประมวลผลสืบค้นในทันที

คุณสมบัตินี้ฟรีสำหรับลูกค้าส่วนใหญ่ แต่ละคลัสเตอร์ Amazon Redshift ได้รับเครดิตการปรับขนาดพร้อมกันสูงสุดหนึ่งชั่วโมงต่อวัน ซึ่งจะช่วยให้คุณสามารถคาดการณ์ค่าใช้จ่ายแบบรายเดือนได้แม้ในช่วงที่ความต้องการวิเคราะห์มีความผันผวน

คำถาม: Elastic Resize คืออะไรและแตกต่างจากการปรับขนาดพร้อมกันอย่างไร

Elastic Resize เพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการปริมาณงานสืบค้น ตัวอย่างเช่น ปริมาณงาน ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Amazon Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มการทำงานพร้อมกันของการสืบค้นโดยรวม

คำถาม: ฉันสามารถเข้าถึงคลัสเตอร์การปรับขนาดพร้อมกันได้โดยตรงหรือไม่

ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ Amazon RedShift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง

การผสานรวมและการโหลดข้อมูล

ถาม: ฉันจะโหลดข้อมูลเข้าคลังข้อมูล Amazon RedShift ได้อย่างไร

คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon RedShift ได้จากแหล่งข้อมูลต่างๆ มากมาย ได้แก่ Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue AWS Data Pipelineและ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในองค์กร Amazon RedShift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังเก็บข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'แทรก' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่งแทรก SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ถาม: ฉันจะโหลดข้อมูลจากแหล่งข้อมูล Amazon RDS, Amazon EMR, Amazon DynamoDB และ Amazon EC2 ที่ฉันมีอยู่ไปยัง Amazon RedShift ได้อย่างไร

คุณสามารถใช้คำสั่ง COPY เพื่อโหลดข้อมูลโดยพร้อมกันไปยัง Amazon Redshift โดยตรงจาก Amazon EMR, Amazon DynamoDB หรือโฮสต์ที่เปิดใช้ SSH นอกจากนั้น Amazon Redshift Spectrum ยังช่วยให้คุณสามารถโหลดข้อมูลจาก Amazon S3 ไปยังคลัสเตอร์ของคุณได้โดยใช้คำสั่ง INSERT INTO ซึ่งทำให้คุณสามารถโหลดข้อมูลจากรูปแบบต่างๆ เช่น Parquet และ RC ไปยังคลัสเตอร์ของคุณได้ โปรดทราบว่า หากคุณใช้วิธีนี้ ระบบจะคิดค่าบริการสำหรับ Redshift Spectrum เพิ่มขึ้นสำหรับข้อมูลที่สแกนมาจาก Amazon S3 

AWS Data Pipeline มีโซลูชันที่ทนต่อข้อผิดพลาด น่าเชื่อถือ และมีประสิทธิภาพสูงในการโหลดข้อมูลจากแหล่งข้อมูลต่างๆ ของ AWS อย่าง Amazon RDS ไปยัง RedShift คุณสามารถใช้ AWS Data Pipeline ในการระบุแหล่งข้อมูลและการแปลงข้อมูลที่ต้องการ และเรียกใช้สคริปต์นำเข้าที่เขียนไว้ล่วงหน้าเพื่อโหลดข้อมูลไปยัง Amazon RedShift อีกทั้ง AWS Glue ยังเป็นบริการแยก แปลง และโหลดข้อมูล (ETL) ที่มีการจัดการเต็มรูปแบบอีกด้วย ซึ่งช่วยให้สามารถจัดเตรียมและโหลดข้อมูลเพื่อการวิเคราะห์ได้อย่างง่ายดาย คุณสามารถสร้างและเรียกใช้งาน ETL ของ AWS Glue ได้ด้วยการคลิกไม่กี่ครั้งใน AWS Management Console นอกจากนั้น บริษัท ETL หลายๆ แห่งต่างให้การรับรอง Amazon Redshift สำหรับการใช้งานร่วมกับเครื่องมือของตนเอง และอีกหลายบริษัทยังเสนอช่วงทดลองใช้งานฟรีที่จะช่วยให้คุณเริ่มโหลดข้อมูลของคุณได้อีกด้วย คุณสมบัติเหล่านี้บางส่วนยังปรับใช้การผสานรวมกับ Redshift Console ที่ลึกซึ้งยิ่งขึ้นอีกด้วย เพื่อการค้นหาและการตรวจสอบ Data Pipeline ใน Amazon Redshift ที่ง่ายขึ้นจากแหล่งข้อมูลของบุคคลภายนอกต่างๆ

ถาม: ฉันมีข้อมูลจำนวนมากที่ต้องโหลดไปยัง Amazon Redshift เป็นครั้งแรก ซึ่งการถ่ายโอนผ่านอินเทอร์เน็ตอาจใช้เวลานาน ฉันจะโหลดข้อมูลนี้อย่างไร

คุณสามารถใช้ AWS Snowball ถ่ายโอนข้อมูลไปยัง Amazon S3 ได้โดยใช้อุปกรณ์จัดเก็บข้อมูลแบบพกพา นอกจากนั้น คุณสามารถใช้ AWS Direct Connect ในการสร้างการเชื่อมต่อเครือข่ายส่วนตัวระหว่างเครือข่ายหรือศูนย์ข้อมูลของคุณกับ AWS ได้ คุณสามารถเลือกพอร์ตการเชื่อมต่อแบบ 1Gbit/วินาที หรือแบบ 10 Gbit/วินาที ในการถ่ายโอนข้อมูลได้

การรักษาความปลอดภัย

ถาม: Amazon RedShift รักษาความปลอดภัยให้กับข้อมูลของฉันอย่างไร

Amazon RedShift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวม AWS IAM ในตัว, การเชื่อมโยงข้อมูลประจำตัวสำหรับการตรวจสอบสิทธิ์แบบ Single-Sign On (SSO), Multi-Factor Authentication, การควบคุมการเข้าถึงระดับคอลัมน์, Amazon Virtual Private Cloud (Amazon VPC) และมอบการผสานรวม AWS KMS ในตัวเพื่อปกป้องข้อมูลของคุณทั้งในระหว่างการส่งและการพักเก็บ Amazon RedShift จะเข้ารหัสและรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอนและข้อมูลที่จัดเก็บโดยใช้เทคนิคการเข้ารหัสตามมาตรฐานอุตสาหกรรม Amazon Redshift รองรับการเชื่อมต่อแบบเปิดใช้ SSL ระหว่างแอปพลิเคชันไคลเอ็นต์และคลัสเตอร์คลังเก็บข้อมูล Redshift ของคุณ เพื่อรักษาความปลอดภัยให้กับข้อมูลระหว่างการถ่ายโอน Amazon Redshift จะเข้ารหัสแต่ละบล็อกโดยใช้ AES-256 ที่มีการเร่งฮาร์ดแวร์ขณะที่เขียนข้อมูลลงดิสก์ เพื่อรักษาความปลอดภัยให้กับข้อมูลที่จัดเก็บ โดยจะดำเนินการในระดับต่ำภายในระบบย่อย I/O ซึ่งเข้ารหัสทุกข้อมูลที่เขียนลงในดิสก์ รวมถึงผลลัพธ์การสืบค้นระยะกลาง ระบบจะสำรองข้อมูลบล็อกตามเดิม ซึ่งหมายความว่าข้อมูลสำรองจะได้รับการเข้ารหัสด้วยเช่นกัน ตามค่าเริ่มต้น Amazon RedShift จะดูแลการจัดการคีย์ให้ แต่คุณสามารถเลือกที่จะจัดการคีย์ของคุณเองโดยผ่าน AWS Key Management Service ได้ คุณสามารถใช้คุณสมบัติด้านความปลอดภัยทั้งหมดของ Amazon RedShift ได้โดยไม่มีค่าใช้จ่ายเพิ่มเติม Redshift Spectrum รองรับการเข้ารหัสฝั่งเซิร์ฟเวอร์ (SSE) ของ Amazon S3 โดยใช้คีย์เริ่มต้นของบัญชีผู้ใช้ที่จัดการโดย AWS Key Management Service (KMS)

ถาม: RedShift รองรับการควบคุมการเข้าถึงแบบละเอียด อย่างเช่น ความปลอดภัยระดับคอลัมน์หรือไม่

รองรับ การควบคุมความปลอดภัยระดับคอลัมน์แบบละเอียดช่วยให้ผู้ใช้เห็นเฉพาะข้อมูลที่ควรเข้าถึง Amazon RedShift รองรับการควบคุมการเข้าถึงระดับคอลัมน์สำหรับตารางเฉพาะที่ ดังนั้นคุณจึงสามารถควบคุมการเข้าถึงคอลัมน์แต่ละคอลัมน์ของตาราง หรือดูตามการมอบ/การเพิกถอนสิทธิ์ระดับคอลัมน์แก่ผู้ใช้หรือกลุ่มของผู้ใช้ RedShift ได้รับการผสานรวมเข้ากับ AWS Lake Formation ซึ่งช่วยสร้างความมั่นใจว่าการควบคุมการเข้าถึงระดับคอลัมน์ของ Lake Formation จะถูกบังคับใช้สำหรับการสืบค้น RedShift กับข้อมูลในที่จัดเก็บข้อมูลดิบ

ถาม: Amazon Redshift รองรับการมาสก์ข้อมูลหรือการเปลี่ยนแปลงข้อมูลให้เป็นโทเค็นหรือไม่

ฟังก์ชันที่กำหนดโดยผู้ใช้ของ AWS Lambda (UDF) ช่วยให้คุณสามารถใช้ฟังก์ชัน AWS Lambda เป็น UDF ใน Amazon Redshift และเรียกใช้จากการสืบค้นบน Redshift SQL ได้ ฟังก์ชันนี้ช่วยให้คุณสามารถเขียนส่วนขยายแบบกำหนดเองสำหรับการสืบค้น SQL ของคุณ เพื่อให้สามารถผสานรวมเข้ากับบริการอื่นๆ หรือผลิตภัณฑ์จากบุคคลภายนอกได้ดียิ่งขึ้น คุณสามารถเขียน Lambda UDF เพื่อเปิดใช้งานการสร้างโทเค็นภายนอก การปกปิดข้อมูล การระบุตัวตนหรือการไม่ระบุตัวตนของข้อมูลโดยการผสานรวมกับผู้จัดจำหน่าย เช่น Protegrity และปกป้องหรือยกเลิกการปกป้องข้อมูลที่ละเอียดอ่อนตามสิทธิ์และกลุ่มของผู้ใช้ในระหว่างเวลาสืบค้น

ถาม: Amazon Redshift รองรับ Single Sign-On หรือไม่

รองรับ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร เช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า Amazon RedShift ให้รองรับ Single-Sign On ได้

ถาม: Amazon Redshift รองรับ Single-Sign On ด้วย Microsoft Azure Active Directory ได้อย่างไร

คุณสามารถลงชื่อเข้าใช้คลัสเตอร์ Amazon RedShift ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถลงชื่อเข้าใช้ RedShift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน RedShift

ถาม: Amazon RedShift รองรับ Multi-Factor Authentication (MFA) หรือไม่

รองรับ คุณสามารถใช้ Multi-Factor Authentication (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ Amazon RedShift

ถาม: ฉันสามารถใช้ Amazon RedShift ใน Amazon Virtual Private Cloud (Amazon VPC) ได้หรือไม่

ได้ คุณสามารถใช้ Amazon RedShift เป็นส่วนหนึ่งในการกำหนดค่า VPC ของคุณได้ คุณสามารถกำหนดโครงสร้างเครือข่ายเสมือนที่มีความคล้ายกับเครือข่ายแบบเดิมที่คุณอาจใช้งานได้ในศูนย์ข้อมูลของคุณเองด้วย Amazon VPC ซึ่งจะช่วยให้คุณสามารถควบคุมได้ว่าใครบ้างที่สามารถเข้าถึงคลัสเตอร์คลังเก็บข้อมูล RedShift ของคุณได้ คุณสามารถใช้ Redshift Spectrum ร่วมกับคลัสเตอร์ Redshift ที่เป็นส่วนหนึ่งของ Amazon VPC ได้

Amazon Redshift รองรับตำแหน่งข้อมูล VPC ที่มีการจัดการ (ให้บริการโดย AWS PrivateLink) เพื่อเชื่อมต่อกับคลัสเตอร์ Redshift ของคุณใน VPC ตำแหน่งข้อมูลที่จัดการโดย Amazon Redshift ช่วยให้คุณสามารถเข้าถึงคลังข้อมูล Redshift แบบส่วนตัวภายใน VPC ของคุณจากแอปพลิเคชันไคลเอนต์ใน VPC อื่นภายในบัญชี AWS เดียวกันหรือบัญชีอื่น และเรียกใช้ภายในองค์กรโดยไม่ต้องใช้ IP สาธารณะหรือไม่ต้องมีการรับส่งข้อมูลเพื่อสำรวจอินเทอร์เน็ต

ถาม: ฉันสามารถเข้าถึงโหนดประมวลผล Amazon Redshift ได้โดยตรงหรือไม่

ไม่ได้ โหนดประมวลผล Amazon Redshift ของคุณจะอยู่ในเครือข่ายส่วนตัวและสามารถเข้าถึงได้จากโหนดนำของคลัสเตอร์คลังเก็บข้อมูลของคุณเท่านั้น ซึ่งจะช่วยเพิ่มระดับความปลอดภัยให้ข้อมูลของคุณ

ถาม: Redshift รองรับการควบคุมการเข้าถึงตามบทบาทในฐานข้อมูลหรือไม่ (ก่อนการประกาศ)

Amazon Redshift จะรองรับการควบคุมการเข้าถึงตามบทบาทในเร็วๆ นี้

ความพร้อมใช้งานและความคงทน

ถาม: ถ้าไดรฟ์บนโหนดตัวใดตัวหนึ่งของฉันล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังข้อมูลและความทนทานของข้อมูลของฉัน

Amazon Redshift จะตรวจหาความล้มเหลวของไดรฟ์หรือโหนดในกรณีเหล่านี้ และเปลี่ยนโหนดคลัสเตอร์นั้นโดยอัตโนมัติ บนคลัสเตอร์ Dense Compute (DC) และ Dense Storage (DS2) ข้อมูลจะถูกเก็บไว้ในโหนดประมวลผลเพื่อให้แน่ใจว่าข้อมูลมีความทนทานสูง เมื่อเปลี่ยนโหนดแล้ว ระบบจะรีเฟรชข้อมูลจากสำเนาบนโหนดอื่น

คลัสเตอร์ RA3 และ Redshift Serverless จะไม่ได้รับผลกระทบในลักษณะเดียวกันนี้ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน Amazon S3 และไดรฟ์ในเครื่องเป็นเพียงแคชข้อมูลเท่านั้น ในกรณีที่มีการเปลี่ยนโหนด ข้อมูลจะถูกดึงมาจาก Amazon S3 Amazon S3 รับประกันความทนทานของข้อมูลถึง 99.9999% ในกรณีที่มีโหนดหรือคลัสเตอร์สมบูรณ์ล้มเหลวหลายรายการ สำเนาข้อมูลล่าสุดจะอยู่ใน S3 และสามารถกู้คืนคลัสเตอร์ได้ใน AZ เดียวกันหรือ AZ อื่นโดยไม่สูญเสียข้อมูล

คลัสเตอร์คลังเก็บข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ทำให้โหนดทดแทนของคุณพร้อมใช้งานทันที และโหลดข้อมูลที่เข้าถึงบ่อยที่สุดของคุณจาก Amazon S3 บน RA3 และแบบไร้เซิร์ฟเวอร์ และจากสำเนาบน DS2 และ Amazon Dense Compute (DC2) คลัสเตอร์ DC2 และ DS2 แบบโหนดเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 สามารถสร้างคลัสเตอร์ RA3.XLPLUS แบบโหนดเดี่ยวใหม่ได้โดยไม่สูญเสียข้อมูลโดยใช้ข้อมูลที่จัดเก็บไว้ใน S3 ด้วยความช่วยเหลือจาก AWS Support เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูลเพื่อเพิ่มความพร้อมใช้งานสูงสุด

ถาม: ในกรณีที่โหนดบางตัวทำงานล้มเหลว จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

Amazon RedShift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณในอัตโนมัติ คลัสเตอร์คลังเก็บข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วเท่าที่เป็นไปได้ คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์ทำงานล้มเหลว คุณจำเป็นต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล

ถาม: หาก Availability Zone (AZ) ของคลัสเตอร์คลังเก็บข้อมูลเกิดขัดข้อง จะเกิดอะไรขึ้นกับความพร้อมใช้งานของคลัสเตอร์คลังเก็บข้อมูลและความคงทนของข้อมูล

หากคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ของ Availability Zone ของคุณไม่สามารถใช้งานได้ Amazon Redshift จะย้ายคลัสเตอร์ของคุณไปยัง AWS Availability Zone (AZ) โดยอัตโนมัติโดยไม่มีการสูญเสียข้อมูลหรือเปลี่ยนแปลงแอปพลิเคชัน โดยคุณต้องเปิดใช้งานความสามารถในการย้ายตำแหน่งในการตั้งค่าคลัสเตอร์ของคุณเพื่อเปิดใช้ฟังก์ชันนี้

ถาม: Amazon Redshift รองรับการติดตั้งใช้งานแบบ Multi-AZ หรือไม่

Amazon Redshift รองรับเฉพาะการติดตั้งใช้งานในรีเจี้ยนเดียวเท่านั้นในตอนนี้ หากต้องการตั้งค่าการกำหนดค่าการกู้คืนข้อมูลหลังภัยพิบัติ (DR) คุณสามารถเปิดใช้งานการคัดลอกสแนปช็อตข้ามรีเจี้ยนในคลัสเตอร์ของคุณได้ ซึ่งจะจำลองสแนปช็อตทั้งหมดจากคลัสเตอร์ของคุณไปยังรีเจี้ยน AWS อื่น ในเหตุการณ์ DR สามารถกู้คืนสแนปช็อตในรีเจี้ยนจำลองเพื่อสร้างคลัสเตอร์ใหม่ได้ และ Amazon Redshift ยังสนับสนุนการแชร์ข้อมูลข้ามรีเจี้ยนอีกด้วย โดยที่คลัสเตอร์ผู้บริโภคสามารถเข้าถึงข้อมูลสดในคลัสเตอร์ผู้ผลิตในรีเจี้ยนอื่นได้ คุณสมบัตินี้สนับสนุนเฉพาะกับ Amazon Redshift Serverless และ RA3 เท่านั้น

การสืบค้นและการวิเคราะห์

ถาม: Amazon Redshift และ Redshift Spectrum ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ได้หรือไม่

ได้ Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานการทำงานที่ได้รับการตรวจสอบแล้วกับผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยแต่ละรายมีช่วงทดลองใช้งานฟรีเพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที

Amazon Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ

คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้

ถาม: Amazon Redshift Spectrum รองรับรูปแบบข้อมูลและรูปแบบการบีบอัดประเภทใด

ในปัจจุบัน Amazon Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV

Amazon Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy แล้วในตอนนี้

ถาม: จะเกิดอะไรขึ้นหากตารางในพื้นที่จัดเก็บภายในของฉันมีชื่อเหมือนกันกับตารางภายนอก

คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน

ถาม: ฉันใช้งาน Hive Metastore ในการจัดเก็บข้อมูลเมตาเกี่ยวกับ Data Lake ของ S3 แล้วฉันสามารถใช้ Redshift Spectrum ได้หรือไม่

ได้ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้

ถาม: ฉันจะรับรายการตารางฐานข้อมูลภายนอกทั้งหมดที่สร้างขึ้นในคลัสเตอร์ได้อย่างไร

คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้

ถาม: Redshift รองรับความสามารถในการใช้ Machine Learning ด้วย SQL หรือไม่

รองรับ คุณสมบัติ Amazon Redshift ML ช่วยให้ผู้ใช้ SQL สามารถสร้าง ฝึกอบรม และติดตั้งใช้งานโมเดลแมชชีนเลิร์นนิง (ML) ได้อย่างง่ายดายด้วยการใช้คำสั่ง SQL ที่ตนคุ้นเคย Amazon Redshift ML ช่วยให้คุณสามารถใช้ประโยชน์จากข้อมูลของคุณใน Amazon Redshift ด้วย Amazon SageMaker ซึ่งเป็นบริการ ML ที่มีการจัดการอย่างเต็มรูปแบบ Amazon Redshift รองรับทั้งการเรียนรู้แบบไม่มีผู้ดูแล (K-Means) และการเรียนรู้แบบมีผู้ดูแล (Autopilot, XGBoost, อัลกอริทึม MLP)

ถาม: Amazon Redshift มี API เพื่อสืบค้นข้อมูลหรือไม่

Amazon Redshift มี Data API ที่คุณสามารถเข้าถึงข้อมูลได้อย่างสะดวกจาก Amazon Redshift ด้วยแอปพลิเคชัน cloud-native แบบดั้งเดิมทุกประเภท บริการบนเว็บแบบไร้เซิร์ฟเวอร์และอยู่ในคอนเทนเนอร์ รวมถึงแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ Data API ช่วยลดความซับซ้อนในการเข้าถึง Amazon Redshift เนื่องจากคุณไม่จำเป็นต้องกำหนดค่าไดรฟ์เวอร์และจัดการการเชื่อมต่อฐานข้อมูล คุณสามารถเรียกใช้คำสั่ง SQL ไปยังคลัสเตอร์ Amazon Redshift ได้อย่างง่ายดายเพียงแค่เรียกตำแหน่งข้อมูล API ที่ปลอดภัยซึ่งได้รับจาก Data API Data API ดูแลในส่วนของการจัดการการเชื่อมต่อฐานข้อมูลและการบัฟเฟอร์ข้อมูล และ Data API เป็นแบบอะซิงโครนัส คุณจึงสามารถดึงผลลัพธ์ได้ในภายหลัง ผลการสืบค้นของคุณจะถูกจัดเก็บเป็นเวลา 24 ชั่วโมง

ถาม: ฉันสามารถใช้ข้อมูลประจำตัวประเภทใดกับ Data API ของ Amazon Redshift

Data API รองรับทั้งข้อมูลประจำตัว IAM และข้อมูลประจำตัวที่ใช้คีย์ลับจาก AWS Secrets Manager Data API รวมเข้ากับข้อมูลประจำตัว AWS Identity and Access Management (IAM) ดังนั้นคุณจึงสามารถใช้งานผู้ให้บริการข้อมูลประตัวอย่าง Okta หรือ Azure Active Directory หรือข้อมูลประจำตัวฐานข้อมูลที่จัดเก็บใน Secrets Manager โดยไม่ต้องผ่านข้อมูลประจำตัวฐานข้อมูลในการเรียกใช้ API

ถาม: ฉันสามารถใช้ Data API ของ Amazon Redshift จาก AWS CLI ได้หรือไม่

ได้ คุณสามารถใช้ Data API จาก AWS CLI โดยใช้ตัวเลือกบรรทัดคำสั่งที่เป็นข้อมูลของ AWS Redshift ได้

ถาม: Data API ของ Redshift ผสานการทำงานกับบริการของ AWS อื่นหรือไม่

คุณสามารถใช้ Data API จากบริการอื่นๆ เช่น AWS Lambda, AWS Cloud9, AWS AppSync และ Amazon EventBridge ได้

ถาม: ฉันต้องจ่ายค่าบริการการใช้งาน Data API ของ Amazon Redshift แยกต่างหากหรือไม่

ไม่ Data API ไม่มีค่าบริการแยกต่างหาก

การสำรองและการกู้คืนข้อมูล

ถาม: Amazon RedShift สำรองข้อมูลของฉันอย่างไร ฉันจะกู้คืนคลัสเตอร์จากข้อมูลสำรองได้อย่างไร

คลัสเตอร์ Amazon Redshift RA3 และ Amazon Redshift Serverless ใช้ Redshift Managed Storage ซึ่งมีสำเนาล่าสุดของข้อมูลอยู่เสมอ คลัสเตอร์ DS2 และ DC2 ทำสำเนาข้อมูลบนคลัสเตอร์เพื่อให้แน่ใจว่าสำเนาล่าสุดจะพร้อมใช้งานในกรณีที่เกิดความล้มเหลว ระบบจะสร้างการสำรองข้อมูลขึ้นโดยอัตโนมัติในคลัสเตอร์ Redshift ทุกประเภทและจะคงไว้เป็นเวลา 24 ชั่วโมง และจุดกู้คืนแบบไร้เซิร์ฟเวอร์จะสำรองข้อมูลไว้ในช่วง 24 ชั่วโมงที่ผ่านมา

และคุณยังสามารถสร้างข้อมูลสำรองของคุณเองที่สามารถเก็บไว้ได้อย่างไม่มีกำหนดด้วยเช่นกัน ข้อมูลสำรองเหล่านี้สร้างขึ้นได้ทุกเมื่อและสามารถแปลงข้อมูลสำรองอัตโนมัติจากจุดกู้คืนของ Amazon Redshift หรือ Amazon Redshift Serverless เป็นข้อมูลสำรองของผู้ใช้ได้เพื่อเก็บรักษาให้ยาวนานขึ้น

Amazon Redshift ยังสามารถจำลองสแนปช็อตหรือจุดกู้คืนของคุณแบบไม่พร้อมกันไปยัง Amazon S3 ในรีเจี้ยนอื่นเพื่อกู้คืนข้อมูลหลังภัยพิบัติ

บนคลัสเตอร์ DS2 หรือ DC2 ระบบจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น

ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8 TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8 TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้ AWS Management Console หรือ API ของ Amazon RedShift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon RedShift

Amazon RedShift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้นสแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังเก็บข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว

ถาม: ฉันสามารถจัดการการเก็บรักษาข้อมูลสำรองและสแนปช็อตอัตโนมัติได้อย่างไร

คุณสามารถใช้ AWS Management Console หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)

ถาม: หากฉันลบคลัสเตอร์คลังเก็บข้อมูล จะเกิดอะไรขึ้นกับข้อมูลสำรองของฉัน

หากคุณลบคลัสเตอร์คลังเก็บข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังเก็บข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังเก็บข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตามอัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่ว่าคุณเลือกที่จะลบออก

การเฝ้าติดตามและการบำรุงรักษา

ถาม: ฉันสามารถตรวจสอบประสิทธิภาพของคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift ได้อย่างไร

ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังเก็บข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน AWS Management Console หรือ API ของ Amazon CloudWatch นอกจากนั้น คุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้ AWS Management Console มีแดชบอร์ดการติดตาม สำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ Amazon RedShift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่าน AWS Management Console อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่

ถาม: ระยะเวลาบำรุงรักษาคืออะไร ฉันจะสามารถใช้งานคลัสเตอร์คลังเก็บข้อมูลของระหว่างการบำรุงรักษาซอฟต์แวร์ได้หรือไม่

Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราว เพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยแก้ไขคลัสเตอร์โดยทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon RedShift ในการทำงานทั่วไปได้ระหว่างการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตามภูมิภาค โปรดดูที่ระยะเวลาบำรุงรักษาในคู่มือการจัดการ Amazon Redshift

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Redshift

ไปที่หน้าราคา
พร้อมสร้างหรือยัง
เริ่มต้นใช้งาน Amazon Redshift
มีคำถามเพิ่มเติมหรือไม่
ติดต่อเรา