ถาม: คลังข้อมูลคืออะไร

การวิเคราะห์เป็นสิ่งที่พบเห็นได้ทั่วไป เราใช้รายงานและแดชบอร์ดทั้งหมดเพื่อจัดการงาน รายงานความคืบหน้าของเราให้ทางผู้ถือหุ้นทราบ และดำเนินการวิเคราะห์เฉพาะกิจเพื่อช่วยในการตัดสินใจ คลังข้อมูลที่จัดเก็บข้อมูลได้อย่างมีประสิทธิภาพคือสิ่งที่อยู่เบื้องหลังเครื่องมือรายงาน แดชบอร์ด และ BI เหล่านี้ เพื่อลด I/O และส่งผลการสืบค้นได้อย่างรวดเร็วฉับไวให้แก่ผู้ใช้จำนวนมหาศาลได้พร้อมๆ กัน คลังข้อมูลใช้สถาปัตยกรรมและพื้นที่จัดเก็บแบบพิเศษเพื่อประสิทธิภาพในการสืบค้นและโหลดข้อมูลที่รวดเร็ว ไม่เหมือนกับฐานข้อมูลการทำรายการ นอกจากนี้ คลังข้อมูลจำเป็นต้องมีความสามารถในการปรับขนาดได้สูง เพื่อให้คุณสามารถเพิ่มแหล่งข้อมูลได้ตลอดเวลาเพื่อทำให้การวิเคราะห์และข้อมูลเชิงลึกมีคุณภาพมากยิ่งขึ้น ประการสุดท้าย คลังข้อมูลควรผสานรวมกับเครื่องมือของระบบธุรกิจอัจฉริยะและไคลเอ็นต์ SQL ของบริษัทอื่นได้อย่างราบรื่น และรองรับ SQL มาตรฐาน เพื่อให้ลูกค้าใช้ทักษะที่ตัวเองมีอยู่แล้วได้

ถาม: เหตุใดจึงควรเรียกใช้คลังข้อมูลบน AWS

Amazon Redshift ซึ่งเป็นโซลูชันคลังข้อมูลของเรา เป็นโซลูชันที่ใช้งานง่าย รวดเร็ว และมีการจัดการอย่างเต็มรูปแบบ ซึ่งจะทำให้การจัดสรรโครงสร้างพื้นฐานและงานการดูแลระบบ เช่น การสำรองข้อมูล การจำลองแบบ และการแพตช์ เป็นไปโดยอัตโนมัติ โซลูชันนี้จะผสานรวมกับเครื่องมือ BI และ ETL ของบริษัทอื่นได้อย่างราบรื่น ทำให้คุณเข้าถึงรายงานฉบับแรกของคุณได้ในเวลาเพียงไม่กี่นาที และไม่มีขีดจำกัดสำหรับปริมาณข้อมูลที่คุณสามารถดาวน์โหลดและวิเคราะห์ ในขณะที่ข้อมูลของคุณมีจำนวนเพิ่มมากขึ้นเรื่อยๆ คุณไม่ต้องกังวลเรื่องการอัปเกรดระบบที่มีค่าใช้จ่ายสูงหรือทำงานช้า Amazon Redshift ทำงานได้อย่างรวดเร็วในทุกขนาด เนื่องจากใช้พื้นที่จัดเก็บข้อมูลแบบคอลัมน์และเทคนิคการเพิ่มประสิทธิภาพหลายเทคนิค นอกจากนี้ Amazon Redshift ยังประหยัดคุ้มค่า และคิดค่าบริการตามการใช้งานจริงเท่านั้น สรุปก็คือ คุณสามารถมีจำนวนผู้ใช้ได้ไม่จำกัดที่ทำการวิเคราะห์แบบไม่จำกัดบนข้อมูลทั้งหมดของคุณด้วยค่าบริการเพียง 1,000 USD ต่อเทระไบต์ต่อปี 

ถาม: Amazon RedShift คืออะไร

Amazon Redshift เป็นคลังข้อมูลที่รวดเร็ว มีการจัดการแบบเต็มรูปแบบ และอยู่ในระดับเพตะไบต์ซึ่งช่วยให้การวิเคราะห์ข้อมูลทั้งหมดของคุณทำได้ง่ายและประหยัดค่าใช้จ่ายด้วยการใช้เครื่องมือของระบบธุรกิจอัจฉริยะ (BI) ที่มีอยู่เดิมของคุณ ค่าบริการสำหรับข้อมูลขนาดเล็กเริ่มต้นที่ 0.25 USD ต่อชั่วโมง โดยไม่มีข้อผูกมัดใดๆ และปรับขนาดเป็นข้อมูลระดับเพตะไบต์ได้ที่ 1,000 USD ต่อเทระไบต์ต่อปี ซึ่งมีค่าใช้จ่ายน้อยกว่าหนึ่งในสิบของโซลูชันแบบเดิม โดยทั่วไป ลูกค้าจะเห็นการบีบอัดข้อมูล 3 เท่า ซึ่งลดค่าใช้จ่ายลงเหลือ 333 USD ต่อหนึ่งเทระไบต์ที่ไม่มีการบีบอัดต่อปี

ถาม: ประสิทธิภาพการทำงานของ Amazon Redshift เปรียบเทียบกับฐานข้อมูลแบบดั้งเดิมในส่วนคลังข้อมูลและการวิเคราะห์เป็นอย่างไรบ้าง

Amazon RedShift ใช้นวัตกรรมมากมายเพื่อให้มีประสิทธิภาพสูงกว่าฐานข้อมูลแบบดั้งเดิมในส่วนคลังข้อมูลและการวิเคราะห์ข้อมูลถึงสิบเท่า:

  • การประมวลผลแบบขนานปริมาณมหาศาล: Amazon Redshift ให้ประสิทธิภาพการสืบค้นที่รวดเร็วสำหรับชุดข้อมูลที่มีขนาดตั้งแต่กิกะไบต์ไปจนถึงเอกซะไบต์ Redshift ใช้พื้นที่จัดเก็บข้อมูลแบบคอลัมน์ การบีบอัดข้อมูล และโซนแมปเพื่อลดจำนวน I/O ที่จำเป็นต้องใช้ในการดำเนินการสืบค้น Redshift ใช้สถาปัตยกรรมคลังข้อมูลการประมวลผลแบบขนานปริมาณมหาศาล (MPP) โดยมีการสร้างคู่ขนานและกระจายการดำเนินการ SQL เพื่อใช้ประโยชน์จากทรัพยากรทั้งหมดที่มี ฮาร์ดแวร์พื้นฐานได้รับการออกแบบมาเพื่อการประมวลผลข้อมูลที่มีประสิทธิภาพสูง โดยใช้พื้นที่จัดเก็บที่มีการแนบมาเฉพาะที่เพื่อเพิ่มปริมาณการประมวลผลระหว่าง CPU และไดรฟ์ กับเครือข่ายแบบตาข่ายแบนด์วิดท์สูงเพื่อเพิ่มปริมาณการประมวลผลระหว่างโหนด
  • แมชชีนเลิร์นนิ่ง: Amazon Redshift ใช้แมชชีนเลิร์นนิ่งเพื่อจัดส่งปริมาณการประมวลผลระดับสูง ไม่ว่าจะมีปริมาณงานหรือการใช้งานพร้อมกันเท่าใดก็ตาม Redshift ใช้อัลกอริทึมที่ละเอียดซับซ้อนเพื่อคาดการณ์รันไทม์ของการสืบค้นขาเข้า และส่งการสืบค้นไปยังคิวที่เหมาะสมที่สุดเพื่อการประมวลผลที่รวดเร็วที่สุด ตัวอย่างเช่น การสืบค้นต่างๆ อย่างเช่น แดชบอร์ดและรายการที่มีข้อกำหนดกระบวนการทำงานพร้อมกันระดับสูงนั้น ระบบจะกำหนดเส้นทางไปยังคิวเร่งด่วนเพื่อประมวลผลโดยทันที ในขณะที่กระบวนการทำงานพร้อมกันเพิ่มมากขึ้น Amazon Redshift จะคาดการณ์เวลาที่ระบบอาจเริ่มต้นการจัดคิวและติดตั้งทรัพยากรชั่วคราวเพื่อใช้จริงโดยอัตโนมัติด้วยคุณสมบัติการปรับขนาดพร้อมกัน เพื่อรับรองประสิทธิภาพการทำงานที่รวดเร็วอย่างต่อเนื่อง ไม่ว่าความต้องการบนคลัสเตอร์จะมีความผันผวนหรือไม่ก็ตาม
  • Result caching: Amazon Redshift ใช้แคชช่วยเร่งเวลาตอบสนองต่อการสืบค้นแบบซ้ำๆ ให้เหลือเพียงเสี้ยววินาที เครื่องมือแดชบอร์ด การสร้างภาพ และระบบธุรกิจอัจฉริยะที่เรียกใช้การสืบค้นซ้ำๆ จะเพิ่มประสิทธิภาพได้อย่างมาก เมื่อเรียกใช้การสืบค้น Redshift จะค้นหาแคชเพื่อดูว่ามีผลลัพธ์แคชจากการเรียกใช้ก่อนหน้าหรือไม่ หากพบผลลัพธ์ที่แคช และข้อมูลไม่มีการเปลี่ยนแปลง ผลลัพธ์ที่แคชจะถูกส่งคืนทันทีแทนที่จะเรียกใช้การสืบค้นอีก 

ถาม: ฉันจะเข้าถึงคลัสเตอร์คลังข้อมูลที่เปิดใช้งานอยู่ได้อย่างไร

เมื่อคลัสเตอร์คลังเก็บข้อมูลของคุณพร้อมใช้งานแล้ว คุณสามารถเรียกใช้ตำแหน่งข้อมูลและสตริงการเชื่อมต่อ JDBC และ ODBC ได้จาก AWS Management Console หรือโดยใช้ API ของ Redshift จากนั้น คุณสามารถใช้สตริงการเชื่อมต่อนี้กับเครื่องมือจัดการฐานข้อมูล ภาษาการเขียนโปรแกรม หรือเครื่องมือธุรกิจอัจฉริยะ (BI) ของคุณได้ คุณจะต้องอนุญาตคำขอเครือข่ายสำหรับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่ สำหรับคำอธิบายโดยละเอียด โปรดดูที่คู่มือการเริ่มใช้งานของเรา

ถาม: Amazon Redshift ใช้งานร่วมกับแพ็คเกจซอฟต์แวร์ธุรกิจอัจฉริยะและเครื่องมือ ETL ได้หรือไม่

Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Console เรามีการผสานรวมที่ได้รับการตรวจสอบแล้วกับผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยแต่ละรายมีช่วงทดลองใช้งานฟรีเพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Redshift ได้อย่างไร

คุณสามารถทดลองใช้งาน Amazon Redshift ได้ฟรี หากคุณไม่เคยสร้างคลัสเตอร์ Amazon Redshift มาก่อน คุณมีสิทธิ์ได้รับการทดลองใช้งานโหนด DC1.Large ฟรีเป็นเวลา 2 เดือน คุณจะได้รับสิทธิ์การใช้งานฟรี 750 ชั่วโมงต่อเดือน ซึ่งเป็นจำนวนชั่วโมงที่เพียงพอสำหรับเรียกใช้โหนด DC1.Large หนึ่งโหนดที่มีพื้นที่จัดเก็บ SSD แบบบีบอัดข้อมูลขนาด 160GB อย่างต่อเนื่อง นอกจากนี้ คุณยังสามารถสร้างคลัสเตอร์ที่มีโหนดจำนวนมากเพื่อทดสอบชุดข้อมูลที่มีขนาดใหญ่ขึ้น ซึ่งจะทำให้ชั่วโมงการใช้งานฟรีหมดเร็วขึ้น ทันทีที่สิทธิ์การทดลองใช้งานฟรี 2 เดือนของคุณหมดอายุ หรือมีการใช้งานเกิน 750 ชั่วโมงต่อเดือน คุณสามารถปิดคลัสเตอร์ของคุณเพื่อหลีกเลี่ยงการคิดค่าบริการใดๆ หรือเปิดใช้งานต่อไปโดยเสียค่าบริการใน อัตราการใช้งานตามความต้องการแบบมาตรฐาน