การประมวลผลวิเคราะห์ทางออนไลน์คืออะไร

การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) เป็นเทคโนโลยีซอฟต์แวร์ที่คุณสามารถใช้ในการวิเคราะห์ข้อมูลธุรกิจจากมุมมองต่างๆ องค์กรต่างๆ รวบรวมและจัดเก็บข้อมูลจากแหล่งที่มาของข้อมูลหลายแห่ง เช่น เว็บไซต์ แอปพลิเคชัน เครื่องวัดอัจฉริยะ และระบบภายใน OLAP รวมและจัดกลุ่มข้อมูลนี้ให้เป็นหมวดหมู่เพื่อให้ได้ข้อมูลเชิงลึกที่สามารถนำไปปฏิบัติได้ในการวางแผนเชิงกลยุทธ์ ยกตัวอย่างเช่น ร้านค้าปลีกเก็บข้อมูลเกี่ยวกับผลิตภัณฑ์ทั้งหมดที่จะขาย เช่น สี ขนาด ต้นทุน และสถานที่ตั้ง ผู้ค้าปลีกยังรวบรวมข้อมูลการซื้อของลูกค้าด้วย เช่น ชื่อของสินค้าที่สั่งซื้อ และมูลค่าการขายทั้งหมดในระบบที่แตกต่างกัน OLAP รวมชุดข้อมูลเพื่อคำถามเช่นสีผลิตภัณฑ์ใดเป็นที่นิยมมากกว่าหรือโฆษณาแฝงส่งเสริมการขายอย่างไร

ทำไม OLAP จึงสำคัญ

การประมวลผลวิเคราะห์ทางออนไลน์ (OLAP) ช่วยให้องค์กรประมวลผลและได้รับประโยชน์จากข้อมูลดิจิทัลที่เพิ่มมากขึ้นเรื่อยๆ ประโยชน์บางส่วนของ OLAP มีดังต่อไปนี้

ตัดสินใจได้เร็วกว่า

ธุรกิจใช้ OLAP ในเพื่อจะตัดสินใจได้อย่างรวดเร็วและถูกต้องเพื่อคงความสามาระในการแข่งขันในเศรษฐกิจที่เปลี่ยนแปลงอย่างรวดเร็ว การสอบถามเชิงวิเคราะห์เกี่ยวกับฐานข้อมูลแบบเชิงสัมพันธ์ต่างๆ ใช้เวลานานเพราะระบบคอมพิวเตอร์คจะ้นหาจากหลายตารางข้อมูล อีกด้านหนึ่ง ระบบ OLAP ได้คำนวณล่วงหน้าและบูรณาการข้อมูลเพื่อให้นักวิเคราะห์ธุรกิจสามารถสร้างรายงานได้เร็วขึ้นเมื่อมีความจำเป็น

การสนับสนุนผู้ใช้ทั่วไป

ระบบ OLAP ทำให้การวิเคราะห์ข้อมูลที่ซับซ้อนง่ายขึ้นสำหรับผู้ใช้ทางธุรกิจทั่วไป ผู้ใช้ธุรกิจสามารถสร้างการคำนวณเชิงวิเคราะห์ที่ซับซ้อนและสร้างรายงานแทนการศึกษาวิธีใช้ฐานข้อมูล

มุมมองข้อมูลแบบบูรณาการ

OLAP ให้แพลตฟอร์มแบบครบวงจรสำหรับการตลาด การเงิน การผลิต และหน่วยธุรกิจอื่นๆ ผู้จัดการและผู้มีอำนาจตัดสินใจสามารถดูภาพรวมและแก้ปัญหาได้อย่างมีประสิทธิภาพ พวกเขาสามารถวิเคราะห์แบบจำลองสถานการณ์ซึ่งจะแสดงให้เห็นถึงผลจากการตัดสินใจของฝ่ายหนึ่งจากภาคส่วนธุรกิจอื่น

สถาปัตยกรรม OLAP คืออะไร

การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) จัดเก็บข้อมูลหลายมิติโดยการแสดงข้อมูลมากกว่าสองมิติหรือหมวดหมู่ ข้อมูลสองมิติมีคอลัมน์และแถว แต่ข้อมูลหลายมิติมีหลายลักษณะ ตัวอย่างเช่น ข้อมูลหลายมิติสำหรับการขายผลิตภัณฑ์อาจประกอบด้วยมิติข้อมูลต่อไปนี้

  • ประเภทของผลิตภัณฑ์
  • ตำแหน่งที่ตั้ง
  • เวลา

วิศวกรข้อมูลสร้างระบบ OLAP หลายมิติที่ประกอบด้วยองค์ประกอบดังต่อไปนี้ 

คลังข้อมูล

คลังข้อมูลเก็บรวบรวมข้อมูลจากแหล่งที่มาที่แตกต่างกันรวมทั้ง แอปพลิเคชัน ไฟล์ และฐานข้อมูล จะประมวลผลข้อมูลโดยใช้เครื่องมือต่างๆ เพื่อให้ข้อมูลที่มีความพร้อมสำหรับการวิเคราะห์ ยกตัวอย่างเช่น คลังข้อมูลอาจเก็บรวบรวมข้อมูลจากฐานข้อมูลแบบเชิงสัมพันธ์ที่เก็บข้อมูลในตารางแบบแถวและคอลัมน์ 

เครื่องมือ ETL

กระบวนการ Extract, Transform and Load (ETL) เป็นกระบวนการฐานข้อมูลที่ดึงข้อมูล เปลี่ยนแปลง และเตรียมรูปแบบข้อมูลให้เหมาะสมกับการวิเคราะห์โดยอัตโนมัติ คลังข้อมูลใช้ ETL ในการแปลงและจัดการมาตรฐานข้อมูลจากแหล่งต่างๆ ก่อนจะทำให้สามารถใช้ได้กับเครื่องมือ OLAP

เซิร์ฟเวอร์ OLAP

เซิร์ฟเวอร์ OLAP เป็นเครื่องพื้นฐานที่ชับเคลื่อนระบบ OLAP ใช้เครื่องมือ ETL ในการแปลงข้อมูลในฐานข้อมูลแบบเชิงสัมพันธ์และเตรียมสำหรับการดำเนินงาน OLAP 

ฐานข้อมูล OLAP

ฐานข้อมูล OLAP เป็นฐานข้อมูลที่แยกต่างหากที่เชื่อมต่อกับคลังข้อมูล วิศวกรข้อมูลบางครั้งใช้ฐานข้อมูล OLAP เพื่อป้องกันไม่ให้คลังข้อมูลเป็นภาระจากการวิเคราะห์ของ OLAP พวกเขายังใช้ฐานข้อมูล OLAP เพื่อให้ง่ายต่อการสร้างแบบจำลองข้อมูล OLAP

ก้อน OLAP

ก้อนข้อมูลเป็นรูปแบบที่เป็นตัวแทนของแถวข้อมูลหลายมิติ แม้ว่าจะเห็นภาพได้ง่ายขึ้นว่าเป็นแบบจำลองข้อมูลสามมิติ แต่ก้อนข้อมูลส่วนมากจะมีมิติมากกว่าสามมิติ ก้อน OLAP หรือ hypercube เป็นคำสำหรับก้อนข้อมูลในระบบ OLAP ก้อน OLAP จะคงที่เพราะไม่สามารถเปลี่ยนขนาดและข้อมูลพื้นฐานเมื่อจำลอง ตัวอย่างเช่น จะต้องสร้างก้อนขึ้นใหม่ทั้งหมดถ้าเพิ่มมิติคลังสินค้าลงในก้อนที่มีมิติผลิตภัณฑ์ สถานที่ และเวลา 

เครื่องมือวิเคราะห์ OLAP

นักวิเคราะห์ธุรกิจใช้เครื่องมือ OLAP ในการจัดการก้อน OLAP พวกเขาจะเริ่มการดำเนินการ เช่น การตัด หั่น และแบ่ง เพื่อรับข้อมูลเชิงลึกเข้าไปในข้อมูลที่เฉพาะเจาะจงภายในก้อน OLAP 

OLAP ทำงานอย่างไร

OLAP ทำงานอย่างไร

ระบบประมวลผลการวิเคราะห์ออนไลน์ (OLAP) ทำงานโดยการรวบรวม จัดระเบียบ รวมกลุ่ม และวิเคราะห์ข้อมูลโดยใช้ขั้นตอนต่อไปนี้ 

  1. เซิร์ฟเวอร์ OLAP จะรวบรวมข้อมูลจากแหล่งที่มาของข้อมูลหลายแหล่ง รวมทั้งฐานข้อมูลแบบเชิงสัมพันธ์และคลังข้อมูล
  2. จากนั้นกระบวนการ Extract, Transform and Load (ETL) จะทำความสะอาด รวมกลุ่ม คำนวณล่วงหน้า และจัดเก็บข้อมูลในก้อน OLAP ตามจำนวนของมิติข้อมูลที่ระบุ
  3. นักวิเคราะห์ธุรกิจใช้เครื่องมือ OLAP เพื่อสอบถามและสร้างรายงานจากข้อมูลหลายมิติในก้อน OLAP

OLAP ใช้ Multidimensional Expressions (MDX) เพื่อถามก้อน OLAP MDX เป็นการสืบค้นเช่นเดียวกับ SQL ที่ให้ชุดคำสั่งเพื่อจัดการฐานข้อมูล

OLAP มีประเภทใดบ้าง

ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) มีวิธีการทำงานหลัก 3 วิธี

MOLAP

ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์หลายมิติ (MOLAP) คือการสร้างก้อนข้อมูลที่หมายถึงข้อมูลหลายมิติจากคลังข้อมูล MOLAP เก็บข้อมูลข้อมูลที่คำนวณไว้ล่วงหน้าใน hypercube วิศวกรข้อมูลใช้ MOLAP เพราะประเภทของเทคโนโลยี OLAP นี้ให้การวิเคราะห์ที่รวดเร็ว 

ROLAP

แทนที่จะใช้ลูกบาศก์ข้อมูล ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์เชิงสัมพันธ์ (ROLAP) ช่วยให้วิศวกรข้อมูลสามารถทำการวิเคราะห์ข้อมูลหลายมิติบนฐานข้อมูลแบบเชิงสัมพันธ์ อีกนัยหนึ่ง วิศวกรข้อมูลใช้แบบสอบถาม SQL เพื่อค้นหาและดึงข้อมูลเฉพาะจากมิติข้อมูลที่กำหนด ROLAP เหมาะสำหรับการวิเคราะห์ข้อมูลที่จำนวนมากและมีรายละเอียด อย่างไรก็ตาม ROLAP มีตอบสนองต่อคำถามช้าเมื่อเทียบกับ MOLAP 

HOLAP

ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์ไฮบริด (HOLAP) รวมส่วนที่ดีที่สุด MOLAP และ ROLAP สถาปัตยกรรมทั้งสอง HOLAP ช่วยให้วิศวกรข้อมูลดึงผลการวิเคราะห์จากก้อนข้อมูลและดึงข้อมูลรายละเอียดจากฐานข้อมูลแบบเชิงสัมพันธ์ได้อย่างรวดเร็ว 

การสร้างแบบจำลองข้อมูลใน OLAP คืออะไร

การสร้างแบบจำลองข้อมูลคือการแสดงข้อมูลในคลังข้อมูลหรือฐานข้อมูลประมวลผลการวิเคราะห์ออนไลน์ (OLAP) การสร้างแบบจำลองข้อมูลเป็นสิ่งจำเป็นในการประมวลผลการวิเคราะห์ออนไลน์เชิงสัมพันธ์ (ROLAP) เพราะเป็นการวิเคราะห์ข้อมูลโดยตรงจากฐานข้อมูลแบบเชิงสัมพันธ์ เก็บข้อมูลหลายมิติแบบ Star Schema หรือ Snowflake Schema 

Star Schema

Star Schema ประกอบด้วยตารางข้อเท็จจริงและตารางหลายมิติ ตารางข้อเท็จจริงคือตารางข้อมูลที่มีค่าตัวเลขที่เกี่ยวข้องกับกระบวนการทางธุรกิจและตารางมิติมีค่าที่อธิบายแต่ละแอตทริบิวต์ในตารางข้อเท็จจริง ตารางข้อเท็จจริงหมายถึงตารางมิติรหัสภายนอก – รหัสเฉพาะที่มีความสัมพันธ์กับข้อมูลที่เลือกในตารางมิติ 

ใน Star Schema ตารางข้อเท็จจริงเชื่อมต่อกับตารางหลายมิติเพื่อให้รูปแบบข้อมูลมีลักษณะเหมือนดาว ตัวอย่างของตารางข้อเท็จจริงสำหรับการขายผลิตภัณฑ์มีตัวอย่างดังนี้ 

  • รหัสผลิตภัณฑ์
  • รหัสตำแหน่งที่ตั้ง
  • ID พนักงานขาย
  • ยอดขาย

รหัสผลิตภัณฑ์บอกระบบฐานข้อมูลเพื่อดึงข้อมูลจากตารางมิติผลิตภัณฑ์ซึ่งอาจมีลักษณะดังนี้

  • รหัสผลิตภัณฑ์
  • ชื่อผลิตภัณฑ์
  • ประเภทของผลิตภัณฑ์
  • ต้นทุนของผลิตภัณฑ์

ในทางเดียวกัน รหัสตำแหน่งที่ตั้งจะบ่งชี้ตารางมิติสถานที่ซึ่งมีดังต่อไปนี้

  • รหัสตำแหน่งที่ตั้ง
  • ประเทศ
  • เมือง

ตารางพนักงานขายอาจมีลักษณะดังต่อไปนี้

  • ID พนักงานขาย
  • ชื่อ
  • นามสกุล
  • อีเมล

Snowflake Schema

Snowflake Schema พัฒนาจาก Star Schema บางตารางมิติอาจนำไปสู่ตารางมิติรองหนึ่งตารางหรือมากกว่า ซึ่งจะส่งผลในรูปร่างเหมือนเกล็ดหิมะเมื่อรวมตารางมิติ 

ตัวอย่างเช่น ตารางมิติผลิตภัณฑ์อาจมีชนิดข้อมูลต่อไปนี้

  • รหัสผลิตภัณฑ์
  • ชื่อผลิตภัณฑ์
  • รหัสประเภทผลิตภัณฑ์
  • ต้นทุนของผลิตภัณฑ์

รหัสประเภทผลิตภัณฑ์เชื่อมต่อกับตารางมิติอื่นดังตัวอย่างต่อไปนี้

  • รหัสประเภทผลิตภัณฑ์
  • ชื่อประเภท
  • เวอร์ชัน
  • ตัวแปร 

การดำเนินงาน OLAP คืออะไร

นักวิเคราะห์ธุรกิจดำเนินการวิเคราะห์พื้นฐานหลายอย่างด้วยก้อนการประมวลผลเชิงวิเคราะห์ออนไลน์หลายมิติ (MOLAP) 

โรลอัพ

ระบบการประมวลผลการวิเคราะห์ออนไลน์ (OLAP) สรุปข้อมูลสำหรับคุณลักษณะเฉพาะใน Roll Up สรุปสั้นๆ คือ จะแสดงข้อมูลที่มีรายละเอียดน้อย ตัวอย่างเช่น อาจดูการขายสินค้าตาม นิวยอร์ก แคลิฟอร์เนีย ลอนดอน และโตเกียว การดำเนินการแบบ Roll-Up จะให้มุมมองของข้อมูลการขายตามประเทศ เช่น สหรัฐอเมริกา สหราชอาณาจักร และญี่ปุ่น 

Drill Down

Drill Down คือขั้วตรงข้ามของการดำเนินการแบบ Roll-Up นักวิเคราะห์ธุรกิจย้อนลงตามลำดับชั้นแนวคิดและดึงรายละเอียดที่พวกเขาต้องการ ตัวอย่างเช่น พวกเขาสามารถเปลี่ยนจากดูข้อมูลการขายเป็นปีเป็นแสดงภาพตามเดือน

ตัด

วิศวกรข้อมูลใช้การดำเนินการตัดเพื่อสร้างมุมมองสองมิติจากก้อน OLAP ยกตัวอย่างเช่น ก้อน MOLAP เรียงลำดับข้อมูลตามผลิตภัณฑ์ เมือง และเดือน วิศวกรข้อมูลสามารถสร้างตารางเหมือนสเปรดชีตที่ประกอบด้วยผลิตภัณฑ์และเมืองตามเดือนที่ระบุโดยการหั่นก้อน 

หั่น

วิศวกรข้อมูลใช้การดำเนินการหั่นเพื่อสร้างก้อนย่อยที่ขนาดเล็กจากก้อน OLAP พวกเขากำหนดมิติที่ต้องการและสร้างก้อนขนาดเล็กจาก hypercube เดิม

แบ่ง

การดำเนินการแบ่งมีการหมุนก้อน OLAP โดยยึดมิติหนึ่งเพื่อรับมุมมองที่แตกต่างกันในรูปแบบข้อมูลหลายมิติ ตัวอย่างเช่น ก้อน OLAP สามมิติมีมิติดังต่อไปนี้บนแกนที่เกี่ยวข้อง

  • แกน X – ผลิตภัณฑ์ 
  • แกน Y – ตำแหน่งที่ตั้ง
  • แกน Z – เวลา

เมื่อแบ่ง ก้อน OLAP มีการกำหนดค่าต่อไปนี้

  • แกน X – ตำแหน่ง
  • แกน Y – เวลา
  • แกน Z – ผลิตภัณฑ์

OLAP เป็นอย่างไรเมื่อเทียบกับวิธีการวิเคราะห์ข้อมูลอื่นๆ

การทำเหมืองข้อมูล

การทำเหมืองข้อมูลเป็นเทคโนโลยีการวิเคราะห์ที่ประมวลผลข้อมูลประวัติจำนวนมากเพื่อหารูปแบบและข้อมูลเชิงลึก นักวิเคราะห์ธุรกิจใช้เครื่องมือการทำเหมืองข้อมูลเพื่อค้นหาความสัมพันธ์ระหว่างข้อมูลและคาดการณ์แนวโน้มในอนาคตอย่างแม่นยำ

OLAP และการทำเหมืองข้อมูล

ระบบการประมวลผลการวิเคราะห์ออนไลน์ ( OLAP) เป็นเทคโนโลยีการวิเคราะห์ฐานข้อมูลคือการสอบถาม ดึง และศึกษาข้อมูลสรุป ในทางกลับกัน การทำเหมืองข้อมูลคือการมองลึกลงไปในข้อมูลที่ยังไม่ได้ประมวลผล ยกตัวอย่างเช่น นักการตลาดสามารถใช้เครื่องมือการทำเหมืองข้อมูลเพื่อวิเคราะห์พฤติกรรมของผู้ใช้จากบันทึกการเข้าชมเว็บไซต์ทุกครั้ง พวกเขาอาจใช้ซอฟต์แวร์ OLAP เพื่อตรวจสอบพฤติกรรมเหล่านั้นจากมุมต่างๆ เช่น ระยะเวลา อุปกรณ์ประเทศ ภาษา และประเภทของเบราว์เซอร์ 

OLTP

การประมวลผลธุรกรรมออนไลน์ (OLTP) เป็นเทคโนโลยีข้อมูลที่เก็บข้อมูลในฐานข้อมูลได้อย่างรวดเร็วและเชื่อถือได้ วิศวกรข้อมูลใช้เครื่องมือ OLTP เพื่อจัดเก็บข้อมูลการทำธุรกรรม เช่น บันทึกทางการเงิน การสมัครสมาชิกบริการ และความคิดเห็นของลูกค้า ในฐานข้อมูลแบบเชิงสัมพันธ์ ระบบ OLTP เกี่ยวข้องกับการสร้าง การปรับปรุง และการลบระเบียนในตารางสัมพันธ์ 

OLAP และ OLTP

OLTP เหมาะสำหรับการจัดการและการจัดเก็บการทำธุรกรรมหลายธุรกรรมในฐานข้อมูล แต่ไม่สามารถดำเนินการค้นหาจากข้อมูลที่ซับซ้อน ดังนั้น นักวิเคราะห์ธุรกิจจึงใช้ระบบ OLAP ในการวิเคราะห์ข้อมูลหลายมิติ ยกตัวอย่างเช่น นักวิทยาศาสตร์ข้อมูลเชื่อมต่อ ฐานข้อมูล OLTP กับ ้อน Cloud-based OLAP เพื่อทำการสืบค้นข้อมูลประวัติเชิงคำนวณเป็นหลัก

AWS ช่วยเรื่อง OLAP ได้อย่างไร

ฐานข้อมูล AWS มีมีการจัดการฐานข้อมูลระบบคลาวด์ที่หลากหลายเพื่อช่วยให้องค์กรจัดเก็บและดำเนินการงานประมวลผลเชิงวิเคราะห์ออนไลน์ ( OLAP) นักวิเคราะห์ข้อมูลใช้ฐานข้อมูล AWS เพื่อสร้างฐานข้อมูลที่ปลอดภัยที่สอดคล้องกับความต้องการขององค์กร องค์กรจะย้ายข้อมูลธุรกิจของตนไปยังฐานข้อมูล AWS เนื่องจากราคาที่ต่ำและความสามารถในการเพิ่มทรัพยากรได้ 

  • Amazon Redshift เป็นคลังข้อมูลระบบคลาวด์ที่ออกแบบมาเฉพาะสำหรับการประมวลผลการวิเคราะห์ออนไลน์
  • Amazon Relational Database Service (Amazon RDS) เป็นฐานข้อมูลแบบเชิงสัมพันธ์ที่มีฟังก์ชันการทำงาน OLAP วิศวกรข้อมูลใช้ Amazon RDS กับ Oracle OLAP เพื่อดำเนินการค้นหาที่ซับซ้อนในก้อนมิติ
  • Amazon Aurora เป็นฐานข้อมูลแบบเชิงสัมพันธ์ระบบคลาวด์ที่สามารถใช้ร่วมกับ MySQL- และ PostgreSQL พัฒนาให้เหมาะสำหรับการทำงานของเวิร์กโหลด OLAP ที่ซับซ้อน


เริ่มใช้งาน OLAP บน AWS ด้วยการสร้างบัญชี AWS วันนี้

ขั้นตอนถัดไปของการประมวลผลเชิงวิเคราะห์ออนไลน์

ดูแหล่งข้อมูลที่เกี่ยวกับผลิตภัณฑ์เพิ่มเติม
เรียนรู้เพิ่มเติมเกี่ยวกับบริการด้านการวิเคราะห์ 
ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที 

ลงชื่อสมัครใช้งาน 
เริ่มต้นการสร้างใน Console

เริ่มต้นสร้างด้วย AWS ใน AWS Management Console

ลงชื่อเข้าใช้