การประมวลผลวิเคราะห์ทางออนไลน์คืออะไร
การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) เป็นเทคโนโลยีซอฟต์แวร์ที่คุณสามารถใช้ในการวิเคราะห์ข้อมูลธุรกิจจากมุมมองต่างๆ องค์กรต่างๆ รวบรวมและจัดเก็บข้อมูลจากแหล่งที่มาของข้อมูลหลายแห่ง เช่น เว็บไซต์ แอปพลิเคชัน เครื่องวัดอัจฉริยะ และระบบภายใน OLAP รวมและจัดกลุ่มข้อมูลนี้ให้เป็นหมวดหมู่เพื่อให้ได้ข้อมูลเชิงลึกที่สามารถนำไปปฏิบัติได้ในการวางแผนเชิงกลยุทธ์ ยกตัวอย่างเช่น ร้านค้าปลีกเก็บข้อมูลเกี่ยวกับผลิตภัณฑ์ทั้งหมดที่จะขาย เช่น สี ขนาด ต้นทุน และสถานที่ตั้ง ผู้ค้าปลีกยังรวบรวมข้อมูลการซื้อของลูกค้าด้วย เช่น ชื่อของสินค้าที่สั่งซื้อ และมูลค่าการขายทั้งหมดในระบบที่แตกต่างกัน OLAP รวมชุดข้อมูลเพื่อคำถามเช่นสีผลิตภัณฑ์ใดเป็นที่นิยมมากกว่าหรือโฆษณาแฝงส่งเสริมการขายอย่างไร
ทำไม OLAP จึงสำคัญ
การประมวลผลวิเคราะห์ทางออนไลน์ (OLAP) ช่วยให้องค์กรประมวลผลและได้รับประโยชน์จากข้อมูลดิจิทัลที่เพิ่มมากขึ้นเรื่อยๆ ประโยชน์บางส่วนของ OLAP มีดังต่อไปนี้
ตัดสินใจได้เร็วกว่า
ธุรกิจใช้ OLAP ในเพื่อจะตัดสินใจได้อย่างรวดเร็วและถูกต้องเพื่อคงความสามาระในการแข่งขันในเศรษฐกิจที่เปลี่ยนแปลงอย่างรวดเร็ว การสอบถามเชิงวิเคราะห์เกี่ยวกับฐานข้อมูลแบบเชิงสัมพันธ์ต่างๆ ใช้เวลานานเพราะระบบคอมพิวเตอร์คจะ้นหาจากหลายตารางข้อมูล อีกด้านหนึ่ง ระบบ OLAP ได้คำนวณล่วงหน้าและบูรณาการข้อมูลเพื่อให้นักวิเคราะห์ธุรกิจสามารถสร้างรายงานได้เร็วขึ้นเมื่อมีความจำเป็น
การสนับสนุนผู้ใช้ทั่วไป
ระบบ OLAP ทำให้การวิเคราะห์ข้อมูลที่ซับซ้อนง่ายขึ้นสำหรับผู้ใช้ทางธุรกิจทั่วไป ผู้ใช้ธุรกิจสามารถสร้างการคำนวณเชิงวิเคราะห์ที่ซับซ้อนและสร้างรายงานแทนการศึกษาวิธีใช้ฐานข้อมูล
มุมมองข้อมูลแบบบูรณาการ
OLAP ให้แพลตฟอร์มแบบครบวงจรสำหรับการตลาด การเงิน การผลิต และหน่วยธุรกิจอื่นๆ ผู้จัดการและผู้มีอำนาจตัดสินใจสามารถดูภาพรวมและแก้ปัญหาได้อย่างมีประสิทธิภาพ พวกเขาสามารถวิเคราะห์แบบจำลองสถานการณ์ซึ่งจะแสดงให้เห็นถึงผลจากการตัดสินใจของฝ่ายหนึ่งจากภาคส่วนธุรกิจอื่น
สถาปัตยกรรม OLAP คืออะไร
การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) จัดเก็บข้อมูลหลายมิติโดยการแสดงข้อมูลมากกว่าสองมิติหรือหมวดหมู่ ข้อมูลสองมิติมีคอลัมน์และแถว แต่ข้อมูลหลายมิติมีหลายลักษณะ ตัวอย่างเช่น ข้อมูลหลายมิติสำหรับการขายผลิตภัณฑ์อาจประกอบด้วยมิติข้อมูลต่อไปนี้
- ประเภทของผลิตภัณฑ์
- ตำแหน่งที่ตั้ง
- เวลา
วิศวกรข้อมูลสร้างระบบ OLAP หลายมิติที่ประกอบด้วยองค์ประกอบดังต่อไปนี้
คลังข้อมูล
คลังข้อมูลเก็บรวบรวมข้อมูลจากแหล่งที่มาที่แตกต่างกันรวมทั้ง แอปพลิเคชัน ไฟล์ และฐานข้อมูล จะประมวลผลข้อมูลโดยใช้เครื่องมือต่างๆ เพื่อให้ข้อมูลที่มีความพร้อมสำหรับการวิเคราะห์ ยกตัวอย่างเช่น คลังข้อมูลอาจเก็บรวบรวมข้อมูลจากฐานข้อมูลแบบเชิงสัมพันธ์ที่เก็บข้อมูลในตารางแบบแถวและคอลัมน์
เครื่องมือ ETL
กระบวนการ Extract, Transform and Load (ETL) เป็นกระบวนการฐานข้อมูลที่ดึงข้อมูล เปลี่ยนแปลง และเตรียมรูปแบบข้อมูลให้เหมาะสมกับการวิเคราะห์โดยอัตโนมัติ คลังข้อมูลใช้ ETL ในการแปลงและจัดการมาตรฐานข้อมูลจากแหล่งต่างๆ ก่อนจะทำให้สามารถใช้ได้กับเครื่องมือ OLAP
เซิร์ฟเวอร์ OLAP
เซิร์ฟเวอร์ OLAP เป็นเครื่องพื้นฐานที่ชับเคลื่อนระบบ OLAP ใช้เครื่องมือ ETL ในการแปลงข้อมูลในฐานข้อมูลแบบเชิงสัมพันธ์และเตรียมสำหรับการดำเนินงาน OLAP
ฐานข้อมูล OLAP
ฐานข้อมูล OLAP เป็นฐานข้อมูลที่แยกต่างหากที่เชื่อมต่อกับคลังข้อมูล วิศวกรข้อมูลบางครั้งใช้ฐานข้อมูล OLAP เพื่อป้องกันไม่ให้คลังข้อมูลเป็นภาระจากการวิเคราะห์ของ OLAP พวกเขายังใช้ฐานข้อมูล OLAP เพื่อให้ง่ายต่อการสร้างแบบจำลองข้อมูล OLAP
ก้อน OLAP
ก้อนข้อมูลเป็นรูปแบบที่เป็นตัวแทนของแถวข้อมูลหลายมิติ แม้ว่าจะเห็นภาพได้ง่ายขึ้นว่าเป็นแบบจำลองข้อมูลสามมิติ แต่ก้อนข้อมูลส่วนมากจะมีมิติมากกว่าสามมิติ ก้อน OLAP หรือ hypercube เป็นคำสำหรับก้อนข้อมูลในระบบ OLAP ก้อน OLAP จะคงที่เพราะไม่สามารถเปลี่ยนขนาดและข้อมูลพื้นฐานเมื่อจำลอง ตัวอย่างเช่น จะต้องสร้างก้อนขึ้นใหม่ทั้งหมดถ้าเพิ่มมิติคลังสินค้าลงในก้อนที่มีมิติผลิตภัณฑ์ สถานที่ และเวลา
เครื่องมือวิเคราะห์ OLAP
นักวิเคราะห์ธุรกิจใช้เครื่องมือ OLAP ในการจัดการก้อน OLAP พวกเขาจะเริ่มการดำเนินการ เช่น การตัด หั่น และแบ่ง เพื่อรับข้อมูลเชิงลึกเข้าไปในข้อมูลที่เฉพาะเจาะจงภายในก้อน OLAP
OLAP ทำงานอย่างไร
OLAP ทำงานอย่างไร
ระบบประมวลผลการวิเคราะห์ออนไลน์ (OLAP) ทำงานโดยการรวบรวม จัดระเบียบ รวมกลุ่ม และวิเคราะห์ข้อมูลโดยใช้ขั้นตอนต่อไปนี้
- เซิร์ฟเวอร์ OLAP จะรวบรวมข้อมูลจากแหล่งที่มาของข้อมูลหลายแหล่ง รวมทั้งฐานข้อมูลแบบเชิงสัมพันธ์และคลังข้อมูล
- จากนั้นกระบวนการ Extract, Transform and Load (ETL) จะทำความสะอาด รวมกลุ่ม คำนวณล่วงหน้า และจัดเก็บข้อมูลในก้อน OLAP ตามจำนวนของมิติข้อมูลที่ระบุ
- นักวิเคราะห์ธุรกิจใช้เครื่องมือ OLAP เพื่อสอบถามและสร้างรายงานจากข้อมูลหลายมิติในก้อน OLAP
OLAP ใช้ Multidimensional Expressions (MDX) เพื่อถามก้อน OLAP MDX เป็นการสืบค้นเช่นเดียวกับ SQL ที่ให้ชุดคำสั่งเพื่อจัดการฐานข้อมูล
OLAP มีประเภทใดบ้าง
ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) มีวิธีการทำงานหลัก 3 วิธี
MOLAP
ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์หลายมิติ (MOLAP) คือการสร้างก้อนข้อมูลที่หมายถึงข้อมูลหลายมิติจากคลังข้อมูล MOLAP เก็บข้อมูลข้อมูลที่คำนวณไว้ล่วงหน้าใน hypercube วิศวกรข้อมูลใช้ MOLAP เพราะประเภทของเทคโนโลยี OLAP นี้ให้การวิเคราะห์ที่รวดเร็ว
ROLAP
แทนที่จะใช้ลูกบาศก์ข้อมูล ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์เชิงสัมพันธ์ (ROLAP) ช่วยให้วิศวกรข้อมูลสามารถทำการวิเคราะห์ข้อมูลหลายมิติบนฐานข้อมูลแบบเชิงสัมพันธ์ อีกนัยหนึ่ง วิศวกรข้อมูลใช้แบบสอบถาม SQL เพื่อค้นหาและดึงข้อมูลเฉพาะจากมิติข้อมูลที่กำหนด ROLAP เหมาะสำหรับการวิเคราะห์ข้อมูลที่จำนวนมากและมีรายละเอียด อย่างไรก็ตาม ROLAP มีตอบสนองต่อคำถามช้าเมื่อเทียบกับ MOLAP
HOLAP
ระบบการประมวลผลเชิงวิเคราะห์ออนไลน์ไฮบริด (HOLAP) รวมส่วนที่ดีที่สุด MOLAP และ ROLAP สถาปัตยกรรมทั้งสอง HOLAP ช่วยให้วิศวกรข้อมูลดึงผลการวิเคราะห์จากก้อนข้อมูลและดึงข้อมูลรายละเอียดจากฐานข้อมูลแบบเชิงสัมพันธ์ได้อย่างรวดเร็ว
การสร้างแบบจำลองข้อมูลใน OLAP คืออะไร
การสร้างแบบจำลองข้อมูลคือการแสดงข้อมูลในคลังข้อมูลหรือฐานข้อมูลประมวลผลการวิเคราะห์ออนไลน์ (OLAP) การสร้างแบบจำลองข้อมูลเป็นสิ่งจำเป็นในการประมวลผลการวิเคราะห์ออนไลน์เชิงสัมพันธ์ (ROLAP) เพราะเป็นการวิเคราะห์ข้อมูลโดยตรงจากฐานข้อมูลแบบเชิงสัมพันธ์ เก็บข้อมูลหลายมิติแบบ Star Schema หรือ Snowflake Schema
Star Schema
Star Schema ประกอบด้วยตารางข้อเท็จจริงและตารางหลายมิติ ตารางข้อเท็จจริงคือตารางข้อมูลที่มีค่าตัวเลขที่เกี่ยวข้องกับกระบวนการทางธุรกิจและตารางมิติมีค่าที่อธิบายแต่ละแอตทริบิวต์ในตารางข้อเท็จจริง ตารางข้อเท็จจริงหมายถึงตารางมิติรหัสภายนอก – รหัสเฉพาะที่มีความสัมพันธ์กับข้อมูลที่เลือกในตารางมิติ
ใน Star Schema ตารางข้อเท็จจริงเชื่อมต่อกับตารางหลายมิติเพื่อให้รูปแบบข้อมูลมีลักษณะเหมือนดาว ตัวอย่างของตารางข้อเท็จจริงสำหรับการขายผลิตภัณฑ์มีตัวอย่างดังนี้
- รหัสผลิตภัณฑ์
- รหัสตำแหน่งที่ตั้ง
- ID พนักงานขาย
- ยอดขาย
รหัสผลิตภัณฑ์บอกระบบฐานข้อมูลเพื่อดึงข้อมูลจากตารางมิติผลิตภัณฑ์ซึ่งอาจมีลักษณะดังนี้
- รหัสผลิตภัณฑ์
- ชื่อผลิตภัณฑ์
- ประเภทของผลิตภัณฑ์
- ต้นทุนของผลิตภัณฑ์
ในทางเดียวกัน รหัสตำแหน่งที่ตั้งจะบ่งชี้ตารางมิติสถานที่ซึ่งมีดังต่อไปนี้
- รหัสตำแหน่งที่ตั้ง
- ประเทศ
- เมือง
ตารางพนักงานขายอาจมีลักษณะดังต่อไปนี้
- ID พนักงานขาย
- ชื่อ
- นามสกุล
- อีเมล
Snowflake Schema
Snowflake Schema พัฒนาจาก Star Schema บางตารางมิติอาจนำไปสู่ตารางมิติรองหนึ่งตารางหรือมากกว่า ซึ่งจะส่งผลในรูปร่างเหมือนเกล็ดหิมะเมื่อรวมตารางมิติ
ตัวอย่างเช่น ตารางมิติผลิตภัณฑ์อาจมีชนิดข้อมูลต่อไปนี้
- รหัสผลิตภัณฑ์
- ชื่อผลิตภัณฑ์
- รหัสประเภทผลิตภัณฑ์
- ต้นทุนของผลิตภัณฑ์
รหัสประเภทผลิตภัณฑ์เชื่อมต่อกับตารางมิติอื่นดังตัวอย่างต่อไปนี้
- รหัสประเภทผลิตภัณฑ์
- ชื่อประเภท
- เวอร์ชัน
- ตัวแปร
การดำเนินงาน OLAP คืออะไร
นักวิเคราะห์ธุรกิจดำเนินการวิเคราะห์พื้นฐานหลายอย่างด้วยก้อนการประมวลผลเชิงวิเคราะห์ออนไลน์หลายมิติ (MOLAP)
โรลอัพ
ระบบการประมวลผลการวิเคราะห์ออนไลน์ (OLAP) สรุปข้อมูลสำหรับคุณลักษณะเฉพาะใน Roll Up สรุปสั้นๆ คือ จะแสดงข้อมูลที่มีรายละเอียดน้อย ตัวอย่างเช่น อาจดูการขายสินค้าตาม นิวยอร์ก แคลิฟอร์เนีย ลอนดอน และโตเกียว การดำเนินการแบบ Roll-Up จะให้มุมมองของข้อมูลการขายตามประเทศ เช่น สหรัฐอเมริกา สหราชอาณาจักร และญี่ปุ่น
Drill Down
Drill Down คือขั้วตรงข้ามของการดำเนินการแบบ Roll-Up นักวิเคราะห์ธุรกิจย้อนลงตามลำดับชั้นแนวคิดและดึงรายละเอียดที่พวกเขาต้องการ ตัวอย่างเช่น พวกเขาสามารถเปลี่ยนจากดูข้อมูลการขายเป็นปีเป็นแสดงภาพตามเดือน
ตัด
วิศวกรข้อมูลใช้การดำเนินการตัดเพื่อสร้างมุมมองสองมิติจากก้อน OLAP ยกตัวอย่างเช่น ก้อน MOLAP เรียงลำดับข้อมูลตามผลิตภัณฑ์ เมือง และเดือน วิศวกรข้อมูลสามารถสร้างตารางเหมือนสเปรดชีตที่ประกอบด้วยผลิตภัณฑ์และเมืองตามเดือนที่ระบุโดยการหั่นก้อน
หั่น
วิศวกรข้อมูลใช้การดำเนินการหั่นเพื่อสร้างก้อนย่อยที่ขนาดเล็กจากก้อน OLAP พวกเขากำหนดมิติที่ต้องการและสร้างก้อนขนาดเล็กจาก hypercube เดิม
แบ่ง
การดำเนินการแบ่งมีการหมุนก้อน OLAP โดยยึดมิติหนึ่งเพื่อรับมุมมองที่แตกต่างกันในรูปแบบข้อมูลหลายมิติ ตัวอย่างเช่น ก้อน OLAP สามมิติมีมิติดังต่อไปนี้บนแกนที่เกี่ยวข้อง
- แกน X – ผลิตภัณฑ์
- แกน Y – ตำแหน่งที่ตั้ง
- แกน Z – เวลา
เมื่อแบ่ง ก้อน OLAP มีการกำหนดค่าต่อไปนี้
- แกน X – ตำแหน่ง
- แกน Y – เวลา
- แกน Z – ผลิตภัณฑ์
OLAP เป็นอย่างไรเมื่อเทียบกับวิธีการวิเคราะห์ข้อมูลอื่นๆ
การทำเหมืองข้อมูล
การทำเหมืองข้อมูลเป็นเทคโนโลยีการวิเคราะห์ที่ประมวลผลข้อมูลประวัติจำนวนมากเพื่อหารูปแบบและข้อมูลเชิงลึก นักวิเคราะห์ธุรกิจใช้เครื่องมือการทำเหมืองข้อมูลเพื่อค้นหาความสัมพันธ์ระหว่างข้อมูลและคาดการณ์แนวโน้มในอนาคตอย่างแม่นยำ
OLAP และการทำเหมืองข้อมูล
ระบบการประมวลผลการวิเคราะห์ออนไลน์ ( OLAP) เป็นเทคโนโลยีการวิเคราะห์ฐานข้อมูลคือการสอบถาม ดึง และศึกษาข้อมูลสรุป ในทางกลับกัน การทำเหมืองข้อมูลคือการมองลึกลงไปในข้อมูลที่ยังไม่ได้ประมวลผล ยกตัวอย่างเช่น นักการตลาดสามารถใช้เครื่องมือการทำเหมืองข้อมูลเพื่อวิเคราะห์พฤติกรรมของผู้ใช้จากบันทึกการเข้าชมเว็บไซต์ทุกครั้ง พวกเขาอาจใช้ซอฟต์แวร์ OLAP เพื่อตรวจสอบพฤติกรรมเหล่านั้นจากมุมต่างๆ เช่น ระยะเวลา อุปกรณ์ประเทศ ภาษา และประเภทของเบราว์เซอร์
OLTP
การประมวลผลธุรกรรมออนไลน์ (OLTP) เป็นเทคโนโลยีข้อมูลที่เก็บข้อมูลในฐานข้อมูลได้อย่างรวดเร็วและเชื่อถือได้ วิศวกรข้อมูลใช้เครื่องมือ OLTP เพื่อจัดเก็บข้อมูลการทำธุรกรรม เช่น บันทึกทางการเงิน การสมัครสมาชิกบริการ และความคิดเห็นของลูกค้า ในฐานข้อมูลแบบเชิงสัมพันธ์ ระบบ OLTP เกี่ยวข้องกับการสร้าง การปรับปรุง และการลบระเบียนในตารางสัมพันธ์
OLAP และ OLTP
OLTP เหมาะสำหรับการจัดการและการจัดเก็บการทำธุรกรรมหลายธุรกรรมในฐานข้อมูล แต่ไม่สามารถดำเนินการค้นหาจากข้อมูลที่ซับซ้อน ดังนั้น นักวิเคราะห์ธุรกิจจึงใช้ระบบ OLAP ในการวิเคราะห์ข้อมูลหลายมิติ ยกตัวอย่างเช่น นักวิทยาศาสตร์ข้อมูลเชื่อมต่อ ฐานข้อมูล OLTP กับ ้อน Cloud-based OLAP เพื่อทำการสืบค้นข้อมูลประวัติเชิงคำนวณเป็นหลัก
AWS ช่วยเรื่อง OLAP ได้อย่างไร
ฐานข้อมูล AWS มีมีการจัดการฐานข้อมูลระบบคลาวด์ที่หลากหลายเพื่อช่วยให้องค์กรจัดเก็บและดำเนินการงานประมวลผลเชิงวิเคราะห์ออนไลน์ ( OLAP) นักวิเคราะห์ข้อมูลใช้ฐานข้อมูล AWS เพื่อสร้างฐานข้อมูลที่ปลอดภัยที่สอดคล้องกับความต้องการขององค์กร องค์กรจะย้ายข้อมูลธุรกิจของตนไปยังฐานข้อมูล AWS เนื่องจากราคาที่ต่ำและความสามารถในการเพิ่มทรัพยากรได้
- Amazon Redshift เป็นคลังข้อมูลระบบคลาวด์ที่ออกแบบมาเฉพาะสำหรับการประมวลผลการวิเคราะห์ออนไลน์
- Amazon Relational Database Service (Amazon RDS) เป็นฐานข้อมูลแบบเชิงสัมพันธ์ที่มีฟังก์ชันการทำงาน OLAP วิศวกรข้อมูลใช้ Amazon RDS กับ Oracle OLAP เพื่อดำเนินการค้นหาที่ซับซ้อนในก้อนมิติ
- Amazon Aurora เป็นฐานข้อมูลแบบเชิงสัมพันธ์ระบบคลาวด์ที่สามารถใช้ร่วมกับ MySQL- และ PostgreSQL พัฒนาให้เหมาะสำหรับการทำงานของเวิร์กโหลด OLAP ที่ซับซ้อน
เริ่มใช้งาน OLAP บน AWS ด้วยการสร้างบัญชี AWS วันนี้