การแบ่งกลุ่มฐานข้อมูลคืออะไร

การแบ่งกลุ่มฐานข้อมูล คือกระบวนการของการจัดเก็บฐานข้อมูลขนาดใหญ่ในหลายเครื่อง เครื่องหรือเซิร์ฟเวอร์ฐานข้อมูลเดียวสามารถจัดเก็บและประมวลผลได้เพียงจำนวนข้อมูลที่จำกัด การแบ่งกลุ่มฐานข้อมูลเอาชนะข้อจำกัดนี้โดยการแบ่งข้อมูลออกเป็นชิ้นเล็กๆ ที่เรียกว่าส่วนข้อมูล และจัดเก็บส่วนข้อมูลเหล่านั้นไว้ในหลายเซิร์ฟเวอร์ฐานข้อมูล เซิร์ฟเวอร์ฐานข้อมูลทั้งหมดมักจะมีเทคโนโลยีพื้นฐานเดียวกันและทั้งหมดทำงานร่วมกันเพื่อจัดเก็บและประมวลผลข้อมูลปริมาณมาก

เหตุใดการแบ่งส่วนฐานะข้อมูลจึงสำคัญ

เมื่อแอปพลิเคชันเติบโตขึ้น จำนวนผู้ใช้แอปพลิเคชันและจำนวนข้อมูลที่จัดเก็บจะเพิ่มขึ้นเมื่อเวลาผ่านไป ฐานข้อมูลจะกลายเป็นคอขวดถ้าปริมาณข้อมูลมีขนาดใหญ่เกินไปและมีผู้ใช้จำนวนมากพยายามที่จะใช้แอปพลิเคชันในการอ่านหรือบันทึกข้อมูลพร้อมกัน แอปพลิเคชันช้าลงและมีผลต่อประสบการณ์ของลูกค้า การแบ่งส่วนฐานข้อมูลเป็นหนึ่งในวิธีการในการแก้ปัญหานี้เพราะทำให้เกิดการประมวลผลชุดข้อมูลขนาดเล็กในแต่ละส่วนข้อมูล

การแบ่งส่วนฐานข้อมูลมีประโยชน์อย่างไร

องค์กรใช้การแบ่งส่วนฐานข้อมูลเพื่อประโยชน์ต่อไปนี้:

ลดเวลาตอบกลับ

การดึงข้อมูลใช้เวลานานสำหรับฐานข้อมูลขนาดใหญ่ ระบบการจัดการฐานข้อมูล จำเป็นต้องค้นหาหลายแถวเพื่อดึงข้อมูลที่ถูกต้อง ในทางตรงกันข้าม ส่วนข้อมูลนั้นมีแถวน้อยกว่าฐานข้อมูลทั้งหมด ดังนั้นจึงใช้เวลาน้อยลงในการดึงข้อมูลที่ต้องการหรือเรียกใช้รันคิวรี่ฐานข้อมูลที่แบ่งส่วนแล้ว 

หลีกเลี่ยงปัญหาการหยุดชะงักของบริการทั้งหมด

ถ้าคอมพิวเตอร์ที่เป็นโฮสต์ฐานข้อมูลล้มเหลว แอปพลิเคชันที่ขึ้นอยู่กับฐานข้อมูลนั้นก็จะล้มเหลวเช่นกัน การแบ่งส่วนฐานข้อมูลป้องกันปัญหานี้โดยการกระจายส่วนของฐานข้อมูลลงในคอมพิวเตอร์ต่างๆ ความล้มเหลวของคอมพิวเตอร์เครื่องใดเครื่องหนึ่งจะไม่ชัตดาวน์แอปพลิเคชันเนื่องจากยังสามารถทำงานกับส่วนข้อมูลอื่นๆ ได้ โดยยังมักจะทำการแบ่งส่วนข้อมูลร่วมกับการจำลองข้อมูลข้ามส่วนข้อมูลด้วย ดังนั้น ถ้าหนึ่งส่วนข้อมูลใช้การไม่ได้ จะยังคงสามารถเข้าถึงข้อมูลและกู้คืนจากส่วนข้อมูลสำรองได้

ปรับขนาดได้อย่างมีประสิทธิภาพ

ฐานข้อมูลที่เติบโตขึ้นใช้ทรัพยากรการประมวลผลมากขึ้นและบรรลุขีดความจุสูงสุด องค์กรสามารถใช้การแบ่งส่วนฐานข้อมูลเพื่อเพิ่มทรัพยากรการประมวลผลมากขึ้นเพื่อรองรับการปรับฐานข้อมูล พวกเขาสามารถเพิ่มส่วนข้อมูลใหม่ที่รันไทม์ได้โดยไม่ต้องปิดแอปพลิเคชันสำหรับการบำรุงรักษา

การแบ่งส่วนฐานข้อมูลทำงานอย่างไร

ฐานข้อมูลเก็บข้อมูลในชุดข้อมูลหลายส่วนที่ประกอบด้วยคอลัมน์และแถว การแบ่งส่วนฐานข้อมูลจะแยกชุดข้อมูลหนึ่งชุดลงในพาร์ทิชันหรือส่วนข้อมูล แต่ละส่วนข้อมูลจะมีแถวที่ไม่ซ้ำกันของข้อมูลที่คุณสามารถจัดเก็บแยกต่างหากในคอมพิวเตอร์หลายเครื่องได้ หรือที่เรียกว่าโหนด ส่วนข้อมูลทั้งหมดทำงานบนโหนดต่างกัน แต่ใช้สคีมาหรือรูปแบบฐานข้อมูลเดิม 

ยกตัวอย่างเช่น ฐานข้อมูลที่ไม่ได้แบ่งส่วนที่มีชุดข้อมูลสำหรับระเบียนลูกค้าอาจมีลักษณะเช่นนี้

รหัสลูกค้า

ชื่อ

รัฐ

1

จอห์น

แคลิฟอร์เนียเหนือ

2

เจน

วอชิงตัน

3

เปาโล

แอริโซนา

4

แวง

จอร์เจีย

การแบ่งส่วนข้อมูลนั้นยังรวมถึงการแบ่งแถวของข้อมูลจากตาราง และจัดเก็บไว้ในเครื่องต่างๆ ดังต่อไปนี้

คอมพิวเตอร์ A

รหัสลูกค้า

ชื่อ

รัฐ

1

จอห์น

แคลิฟอร์เนียเหนือ

2

เจน

วอชิงตัน

คอมพิวเตอร์ B

รหัสลูกค้า

ชื่อ

รัฐ

3

เปาโล

แอริโซนา

4

แวง

จอร์เจีย

Shard

ชุดข้อมูลที่แบ่งเป็นพาร์ทิชันไว้นั้นเรียกว่าส่วนข้อมูลโลจิคัล เครื่องที่เก็บส่วนข้อมูลโลจิคัลนั้นเรียกว่าส่วนข้อมูลกายภาพหรือโหนดฐานข้อมูล ส่วนข้อมูลทางกายภาพประกอบไปด้วยส่วนข้อมูลโลจิคัลมากมาย 

คีย์ของส่วนข้อมูล

นักพัฒนาซอฟต์แวร์ใช้คีย์ของส่วนข้อมูลในการกำหนดวิธีการแบ่งพาร์ทิชันชุดข้อมูล คอลัมน์ในชุดข้อมูลจะกำหนดว่าแถวข้อมูลใดจะถูกรวมเข้าด้วยกันเป็นส่วนข้อมูล นักออกแบบฐานข้อมูลเลือกคีย์ส่วนข้อมูลจากคอลัมน์ที่มีอยู่หรือสร้างใหม่

สถาปัตยกรรมที่ไม่ใช้ร่วมกัน

การแบ่งส่วนฐานข้อมูลทำงานบนสถาปัตยกรรมที่ไม่ใช้ร่วมกัน ส่วนข้อมูลกายภาพแต่ละชิ้นทำงานได้อย่างอิสระและไม่สัมพันธ์กับส่วนข้อมูลอื่นๆ มีเพียงส่วนข้อมูลกายภาพที่มีข้อมูลที่คุณร้องขอเท่านั้นที่จะประมวลผลในแบบคู่ขนานให้กับคุณ 

เลเยอร์ซอฟต์แวร์จะประสานกับพื้นที่เก็บข้อมูลและเข้าถึงจากส่วนข้อมูลแยกย่อยเหล่านี้ ยกตัวอย่างเช่น เทคโนโลยีฐานข้อมูลบางประเภทมีฟีเจอร์แบ่งส่วนข้อมูลอัตโนมัติในตัว นักพัฒนาซอฟต์แวร์ยังสามารถเขียนโค้ดแบ่งส่วนข้อมูลในแอปพลิเคชันของพวกเขาเพื่อจัดเก็บหรือดึงข้อมูลจากส่วนข้อมูลที่ถูกต้องหรือหลายๆ ส่วนได้ 

การแบ่งส่วนฐานข้อมูลมีกี่ประเภท

วิธีการแบ่งส่วนฐานข้อมูลใช้กฎที่แตกต่างกันกับคีย์ส่วนข้อมูลเพื่อระบุโหนดที่ถูกต้องสำหรับแถวข้อมูลนั้นๆ ต่อไปนี้คือสถาปัตยกรรมการแบ่งส่วนข้อมูลทั่วไป

การแบ่งส่วนข้อมูลตามช่วง

การแบ่งส่วนข้อมูลตามช่วงหรือการแบ่งส่วนข้อมูลแบบไดนามิกจะแบ่งแถวฐานข้อมูลตามช่วงของค่า จากนั้นนักออกแบบฐานข้อมูลจะกำหนดคีย์ส่วนข้อมูลให้กับช่วงนั้นๆ ยกตัวอย่างเช่น นักออกแบบฐานข้อมูลจะแบ่งพาร์ทิชันข้อมูลตามพยัญชนะตัวแรกของชื่อของลูกค้า ดังต่อไปนี้ 

 

ชื่อ

คีย์ของส่วนข้อมูล

เริ่มต้นด้วย A ถึง I

ก.

เริ่มต้นด้วย J ถึง S

ข.

เริ่มต้นด้วย T ถึง Z

ค.

 

เมื่อมีการเขียนบันทึกลูกค้าไปยังฐานข้อมูล แอปพลิเคชันจะระบุคีย์ของส่วนข้อมูลที่ถูกต้องโดยการตรวจสอบชื่อของลูกค้า จากนั้นแอปพลิเคชันจะจับคู่คีย์กับโหนดกายภาพและจัดเก็บแถวไปยังเครื่องดังกล่าว ในทำนองเดียวกัน แอปพลิเคชันจะทำการจับคู่ย้อนกลับเมื่อค้นหาบันทึกใดโดยเฉพาะ

ข้อดีและข้อเสีย

ขึ้นอยู่กับค่าข้อมูล การแบ่งส่วนตามช่วงสามารถทำให้เกิดข้อมูลเกินพิกัดในโหนดกายภาพเดียวได้ ในตัวอย่างของเรา ส่วนข้อมูล (ที่มีชื่อที่ขึ้นต้นด้วย A ถึง I) อาจจะมีจำนวนมากกว่าส่วนข้อมูล C มาก (ที่มีชื่อที่ขึ้นต้นด้วย T ถึง Z) แต่อย่างไรก็ตาม การนำไปใช้จริงนั้นก็ง่ายกว่า

ส่วนข้อมูลแบบแฮช

ส่วนข้อมูลแบบแฮชจะกำหนดคีย์ส่วนข้อมูลให้กับแต่ละแถวของฐานข้อมูล โดยใช้สูตรทางคณิตศาสตร์ที่เรียกว่าฟังก์ชั่นแฮช ฟังก์ชั่นแฮชจะนำข้อมูลจากแถวนั้นมาละสร้างเป็นค่าแฮช แอปพลิเคชันจะใช้ค่าแฮชเป็นคีย์ส่วนข้อมูลและจัดเก็บข้อมูลไว้ในส่วนข้อมูลกายภาพนั้นๆ

นักพัฒนาซอฟต์แวร์ใช้ส่วนข้อมูลแบบแฮชเพื่อกระจายข้อมูลในฐานข้อมูลในหมู่ส่วนข้อมูลต่างๆ ยกตัวอย่างเช่น ซอฟต์แวร์แยกระเบียนของลูกค้าออกเป็นสองส่วนข้อมูลที่มีค่าแฮชเท่ากับ 1 และ 2 

ชื่อ

ค่าแฮช

จอห์น

1

เจน

2

เปาโล

1

แวง

2

ข้อดีและข้อเสีย

แม้ว่าการแบ่งส่วนข้อมูลแบบแฮชจะทำให้กระจายข้อมูลได้ทั่วถึงกันในส่วนข้อมูลกายภาพ แต่ก็ไม่ได้แยกฐานข้อมูลตามความหมายของข้อมูล ดังนั้น นักพัฒนาซอฟต์แวร์อาจประสบปัญหาการกำหนดค่าแฮชเมื่อเพิ่มส่วนข้อมูลกายภาพไปยังสภาพแวดล้อมการประมวลผลมากขึ้น 

ส่วนข้อมูลไดเรกทอรี

ส่วนข้อมูลไดเรกทอรีใช้ตารางการค้นหาในการจับคู่ข้อมูลในฐานข้อมูลเข้ากับส่วนข้อมูลกายภาพที่เกี่ยวข้องกัน ตารางการค้นหาเป็นเหมือนตารางบนสเปรดชีตที่เชื่อมโยงคอลัมน์ฐานข้อมูลกับคีย์ส่วนข้อมูล ตัวอย่างเช่น แผนภาพต่อไปนี้แสดงตารางการค้นหาสำหรับสีเสื้อผ้า

สี

คีย์ของส่วนข้อมูล

สีน้ำเงิน

ก.

สีแดง

ข.

สีเหลือง 

ค.

สีดำ

ง.

เมื่อแอปพลิเคชันเก็บข้อมูลเสื้อผ้าในฐานข้อมูล แอปพลิเคชันนั้นจะอ้างอิงจากตารางการค้นหา ถ้าชุดเป็นสีฟ้า แอปพลิเคชันจะจัดเก็บข้อมูลไว้ในส่วนข้อมูลที่ตรงกัน 

ข้อดีและข้อเสีย

นักพัฒนาซอฟต์แวร์ใช้ส่วนข้อมูลไดเรกทอรีเพราะมีความยืดหยุ่น แต่ละส่วนข้อมูลเป็นตัวแทนความหมายของฐานข้อมูลและไม่ได้จำกัดโดยช่วง อย่างไรก็ตาม ส่วนข้อมูลไดเรกทอรีจะล้มเหลวถ้าตารางการค้นหาประกอบด้วยข้อมูลที่ไม่ถูกต้อง 

ส่วนข้อมูลภูมิศาสตร์

ส่วนข้อมูลภูมิศาสตร์จะแยกและเก็บข้อมูลฐานข้อมูลตามตำแหน่งทางภูมิศาสตร์ ยกตัวอย่างเช่น เว็บไซต์บริการหาคู่ ใช้ฐานข้อมูลเพื่อเก็บข้อมูลลูกค้าจากเมืองต่างๆ ดังนี้ 

ชื่อ

คีย์ของส่วนข้อมูล

จอห์น

แคลิฟอร์เนียเหนือ

เจน

วอชิงตัน

เปาโล

แอริโซนา

นักพัฒนาซอฟต์แวร์ใช้เมืองเป็นคีย์ส่วนข้อมูล โดยจะเก็บข้อมูลของลูกค้าแต่ละรายในส่วนข้อมูลกายภาพที่อยู่ทางภูมิศาสตร์ในเมืองที่เกี่ยวข้อง 

ข้อดีและข้อเสีย

ส่วนข้อมูลภูมิศาสตร์ช่วยให้แอปพลิเคชันสามารถเรียกข้อมูลได้เร็วขึ้นเนื่องจากระยะห่างระหว่างส่วนข้อมูลและลูกค้าที่ร้องขอ ถ้ารูปแบบการเข้าถึงข้อมูลส่วนใหญ่ขึ้นอยู่กับภูมิศาสตร์แล้ว วิธีนี้เป็นวิธีที่เหมาะสม แต่อย่างไรก็ตาม ส่วนข้อมูลทางภูมิศาสตร์ก็อาจส่งผลให้มีการกระจายข้อมูลที่ไม่สม่ำเสมอ 

วิธีการเพิ่มประสิทธิภาพการแบ่งส่วนฐานข้อมูลสำหรับการกระจายข้อมูลอย่างเท่าเทียมกัน

เมื่อส่วนข้อมูลกายภาพใดนั้นมีข้อมูลเกินพิกัด แม้ว่าส่วนอื่นๆ จะยังไม่เกินพิกัด อาจส่งผลให้เกิดพื้นที่ที่มีการใช้งานสูงในฐานข้อมูลได้ พื้นที่ที่มีการใช้งานสูงจะชะลอกระบวนการดึงข้อมูลบนฐานข้อมูล และทำลายวัตถุประสงค์ของการแบ่งส่วนข้อมูล 

การเลือกคีย์ส่วนข้อมูลที่ดีจะสามารถกระจายข้อมูลไปไว้ในส่วนข้อมูลต่างๆ ได้ดี เมื่อเลือกคีย์ส่วนข้อมูล นักออกแบบฐานข้อมูลควรพิจารณาปัจจัยดังต่อไปนี้ 

คาร์ดินัลลิตี้

คาร์ดินาลลิตี้จะอธิบายค่าที่เป็นไปได้ของคีย์ส่วนข้อมูล โดยจะเป็นตัวกำหนดจำนวนสูงสุดที่เป็นไปได้ของส่วนข้อมูลในฐานข้อมูลที่จัดการเป็นคอลัมน์แบบแยก ตัวอย่างเช่นหากผู้ออกแบบฐานข้อมูลเลือกช่องข้อมูลแบบใช่/ไม่เป็นคีย์ส่วนข้อมูล จำนวนของคีย์ก็จะจำกัดอยู่ที่สอง

ความถี่

ความถี่คือความน่าจะเป็นของการจัดเก็บข้อมูลที่เฉพาะเจาะจงในส่วนข้อมูลนั้นๆ ยกตัวอย่างเช่น การออกแบบฐานข้อมูลเลือกอายุเป็นคีย์ส่วนข้อมูลสำหรับเว็บไซต์ฟิตเนส บันทึกส่วนใหญ่อาจจะไปลงในโหนดสำหรับสมาชิกอายุ 30-45 ปีและส่งผลให้เกิดพื้นที่ที่มีการใช้งานสูงในฐานข้อมูล 

การเปลี่ยนแปลงโมโนโทนิค

การเปลี่ยนแปลงแบบโมโนโทนิคคืออัตราการเปลี่ยนแปลงของคีย์ส่วนข้อมูล การเพิ่มขึ้นหรือลดลงแบบโมโนโทนิคทำให้เกิดส่วนข้อมูลที่ไม่สมดุล ยกตัวอย่างเช่น ฐานข้อมูลของผลตอบรับจะแบ่งออกเป็นสามส่วนข้อมูลกายภาพต่อไปนี้:

  • ส่วนข้อมูล A เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 0 - 10 รายการ
  • ส่วนข้อมูล B เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 11 - 20 รายการ
  • ส่วนข้อมูล C เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 21 รายการหรือมากกว่า

เมื่อธุรกิจเติบโตขึ้นลูกค้าจะซื้อสินค้าได้มากกว่า 21 รายการขึ้นไป แอปพลิเคชันเก็บข้อเสนอแนะของพวกเขาไว้ในส่วนข้อมูล C ซึ่งส่งผลให้ส่วนข้อมูลไม่สมดุลเพราะส่วนข้อมูล C มีบันทึกข้อเสนอแนะมากขึ้นกว่าส่วนข้อมูลอื่นๆ

อะไรคือทางเลือกอื่นนอกจากการแบ่งส่วนฐานข้อมูล

การแบ่งส่วนฐานข้อมูลเป็นกลยุทธ์การปรับขนาดแนวนอนที่จัดสรรโหนดหรือคอมพิวเตอร์ที่จะแบ่งปันเวิร์กโหลดของแอปพลิเคชันเพิ่มเติม องค์กรได้รับประโยชน์จากการปรับขนาดแนวนอนเพราะเป็นสถาปัตยกรรมทที่มีข้อผิดพลาดน้อย เมื่อคอมพิวเตอร์เครื่องหนึ่งหยุดทำงาน เครื่องอื่น จะยังคงทำงานโดยไม่หยุดชะงัก นักออกแบบฐานข้อมูลจะเวลาดาวน์ไท์ได้โดยการกระจายส่วนข้อมูลกายภาพไว้ในเซิร์ฟเวอร์หลายเครื่อง 

อย่างไรก็ตาม ส่วนข้อมูลเป็นเพียงหนึ่งในกลยุทธ์การปรับขนาดฐานข้อมูลมากมาย เรียนรู้เทคนิคอื่นๆ และเข้าใจความแตกต่าง

การปรับขนาดแนวตั้ง

การปรับขนาดแนวตั้งเพิ่มพลังการประมวลผลของเครื่องเครื่องเดียว ตัวอย่างเช่น ทีมไอทีจะเพิ่ม CPU, RAM และฮาร์ดดิสก์ไปยังเซิร์ฟเวอร์ฐานข้อมูลเพื่อเพิ่มปริมาณการใช้งานที่เพิ่มขึ้น 

การเปรียบเทียบการเข้ารหัสฐานข้อมูลและการปรับขนาดแนวตั้ง

การปรับขนาดแนวตั้งมีค่าใช้จ่ายน้อย แต่มีข้อจำกัดในการใช้ทรัพยากรประมวลผลที่ไม่สามารถปรับขนาดแนวตั้งได้ แต่อีกด้านหนึ่ง การแบ่งส่วนข้อมูลซึ่งเป็นกลยุทธ์การปรับขนาดแนวนอนจะง่ายต่อการนำไปใช้จริงมากกว่า ตัวอย่างเช่น ทีม IT ติดตั้งคอมพิวเตอร์หลายเครื่องแทนการปรับรุ่นฮาร์ดแวร์คอมพิวเตอร์เก่า

การจำลองแบบ

การจำลองแบบเป็นเทคนิคที่สร้างสำเนาที่แน่นอนของฐานข้อมูลและเก็บไว้ในคอมพิวเตอร์หลายเครื่อง นักออกแบบฐานข้อมูลใช้การจำลองแบบในการออกแบบ ระบบการจัดการฐานข้อมูลแบบเชิงสัมพันธ์ที่มีความผิดพลาดต่ำ เมื่อหนึ่งในคอมพิวเตอร์ที่โฮสต์ฐานข้อมูลหยุดทำงาน แบบจำลองอื่นๆ จะยังคงทำงานอยู่ การจำลองแบบเป็นแนวทางปฏิบัติทั่วไปในระบบคอมพิวเตอร์แบบกระจาย

การเปรียบเทียบการแบ่งส่วนฐานข้อมูลและการจำลองแบบ

การแบ่งส่วนฐานข้อมูลไม่ได้สร้างสำเนาของข้อมูลเดียวกัน แต่เป็นการแยกฐานข้อมูลหนึ่งออกเป็นหลายส่วนและเก็บไว้ในคอมพิวเตอร์หลายเครื่อง ซึ่งแตกต่างจากการจำลองแบบ การแบ่งส่วนฐานข้อมูลไม่ได้ทำให้เกิดความพร้อมใช้งานสูง การแบ่งส่วนข้อมูลสามารถใช้ร่วมกับการจำลองแบบเพื่อให้ได้ทั้งขนาดและความพร้อมใช้งานสูงได้

ในบางกรณี การแบ่งส่วนฐานข้อมูลอาจประกอบด้วยการจำลองแบบของชุดข้อมูลใดข้อมูลหนึ่ง ยกตัวอย่างเช่น ร้านค้าปลีกที่ขายสินค้าให้กับลูกค้าทั้งสหรัฐอเมริกาและยุโรปอาจเก็บแบบจำลองของตารางการแปลงขนาดบนส่วนข้อมูลคนละส่วนสำหรับทั้งสองภูมิภาค แอปพลิเคชันสามารถใช้สำเนาที่คัดลอกไว้ของตารางการแปลงเพื่อแปลงขนาดได้โดยไม่ต้องเข้าถึงเซิร์ฟเวอร์ฐานข้อมูลอื่นๆ 

การแบ่งพาร์ทิชัน

พาร์ทิชันเป็นกระบวนการของการแยกตารางฐานข้อมูลออกเป็นหลายกลุ่ม โดยแบ่งออกได้เป็น 2 ประเภท คือ 

  • การแบ่งพาร์ทิชันแนวนอนที่แยกฐานข้อมูลเป็นแถว
  • การแบ่งพาร์ทิชันแนวตั้งที่สร้างพาร์ทิชันต่างๆ ของคอลัมน์ฐานข้อมูล 

เปรียบเทียบการแบ่งส่วนฐานข้อมูลและการแบ่งพาร์ทิชัน

การแบ่งส่วนฐานข้อมูลเป็นเหมือนการแบ่งพาร์ทิชันแนวนอน ทั้งสองกระบวนการแยกฐานข้อมูลออกเป็นกลุ่มแถวที่ไม่ซ้ำกันหลายกลุ่ม การแบ่งพาร์ทิชันจะเก็บกลุ่มข้อมูลทั้งหมดในคอมพิวเตอร์เครื่องเดียวกัน แต่การแบ่งส่วนฐานข้อมูลกระจายไปทั่วคอมพิวเตอร์หลากหลายเครื่อง

ปัญหาของการแบ่งส่วนฐานข้อมูลคืออะไร

องค์กรอาจต้องเผชิญกับปัญหาเหล่านี้เมื่อมีการแบ่งส่วนข้อมูลฐานข้อมูล

พื้นที่ที่มีการใช้งานข้อมูลสูง

ส่วนข้อมูลส่วนกลายเป็นไม่สมดุลเนื่องจากการกระจายข้อมูลที่ไม่สม่ำเสมอ ยกตัวอย่างเช่น ส่วนข้อมูลกายภาพเดียวที่มีชื่อลูกค้าที่ขึ้นต้นด้วย A ได้รับข้อมูลมากกว่าส่วนอื่นๆ ส่วนข้อมูลทางกายภาพนี้จะใช้ทรัพยากรการประมวลผลมากกว่าส่วนอื่นๆ

โซลูชัน

คุณสามารถกระจายข้อมูลอย่างเท่าเทียมกันโดยใช้คีย์ส่วนข้อมูลที่เหมาะสม ชุดข้อมูลบางชุดเหมาะสมสำหรับการทำส่วนข้อมูลมากกว่าชุดข้อมูลอื่นๆ

ความซับซ้อนในการดำเนินงาน

การแบ่งส่วนข้อมูลฐานข้อมูลสร้างความซับซ้อนในการดำเนินงาน แทนที่จะจัดการฐานข้อมูลเดียว นักพัฒนาต้องจัดการโหนดฐานข้อมูลหลายโหนด เมื่อกำลังเรียกข้อมูล นักพัฒนาจะต้องคิวรี่ส่วนข้อมูลหลายส่วนและรวมข้อมูลเข้าด้วยกัน การดำเนินการดึงข้อมูลเหล่านี้สามารถทำให้การวิเคราะห์มีความซับซ้อนได้

โซลูชัน

ใน พอร์ตโฟลิโอฐานข้อมูลของ AWS การตั้งค่าฐานข้อมูลและการดำเนินงานนั้นเป็นกระบวนการอัตโนมัติส่วนมาก ซึ่งทำให้การทำงานกับสถาปัตยกรรมฐานข้อมูลที่แบ่งเป็นส่วนข้อมูลนั้นคล่องตัวมากขึ้น

ค่าใช้จ่ายโครงสร้างพื้นฐาน

องค์กรต้องจ่ายค่าใช้จ่ายด้านโครงสร้างพื้นฐานมากขึ้นเมื่อเพิ่มคอมพิวเตอร์ไปยังส่วนข้อมูลกายภาพ ค่าใช้จ่ายในการบำรุงรักษาอาจเพิ่มขึ้นหากคุณเพิ่มจำนวนเครื่องในศูนย์ข้อมูลในองค์กร

โซลูชัน

นักพัฒนาซอฟต์แวร์ใช้ Amazon Elastic Compute Cloud (Amazon EC2) เพื่อโฮสต์และปรับขนาดส่วนข้อมูลบนคลาวด์ คุณสามารถประหยัดเงินโดยใช้โครงสร้างพื้นฐานเสมือนที่ AWS จัดการได้อย่างเต็มที่

ความซับซ้อนของแอปพลิเคชัน

ระบบการจัดการฐานข้อมูลส่วนใหญ่ไม่มีคุณสมบัติแบ่งส่วนข้อมูลในตัว ซึ่งหมายความว่านักออกแบบฐานข้อมูลและนักพัฒนาซอฟต์แวร์จะต้องแยกและจัดการฐานข้อมูลด้วยตนเอง

โซลูชัน

คุณสามารถโยกย้ายข้อมูลของคุณไปยัง ฐานข้อมูลที่สร้างตามวัตถุประสงค์ของ AWS ซึ่งมีคุณสมบัติในตัวหลายอย่างที่สนับสนุนการปรับขนาดแนวนอน

AWS ช่วยเหลือคุณในการแบ่งส่วนข้อมูลได้อย่างไร

AWS เป็น แพลตฟอร์มการจัดการข้อมูลระดับโลกที่คุณสามารถใช้เพื่อสร้างกลยุทธ์ข้อมูลที่ทันสมัย ด้วย AWS คุณสามารถเลือกฐานข้อมูลที่สร้างตามวัตถุประสงค์ ที่เหมาะสม บรรลุประสิทธิภาพในระดับที่เหมาะสม เรียกใช้ฐานข้อมูลที่มีการจัดการอย่างเต็มรูปแบบ และมีความพร้อมใช้งานและความปลอดภัยสูง

เริ่มต้นการบริหารจัดการข้อมูลบน AWS ด้วยการสร้างบัญชี AWS วันนี้

ขั้นตอนถัดไปของ AWS

ดูแหล่งข้อมูลที่เกี่ยวกับผลิตภัณฑ์เพิ่มเติม
เรียนรู้เพิ่มเติมเกี่ยวกับบริการฐานข้อมูล 
ลงชื่อสมัครใช้งานบัญชีฟรี

ดูบริการฐานข้อมูลฟรี

ลงชื่อสมัครใช้งาน 
เริ่มต้นการสร้างในคอนโซล

เริ่มต้นสร้างในคอนโซลการจัดการของ AWS

ลงชื่อเข้าใช้