RAG (Retrieval-Augmented Generation) คืออะไร

สร้างบัญชี AWS

สำรวจข้อเสนอ AI ฟรี

สร้าง ปรับใช้ และเรียกใช้แอปพลิเคชันปัญญาประดิษฐ์ในระบบคลาวด์ฟรี

ตรวจสอบบริการปัญญาประดิษฐ์

สร้างสรรค์นวัตกรรมได้เร็วยิ่งขึ้นด้วยชุดบริการ AI ที่ครอบคลุมที่สุด

เรียกดูการฝึกอบรม AI

สร้างทักษะ AI ตามความต้องการด้วยหลักสูตร บทช่วยสอน และทรัพยากร

อ่านบล็อก AI และแมชชีนเลิร์นนิง

อ่านเกี่ยวกับข่าวสารล่าสุดเกี่ยวกับผลิตภัณฑ์ AWS AI และ ML และแนวปฏิบัติที่ดีที่สุด

Retrieval-Augmented Generation คืออะไร

Retrieval-Augmented Generation (RAG) เป็นกระบวนการปรับเอาต์พุตโมเดลภาษาขนาดใหญ่ให้เหมาะสม ดังนั้นจึงอ้างอิงฐานความรู้ที่เชื่อถือได้นอกแหล่งที่มาของข้อมูลการฝึกอบรมก่อนที่จะสร้างการตอบสนอง โมเดลภาษาขนาดใหญ่ (LLM) ได้รับการฝึกบนข้อมูลจำนวนมากและใช้พารามิเตอร์หลายพันล้านรายการเพื่อสร้างเอาต์พุตต้นฉบับสำหรับงาน เช่น ตอบคำถาม แปลภาษา และการเติมประโยค RAG ขยายความสามารถที่ทรงพลังอยู่แล้วของ LLM ไปยังโดเมนเฉพาะหรือฐานความรู้ภายในขององค์กรโดยไม่จำเป็นต้องรักษาโมเดลไว้ เป็นวิธีการที่คุ้มค่าในการปรับปรุงเอาต์พุต LLM เพื่อคงความเกี่ยวข้อง แม่นยำ และมีประโยชน์ในบริบทต่าง ๆ

เหตุใด Retrieval-Augmented Generation จึงมีความสำคัญ

LLM เป็นเทคโนโลยีปัญญาประดิษฐ์ (AI) ที่สำคัญที่ขับเคลื่อนแชทบอทอัจฉริยะและแอปพลิเคชันการประมวลผลภาษาธรรมชาติ (NLP) อื่น ๆ เป้าหมายคือการสร้างบอทที่สามารถตอบคำถามของผู้ใช้ในบริบทต่าง ๆ โดยการอ้างอิงข้ามแหล่งความรู้ที่เชื่อถือได้ น่าเสียดายที่ลักษณะของเทคโนโลยี LLM ทำให้เกิดการคาดการณ์ไม่ได้ในการตอบสนอง LLM นอกจากนี้ข้อมูลการฝึก LLM ยังเป็นข้อมูลที่คงที่และแนะนำวันที่ตัดยอดความรู้ที่มีอยู่

ความท้าทายที่รู้จักของ LLM ได้แก่:

การนำเสนอข้อมูลเท็จเมื่อไม่มีคำตอบ
การนำเสนอข้อมูลที่ล้าสมัยหรือข้อมูลทั่วไปเมื่อผู้ใช้คาดหวังการตอบสนองที่เฉพาะเจาะจงในปัจจุบัน
การสร้างการตอบสนองจากแหล่งที่มาที่ไม่ได้รับอนุญาต
การสร้างการตอบสนองที่ไม่ถูกต้องเนื่องจากความสับสนในคำศัพท์ ซึ่งแหล่งที่มาของการฝึกที่แตกต่างกันจะใช้คำศัพท์เดียวกันในการพูดคุยเกี่ยวกับสิ่งต่าง ๆ

คุณสามารถนึกถึงโมเดลภาษาขนาดใหญ่ว่าเป็นพนักงานใหม่ที่กระตือรือร้นมากเกินไปและปฏิเสธที่จะรับทราบเหตุการณ์ปัจจุบัน แต่จะตอบทุกคำถามด้วยความมั่นใจเสมอ น่าเสียดายที่ทัศนคติดังกล่าวอาจส่งผลเสียต่อความไว้วางใจของผู้ใช้ และไม่ใช่สิ่งที่คุณต้องการให้แชทบอทของคุณเลียนแบบ!

RAG เป็นวิธีหนึ่งในการแก้ปัญหาความท้าทายเหล่านี้ โดยจะเปลี่ยนเส้นทาง LLM เพื่อดึงข้อมูลที่เกี่ยวข้องจากแหล่งที่มาของความรู้ที่เชื่อถือได้และกำหนดไว้ล่วงหน้า องค์กรสามารถควบคุมเอาต์พุตข้อความที่สร้างได้มากขึ้น และผู้ใช้จะได้รับข้อมูลเชิงลึกเกี่ยวกับวิธีที่ LLM สร้างการตอบสนอง

ประโยชน์ของ Retrieval-Augmented Generation มีอะไรบ้าง

เทคโนโลยี RAG นำประโยชน์หลายประการมาสู่ความพยายามขององค์กรในการสร้าง AI ช่วยสร้าง

การดำเนินการที่คุ้มค่า

การพัฒนาแชทบอทโดยทั่วไปจะเริ่มต้นโดยการใช้โมเดลพื้นฐาน โมเดลพื้นฐาน (FM) เป็น LLM ที่เข้าถึง API ได้และได้รับการฝึกเกี่ยวกับสเปกตรัมกว้าง ๆ ของภาพรวมและข้อมูลที่ไม่มีป้ายกำกับ การฝึกอบรม FM ใหม่สำหรับข้อมูลเฉพาะขององค์กรหรือโดเมนมีค่าใช้จ่ายสูงในแง่ของการประมวลผลและการเงิน RAG เป็นวิธีการที่คุ้มค่ามากขึ้นในการแนะนำข้อมูลใหม่ไปยัง LLM โดยการทำให้เทคโนโลยีปัญญาประดิษฐ์ช่วยสร้าง (AI ช่วยสร้าง) เข้าถึงได้อย่างกว้างขวางขึ้นและใช้งานได้มากขึ้น

ข้อมูลปัจจุบัน

แม้ว่าแหล่งที่มาของข้อมูลการฝึกต้นฉบับสำหรับ LLM จะเหมาะสมกับความต้องการของคุณก็ตาม แต่การรักษาความเกี่ยวข้องก็ยังเป็นเรื่องท้าทายอยู่ RAG ช่วยให้นักพัฒนาสามารถจัดหาการวิจัย สถิติ หรือข่าวล่าสุดให้กับโมเดลช่วยสร้าง นักพัฒนาสามารถใช้ RAG เพื่อเชื่อมต่อ LLM โดยตรงกับฟีดโซเชียลมีเดีย ไซต์ข่าว หรือแหล่งข้อมูลอื่น ๆ ที่อัปเดตบ่อยครั้ง จากนั้น LLM จะสามารถให้ข้อมูลล่าสุดแก่ผู้ใช้ได้

เพิ่มความไว้วางใจของผู้ใช้

RAG ช่วยให้ LLM สามารถนำเสนอข้อมูลที่แม่นยำพร้อมการระบุแหล่งที่มา เอาต์พุตอาจรวมถึงการกล่าวอ้างหรือการอ้างอิงถึงแหล่งที่มา นอกจากนี้ผู้ใช้ยังสามารถค้นหาเอกสารต้นฉบับได้ด้วยตนเอง หากต้องการคำชี้แจงเพิ่มเติมหรือรายละเอียดเพิ่มเติม ซึ่งสามารถเพิ่มความไว้วางใจและความมั่นใจให้โซลูชัน AI ช่วยสร้างของคุณ

ควบคุมนักพัฒนาได้มากขึ้น

เมื่อใช้ RAG นักพัฒนาสามารถทดสอบและปรับปรุงแอปพลิเคชันแชทให้มีประสิทธิภาพมากขึ้นได้ นักพัฒนาสามารถควบคุมและเปลี่ยนแหล่งที่มาของข้อมูล LLM เพื่อปรับให้เข้ากับข้อกำหนดที่กำลังเปลี่ยนแปลงไปหรือการใช้งานข้ามฟังก์ชัน นอกจากนี้นักพัฒนายังสามารถจำกัดการดึงข้อมูลที่ละเอียดอ่อนไว้ในระดับการอนุญาตที่แตกต่างกัน และแน่ใจได้ว่า LLM จะสร้างการตอบสนองที่เหมาะสม นอกจากนี้พวกเขายังสามารถแก้ไขปัญหาและแก้ไขหาก LLM อ้างอิงแหล่งข้อมูลที่ไม่ถูกต้องสำหรับคำถามเฉพาะ องค์กรสามารถใช้เทคโนโลยี AI ช่วยสร้างได้อย่างมั่นใจมากขึ้นสำหรับการใช้งานที่หลากหลายมากขึ้น

Retrieval-Augmented Generation ทำงานอย่างไร

หากไม่มี RAG จากนั้น LLM จะใช้อินพุตของผู้ใช้และสร้างการตอบสนองตามข้อมูลที่ได้รับการฝึกหรือสิ่งที่รู้อยู่แล้ว เมื่อใช้ RAG ระบบจะเริ่มใช้คอมโพเนนต์การดึงข้อมูลที่ใช้อินพุตของผู้ใช้ในการดึงข้อมูลจากแหล่งที่มาของข้อมูลแหล่งใหม่ก่อน LLM จะได้รับทั้งการสืบค้นผู้ใช้และข้อมูลที่เกี่ยวข้อง LLM ใช้ความรู้ใหม่และข้อมูลการฝึกเพื่อสร้างการตอบสนองที่ดีขึ้น ส่วนต่อไปนี้ให้ภาพรวมของกระบวนการ

สร้างข้อมูลภายนอก

ข้อมูลใหม่ที่อยู่นอกชุดข้อมูลการฝึกต้นฉบับของ LLM เรียกว่า ข้อมูลภายนอก ซึ่งสามารถมาจากแหล่งที่มาของข้อมูลหลายแหล่ง เช่น API, ฐานข้อมูล หรือที่เก็บเอกสาร ข้อมูลอาจอยู่ในรูปแบบต่าง ๆ เช่น ไฟล์ ระเบียนฐานข้อมูล หรือข้อความแบบฟอร์มยาว เทคนิค AI อีกอย่างหนึ่งที่เรียกว่าการฝังโมเดลภาษา ให้แปลงข้อมูลเป็นการแสดงข้อมูลตัวเลขและจัดเก็บไว้ในฐานข้อมูลเวกเตอร์ กระบวนการนี้สร้างไลบรารีความรู้ที่โมเดล AI ช่วยสร้างสามารถเข้าใจได้

ดึงข้อมูลที่เกี่ยวข้อง

ขั้นตอนต่อไปคือการค้นหาความเกี่ยวข้อง ระบบจะแปลงการสืบค้นของผู้ใช้เป็นการแสดงข้อมูลเวกเตอร์และจับคู่กับฐานข้อมูลเวกเตอร์ ตัวอย่างเช่น พิจารณาแชทบอทอัจฉริยะที่สามารถตอบคำถามทรัพยากรมนุษย์ให้กับองค์กรได้ หากพนักงานค้นหา"ฉันมีวันลาประจำปีกี่วัน" ระบบจะดึงเอกสารนโยบายการลาประจำปีพร้อมกับบันทึกการลาที่ผ่านมาของพนักงานแต่ละคน เอกสารเฉพาะเหล่านี้จะถูกส่งคืน เนื่องจากมีความเกี่ยวข้องอย่างมากกับสิ่งที่พนักงานป้อนอินพุตเข้ามา ระบบจะสร้างและคำนวณความเกี่ยวข้องโดยใช้การคำนวณและการแสดงข้อมูลเวกเตอร์ทางคณิตศาสตร์

เพิ่มพรอมต์ของ LLM

ถัดไป โมเดล RAG จะเพิ่มอินพุต (หรือพรอมต์) ของผู้ใช้ โดยการเพิ่มข้อมูลที่ดึงที่เกี่ยวข้องในบริบท ขั้นตอนนี้ใช้เทคนิคทางวิศวกรรมการโต้ตอบเพื่อสื่อสารกับ LLM อย่างมีประสิทธิภาพ พรอมต์เสริมช่วยให้โมเดลภาษาขนาดใหญ่สามารถสร้างคำตอบที่ถูกต้องสำหรับการสืบค้นของผู้ใช้

อัปเดตข้อมูลภายนอก

คำถามถัดไปอาจเป็นคำถามที่ว่า จะเกิดอะไรขึ้นถ้าข้อมูลภายนอกเป็นข้อมูลที่เก่าแล้ว หากต้องการรักษาข้อมูลปัจจุบันไว้สำหรับการดึงข้อมูล ให้อัปเดตเอกสารแบบอะซิงโครนัสและอัปเดตการฝังการแสดงข้อมูลของเอกสาร คุณสามารถทำได้ผ่านทางกระบวนการแบบเรียลไทม์อัตโนมัติหรือการประมวลผลแบบแบตช์เป็นระยะ ๆ นี่คือความท้าทายที่พบบ่อยในการวิเคราะห์ข้อมูล ซึ่งสามารถใช้แนวทางวิทยาศาสตร์ข้อมูลที่แตกต่างกันในการจัดการการเปลี่ยนแปลงได้

แผนภาพต่อไปนี้แสดงขั้นตอนแนวคิดของการใช้ RAG กับ LLM

ความแตกต่างระหว่าง Retrieval-Augmented Generation และการค้นหาความหมายคืออะไร

การค้นหาความหมายจะช่วยเพิ่มประสิทธิภาพของผลลัพธ์ RAG สำหรับองค์กรที่ต้องการเพิ่มแหล่งความรู้ภายนอกซึ่งมีอยู่มากมายให้กับแอปพลิเคชัน LLM องค์กรสมัยใหม่จัดเก็บข้อมูลจำนวนมากไว้ในหลายระบบ ไม่ว่าจะเป็นคู่มือ คำถามที่พบบ่อย รายงานการวิจัย คู่มือการบริการลูกค้า และเอกสารด้านทรัพยากรบุคคล เป็นต้น การดึงบริบทเป็นเรื่องท้าทายในวงกว้างและส่งผลให้เอาต์พุตช่วยสร้างมีคุณภาพลดลง

เทคโนโลยีการค้นหาความหมายสามารถสแกนฐานข้อมูลขนาดใหญ่ที่มีข้อมูลที่แตกต่างกันและดึงข้อมูลได้อย่างแม่นยำยิ่งขึ้น ตัวอย่างเช่น ความสามารถในการตอบคำถามอย่าง “เมื่อปีที่แล้วใช้จ่ายไปกับการซ่อมแซมเครื่องจักรเท่าใด” โดยการแม็บคำถามกับเอกสารที่เกี่ยวข้องและส่งคืนข้อความที่เฉพาะเจาะจงแทนผลการค้นหา จากนั้นนักพัฒนาสามารถใช้คำตอบนั้นเพื่อให้บริบทเพิ่มเติมกับ LLM

โซลูชันการค้นหาคำสำคัญหรือแบบดั้งเดิมใน RAG ให้ผลลัพธ์ที่ จำกัดสำหรับงานที่ใช้ความรู้หนาแน่น นอกจากนี้นักพัฒนายังต้องจัดการกับการฝังคำ การแบ่งเอกสาร และความซับซ้อนอื่น ๆ ในระหว่างการเตรียมข้อมูลด้วยตนเองอีกด้วย ในทางตรงกันข้าม เทคโนโลยีการค้นหาความหมายจะทำงานทั้งหมดที่เกี่ยวกับการจัดเตรียมฐานความรู้ ดังนั้นนักพัฒนาจึงไม่จำเป็นต้องทำเอง นอกจากนี้ยังสามารถสร้างข้อความที่เกี่ยวข้องกับความหมายและคำโทเค็นที่เรียงตามความเกี่ยวข้อง เพื่อเพิ่มคุณภาพของเพย์โหลด RAG ให้สูงสุด

AWS จะรองรับข้อกำหนดของ Retrieval-Augmented Generation ของคุณได้อย่างไร

Amazon Bedrock (FM) เป็นบริการที่มีการจัดการเต็มรูปแบบซึ่งเสนอโมเดลพื้นฐาน (FM) ที่มีประสิทธิภาพสูงควบคู่ไปกับความสามารถอันหลากหลายที่คุณต้องใช้ในการสร้างแอปพลิเคชัน AI ช่วยสร้าง ทำให้การพัฒนานั้นง่ายดายขึ้น พร้อมทั้งยังมีความปลอดภัยและเป็นส่วนตัว ด้วยฐานความรู้สำหรับ Amazon Bedrock คุณสามารถเชื่อมต่อ FM กับแหล่งที่มาของข้อมูลของคุณสำหรับ RAG ได้ในไม่กี่คลิก การแปลงเวกเตอร์ การดึงข้อมูล และการสร้างผลลัพธ์ที่ดีขึ้นทั้งหมดจะได้รับการจัดการโดยอัตโนมัติ

สำหรับองค์กรที่จัดการ RAG ของตนเอง Amazon Kendra เป็นบริการค้นหาองค์กรที่แม่นยำสูงซึ่งขับเคลื่อนโดยแมชชีนเลิร์นนิง โดยให้บริการ Kendra Retrieve API ที่ปรับให้เหมาะสมซึ่งคุณสามารถใช้กับการจัดอันดับความหมายด้วยความแม่นยำสูงของ Amazon Kendra ในฐานะตัวรับระดับองค์กรสำหรับเวิร์กโฟลว์ RAG ของคุณ ตัวอย่างเช่น ด้วย Receive API คุณสามารถ:

ดึงข้อความที่เกี่ยวข้องกับความหมายได้สูงสุด 100 คำ โดยมีคำโทเค็นมากถึง 200 คำ โดยเรียงลำดับตามความเกี่ยวข้อง
ใช้ตัวเชื่อมต่อที่สร้างไว้ล่วงหน้ากับเทคโนโลยีข้อมูลยอดนิยม เช่น Amazon Simple Storage Service, SharePoint, Confluence และเว็บไซต์อื่น ๆ
รองรับรูปแบบเอกสารที่หลากหลายเช่น HTML, Word, PowerPoint, PDF, Excel และไฟล์ข้อความ
กรองการตอบสนองตามเอกสารเหล่านั้นที่ได้รับอนุญาตตามสิทธิ์ของผู้ใช้ปลายทาง

Amazon ยังเสนอตัวเลือกสำหรับองค์กรที่ต้องการสร้างโซลูชัน AI ช่วยสร้างแบบกำหนดเองมากขึ้น Amazon SageMaker JumpStart เป็นฮับ ML ที่มีโมเดลพื้นฐาน (FM) อัลกอริทึมในตัว และโซลูชัน ML ที่สร้างไว้ล่วงหน้า ซึ่งคุณสามารถปรับใช้ได้ด้วยการคลิกเพียงไม่กี่ครั้ง คุณสามารถเร่งการใช้งาน RAG ได้โดยอ้างอิงถึงโน้ตบุ๊ก SageMaker ที่มีอยู่และตัวอย่างโค้ด

เริ่มต้นด้วย Retrieval-Augmented Generation บน AWS ด้วยการสร้างบัญชีฟรีวันนี้