OCR (การรู้จำอักขระด้วยแสง) คืออะไร
OCR (การรู้จำอักขระด้วยแสง) คืออะไร
การรู้จำอักขระด้วยแสง (OCR) เป็นกระบวนการที่แปลงภาพข้อความให้เป็นรูปแบบข้อความที่เครื่องอ่านได้ ตัวอย่างเช่น หากคุณสแกนแบบฟอร์มหรือใบเสร็จ คอมพิวเตอร์ของคุณจะบันทึกการสแกนดังกล่าวเป็นไฟล์รูปภาพ คุณไม่สามารถใช้ตัวแก้ไขข้อความเพื่อแก้ไข ค้นหา หรือนับคำในไฟล์รูปภาพได้ อย่างไรก็ตาม คุณสามารถใช้ OCR เพื่อแปลงรูปภาพเป็นเอกสารข้อความที่มีการจัดเก็บเนื้อหาเป็นข้อมูลตัวอักษรได้
เหตุใด OCR จึงมีความสำคัญ
เวิร์กโฟลว์ทางธุรกิจส่วนใหญ่เกี่ยวข้องกับการรับข้อมูลจากสื่อสิ่งพิมพ์ แบบฟอร์มกระดาษ ใบแจ้งหนี้ เอกสารทางกฎหมายที่สแกนไว้ และสัญญาที่พิมพ์ออกมาล้วนเป็นส่วนหนึ่งของกระบวนการทางธุรกิจ เอกสารมากมายเหล่านี้ต้องใช้เวลาและพื้นที่ในการจัดเก็บและจัดการเป็นจำนวนมาก แม้ว่าการจัดการเอกสารแบบไม่ใช้กระดาษจะเป็นแนวทางที่ดี แต่การสแกนเอกสารเป็นรูปภาพนั้นก็มีอุปสรรคมากมายไม่แพ้กัน โดยกระบวนการดังกล่าวต้องอาศัยการดำเนินการด้วยตนเอง และอาจมีความยุ่งยากและใช้เวลานาน
นอกจากนี้การแปลงเนื้อหาเอกสารนี้เป็นดิจิทัลจะสร้างไฟล์รูปภาพที่มีข้อความที่ซ่อนอยู่ภายใน ซึ่งข้อความในรูปภาพไม่สามารถประมวลผลด้วยซอฟต์แวร์ประมวลผลคำในลักษณะเดียวกับเอกสารข้อความได้ เทคโนโลยี OCR จะแก้ปัญหาดังกล่าวด้วยการแปลงรูปภาพข้อความเป็นข้อมูลตัวอักษรที่สามารถวิเคราะห์ได้โดยซอฟต์แวร์ทางธุรกิจอื่นๆ คุณจึงสามารถใช้ข้อมูลดังกล่าวเพื่อทำการวิเคราะห์ ปรับการดำเนินงานให้มีประสิทธิภาพขึ้น ทำให้กระบวนการเป็นไปโดยอัตโนมัติ และปรับปรุงประสิทธิภาพการทำงาน
OCR มีข้อดีใดบ้าง
ข้อดีที่สำคัญของเทคโนโลยี OCR มีดังต่อไปนี้:
ข้อความที่ค้นหาได้
ธุรกิจต่างๆ สามารถแปลงเอกสารที่มีอยู่และใหม่เป็นคลังความรู้ถาวรที่ค้นหาได้อย่างเต็มรูปแบบ นอกจากนี้ พวกเขายังสามารถประมวลผลฐานข้อมูลตัวอักษรโดยอัตโนมัติโดยใช้ซอฟต์แวร์พินิจพิเคราะห์ข้อมูลเพื่อการประมวลผลความรู้เพิ่มเติมได้อีกด้วย
ประสิทธิภาพการดำเนินงาน
คุณสามารถปรับปรุงประสิทธิภาพได้โดยใช้ซอฟต์แวร์ OCR เพื่อผสานรวมเวิร์กโฟลว์เอกสารและเวิร์กโฟลว์ดิจิทัลภายในธุรกิจของคุณโดยอัตโนมัติ ตัวอย่างบางส่วนของสิ่งต่างๆ ที่ซอฟต์แวร์ OCR สามารถทำได้มีดังนี้:
- สแกนแบบฟอร์มที่กรอกด้วยลายมือเพื่อตรวจสอบ ตรวจทาน แก้ไข และวิเคราะห์โดยอัตโนมัติ ซึ่งช่วยประหยัดเวลาที่ต้องใช้สำหรับการประมวลผลเอกสารและการป้อนข้อมูลด้วยตนเอง
- ค้นหาเอกสารที่จำเป็นโดยการค้นหาคำศัพท์ในฐานข้อมูลอย่างรวดเร็ว เพื่อให้คุณไม่ต้องไล่ดูไฟล์ในกล่องด้วยตนเอง
- แปลงบันทึกย่อที่เขียนด้วยลายมือเป็นข้อความและเอกสารที่แก้ไขได้
โซลูชันปัญญาประดิษฐ์
OCR มักเป็นส่วนหนึ่งของโซลูชันปัญญาประดิษฐ์อื่นๆ ที่ธุรกิจต่างๆ อาจนำไปใช้ ตัวอย่างเช่น OCR จะสแกนและอ่านป้ายทะเบียนและป้ายจราจรในรถยนต์ไร้คนขับ ตรวจหาโลโก้แบรนด์ในโพสต์บนโซเชียลมีเดีย หรือระบุบรรจุภัณฑ์ของผลิตภัณฑ์ในภาพโฆษณา เทคโนโลยีปัญญาประดิษฐ์ดังกล่าวช่วยให้ธุรกิจต่างๆ ตัดสินใจทางการตลาดและการดำเนินงานได้ดีขึ้น ซึ่งช่วยลดค่าใช้จ่ายและปรับปรุงประสบการณ์ของลูกค้า
ประวัติและวิวัฒนาการของ OCR คืออะไร?
หนึ่งในพัฒนาที่รู้จักกันครั้งแรกใน OCR คือเครื่องของ Emanuel Goldberg ในปี 1920 ซึ่งสามารถอ่านอักขระและแปลงเป็นรหัสโทรเลข สิ่งนี้สร้างรากฐานสำหรับแนวคิดของการอ่านแบบใช้เครื่องจักร
การยอมรับก่อนกำหนด
ในปี 1950 OCR เริ่มมีรูปร่างเป็นเทคโนโลยีเชิงพาณิชย์ บริษัท เช่น RCA พัฒนาระบบที่สามารถอ่านแบบอักษรเฉพาะสำหรับแอปพลิเคชันธนาคารและไปรษณีย์ ระบบเหล่านี้ถูกนำมาใช้ในการประมวลผลการตรวจสอบและการจัดเรียงจดหมายโดยอัตโนมัติ—การใช้งานที่แคบ แต่มีผลกระทบ
ในช่วงทศวรรษที่ 1960 แบบอักษร OCR-A และ OCR-B ได้รับการออกแบบมาให้ทั้งมนุษย์และเครื่องอ่านได้อย่างง่ายดาย การแนะนำของพวกเขาทำให้ OCR มีความสอดคล้องมากขึ้นในด้านการเงินและรัฐบาล
การขยาย
การปรับปรุงสแกนเนอร์และอัลกอริทึมซอฟต์แวร์ช่วยให้ทำให้ OCR ใช้งานได้จริงสำหรับการใช้งานในธุรกิจประจำวัน โปรแกรมแรกๆ สามารถสแกนเอกสารกระดาษที่พิมพ์และแปลงเป็นข้อความที่แก้ไขได้ แม้ว่าความแม่นยำจะจำกัดก็ตาม
ในทศวรรษ 2000 เครือข่ายประสาทและเทคโนโลยีการเรียนรู้ของเครื่องในยุคแรกทำให้ OCR สามารถก้าวไปกว่าแบบอักษรและเลย์เอาต์คงที่ ตอนนี้ระบบสมัยใหม่สามารถตีความข้อความที่เขียนด้วยลายมือ การสแกนคุณภาพต่ำ และเลย์เอาต์ที่ซับซ้อนด้วยความแม่นยำที่มากขึ้น
มี
ปัจจุบัน OCR ได้พัฒนาจากเครื่องมือเฉพาะเป็นเทคโนโลยีพื้นฐานในการเปลี่ยนแปลงทางดิจิทัล มันถูกฝังไว้ในทุกอย่างตั้งแต่แอปมือถือไปจนถึงแพลตฟอร์มระบบอัตโนมัติขององค์กร รองรับหลายภาษาและจัดการการจับภาพแบบเรียลไทม์ในลักษณะที่ตระหนักถึงบริบท ตอนนี้มันเป็นส่วนสำคัญของระบบอัตโนมัติอัจฉริยะ
กรณีการใช้ OCR ที่แตกต่างกันในการประมวลผลเอกสารมีอะไรบ้าง
OCR เป็นส่วนสำคัญของเวิร์กโฟลว์การประมวลผลเอกสารขององค์กร พิจารณากรณีการใช้งานต่อไปนี้
การค้นหาที่เก็บเอกสารอย่างชาญฉลาด
เทคโนโลยี OCR ช่วยให้สามารถสร้างไฟล์เก็บถาวรดิจิทัลที่ค้นหาได้โดยการแยกข้อความจากเอกสาร PDF แบบอิมเมจ เมื่อจดจำข้อความแล้วสามารถจัดทำดัชนีและใช้ในระบบค้นหาที่ขับเคลื่อนด้วย AI ผู้ใช้สามารถค้นหาไฟล์ที่เกี่ยวข้องในไฟล์ขนาดใหญ่ได้อย่างรวดเร็วและแม่นยำโดยไม่ต้องจำแนกเอกสารเพิ่มเติม ตัวอย่างเช่น การค้นหาชื่อลูกค้าที่เฉพาะเจาะจงจะส่งคืนคำสั่งชำระเงิน ใบแจ้งหนี้ และแบบฟอร์มทั้งหมดที่ส่งเป็นเอกสาร
ธุรกิจสามารถแปลงเอกสารที่มีอยู่และเอกสารที่พิมพ์ใหม่ให้เป็นไฟล์เก็บความรู้ที่ค้นหาได้อย่างเต็มที่ นอกจากนี้ พวกเขายังสามารถประมวลผลฐานข้อมูลตัวอักษรโดยอัตโนมัติโดยใช้ซอฟต์แวร์พินิจพิเคราะห์ข้อมูลเพื่อการประมวลผลความรู้เพิ่มเติมได้อีกด้วย
การประมวลผลภาษาธรรมชาติ
OCR จดจำและแยกข้อความในระดับคำ บรรทัด หรือเซลล์ตาราง ให้การควบคุมได้มากขึ้นเกี่ยวกับวิธีการเตรียมเนื้อหาสำหรับงานการประมวลผลภาษาธรรมชาติแบบดาวน์สตรีม (NLP) เช่น การจำแนกเอกสาร การสรุป การวิเคราะห์ความรู้สึกแบบจำลองหัวข้อ การจดจำเอนทิตี และอื่นๆ ตัวอย่างเช่น การสรุปจะต้องแยกข้อความในย่อหน้า แต่การจดจำเอนทิตีอาจชอบการแยกข้อความในคู่คีย์-ค่า เช่น ไฟล์ JSON
มาตรฐานข้อมูล
เวิร์กโฟลว์เอกสารมักเกี่ยวข้องกับข้อมูลที่ไม่มีโครงสร้างจากรูปแบบและอุตสาหกรรมที่แตกต่างกัน OCR ช่วยทำให้ข้อมูลนี้เป็นปกติโดยการแยกทั้งข้อความและตารางจากประเภทเอกสารที่หลากหลาย เช่น งบการเงิน บันทึกทางคลินิก และรายงานทางเทคนิค คุณจะได้รับการประมวลผลที่รวดเร็วขึ้นและการจัดการข้อมูลที่สม่ำเสมอมากขึ้นในทุกระบบ
การประมวลผลแบบฟอร์มอัตโนมัติ
เทคโนโลยี OCR มีบทบาทสำคัญในการประมวลผลแบบฟอร์มอัตโนมัติ สามารถระบุฟิลด์และแยกข้อมูลที่มีโครงสร้างจากแบบฟอร์มประเภทต่างๆ ทำให้ธุรกิจสามารถรวมข้อมูลนี้เข้ากับฐานข้อมูลโดยตรงโดยไม่ต้องป้อนด้วยตนเอง
คุณลักษณะแอปพลิเคชัน
ความสามารถ OCR สามารถฝังเข้ากับแอปพลิเคชันธุรกิจได้โดยตรงเพื่อให้ผู้ใช้สามารถแยกข้อความแบบเรียลไทม์ได้ด้วยตนเอง ซึ่งจะช่วยลดภาระงานการวิเคราะห์เนื่องจากข้อมูลถูกรวบรวมอย่างถูกต้องที่แหล่งที่มา
OCR ถูกนำมาใช้ในอุตสาหกรรมต่าง ๆ อย่างไร
กรณีการใช้งาน OCR ทั่วไปบางส่วนในอุตสาหกรรมต่างๆ มีดังต่อไปนี้:
การธนาคาร
อุตสาหกรรมการธนาคารใช้ OCR ในการประมวลผลและตรวจสอบเอกสารสำหรับเอกสารเงินกู้ เช็คเงินฝาก และธุรกรรมทางการเงินอื่นๆ โดยการตรวจสอบนี้ได้ปรับปรุงการป้องกันการปลอมแปลงและยกระดับความปลอดภัยของธุรกรรมให้สูงขึ้น ตัวอย่างเช่น BlueVine เป็นบริษัทเทคโนโลยีทางการเงินที่ให้บริการทางการเงินแก่ธุรกิจขนาดเล็กและขนาดกลาง โดยบริษัทใช้ Amazon Textract ซึ่งเป็นบริการ OCR บนระบบคลาวด์ในการพัฒนาผลิตภัณฑ์สำหรับธุรกิจขนาดเล็กในสหรัฐอเมริกาเพื่อเข้าถึงโปรแกรมให้สินเชื่อเพื่อคุ้มครองธุรกิจ (Paycheck Protection Program หรือ PPP) ได้อย่างรวดเร็ว ซึ่งเป็นส่วนหนึ่งของแผนกระตุ้นเศรษฐกิจเพื่อบรรเทาผลกระทบจาก COVID-19 ซึ่ง Amazon Textract ประมวลผลและวิเคราะห์แบบฟอร์ม PPP หลายหมื่นรายการต่อวันโดยอัตโนมัติ เพื่อให้ BlueVine สามารถช่วยให้ธุรกิจหลายพันรายได้รับเงินทุน พร้อมทั้งรักษาสภาพการจ้างงาน 400,000 ตำแหน่งไปในตัว
การดูแลสุขภาพ
อุตสาหกรรมการดูแลสุขภาพใช้ OCR เพื่อประมวลผลบันทึกผู้ป่วย รวมถึงการรักษา การทดสอบ บันทึกของโรงพยาบาล และการชำระเงินประกัน โดย OCR ช่วยปรับปรุงเวิร์กโฟลว์ให้มีประสิทธิภาพมากขึ้นและลดการทำงานด้วยตนเองที่โรงพยาบาลในขณะที่ยังคงดูแลให้บันทึกทันสมัยอยู่เสมอ ตัวอย่างเช่น nib Group ให้การประกันสุขภาพและการรักษาพยาบาลแก่ชาวออสเตรเลียกว่า 1 ล้านคนและได้รับการเรียกร้องค่ารักษาพยาบาลหลายพันรายการต่อวัน ซึ่งลูกค้าสามารถถ่ายรูปใบกำกับยาและส่งผ่านแอปมือถือของ nib ได้ จากนั้น Amazon Textract จะประมวลผลรูปภาพเหล่านี้โดยอัตโนมัติเพื่อให้บริษัทอนุมัติการเรียกร้องเหล่านี้ได้รวดเร็วยิ่งขึ้น
โลจิสติกส์
บริษัทโลจิสติกส์ใช้ OCR เพื่อติดตามฉลากบรรจุภัณฑ์ ใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ได้อย่างมีประสิทธิภาพมากขึ้น ตัวอย่างเช่น Foresight Group ใช้ Amazon Textract เพื่อทำให้การประมวลผลใบแจ้งหนี้ใน SAP เป็นไปโดยอัตโนมัติ การป้อนข้อมูลในเอกสารทางธุรกิจเหล่านี้ด้วยตนเองใช้เวลานานและเกิดข้อผิดพลาดได้ง่าย เนื่องจากพนักงานของ Foresight ต้องป้อนข้อมูลในระบบบัญชีหลายระบบ เมื่อใช้ Amazon Textract ช่วยให้ซอฟต์แวร์ Foresight สามารถอ่านอักขระได้แม่นยำยิ่งขึ้นในเค้าโครงต่างๆ มากมาย ซึ่งช่วยเพิ่มประสิทธิภาพทางธุรกิจ
OCR ทำงานอย่างไร
โปรแกรม OCR หรือซอฟต์แวร์ OCR ทำงานโดยมีขั้นตอนดังต่อไปนี้:
การรับภาพ
ตัวสแกนจะอ่านเอกสารและแปลงเป็นข้อมูลไบนารี จากนั้นซอฟต์แวร์ OCR จะวิเคราะห์ภาพที่สแกนและระบุส่วนที่สว่างเป็นพื้นหลัง และส่วนที่มืดเป็นข้อความ
กระบวนการก่อนการประมวลผล
ซอฟต์แวร์ OCR จะทำความสะอาดรูปภาพก่อน และลบข้อผิดพลาดออกเพื่อเตรียมรูปภาพสำหรับการอ่าน โดยเทคนิคบางส่วนในการทำความสะอาดรูปภาพมีดังนี้:
- การปรับเอกสารให้ตรงหรือการเอียงเอกสารที่สแกนเล็กน้อยเพื่อแก้ไขปัญหาการจัดตำแหน่งระหว่างการสแกน
- การลบนอยส์หรือลบจุดในรูปภาพดิจิทัลออก หรือการปรับขอบของรูปภาพข้อความให้เรียบ
- การทำความสะอาดช่องและเส้นในรูปภาพ
- การรู้จำสคริปต์สำหรับเทคโนโลยี OCR แบบหลายภาษา
การรู้จำข้อความ
อัลกอริทึม OCR สองประเภทหลักหรือกระบวนการซอฟต์แวร์ที่ซอฟต์แวร์ OCR ใช้สำหรับการจดจำข้อความ เรียกว่าการจับคู่รูปแบบและการแยกคุณลักษณะ
การจับคู่รูปแบบ
การจับคู่รูปแบบทำงานโดยการแยกภาพอักขระที่เรียกว่ารูปอักษร และเปรียบเทียบกับรูปอักษรที่จัดเก็บไว้ในลักษณะเดียวกัน การจดจำรูปแบบใช้งานได้เฉพาะในกรณีที่อักษรที่เก็บไว้มีแบบอักษรและมาตราส่วนคล้ายกับอักษรอินพุต โดยวิธีการนี้ใช้ได้ดีกับรูปภาพที่สแกนของเอกสารที่พิมพ์ด้วยแบบอักษรที่เป็นที่รู้จัก
การแยกลักษณะ
การแยกลักษณะจะแบ่งหรือแยกย่อยรูปอักษรออกเป็นคุณสมบัติต่างๆ เช่น เส้น วงปิด ทิศทางของเส้น และจุดตัดของเส้น จากนั้นจึงใช้คุณสมบัติเหล่านี้เพื่อค้นหาคู่ที่เหมาะสมที่สุดหรือตำแหน่งข้างเคียงที่ใกล้ที่สุดในบรรดารูปอักษรต่างๆ ที่จัดเก็บไว้
กระบวนการหลังการประมวลผล
หลังจากการวิเคราะห์ระบบจะแปลงข้อมูลข้อความที่แยกออกมาเป็นเอกสารข้อความที่อ่านได้ด้วยเครื่องได้ ระบบ OCR บางส่วนสามารถสร้างไฟล์ PDF ที่มีคำอธิบายประกอบซึ่งมีทั้งเวอร์ชันก่อนและหลังของเอกสารที่สแกนได้
OCR มีประเภทใดบ้าง
นักวิทยาศาสตร์ข้อมูลจัดประเภทเทคโนโลยี OCR ประเภทต่างๆ ตามการใช้งานและการประยุกต์ใช้ โดยตัวอย่างเล็กๆ น้อยๆ มีดังต่อไปนี้:
ซอฟต์แวร์รู้จำอักขระด้วยแสงอย่างง่าย
เอ็นจิ้น OCR ที่เรียบง่ายทำงานโดยการจัดเก็บแบบอักษรและรูปแบบภาพข้อความที่แตกต่างกันมากมายเป็นเทมเพลต จากนั้นซอฟต์แวร์ OCR จะใช้อัลกอริทึมการจับคู่รูปแบบเพื่อเปรียบเทียบรูปภาพข้อความกับฐานข้อมูลภายในแบบอักขระทีละตัว หากระบบจับคู่ข้อความได้แบบคำต่อคำ ก็จะเรียกวิธีการนี้ว่าการรู้จำคำด้วยแสง แต่โซลูชันนี้มีข้อจำกัดเนื่องจากมีแบบอักษรและลักษณะการเขียนด้วยลายมือที่แทบไม่จำกัด และไม่สามารถบันทึกและจัดเก็บตัวพิมพ์ทุกประเภทไว้ในฐานข้อมูลได้
ซอฟต์แวร์รู้จำอักขระแบบอัจฉริยะ
ระบบ OCR สมัยใหม่ใช้เทคโนโลยีการรู้จำอักขระแบบอัจฉริยะ (ICR) เพื่ออ่านข้อความในลักษณะเดียวกับที่มนุษย์อ่าน ซึ่งจะใช้วิธีการขั้นสูงที่ฝึกฝนเครื่องจักรให้ทำงานเหมือนมนุษย์โดยใช้ซอฟต์แวร์แมชชีนเลิร์นนิง โดยระบบแมชชีนเลิร์นนิงที่เรียกว่านิวรัลเน็ตเวิร์คจะวิเคราะห์ข้อความในหลายระดับ โดยประมวลผลภาพซ้ำๆ ซึ่งจะมองหาลักษณะเฉพาะต่างๆ ของรูปภาพ เช่น เส้นโค้ง จุดตัด และวง และรวมผลลัพธ์ของการวิเคราะห์ระดับต่างๆ เหล่านี้เข้าด้วยกันเพื่อให้ได้ผลลัพธ์สุดท้าย แม้ว่าโดยทั่วไปแล้ว ICR จะประมวลผลรูปภาพทีละอักขระ แต่กระบวนการดังกล่าวมีความรวดเร็ว โดยได้ผลลัพธ์ในไม่กี่วินาที
การรู้จำคำแบบอัจฉริยะ
ระบบการรู้จำคำแบบอัจฉริยะทำงานบนหลักการเดียวกับ ICR แต่จะประมวลผลภาพทั้งคำแทนการประมวลผลภาพล่วงหน้าเป็นอักขระ
การรู้จำเครื่องหมายด้วยแสง
การรู้จำเครื่องหมายด้วยแสงจะระบุโลโก้ ลายน้ำ และสัญลักษณ์ข้อความอื่นๆ ในเอกสาร
AWS สามารถช่วยคุณในการใช้งาน OCR ได้อย่างไร
AWS ขอเสนอ 2 บริการที่ช่วยให้คุณปรับใช้ OCR ในธุรกิจของคุณดังนี้:
Amazon Textract คือบริการแมชชีนเลิร์นนิง (ML) ที่ใช้ OCR เพื่อแยกข้อความ ข้อความที่เขียนด้วยลายมือ และข้อมูลโดยอัตโนมัติจากเอกสารที่สแกน เช่น PDF โดยสามารถอ่านเอกสารหลายพันฉบับในเค้าโครงและรูปแบบที่หลากหลายด้วยความเร็วสูง เมื่อดึงข้อมูลจากเอกสารแล้ว Amazon Textract จะส่งคืนคะแนนความเชื่อมั่นสำหรับทุกสิ่งที่ระบุได้ เพื่อให้คุณสามารถตัดสินใจโดยใช้ข้อมูลได้ว่าต้องการใช้ผลลัพธ์อย่างไร
Amazon Rekognition สามารถวิเคราะห์รูปภาพและวิดีโอนับล้านรายการได้ในเวลาไม่กี่นาที และเสริมประสิทธิภาพงานตรวจสอบภาพโดยมนุษย์ด้วยปัญญาประดิษฐ์ คุณสามารถใช้ Amazon Rekognition API เพื่อแยกข้อความจากทั้งรูปภาพและวิดีโอได้ โดยคุณสามารถแยกข้อความที่บิดเบี้ยวและผิดเพี้ยนได้จากรูปภาพและวิดีโอของป้ายสัญลักษณ์บนถนน โพสต์บนโซเชียลมีเดีย และบรรจุภัณฑ์ของผลิตภัณฑ์
เริ่มต้นใช้งาน OCR บน AWS โดย สร้างบัญชี AWS ได้แล้ววันนี้