Amazon Textract คือบริการแมชชีนเลิร์นนิงที่แยกข้อความ ลายมือ และข้อมูลโดยอัตโนมัติจากเอกสารที่สแกน โดยไม่ได้ใช้แค่การรู้จำอักขระด้วยแสง (OCR) แบบทั่วไปในการระบุ ทำความเข้าใจ และแยกข้อมูลจากแบบฟอร์มและตาราง Amazon Textract ให้คุณจ่ายเฉพาะส่วนที่คุณใช้เท่านั้น ไม่มีค่าธรรมเนียมขั้นต่ำและไม่มีภาระผูกพันจากค่าบริการล่วงหน้า Amazon Textract จะคิดค่าบริการเฉพาะสำหรับหน้าที่ได้รับการประมวลผลเท่านั้น ไม่ว่าคุณจะแยกข้อความ ข้อความที่มีตาราง ข้อมูลในแบบฟอร์ม การสืบค้น หรือประมวลผลใบแจ้งหนี้และเอกสารระบุตัวตน ดูรายละเอียดเพิ่มเติมเกี่ยวกับหน้าต่างๆ และการใช้งานที่ยอมรับได้ของ Amazon Textract ได้ที่คำถามที่พบบ่อย
Amazon Textract มี API ที่แตกต่างกัน 4 ประเภท ได้แก่ API ตรวจจับข้อความในเอกสาร, API วิเคราะห์เอกสาร, API วิเคราะห์ค่าใช้จ่าย และ API วิเคราะห์ ID
API ตรวจจับข้อความในเอกสาร ใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือจากเอกสาร
API วิเคราะห์เอกสาร มีสามรูปแบบ ได้แก่ แบบฟอร์ม ตาราง และการสืบค้น คุณมีความยืดหยุ่นในการเรียกใช้แบบฟอร์ม ตาราง และการสืบค้นผสมผสานกันในลักษณะใดก็ได้
- API วิเคราะห์เอกสารสำหรับแบบฟอร์มจะดึงข้อมูล เช่น คู่คีย์-ค่า (“ชื่อจริง” และค่าที่เกี่ยวข้อง เช่น “Jane Smith”) นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
- API วิเคราะห์เอกสารสำหรับตารางจะดึงข้อมูลแบบตารางที่จัดเป็นคอลัมน์และแถว นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
- API วิเคราะห์เอกสารสำหรับการสืบค้นช่วยให้คุณมีความยืดหยุ่นในการระบุข้อมูลที่คุณต้องการจากเอกสาร (เช่น “ชื่อลูกค้าคืออะไร”) แล้วรับข้อมูลดังกล่าว (เช่น “Jane Doe”) เป็นส่วนหนึ่งของการตอบกลับ คุณไม่จำเป็นต้องกังวลเกี่ยวกับโครงสร้างของข้อมูลในเอกสาร หรือความแตกต่างของวิธีการจัดวางข้อมูลในรูปแบบและเวอร์ชันต่างๆ ของเอกสาร นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
Free Tier
คุณสามารถเริ่มต้นใช้งาน Amazon Textract ได้ฟรีโดยเป็นส่วนหนึ่งของ AWS Free Tier Free Tier นี้มีอายุการใช้งานสามเดือน และลูกค้าใหม่ของ AWS สามารถวิเคราะห์ได้สูงสุดดังนี้
API ตรวจจับข้อความในเอกสาร: 1,000 หน้าต่อเดือน
API วิเคราะห์เอกสาร:
- 100 หน้าต่อเดือนเมื่อใช้รูปแบบของแบบฟอร์มหรือตาราง
- อีก 100 หน้าต่อเดือนเมื่อใช้รูปแบบการสืบค้น ใหม่
API วิเคราะห์ค่าใช้จ่าย: 100 หน้าต่อเดือน
API วิเคราะห์ ID: 100 หน้าต่อเดือน
ราคา API ของ Amazon Textract
*เอาต์พุตของ API วิเคราะห์เอกสารมาพร้อมกับ OCR โดยไม่คำนึงถึงประเภทของรูปแบบที่เลือก
*API วิเคราะห์ค่าใช้จ่ายและ API วิเคราะห์ ID ไม่รวม OCR มาในเอาต์พุต
ตัวอย่างราคานอกช่วง Free Tier
ตัวอย่างราคา 1 - API ตรวจจับข้อความในเอกสาร
สมมติว่าคุณต้องการดึงข้อความจากรายงานวิจัย 100,000 หน้าโดยใช้ API ตรวจจับข้อความในเอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหนึ่งล้านหน้าแรกคือ 0.0015 USD รวมทั้งสิ้นเป็นเงิน 150 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า
ราคาต่อหน้า = 0.0015 USD
ค่าบริการทั้งหมดต่อเดือน = 0.0015 USD * 100,000 = 150 USD
ตัวอย่างราคา 2 - API ตรวจจับข้อความในเอกสาร
สมมติว่าคุณต้องการดึงข้อความจากรายงานวิจัย 2 ล้านหน้าโดยใช้ API ตรวจจับข้อความในเอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าแรกอยู่ที่ 0.0015 USD และหน้าหลังจากนั้นอยู่ที่ 0.0006 USD ดังนั้นสำหรับการประมวลผล 2 ล้านหน้าจะมีค่าใช้จ่ายทั้งหมดอยู่ที่ 2,100 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า
ราคาต่อหน้า = 0.0015 USD สำหรับ 1 ล้านหน้าแรกและ 0.0006 USD สำหรับ 1 ล้านหน้าหลังจากนั้น
ค่าบริการทั้งหมดต่อเดือน = 0.0015 USD * 1,000,000 + 0.0006 USD * 1,000,000 = 1,500 USD + 600 USD = 2,100 USD
ตัวอย่างราคา 3 - API วิเคราะห์เอกสาร – แบบฟอร์มและตาราง
สมมติว่าคุณต้องการดึงข้อความและข้อมูลที่มีโครงสร้างจากแบบฟอร์มภาษี 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง 1 ล้านหน้าอยู่ที่ 0.015 USD และหน้าที่มีแบบฟอร์มอยู่ที่ 0.05 USD รวมทั้งหมดเป็น 325 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า
ราคาสำหรับหน้าที่มีตาราง = 0.015 USD
ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) = 0.05 USD
ค่าบริการทั้งหมด = 0.015 USD * 5,000 + 0.05 USD * 5,000 = 75 USD + 250 USD = 325 USD
ตัวอย่างราคา 4 - API วิเคราะห์เอกสาร – แบบฟอร์มและตาราง
สมมติว่าคุณต้องการดึงข้อความ แบบฟอร์ม และตารางจากแบบฟอร์มภาษี 2 ล้านหน้าโดยใช้ API วิเคราะห์เอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง 1 ล้านหน้าอยู่ที่ 0.015 USD และ 0.01 USD ต่อหน้าสำหรับหน้าหลังจากนั้น หน้าที่มีแบบฟอร์มจะอยู่ที่ 0.05 USD สำหรับ 1 ล้านหน้า และ 0.04 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 115,000 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า
ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) = 0.05 USD สำหรับ 1 ล้านหน้าแรก และ 0.04 USD สำหรับ 1 ล้านหน้าถัดไป
ค่าบริการทั้งหมด = 0.015 USD * 1,000,000 + 0.01 USD * 1,000,000 + 0.05 USD * 1,000,000 + 0.04 USD * 1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD
ตัวอย่างราคา 5 - API วิเคราะห์เอกสาร - การสืบค้น
สมมติว่าคุณต้องการดึงข้อความจากแบบฟอร์มการจำนอง 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.015 USD รวมทั้งหมดเป็น 75 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า
ราคาต่อหน้าที่มีการสืบค้น = 0.015 USD
ค่าบริการทั้งหมด = 0.015 USD * 5,000 = 75 USD
ตัวอย่างราคา 6 - API วิเคราะห์เอกสาร - แบบฟอร์มและการสืบค้น
สมมติว่าคุณต้องการดึงข้อความและข้อมูลในตารางจากแบบฟอร์มภาษี 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตารางและการสืบค้น 1 ล้านหน้าอยู่ที่ 0.020 USD และ 0.015 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 100 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า
ราคาสำหรับหน้าที่มีตารางและการสืบค้น = 0.020 USD
ค่าบริการทั้งหมด = 0.020 USD * 5,000 = 100 USD
ตัวอย่างราคา 7 – API วิเคราะห์เอกสาร – แบบฟอร์มและการสืบค้น
สมมติว่าคุณต้องการดึงข้อความและข้อมูลในแบบฟอร์ม (คู่คีย์-ค่า) จากแบบฟอร์มประกันภัย 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีแบบฟอร์มและการสืบค้น 1 ล้านหน้าอยู่ที่ 0.055 USD และ 0.045 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 275 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า
ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) และการสืบค้น = 0.055 USD
ค่าบริการทั้งหมด = 0.055 USD * 5,000 = 275 USD
ตัวอย่างราคา 8 – API วิเคราะห์เอกสาร – แบบฟอร์มและตารางและการสืบค้น
สมมติว่าคุณต้องการดึงข้อความ แบบฟอร์ม และตารางจากต้นขั้วเงินค่าจ้าง 2 ล้านหน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง แบบฟอร์ม และการสืบค้น 1 ล้านหน้าอยู่ที่ 0.070 USD และ 0.055 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 125,000 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า
ราคาสำหรับหน้าที่มีตาราง แบบฟอร์ม และการสืบค้น = 0.070 USD สำหรับ 1 ล้านหน้าแรก และ 0.055 USD สำหรับ 1 ล้านหน้าถัดไป
ค่าบริการทั้งหมด = 0.070 USD * 1,000,000 + 0.055 USD * 1,000,000 = 70,000 USD + 55,000 USD = 125,000 USD
ตัวอย่างราคา 9 – API วิเคราะห์ค่าใช้จ่าย
สมมติว่าคุณต้องการดึงข้อมูลจากใบแจ้งหนี้ 100,000 ฉบับโดยใช้ API วิเคราะห์ค่าใช้จ่าย ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.01 USD และคุณจะประมวลผลใบแจ้งหนี้ 100,000 ฉบับ ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 1,000 USD ดูการคำนวณด้านล่าง:
จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า
ราคาต่อหน้า = 0.01 USD
ค่าบริการทั้งหมดต่อเดือน = 0.01 USD * 100,000 = 1,000 USD
ตัวอย่างราคา 10 – API วิเคราะห์ค่าใช้จ่าย
สมมติว่าคุณต้องการดึงข้อมูลจากใบแจ้งหนี้ 1,500,000 ฉบับโดยใช้ API วิเคราะห์ค่าใช้จ่าย ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.01 USD และ 0.008 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 14,000 USD ดูการคำนวณด้านล่าง:
จำนวนหน้าทั้งหมดที่ประมวลผล = 1,500,000 หน้า
ราคาต่อหน้า = 0.01 USD สำหรับ 1 ล้านหน้าแรก และ 0.008 USD สำหรับ 500,000 หน้าถัดไป
ค่าบริการทั้งหมดต่อเดือน = 0.01 USD * 1,000,000 + 0.008 USD * 500,000 = 14,000 USD
ตัวอย่างราคา 11 – API วิเคราะห์ ID
สมมติว่าคุณต้องการดึงข้อมูลจากเอกสารระบุตัวตน 100,000 ฉบับโดยใช้ API วิเคราะห์ ID ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 100,000 หน้าอยู่ที่ 0.025 USD สำหรับสูงสุด 100,000 หน้า ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 2,500 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า
ราคาต่อหน้า = 0.025 USD
ค่าบริการทั้งหมดต่อเดือน = 0.025 USD * 100,000 = 2,500 USD
ตัวอย่างราคา 12 – API วิเคราะห์ ID
สมมติว่าคุณต้องการดึงข้อมูลจากเอกสารระบุตัวตน 600,000 ฉบับโดยใช้ API วิเคราะห์ ID ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 100,000 หน้าอยู่ที่ 0.025 USD และ 0.01 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 7,500 USD
จำนวนหน้าทั้งหมดที่ประมวลผล = 600,000 หน้า
ราคาต่อหน้า = 0.025 USD สำหรับ 100,000 หน้าแรก และ 0.01 USD สำหรับ 500,000 หน้าถัดไป
ค่าบริการทั้งหมดต่อเดือน = 0.025 USD * 100,000 + 0.01 USD * 500,000 = 7,500 USD

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีการดึงข้อความและข้อมูลที่มีโครงสร้างจากเอกสารแทบทุกประเภทของ Amazon Textract

เริ่มต้นสร้างด้วย Amazon Textract ใน AWS Management Console