Amazon Textract คือบริการแมชชีนเลิร์นนิงที่แยกข้อความ ลายมือ และข้อมูลโดยอัตโนมัติจากเอกสารที่สแกน โดยไม่ได้ใช้แค่การรู้จำอักขระด้วยแสง (OCR) แบบทั่วไปในการระบุ ทำความเข้าใจ และแยกข้อมูลจากแบบฟอร์มและตาราง Amazon Textract ให้คุณจ่ายเฉพาะส่วนที่คุณใช้เท่านั้น ไม่มีค่าธรรมเนียมขั้นต่ำและไม่มีภาระผูกพันจากค่าบริการล่วงหน้า Amazon Textract จะคิดค่าบริการเฉพาะสำหรับหน้าที่ได้รับการประมวลผลเท่านั้น ไม่ว่าคุณจะแยกข้อความ ข้อความที่มีตาราง ข้อมูลในแบบฟอร์ม การสืบค้น หรือประมวลผลใบแจ้งหนี้และเอกสารระบุตัวตน ดูรายละเอียดเพิ่มเติมเกี่ยวกับหน้าต่างๆ และการใช้งานที่ยอมรับได้ของ Amazon Textract ได้ที่คำถามที่พบบ่อย

Amazon Textract มี API ที่แตกต่างกัน 4 ประเภท ได้แก่ API ตรวจจับข้อความในเอกสาร, API วิเคราะห์เอกสาร, API วิเคราะห์ค่าใช้จ่าย และ API วิเคราะห์ ID

API ตรวจจับข้อความในเอกสาร ใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือจากเอกสาร

API วิเคราะห์เอกสาร มีสามรูปแบบ ได้แก่ แบบฟอร์ม ตาราง และการสืบค้น คุณมีความยืดหยุ่นในการเรียกใช้แบบฟอร์ม ตาราง และการสืบค้นผสมผสานกันในลักษณะใดก็ได้

  • API วิเคราะห์เอกสารสำหรับแบบฟอร์มจะดึงข้อมูล เช่น คู่คีย์-ค่า (“ชื่อจริง” และค่าที่เกี่ยวข้อง เช่น “Jane Smith”) นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
  • API วิเคราะห์เอกสารสำหรับตารางจะดึงข้อมูลแบบตารางที่จัดเป็นคอลัมน์และแถว นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
  • API วิเคราะห์เอกสารสำหรับการสืบค้นช่วยให้คุณมีความยืดหยุ่นในการระบุข้อมูลที่คุณต้องการจากเอกสาร (เช่น “ชื่อลูกค้าคืออะไร”) แล้วรับข้อมูลดังกล่าว (เช่น “Jane Doe”) เป็นส่วนหนึ่งของการตอบกลับ คุณไม่จำเป็นต้องกังวลเกี่ยวกับโครงสร้างของข้อมูลในเอกสาร หรือความแตกต่างของวิธีการจัดวางข้อมูลในรูปแบบและเวอร์ชันต่างๆ ของเอกสาร นอกจากนี้ยังใช้เทคโนโลยี OCR เพื่อดึงข้อความและลายมือทั้งหมดจากเอกสารอีกด้วย
 
API วิเคราะห์ค่าใช้จ่ายดึงข้อมูลจากใบแจ้งหนี้และใบเสร็จรับเงิน เช่น ID ใบแจ้งหนี้, หมายเลขใบแจ้งหนี้, # ใบแจ้งหนี้ และค่าที่เกี่ยวข้องของ 12345 Amazon Textract จดจำเงื่อนไขต่างๆ เหล่านี้เป็น ID ใบแจ้งหนี้และค่าที่เกี่ยวข้องกันเป็น 12345 จึงช่วยให้มีการจัดหมวดหมู่แบบมาตรฐานตามช่องข้อมูลทั่วไป 
 
API วิเคราะห์ ID ใช้แมชชีนเลิร์นนิงเพื่อทำความเข้าใจบริบทของเอกสารระบุตัวตน เช่น หนังสือเดินทางของสหรัฐฯ ใบอนุญาตขับขี่ และบัตรประจำตัวอื่นๆ คุณสามารถดึงข้อมูลที่เฉพาะเจาะจงได้โดยอัตโนมัติ เช่น วันหมดอายุและวันเกิด ตลอดจนระบุและดึงข้อมูลโดยนัย เช่น ชื่อและที่อยู่ ได้อย่างชาญฉลาด รูปภาพ ID แต่ละรูปจะถือเป็นหนึ่งหน้า
 

Free Tier

คุณสามารถเริ่มต้นใช้งาน Amazon Textract ได้ฟรีโดยเป็นส่วนหนึ่งของ AWS Free Tier Free Tier นี้มีอายุการใช้งานสามเดือน และลูกค้าใหม่ของ AWS สามารถวิเคราะห์ได้สูงสุดดังนี้

API ตรวจจับข้อความในเอกสาร: 1,000 หน้าต่อเดือน
API วิเคราะห์เอกสาร:

  • 100 หน้าต่อเดือนเมื่อใช้รูปแบบของแบบฟอร์มหรือตาราง
  • อีก 100 หน้าต่อเดือนเมื่อใช้รูปแบบการสืบค้น ใหม่

API วิเคราะห์ค่าใช้จ่าย: 100 หน้าต่อเดือน
API วิเคราะห์ ID: 100 หน้าต่อเดือน

ราคา API ของ Amazon Textract

*เอาต์พุตของ API วิเคราะห์เอกสารมาพร้อมกับ OCR โดยไม่คำนึงถึงประเภทของรูปแบบที่เลือก
*API วิเคราะห์ค่าใช้จ่ายและ API วิเคราะห์ ID ไม่รวม OCR มาในเอาต์พุต

ตัวอย่างราคานอกช่วง Free Tier

ตัวอย่างราคา 1 - API ตรวจจับข้อความในเอกสาร

สมมติว่าคุณต้องการดึงข้อความจากรายงานวิจัย 100,000 หน้าโดยใช้ API ตรวจจับข้อความในเอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหนึ่งล้านหน้าแรกคือ 0.0015 USD รวมทั้งสิ้นเป็นเงิน 150 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า

ราคาต่อหน้า = 0.0015 USD

ค่าบริการทั้งหมดต่อเดือน = 0.0015 USD * 100,000 = 150 USD

ตัวอย่างราคา 2 - API ตรวจจับข้อความในเอกสาร

สมมติว่าคุณต้องการดึงข้อความจากรายงานวิจัย 2 ล้านหน้าโดยใช้ API ตรวจจับข้อความในเอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าแรกอยู่ที่ 0.0015 USD และหน้าหลังจากนั้นอยู่ที่ 0.0006 USD ดังนั้นสำหรับการประมวลผล 2 ล้านหน้าจะมีค่าใช้จ่ายทั้งหมดอยู่ที่ 2,100 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า

ราคาต่อหน้า = 0.0015 USD สำหรับ 1 ล้านหน้าแรกและ 0.0006 USD สำหรับ 1 ล้านหน้าหลังจากนั้น

ค่าบริการทั้งหมดต่อเดือน = 0.0015 USD * 1,000,000 + 0.0006 USD * 1,000,000 = 1,500 USD + 600 USD = 2,100 USD

ตัวอย่างราคา 3 - API วิเคราะห์เอกสาร – แบบฟอร์มและตาราง

สมมติว่าคุณต้องการดึงข้อความและข้อมูลที่มีโครงสร้างจากแบบฟอร์มภาษี 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง 1 ล้านหน้าอยู่ที่ 0.015 USD และหน้าที่มีแบบฟอร์มอยู่ที่ 0.05 USD รวมทั้งหมดเป็น 325 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า

ราคาสำหรับหน้าที่มีตาราง = 0.015 USD

ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) = 0.05 USD

ค่าบริการทั้งหมด = 0.015 USD * 5,000 + 0.05 USD * 5,000 = 75 USD + 250 USD = 325 USD

ตัวอย่างราคา 4 - API วิเคราะห์เอกสาร – แบบฟอร์มและตาราง

สมมติว่าคุณต้องการดึงข้อความ แบบฟอร์ม และตารางจากแบบฟอร์มภาษี 2 ล้านหน้าโดยใช้ API วิเคราะห์เอกสาร ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง 1 ล้านหน้าอยู่ที่ 0.015 USD และ 0.01 USD ต่อหน้าสำหรับหน้าหลังจากนั้น หน้าที่มีแบบฟอร์มจะอยู่ที่ 0.05 USD สำหรับ 1 ล้านหน้า และ 0.04 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 115,000 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า

ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) = 0.05 USD สำหรับ 1 ล้านหน้าแรก และ 0.04 USD สำหรับ 1 ล้านหน้าถัดไป

ค่าบริการทั้งหมด = 0.015 USD * 1,000,000 + 0.01 USD * 1,000,000 + 0.05 USD * 1,000,000 + 0.04 USD * 1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD

ตัวอย่างราคา 5 - API วิเคราะห์เอกสาร - การสืบค้น

สมมติว่าคุณต้องการดึงข้อความจากแบบฟอร์มการจำนอง 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.015 USD รวมทั้งหมดเป็น 75 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า

ราคาต่อหน้าที่มีการสืบค้น = 0.015 USD

ค่าบริการทั้งหมด = 0.015 USD * 5,000 = 75 USD

ตัวอย่างราคา 6 - API วิเคราะห์เอกสาร - แบบฟอร์มและการสืบค้น

สมมติว่าคุณต้องการดึงข้อความและข้อมูลในตารางจากแบบฟอร์มภาษี 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตารางและการสืบค้น 1 ล้านหน้าอยู่ที่ 0.020 USD และ 0.015 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 100 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า

ราคาสำหรับหน้าที่มีตารางและการสืบค้น = 0.020 USD

ค่าบริการทั้งหมด = 0.020 USD * 5,000 = 100 USD

ตัวอย่างราคา 7 – API วิเคราะห์เอกสาร – แบบฟอร์มและการสืบค้น

สมมติว่าคุณต้องการดึงข้อความและข้อมูลในแบบฟอร์ม (คู่คีย์-ค่า) จากแบบฟอร์มประกันภัย 5,000 หน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีแบบฟอร์มและการสืบค้น 1 ล้านหน้าอยู่ที่ 0.055 USD และ 0.045 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 275 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 5,000 หน้า

ราคาสำหรับหน้าที่มีแบบฟอร์ม (คู่คีย์-ค่า) และการสืบค้น = 0.055 USD

ค่าบริการทั้งหมด = 0.055 USD * 5,000 = 275 USD

ตัวอย่างราคา 8 – API วิเคราะห์เอกสาร – แบบฟอร์มและตารางและการสืบค้น

สมมติว่าคุณต้องการดึงข้อความ แบบฟอร์ม และตารางจากต้นขั้วเงินค่าจ้าง 2 ล้านหน้าโดยใช้ API วิเคราะห์เอกสาร และคุณยังต้องการดึงจุดข้อมูลที่เฉพาะเจาะจง 10 จุดจากแต่ละหน้าผ่านการสืบค้นอีกด้วย ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับหน้าที่มีตาราง แบบฟอร์ม และการสืบค้น 1 ล้านหน้าอยู่ที่ 0.070 USD และ 0.055 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 125,000 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 2,000,000 หน้า 

ราคาสำหรับหน้าที่มีตาราง แบบฟอร์ม และการสืบค้น = 0.070 USD สำหรับ 1 ล้านหน้าแรก และ 0.055 USD สำหรับ 1 ล้านหน้าถัดไป 

ค่าบริการทั้งหมด = 0.070 USD * 1,000,000 + 0.055 USD * 1,000,000 = 70,000 USD + 55,000 USD = 125,000 USD

ตัวอย่างราคา 9 – API วิเคราะห์ค่าใช้จ่าย

สมมติว่าคุณต้องการดึงข้อมูลจากใบแจ้งหนี้ 100,000 ฉบับโดยใช้ API วิเคราะห์ค่าใช้จ่าย ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.01 USD และคุณจะประมวลผลใบแจ้งหนี้ 100,000 ฉบับ ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 1,000 USD ดูการคำนวณด้านล่าง: 

จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า 

ราคาต่อหน้า = 0.01 USD 

ค่าบริการทั้งหมดต่อเดือน = 0.01 USD * 100,000 = 1,000 USD

ตัวอย่างราคา 10 – API วิเคราะห์ค่าใช้จ่าย

สมมติว่าคุณต้องการดึงข้อมูลจากใบแจ้งหนี้ 1,500,000 ฉบับโดยใช้ API วิเคราะห์ค่าใช้จ่าย ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 1 ล้านหน้าอยู่ที่ 0.01 USD และ 0.008 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 14,000 USD ดูการคำนวณด้านล่าง: 

จำนวนหน้าทั้งหมดที่ประมวลผล = 1,500,000 หน้า 

ราคาต่อหน้า = 0.01 USD สำหรับ 1 ล้านหน้าแรก และ 0.008 USD สำหรับ 500,000 หน้าถัดไป 

ค่าบริการทั้งหมดต่อเดือน = 0.01 USD * 1,000,000 + 0.008 USD * 500,000 = 14,000 USD

ตัวอย่างราคา 11 – API วิเคราะห์ ID

สมมติว่าคุณต้องการดึงข้อมูลจากเอกสารระบุตัวตน 100,000 ฉบับโดยใช้ API วิเคราะห์ ID ราคาต่อหน้าในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 100,000 หน้าอยู่ที่ 0.025 USD สำหรับสูงสุด 100,000 หน้า ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 2,500 USD 

จำนวนหน้าทั้งหมดที่ประมวลผล = 100,000 หน้า 

ราคาต่อหน้า = 0.025 USD 

ค่าบริการทั้งหมดต่อเดือน = 0.025 USD * 100,000 = 2,500 USD

ตัวอย่างราคา 12 – API วิเคราะห์ ID

สมมติว่าคุณต้องการดึงข้อมูลจากเอกสารระบุตัวตน 600,000 ฉบับโดยใช้ API วิเคราะห์ ID ราคาต่อหน้าใน Region สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) สำหรับ 100,000 หน้าอยู่ที่ 0.025 USD และ 0.01 USD ต่อหน้าสำหรับหน้าหลังจากนั้น ค่าใช้จ่ายทั้งหมดจะอยู่ที่ 7,500 USD

จำนวนหน้าทั้งหมดที่ประมวลผล = 600,000 หน้า 

ราคาต่อหน้า = 0.025 USD สำหรับ 100,000 หน้าแรก และ 0.01 USD สำหรับ 500,000 หน้าถัดไป 

ค่าบริการทั้งหมดต่อเดือน = 0.025 USD * 100,000 + 0.01 USD * 500,000 = 7,500 USD

Standard Product Icons (Features) Squid Ink
ดูคำถามที่พบบ่อยเกี่ยวกับ Amazon Textract

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีการดึงข้อความและข้อมูลที่มีโครงสร้างจากเอกสารแทบทุกประเภทของ Amazon Textract

เรียนรู้เพิ่มเติม 
Sign up for a free account
ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที 

ลงชื่อสมัครใช้งาน 
Standard Product Icons (Start Building) Squid Ink
เริ่มต้นสร้างใน Console

เริ่มต้นสร้างด้วย Amazon Textract ใน AWS Management Console

ลงชื่อสมัครใช้งาน