Amazon Textract adalah layanan machine learning (ML) yang secara otomatis mengekstraksi teks, tulisan tangan, dan data dari dokumen yang dipindai. Amazon Textract melakukan lebih dari pengenalan karakter optik (OCR) sederhana untuk mengidentifikasi, memahami, dan mengekstraksi data dari formulir dan tabel. Dengan Amazon Textract, Anda hanya membayar sesuai penggunaan. Tidak ada biaya minimum dan tidak ada komitmen di muka. Amazon Textract hanya mengenakan biaya untuk halaman yang diproses, baik itu ekstraksi teks, teks dengan tabel, data formulir, kueri atau faktur proses, dan dokumen identitas. Lihat FAQ untuk detail tambahan tentang halaman dan penggunaan Amazon Textract yang dapat diterima.
Amazon Textract memiliki empat API yang berbeda: API Deteksi Teks Dokumen, API Analisis Dokumen, API Analisis Pengeluaran, dan API Analisis ID.
API Deteksi Teks Dokumen menggunakan teknologi OCR untuk mengekstraksi teks dan tulisan tangan dari sebuah dokumen.
API Analisis Dokumen memiliki tiga fitur, yaitu Formulir, Tabel, dan Kueri. Anda memiliki fleksibilitas untuk memanggil kombinasi Formulir, Tabel, dan Kueri secara bersama-sama.
- API Analisis Dokumen untuk Formulir mengekstraksi data seperti pasangan nilai-kunci (“Nama Depan” dan nilai yang terkait, seperti “Jane Smith”). API ini juga menggunakan teknologi OCR untuk mengekstraksi semua teks dan tulisan tangan dari sebuah dokumen.
- API Analisis Dokumen untuk Tabel mengekstraksi tabulasi atau data tabel yang dikelola dalam kolom dan baris. API ini juga menggunakan teknologi OCR untuk mengekstraksi semua teks dan tulisan tangan dari sebuah dokumen.
- API Analisis Dokumen untuk Kueri memberikan fleksibilitas untuk menentukan informasi yang Anda perlukan dari sebuah dokumen (mis. “Siapakah nama pelanggan?”) dan menerima data tersebut (mis. “Jane Doe”) sebagai bagian dari responsnya. Anda tidak perlu khawatir tentang struktur data di dalam dokumen atau variasi mengenai cara data tersebut dipersiapkan dalam berbagai format dan versi dokumen. API ini juga menggunakan teknologi OCR untuk mengekstraksi semua teks dan tulisan tangan dari sebuah dokumen.
Tingkat Gratis
Sebagai bagian dari AWS Tingkat Gratis, Anda dapat memulai Amazon Textract secara gratis. Tingkat Gratis tersedia selama tiga bulan, dan pelanggan AWS baru dapat menganalisis hingga:
API Deteksi Teks Dokumen: 1.000 halaman per bulan
API Analisis Dokumen:
- 100 halaman per bulan saat menggunakan fitur Formulir atau Tabel
- 100 halaman tambahan per bulan saat menggunakan fitur Kueri BARU
API Analisis Pengeluaran: 100 halaman per bulan
API Analisis ID: 100 halaman per bulan
Harga API Amazon Textract
*Output API Analisis Dokumen sudah termasuk OCR, terlepas dari tipe fitur yang dipilih
*Output API Analisis Pengeluaran dan API Analisis ID tidak termasuk OCR
Contoh harga di luar tingkat gratis
Contoh harga 1 - API Deteksi Teks Dokumen
Misalnya, Anda ingin mengekstraksi teks dari 100.000 halaman laporan penelitian dengan menggunakan API Deteksi Teks Dokumen. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman pertama adalah 0,0015 USD, sehingga biayanya menjadi 150 USD.
Total halaman yang diproses = 100.000
Harga per halaman = 0,0015 USD
Biaya total per bulan = 0,0015 USD * 100.000 = 150 USD
Contoh harga 2 - API Deteksi Teks Dokumen
Misalnya, Anda ingin mengekstraksi teks dari dua juta halaman laporan penelitian dengan menggunakan API Deteksi Teks Dokumen. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman pertama adalah 0,0015 USD, dan harga untuk halaman berikutnya adalah 0,0006 USD, sehingga untuk memproses dua juta halaman maka total biayanya menjadi 2.100 USD.
Total halaman yang diproses = 2.000.000
Harga per halaman = 0,0015 USD untuk satu juta halaman pertama dan 0,0006 USD untuk harga halaman berikutnya
Biaya total per bulan = 0,0015 USD * 1.000.000 + 0,0006 USD * 1.000.000 = 1.500 USD + 600 USD = 2.100 USD
Contoh harga 3 - API Analisis Dokumen – Formulir dan Tabel
Misalnya, Anda ingin mengekstraksi teks dan data terstruktur dari 5.000 halaman formulir pajak dengan menggunakan API Analisis Dokumen. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman dengan tabel adalah 0,015 USD, dan dengan formulir sebesar 0,05 USD, sehingga totalnya menjadi 325 USD.
Total halaman yang diproses = 5.000 halaman
Harga untuk halaman dengan tabel = 0,015 USD
Harga untuk halaman dengan formulir (pasangan nilai-kunci) = 0,05 USD
Total Biaya = 0,015 USD * 5.000 + 0,05 USD * 5.000 = 75 USD + 250 USD = 325 USD
Contoh harga 4 - API Analisis Dokumen – Formulir dan Tabel
Misalnya, Anda ingin mengekstraksi teks, formulir, dan tabel dari dua juta halaman formulir pajak dengan menggunakan API Analisis Dokumen. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman dengan tabel adalah 0,015 USD, dan 0,01 USD per halaman untuk halaman berikutnya setelah satu juta halaman. Halaman dengan formulir adalah 0,05 USD untuk satu juta halaman, dan 0,04 USD per halaman setelah satu juta. Total biayanya adalah 115.000 USD.
Total halaman yang diproses = 2.000.000 halaman
Harga untuk halaman dengan formulir (pasangan nilai-kunci) = 0,05 USD untuk satu juta pertama dan 0,04 USD untuk satu juta berikutnya
Total biaya = 0,015 USD * 1.000.000 + 0,01 USD * 1.000.000 + 0,05 USD * 1.000.000 + 0,04 USD * 1.000.000 = 15.000 USD + 10.000 USD + 50.000 + 40.000 = 115.000 USD
Contoh harga 5 - API Analisis Dokumen – Kueri
Misalnya, Anda ingin mengekstraksi teks dari 5.000 halaman formulir hipotek dengan menggunakan API Analisis Dokumen. Anda juga ingin mengekstraksi 10 titik data tertentu dari setiap halaman melalui Kueri. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman adalah 0,015 USD, sehingga totalnya menjadi 75 USD.
Total halaman yang diproses = 5.000 halaman
Harga per halaman dengan Kueri = 0,015 USD
Total biaya = 0,015 USD * 5.000 = 75 USD
Contoh harga 6 - API Analisis Dokumen – Formulir dan Kueri
Misalnya, Anda ingin mengekstraksi teks dan data tabel dari 5.000 halaman formulir pajak dengan menggunakan API Analisis Dokumen. Anda juga ingin mengekstraksi 10 titik data tertentu dari setiap halaman melalui Kueri. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman dengan Tabel dan Kueri adalah 0,020 USD, dan 0,015 USD per halaman untuk halaman berikutnya setelah satu juta halaman. Total biayanya menjadi 100 USD.
Total halaman yang diproses = 5.000 halaman
Harga untuk halaman dengan tabel dan Kueri = 0,020 USD
Total biaya = 0,020 USD * 5.000 = 100 USD
Contoh harga 7 - API Analisis Dokumen – Formulir dan Kueri
Misalnya, Anda ingin mengekstraksi teks dan data tabel (pasangan nilai-kunci) dari 5.000 halaman formulir asuransi dengan menggunakan API Analisis Dokumen. Anda juga ingin mengekstraksi 10 titik data tertentu dari setiap halaman melalui Kueri. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman dengan Formulir dan Kueri adalah 0,055 USD, dan 0,045 USD per halaman untuk halaman berikutnya setelah satu juta halaman. Total biayanya menjadi 275 USD.
Total halaman yang diproses = 5.000 halaman
Harga untuk halaman dengan Formulir (pasangan nilai-kunci) dan Kueri = 0,055 USD
Total Biaya = 0,055 USD * 5.000 = 275 USD
Contoh harga 8 - API Analisis Dokumen – Formulir, Tabel, dan Kueri
Misalnya, Anda ingin mengekstraksi teks, formulir, dan tabel dari dua juta halaman potongan gaji dengan menggunakan API Analisis Dokumen. Anda juga ingin mengekstraksi 10 titik data tertentu dari setiap halaman melalui Kueri. Harga per halaman di Wilayah AS Barat (Oregon) untuk satu juta halaman dengan Tabel, Formulir, dan Kueri adalah 0,070 USD, dan 0,055 USD per halaman untuk halaman berikutnya setelah satu juta halaman. Total biayanya adalah 125.000 USD.
Total halaman yang diproses = 2.000.000 halaman
Harga untuk halaman dengan Tabel, Formulir, dan Kueri = 0,070 USD untuk satu juta pertama dan 0,055 USD untuk satu juta halaman berikutnya
Total biaya = 0,070 USD * 1.000.000 + 0,055 USD * 1.000.000 = 70.000 USD + 55.000 USD = 125.000 USD
Contoh harga 9 - API Analisis Pengeluaran
Misalnya, Anda ingin mengekstraksi data dari 100.000 faktur dengan menggunakan API Analisis Pengeluaran. Harga per halaman di wilayah US West (Oregon) untuk 1 juta halaman adalah 0,01 USD dan Anda memproses 100.000 faktur. Total biayanya adalah 1.000 USD. Lihat perhitungannya di bawah ini:
Total halaman yang diproses = 100.000
Harga per halaman = 0,01 USD
Biaya total per bulan = 0,01 USD * 100.000 = 1.000 USD
Contoh harga 10 - API Analisis Pengeluaran
Misalnya, Anda ingin mengekstraksi data dari 1.500.000 faktur dengan menggunakan API Analisis Pengeluaran. Harga per halaman di wilayah US West (Oregon) untuk satu juta halaman adalah 0,01 USD per halaman dan 0,008 USD per halaman setelah satu juta. Total biayanya adalah 14.000 USD. Lihat perhitungannya di bawah ini:
Total halaman yang diproses = 1.500.000
Harga per halaman = 0,01 USD untuk 1 juta halaman pertama dan 0,008 USD untuk 500.000 halaman berikutnya
Biaya total per bulan = 0,01 USD * 1.000.000 + 0,008 USD * 500.000 = 14.000 USD
Contoh harga 11 - API Analisis ID
Misalnya, Anda ingin mengekstraksi informasi dari 100.000 dokumen identitas dengan menggunakan API Analisis ID. Harga per halaman di Wilayah AS Barat (Oregon) untuk 100.000 halaman adalah 0,025 USD per halaman hingga 100.000 halaman. Total biayanya adalah 2.500 USD.
Total halaman yang diproses = 100.000
Harga per halaman = 0,025 USD
Biaya total per bulan = 0,025 USD * 100.000 = 2.500 USD
Contoh harga 12 - API Analisis ID
Misalnya, Anda ingin mengekstraksi informasi dari 600.000 dokumen identitas dengan menggunakan API Analisis ID. Harga per halaman di Wilayah AS Barat (Oregon) untuk 100.000 halaman adalah 0,025 USD per halaman dan 0,01 USD per halaman setelah 100.000 halaman. Total biayanya adalah 7.500 USD.
Total halaman yang diproses = 600.000
Harga per halaman = 0,025 USD untuk 100.000 halaman pertama dan 0,01 USD untuk 500.000 halaman berikutnya
Biaya total per bulan = 0,025 USD * 100.000 + 0,01 USD * 500.000 = 7.500 USD

Pelajari lebih lanjut tentang cara Amazon Textract mengekstrak teks dan data terstruktur dari hampir semua jenis dokumen.