Umum

T: Apa itu Amazon Transcribe?

Amazon Transcribe adalah layanan AWS yang memudahkan pelanggan mengonversi ucapan ke teks. Menggunakan teknologi Pengenalan Ucapan Otomatis (Automatic Speech Recognition/ASR), pelanggan dapat memilih untuk menggunakan Amazon Transcribe untuk berbagai aplikasi bisnis, termasuk transkripsi panggilan layanan pelanggan berbasis suara, pembuatan subtitle pada konten audio/video, dan melakukan analisis konten (berbasis teks) pada konten audio/video.  

Q: bagaimana cara Amazon Transcribe berinteraksi dengan produk AWS lainnya?

Amazon Transcribe mengonversi input audio menjadi teks, yang membuka pintu bagi berbagai aplikasi analisis teks pada input suara. Misalnya, dengan menggunakan Amazon Comprehend pada data teks yang dikonversi dari Amazon Transcribe, pelanggan dapat melakukan analisis sentimen atau mengekstrak entitas dan frasa kunci. Demikian pula, dengan mengintegrasikan ke Amazon Translate dan Amazon Polly, pelanggan dapat menerima input suara dalam satu bahasa, menerjemahkannya ke bahasa lain dan menghasilkan output suara yang secara efektif memungkinkan percakapan multi-bahasa. Hal ini juga memungkinkan untuk mengintegrasikan Amazon Transcribe dengan Amazon Elasticsearch untuk mengindeks dan melakukan pencarian berbasis teks di pustaka audio/video. 

T: Apa lagi yang harus saya ketahui sebelum menggunakan layanan Amazon Transcribe?

Amazon Transcribe dirancang untuk menangani beragam karakteristik ucapan dan akustik, termasuk variasi volume, nada, dan kecepatan bicara. Kualitas dan konten sinyal audio (termasuk, tetapi tidak terbatas pada faktor-faktor, seperti kebisingan latar belakang, speaker yang tumpang tindih, ucapan beraksen, atau beralih antar bahasa dalam satu file audio) dapat memengaruhi akurasi output layanan. Kami terus memperbarui layanan untuk meningkatkan kemampuannya mengakomodasi variasi akustik tambahan dan jenis konten. 

Menggunakan Amazon Transcribe

T: Bagaimana pengembang akan mengakses Transcribe?

Cara termudah untuk mulai menggunakan Amazon Transcribe adalah dengan mengirimkan tugas menggunakan konsol untuk mentranskripsi file audio. Anda juga dapat memanggil layanan langsung dari AWS Command Line Interface, atau menggunakan salah satu SDK yang didukung pilihan Anda untuk berintegrasi dengan apiikasi Anda. Bagaimanapun juga, Anda dapat mulai menggunakan Amazon Transcribe untuk menghasilkan transkrip otomatis untuk file audio Anda hanya dengan beberapa baris kode.

T: Jenis input apa yang didukung oleh Amazon Transcribe?

Amazon Transcribe mendukung stream audio 16 kHz dan 8 kHz, dan beberapa encoding audio, termasuk WAV, MP3, MP4, dan FLAC.

T: Apakah Amazon Transcribe mendukung transkripsi real-time?

Ya. Amazon Transcribe memungkinkan pengguna untuk membuka stream dua arah melalui HTTP2. Pengguna dapat mengirim stream audio ke layanan saat menerima stream teks sebagai balasan secara real time.  

Q: Encoding apa yang didukung oleh transkripsi real-time?

Transkripsi streaming saat ini mendukung encoding PCM Linier 16-bit. 

T: Bahasa apa yang didukung oleh Amazon Transcribe?

Untuk informasi tentang dukungan bahasa, lihat halaman dokumentasi ini. 

T: Perangkat apa yang berfungsi dengan Amazon Transcribe?

Amazon Transcribe sebagian besar adalah perangkat agnostik. Secara umum, Amazon Transcribe berfungsi dengan perangkat apa pun yang menyertakan mikrofon pada perangkat seperti ponsel, PC, tablet, dan perangkat IoT (mis. sistem audio mobil). API Amazon Transcribe akan dapat mendeteksi kualitas stream audio yang diinput pada perangkat (8kHz VS 16kHz) dan akan dengan tepat memilih model akustik untuk mengkonversi ucapan ke teks. Selain itu, pengembang dapat memanggil API Transcribe melalui aplikasi mereka untuk mengakses kemampuan konversi ucapan ke teks. 

T: Adakah batasan ukuran pada konten audio yang dapat diproses oleh Amazon Transcribe?

Panggilan layanan Amazon Transcribe dibatasi hingga 4 jam (atau 2 GB) per panggilan API untuk layanan batch kami. Layanan streaming dapat mengakomodasi koneksi terbuka hingga 4 jam. 

T: Apa bahasa pemrograman yang didukung oleh Amazon Transcribe?

Layanan batch Amazon Transcribe mendukung .NET, Go, Java, Javascript, PHP, Python, dan Ruby.
Layanan real-time Amazon Transcribe mendukung Java SDK, Ruby SDK, dan C++ SDK. Dukungan SDK tambahan akan segera tersedia. Untuk detail lebih lanjut, kunjungi halaman Sumber Daya

T: Kata-kata kosakata kustom saya tidak dikenali! Apa yang dapat saya lakukan?

Output pengenalan ucapan tergantung pada sejumlah faktor selain entri kosakata kustom, sehingga tidak ada jaminan bahwa jika suatu istilah dimasukkan dalam kosakata kustom, istilah tersebut akan dikenali dengan benar.
Namun, alasan paling sering adalah bahwa kata kustom tidak memiliki pengucapan yang benar. Jika Anda belum memberikan pengucapan untuk kata kustom Anda, cobalah membuatnya. Jika Anda sudah memberikan satu, periksa kembali kebenarannya, atau sertakan varian pengucapan lainnya jika perlu. Hal ini dapat dilakukan dengan membuat beberapa entri dalam file kosakata kustom yang berbeda di bidang pengucapan.

T: Mengapa saya melihat terlalu banyak kata-kata kustom di output saya?

Kosakata kustom dioptimalkan untuk daftar kecil kata-kata yang ditargetkan; kosakata yang lebih besar dapat menyebabkan pembuatan kata-kata kustom yang berlebihan, terutama ketika kosakata tersebut mengandung kata-kata yang diucapkan dengan cara serupa. Jika Anda memiliki daftar besar, cobalah menguranginya menjadi kata-kata langka dan kata-kata yang sebenarnya diharapkan terjadi pada file audio Anda. Jika Anda memiliki kosakata besar yang mencakup beberapa kasus penggunaan, bagilah menjadi daftar terpisah untuk berbagai kasus penggunaan. Kata-kata yang pendek dan terdengar mirip dengan banyak kata-kata lain, dapat menyebabkan pembuatan yang berlebihan (terlalu banyak kata-kata kustom muncul di output). Lebih disarankan menggabungkan kata-kata ini dengan kata-kata sekitarnya dan mendaftar mereka sebagai frasa yang dipisahkan dengan tanda hubung. Misalnya, kata kustom “A.D.” dapat dimasukkan sebagai bagian dari frasa seperti ‘A.D.-converter ’.

T: Ada dua cara untuk menyediakan pengucapan, bidang IPA atau SoundsLike dalam tabel kosakata kustom. Mana yang lebih baik?

IPA memungkinkan pengucapan yang lebih tepat. Anda harus menyediakan pengucapan IPA jika Anda dapat menghasilkan IPA (mis., dari leksikon yang memiliki pengucapan IPA atau alat konverter online).

T: Saya ingin menggunakan IPA, tetapi saya bukan ahli linguistik. Adakah alat online yang dapat saya gunakan?

Beberapa kamus standar, seperti Oxford English Dictionary atau Cambridge Dictionary (termasuk versi online mereka) menyediakan pengucapan dalam IPA. Ada juga konverter online (mis. easypronunciation.com atau tophonetics.com untuk bahasa Inggris) — namun, perhatikan bahwa dalam kebanyakan kasus alat ini didasarkan pada kamus yang mendasarinya dan mungkin tidak menghasilkan IPA yang benar untuk beberapa kata, seperti nama yang tepat. Amazon Transcribe tidak menyokong alat pihak ketiga mana pun.

T: Apakah saya perlu menggunakan standar IPA berbeda yang khusus untuk aksen berbeda dari bahasa yang sama? (mis. bahasa Inggris-AS versus bahasa Inggris-Inggris)?

Anda harus menggunakan standar IPA yang sesuai untuk file audio yang akan Anda proses — mis., Jika Anda berharap untuk memproses audio dari penutur bahasa Inggris-Inggris, gunakan standar pengucapan bahasa Inggris Britania. Set simbol IPA yang diizinkan dapat berbeda untuk berbagai bahasa dan dialek yang didukung oleh Amazon Transcribe; pastikan bahwa pengucapan Anda hanya berisi karakter yang diizinkan. Detail tentang set karakter IPA dapat ditemukan dalam dokumentasi: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

T: Bagaimana saya bisa memberikan pengucapan menggunakan bidang SoundsLike di tabel kosakata kustom?

Anda dapat memecah kata atau frasa menjadi potongan-potongan kecil dan memberikan pengucapan untuk setiap bagian menggunakan ortografi standar bahasa untuk meniru cara kata itu terdengar. Misalnya, dalam bahasa Inggris Anda dapat memberikan petunjuk pengucapan untuk frasa Los-Angeles seperti ini: loss-ann-gel-es. Petunjuk untuk kata Etienne akan terlihat seperti ini: eh-tee-en. Anda memisahkan setiap bagian dari petunjuk dengan tanda hubung (-). Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input.

T: Bagaimana kerja dua cara memberikan akronim yang berbeda (dengan titik dan tanpa titik tetapi dengan pengucapan)?

Jika Anda menggunakan akronim yang mengandung titik, pengucapan ejaan akan dihasilkan secara internal. Jika Anda tidak menggunakan titik, berikan pengucapan di bidang pengucapan. Untuk beberapa akronim, tidak jelas apakah mereka memiliki pengucapan ejaan atau pengucapan seperti kata (mis., NATO sering diucapkan ‘n eɪ t oʊ’ (nay-toh) daripada ‘ɛn eɪ ti oʊ’ (N. A. T. O.)).

T: Di mana saya dapat menemukan contoh cara menggunakan pengucapan kustom?

Anda dapat menemukan format input sampel dan contoh dalam dokumentasi: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

T: Apa yang terjadi jika saya menggunakan IPA yang salah? Jika saya tidak yakin, apakah saya lebih baik tidak memasukkan IPA?

Sistem akan menggunakan pengucapan yang Anda berikan; hal ini akan meningkatkan kemungkinan kata dikenali dengan benar jika pengucapannya benar dan cocok dengan apa yang diucapkan. Jika Anda tidak yakin menghasilkan IPA yang benar, jalankan perbandingan dengan memroses file audio Anda dengan kosakata yang berisi pengucapan IPA Anda, dan dengan kosakata yang hanya berisi kata-kata (dan, opsional, bentuk tampilan-sebagai). Jika Anda tidak memberikan pengucapan apa pun, layanan akan menggunakan perkiraan yang mungkin atau mungkin tidak berfungsi lebih baik dari input Anda.

T: Saat menggunakan formulir DisplayAs, dapatkah saya menampilkan set karakter yang tidak terkait dengan bahasa asli yang ditranskripsikan? (mis. output “Jalan” sebagai “街道“).

Ya. Meskipun frasa hanya dapat menggunakan set karakter terbatas untuk bahasa tertentu, karakter UTF-8 selain \t (TAB) diizinkan di kolom DisplayAs.

Harga & Ketersediaan

T: Berapa biayanya?

Lihat halaman Harga Amazon Transcribe untuk mempelajari lebih lanjut.

T: Wilayah AWS mana yang tersedia untuk Amazon Transcribe?

Lihat Tabel Wilayah Infrastruktur Global AWS.

Privasi Data

T. Apakah input suara yang diproses oleh Amazon Transcribe disimpan, dan bagaimana mereka digunakan oleh AWS?

Amazon Transcribe dapat menyimpan dan menggunakan input suara yang diproses oleh layanan semata-mata untuk memberikan dan memelihara layanan serta untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi machine-learning/kecerdasan buatan Amazon lainnya. Penggunaan konten Anda penting untuk peningkatan terus-menerus pengalaman pelanggan Amazon Transcribe Anda, termasuk pengembangan dan pelatihan teknologi terkait. Kami tidak menggunakan informasi pengenal pribadi apa pun yang mungkin terkandung dalam konten Anda untuk menargetkan produk, layanan, atau pemasaran kepada Anda atau pengguna akhir Anda. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut. Anda dapat memilih untuk tidak menggunakan konten Anda untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi machine-learning/kecerdasan buatan Amazon lainnya dengan menghubungi AWS Support.

T. Bisakah saya menghapus input suara yang disimpan oleh Amazon Transcribe?

Ya. Anda dapat meminta penghapusan input suara yang terkait dengan akun Anda dengan menghubungi AWS Support. Menghapus input suara dapat menurunkan pengalaman Amazon Transcribe Anda.

T: Siapa yang memiliki akses ke konten saya yang diproses dan disimpan oleh Amazon Transcribe?

Hanya karyawan yang berwenang yang akan memiliki akses ke konten Anda yang diproses oleh Amazon Transcribe. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi tidak aktif dan dalam transit, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut.

T: Apakah saya masih memiliki konten saya yang diproses dan disimpan oleh Amazon Transcribe?

Anda selalu memiliki hak atas konten Anda, dan kami hanya akan menggunakan konten Anda dengan persetujuan Anda.

T: Apakah konten yang diproses oleh Amazon Transcribe dipindahkan ke luar wilayah AWS tempat saya menggunakan Amazon Transcribe?

Konten apa pun yang diproses oleh Amazon Transcribe dienkripsi dan disimpan saat tidak aktif di wilayah AWS di mana Anda menggunakan Amazon Transcribe. Beberapa bagian dari konten yang diproses oleh Amazon Transcribe dapat disimpan di wilayah AWS lain semata-mata sehubungan dengan peningkatan berkelanjutan dan pengembangan pengalaman pelanggan Amazon Transcribe Anda dan teknologi machine-learning/kecerdasan buatan Amazon lainnya. Jika Anda memilih untuk tidak menggunakan konten Anda untuk mengembangkan kualitas Amazon Transcribe dan teknologi machine-learning/kecerdasan buatan Amazon lainnya dengan menghubungi AWS zSupport, konten Anda tidak akan disimpan di wilayah AWS lain. Anda dapat meminta penghapusan input suara yang terkait dengan akun Anda dengan menghubungi AWS Support. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut.

T: Dapatkah saya menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan untuk anak di bawah 13 tahun dan tunduk pada Children’s Online Privacy Protection Act (COPPA)?

Ya, tunduk pada kepatuhan Anda terhadap Ketentuan Layanan Amazon Transcribe, termasuk kewajiban Anda untuk memberikan pemberitahuan yang diperlukan dan mendapatkan persetujuan orang tua yang dapat diverifikasi berdasarkan COPPA, Anda dapat menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.

T: Bagaimana saya menentukan apakah situs web, program, atau aplikasi saya tunduk pada COPPA?

Untuk informasi tentang persyaratan COPPA dan panduan untuk menentukan apakah situs web, program, atau aplikasi lain Anda tunduk pada COPPA, silakan merujuk langsung ke sumber daya yang diberikan dan dipelihara oleh United States Federal Trade Commission. Situs ini juga berisi informasi mengenai cara menentukan apakah suatu layanan ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.

Amazon Transcribe Medical

T. Apa itu Amazon Transcribe Medical?

Amazon Transcribe Medical adalah layanan pengenalan ucapan otomatis (automatic speech recognition/ASR) yang memudahkan pengembang untuk menambahkan kemampuan ucapan ke teks medis ke dalam aplikasi mereka. Dengan menggunakan Amazon Transcribe Medical, Anda dapat dengan cepat dan akurat mentranskrip pendiktean medis dan ucapan percakapan ke dalam teks untuk beragam tujuan, seperti merekam catatan dokter atau memproses analitik teks akhir untuk mengekstrak wawasan yang bermakna.

T. Apa yang dapat saya lakukan dengan Amazon Transcribe Medical?

Amazon Transcribe Medical menggunakan model machine learning lanjutan untuk mentranskrip ucapan medis ke teks secara akurat. Transcribe Medical dapat mentranskrip teks umum yang dapat digunakan untuk mendukung dalam beragam kasus penggunaan, menjangkau alur kerja dokumentasi klinis dan pemantauan keamanan obat (pharmacovigilance) untuk membuat subtitel pada telemedicine dan bahkan menghubungi analitik pusat dalam bidang layanan kesehatan dan ilmu hayat.

T. Untuk menggunakan Amazon Transcribe Medical, apakah saya perlu menjadi seorang ahli dalam pengenalan ucapan otomatis (ASR)?

Tidak, Anda tidak memerlukan keahlian ASR atau machine learning apa pun untuk menggunakan Amazon Transcribe Medical. Anda hanya perlu memanggil API Transcribe Medical, dan layanan akan menangani machine learning yang diperlukan dalam backend untuk mentranskrip ucapan medis ke teks.

T. Bagaimana saya memulai Amazon Transcribe Medical?

Anda dapat memulai Amazon Transcribe Medical dari AWS Management Console atau menggunakan SDK. Silakan lihat halaman dokumentasi teknis ini untuk detailnya.

Amazon Transcribe Medical memberikan tingkat gratis sehingga Anda dapat menguji layanannya. Lihat halaman harga untuk informasi selengkapnya.

T. Bahasa apa yang didukung oleh Amazon Transcribe Medical?

Amazon Transcribe Medical saat ini mendukung transkripsi medis dalam bahasa Inggris AS.

T. Spesialisasi medis apa yang didukung oleh Amazon Transcribe Medical?

Amazon Transcribe Medical mendukung transkripsi untuk perawatan utama, mencakup spesialisasi seperti pengobatan keluarga, pengobatan internal, pediatri, dan OB-GYN.

T. Di wilayah AWS mana Amazon Transcribe Medical tersedia?

Amazon Transcribe Medical saat ini tersedia di AS Timur (Viginia U.), AS Timur (Ohio), AS Barat (Oregon), Kanada (Pusat), UE (Irlandia), dan Asia Pasifik (Sydney).

T. Berapa harga Amazon Transcribe Medical?

Lihat halaman harga Amazon Transcribe Medical untuk mempelajari lebih lanjut tentang detail harga.

T. Apakah HIPAA Amazon Transcribe Medical memenuhi syarat?

Ya.

T. Apakah konten yang diproses oleh Amazon Transcribe Medical digunakan untuk tujuan selain untuk menyediakan layanan?

Amazon Transcribe Medical tidak menggunakan konten yang diproses oleh layanan untuk alasan selain untuk menyediakan dan memelihara layanan. Konten yang diproses oleh layanan tidak digunakan untuk mengembangkan atau meningkatkan kualitas Amazon Transcribe Medical atau teknologi kecerdasan buatan/machine learning Amazon lainnya.

T. Apakah Amazon Transcribe Medical belajar seiring waktu?

Ya, Amazon Transcribe Medical menggunakan machine learning dan secara berkelanjutan dilatih agar menjadi semakin baik untuk kasus penggunaan pengguna. Amazon Transcribe Medical tidak menyimpan atau menggunakan data pelanggan yang digunakan dengan layanan untuk melatih model

T. Apa lagi yang harus saya ketahui sebelum menggunakan layanan Amazon Transcribe Medical?

Amazon Transcribe Medical bukanlah pengganti untuk saran, diagnosis, atau perlakuan medis profesional. Anda dan pengguna akhir Anda bertanggung jawab untuk melaksanakan kebijaksanaan, pengalaman, dan penilaian Anda dalam menentukan ketepatan, kelengkapan, ketepatan waktu, dan kesesuaian informasi apa pun yang diberikan oleh Amazon Transcribe Medical. Anda dan pengguna akhir Anda bertanggung jawab sepenuhnya atas keputusan, saran, tindakan, dan/atau bukan tindakan apa pun berdasarkan penggunaan Amazon Transcribe Medical. Anda bertanggung jawab untuk meninjau output apa pun yang diberikan oleh Amazon Transcribe Medical untuk memastikan output tersebut memenuhi kebutuhan Anda.

Pelajari lebih lanjut tentang harga Amazon Transcribe

Kunjungi halaman harga
Siap untuk memulai?
Cobalah konsol Amazon Transcribe
Ada pertanyaan lagi?
Hubungi kami