Umum

T: Apa itu Amazon Transcribe?

Amazon Transcribe adalah layanan AWS yang memudahkan pelanggan mengonversi ucapan ke teks. Menggunakan teknologi Pengenalan Ucapan Otomatis (Automatic Speech Recognition/ASR), pelanggan dapat memilih untuk menggunakan Amazon Transcribe untuk berbagai aplikasi bisnis, termasuk transkripsi panggilan layanan pelanggan berbasis suara, pembuatan subtitle pada konten audio/video, dan melakukan analisis konten (berbasis teks) pada konten audio/video.  

Q: bagaimana cara Amazon Transcribe berinteraksi dengan produk AWS lainnya?

Amazon Transcribe mengonversi input audio menjadi teks, yang membuka pintu bagi berbagai aplikasi analisis teks pada input suara. Misalnya, dengan menggunakan Amazon Comprehend pada data teks yang dikonversi dari Amazon Transcribe, pelanggan dapat melakukan analisis sentimen atau mengekstrak entitas dan frasa kunci. Demikian pula, dengan mengintegrasikan ke Amazon Translate dan Amazon Polly, pelanggan dapat menerima input suara dalam satu bahasa, menerjemahkannya ke bahasa lain dan menghasilkan output suara yang secara efektif memungkinkan percakapan multi-bahasa. Hal ini juga memungkinkan untuk mengintegrasikan Amazon Transcribe dengan Amazon Elasticsearch untuk mengindeks dan melakukan pencarian berbasis teks di pustaka audio/video. 

T: Apa lagi yang harus saya ketahui sebelum menggunakan layanan Amazon Transcribe?

Amazon Transcribe dirancang untuk menangani beragam karakteristik ucapan dan akustik, termasuk variasi volume, nada, dan kecepatan bicara. Kualitas dan konten sinyal audio (termasuk, tetapi tidak terbatas pada faktor-faktor, seperti kebisingan latar belakang, speaker yang tumpang tindih, ucapan beraksen, atau beralih antar bahasa dalam satu file audio) dapat memengaruhi akurasi output layanan. Kami terus memperbarui layanan untuk meningkatkan kemampuannya mengakomodasi variasi akustik tambahan dan jenis konten. 

Menggunakan Amazon Transcribe

T: Bagaimana pengembang akan mengakses Transcribe?

Cara termudah untuk mulai menggunakan Amazon Transcribe adalah dengan mengirimkan tugas menggunakan konsol untuk mentranskripsi file audio. Anda juga dapat memanggil layanan langsung dari AWS Command Line Interface, atau menggunakan salah satu SDK yang didukung pilihan Anda untuk berintegrasi dengan apiikasi Anda. Bagaimanapun juga, Anda dapat mulai menggunakan Amazon Transcribe untuk menghasilkan transkrip otomatis untuk file audio Anda hanya dengan beberapa baris kode.

T: Apakah Amazon Transcribe mendukung transkripsi real-time?

Ya. Amazon Transcribe memungkinkan pengguna untuk membuka stream dua arah melalui HTTP2. Pengguna dapat mengirim stream audio ke layanan saat menerima stream teks sebagai balasan secara real time.  

Q: Encoding apa yang didukung oleh transkripsi real-time?

Transkripsi streaming saat ini mendukung encoding PCM Linier 16-bit. 

T: Bahasa apa yang didukung oleh Amazon Transcribe?

Untuk informasi tentang dukungan bahasa, lihat halaman dokumentasi ini. 

T: Perangkat apa yang berfungsi dengan Amazon Transcribe?

Amazon Transcribe sebagian besar adalah perangkat agnostik. Secara umum, Amazon Transcribe berfungsi dengan perangkat apa pun yang menyertakan mikrofon pada perangkat seperti ponsel, PC, tablet, dan perangkat IoT (mis. sistem audio mobil). API Amazon Transcribe akan dapat mendeteksi kualitas stream audio yang diinput pada perangkat (8kHz VS 16kHz) dan akan dengan tepat memilih model akustik untuk mengkonversi ucapan ke teks. Selain itu, pengembang dapat memanggil API Transcribe melalui aplikasi mereka untuk mengakses kemampuan konversi ucapan ke teks. 

T: Adakah batasan ukuran pada konten audio yang dapat diproses oleh Amazon Transcribe?

Panggilan layanan Amazon Transcribe dibatasi hingga 4 jam (atau 2 GB) per panggilan API untuk layanan batch kami. Layanan streaming dapat mengakomodasi koneksi terbuka hingga 4 jam. 

T: Apa bahasa pemrograman yang didukung oleh Amazon Transcribe?

Layanan batch Amazon Transcribe mendukung .NET, Go, Java, Javascript, PHP, Python, dan Ruby.
Layanan real-time Amazon Transcribe mendukung Java SDK, Ruby SDK, dan C++ SDK. Dukungan SDK tambahan akan segera tersedia. Untuk detail lebih lanjut, kunjungi halaman Sumber Daya

T: Kata-kata kosakata kustom saya tidak dikenali! Apa yang dapat saya lakukan?

Output pengenalan ucapan tergantung pada sejumlah faktor selain entri kosakata kustom, sehingga tidak ada jaminan bahwa jika suatu istilah dimasukkan dalam kosakata kustom, istilah tersebut akan dikenali dengan benar.
Namun, alasan paling sering adalah bahwa kata kustom tidak memiliki pengucapan yang benar. Jika Anda belum memberikan pengucapan untuk kata kustom Anda, cobalah membuatnya. Jika Anda sudah memberikan satu, periksa kembali kebenarannya, atau sertakan varian pengucapan lainnya jika perlu. Hal ini dapat dilakukan dengan membuat beberapa entri dalam file kosakata kustom yang berbeda di bidang pengucapan.

T: Mengapa saya melihat terlalu banyak kata-kata kustom di output saya?

Kosakata kustom dioptimalkan untuk daftar kecil kata-kata yang ditargetkan; kosakata yang lebih besar dapat menyebabkan pembuatan kata-kata kustom yang berlebihan, terutama ketika kosakata tersebut mengandung kata-kata yang diucapkan dengan cara serupa. Jika Anda memiliki daftar besar, cobalah menguranginya menjadi kata-kata langka dan kata-kata yang sebenarnya diharapkan terjadi pada file audio Anda. Jika Anda memiliki kosakata besar yang mencakup beberapa kasus penggunaan, bagilah menjadi daftar terpisah untuk berbagai kasus penggunaan. Kata-kata yang pendek dan terdengar mirip dengan banyak kata-kata lain, dapat menyebabkan pembuatan yang berlebihan (terlalu banyak kata-kata kustom muncul di output). Lebih disarankan menggabungkan kata-kata ini dengan kata-kata sekitarnya dan mendaftar mereka sebagai frasa yang dipisahkan dengan tanda hubung. Misalnya, kata kustom “A.D.” dapat dimasukkan sebagai bagian dari frasa seperti ‘A.D.-converter ’.

T: Ada dua cara untuk menyediakan pengucapan, bidang IPA atau SoundsLike dalam tabel kosakata kustom. Mana yang lebih baik?

IPA memungkinkan pengucapan yang lebih tepat. Anda harus menyediakan pengucapan IPA jika Anda dapat menghasilkan IPA (mis., dari leksikon yang memiliki pengucapan IPA atau alat konverter online).

T: Saya ingin menggunakan IPA, tetapi saya bukan ahli linguistik. Adakah alat online yang dapat saya gunakan?

Beberapa kamus standar, seperti Oxford English Dictionary atau Cambridge Dictionary (termasuk versi online mereka) menyediakan pengucapan dalam IPA. Ada juga konverter online (mis. easypronunciation.com atau tophonetics.com untuk bahasa Inggris) — namun, perhatikan bahwa dalam kebanyakan kasus alat ini didasarkan pada kamus yang mendasarinya dan mungkin tidak menghasilkan IPA yang benar untuk beberapa kata, seperti nama yang tepat. Amazon Transcribe tidak menyokong alat pihak ketiga mana pun.

T: Apakah saya perlu menggunakan standar IPA berbeda yang khusus untuk aksen berbeda dari bahasa yang sama? (mis. bahasa Inggris-AS versus bahasa Inggris-Inggris)?

Anda harus menggunakan standar IPA yang sesuai untuk file audio yang akan Anda proses — mis., Jika Anda berharap untuk memproses audio dari penutur bahasa Inggris-Inggris, gunakan standar pengucapan bahasa Inggris Britania. Set simbol IPA yang diizinkan dapat berbeda untuk berbagai bahasa dan dialek yang didukung oleh Amazon Transcribe; pastikan bahwa pengucapan Anda hanya berisi karakter yang diizinkan. Detail tentang set karakter IPA dapat ditemukan dalam dokumentasi: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

T: Bagaimana saya bisa memberikan pengucapan menggunakan bidang SoundsLike di tabel kosakata kustom?

Anda dapat memecah kata atau frasa menjadi potongan-potongan kecil dan memberikan pengucapan untuk setiap bagian menggunakan ortografi standar bahasa untuk meniru cara kata itu terdengar. Misalnya, dalam bahasa Inggris Anda dapat memberikan petunjuk pengucapan untuk frasa Los-Angeles seperti ini: loss-ann-gel-es. Petunjuk untuk kata Etienne akan terlihat seperti ini: eh-tee-en. Anda memisahkan setiap bagian dari petunjuk dengan tanda hubung (-). Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input.

T: Bagaimana kerja dua cara memberikan akronim yang berbeda (dengan titik dan tanpa titik tetapi dengan pengucapan)?

Jika Anda menggunakan akronim yang mengandung titik, pengucapan ejaan akan dihasilkan secara internal. Jika Anda tidak menggunakan titik, berikan pengucapan di bidang pengucapan. Untuk beberapa akronim, tidak jelas apakah mereka memiliki pengucapan ejaan atau pengucapan seperti kata (mis., NATO sering diucapkan ‘n eɪ t oʊ’ (nay-toh) daripada ‘ɛn eɪ ti oʊ’ (N. A. T. O.)).

T: Di mana saya dapat menemukan contoh cara menggunakan pengucapan kustom?

Anda dapat menemukan format input sampel dan contoh dalam dokumentasi: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

T: Apa yang terjadi jika saya menggunakan IPA yang salah? Jika saya tidak yakin, apakah saya lebih baik tidak memasukkan IPA?

Sistem akan menggunakan pengucapan yang Anda berikan; hal ini akan meningkatkan kemungkinan kata dikenali dengan benar jika pengucapannya benar dan cocok dengan apa yang diucapkan. Jika Anda tidak yakin menghasilkan IPA yang benar, jalankan perbandingan dengan memroses file audio Anda dengan kosakata yang berisi pengucapan IPA Anda, dan dengan kosakata yang hanya berisi kata-kata (dan, opsional, bentuk tampilan-sebagai). Jika Anda tidak memberikan pengucapan apa pun, layanan akan menggunakan perkiraan yang mungkin atau mungkin tidak berfungsi lebih baik dari input Anda.

T: Saat menggunakan formulir DisplayAs, dapatkah saya menampilkan set karakter yang tidak terkait dengan bahasa asli yang ditranskripsikan? (mis. output “Jalan” sebagai “街道“).

Ya. Meskipun frasa hanya dapat menggunakan set karakter terbatas untuk bahasa tertentu, karakter UTF-8 selain \t (TAB) diizinkan di kolom DisplayAs.

T: Apakah redaksi konten Automatic tersedia dengan API batch dan streaming untuk Trancribe?

Tidak, saat ini redaksi konten hanya tersedia untuk API batch.

T: Bahasa apa yang didukung untuk redaksi konten Automatic?

Bahasa Inggris-AS (en-US) saat ini didukung.

T: Redaksi konten Automatic juga meredaksi informasi pribadi dari audio sumber?

Tidak, fitur ini tidak menghapus informasi pribadi yang sensitif dari audio sumber. Namun, Anda dapat meredaksi informasi pribadi dari audio sumber sendiri menggunakan tanda waktu mulai dan akhir yang disediakan dalam transkrip yang diredaksi untuk setiap instans ungkapan PII yang teridentifikasi.

T: Dapatkah saya menggunakan redaksi konten Automatic dari transkrip teks yang sudah ada?

Tidak, redaksi konten Automatic hanya berkerja di file audio sebagai input.

T: Apa saja yang perlu saya ketahui sebelum menggunakan redaksi konten Automatic?

Redaksi konten Automatic dirancang untuk mengidentifikasi dan menghapus personally identifiable information (PII), tetapi karena sifat prediktif pembelajaran mesin, redaksi konten ini mungkin tidak mengidentifikasi dan menghapus semua instans PII dalam transkrip yang dihasilkan oleh layanan. Anda harus meninjau segala output yang diberikan oleh redaksi konten Automatic untuk memastikan output memenuhi kebutuhan Anda.

Q: API mana yang mendukung Identifikasi bahasa Automatic?

Identifikasi bahasa Automatic saat ini didukung untuk API batch.

Q: Bahasa apa yang dapat diidentifikasi secara otomatis oleh Amazon Transcribe?

Amazon Transcribe dapat mengidentifikasi semua bahasa yang didukung oleh API batch.

T: Apakah Amazon Transcribe dapat mengidentifikasi beberapa bahasa dalam file audio yang sama?

Amazon Transcribe hanya mengidentifikasi bahasa yang dominan dalam file audio.

T: Apakah ada cara untuk membatasi daftar bahasa yang dapat dipilih untuk Identifikasi bahasa Automatic?

Ya, Anda dapat menentukan daftar bahasa yang mungkin ada dalam pustaka media Anda. Ketika Anda memberikan daftar bahasa, bahasa yang diidentifikasi akan dipilih dari daftar tersebut. Jika tidak ada bahasa yang ditentukan, sistem akan memproses file audio dengan semua bahasa yang didukung oleh Amazon Transcribe dan memilih yang paling memungkinkan. Akurasi identifikasi bahasa menjadi lebih baik jika daftar bahasa pilihan diberikan.

Harga & Ketersediaan

T: Berapa biayanya?

Lihat halaman Harga Amazon Transcribe untuk mempelajari lebih lanjut.

T: Wilayah AWS mana yang tersedia untuk Amazon Transcribe?

Lihat Tabel Wilayah Infrastruktur Global AWS.

Privasi Data

T. Apakah input suara yang diproses oleh Amazon Transcribe disimpan, dan bagaimana input suara tersebut digunakan oleh AWS?

Amazon Transcribe dapat menyimpan dan menggunakan input suara yang diproses oleh layanan semata-mata untuk memberikan dan memelihara layanan serta untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi pembelajaran mesin/kecerdasan buatan Amazon lainnya. Penggunaan konten Anda penting untuk peningkatan terus-menerus pengalaman pelanggan Amazon Transcribe Anda, termasuk pengembangan dan pelatihan teknologi terkait. Kami tidak menggunakan informasi pengenal pribadi apa pun yang mungkin terkandung dalam konten Anda untuk menargetkan produk, layanan, atau pemasaran kepada Anda atau pengguna akhir Anda. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut. Anda dapat memilih untuk tidak menggunakan konten Anda untuk meningkatkan dan mengembangkan kualitas Amazon Transcribe dan teknologi pembelajaran mesin/kecerdasan buatan Amazon lainnya dengan menggunakan kebijakan tidak ikut serta (opt-out) AWS Organizations. Untuk informasi tentang cara tidak ikut serta, lihat Mengelola kebijakan tidak ikut serta layanan kecerdasan buatan (AI).

T: Dapatkah saya menghapus data dan artefak yang terkait dengan tugas transkripsi yang disimpan oleh Amazon Transcribe?

Ya. Anda dapat menggunakan API Delete untuk menghapus data dan artefak lainnya yang terkait dengan tugas transkripsi. Jika Anda mengalami masalah saat melakukannya, hubungi AWS Support.

T: Siapa yang memiliki akses ke konten saya yang diproses dan disimpan oleh Amazon Transcribe?

Hanya karyawan yang berwenang yang akan memiliki akses ke konten Anda yang diproses oleh Amazon Transcribe. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi tidak aktif dan dalam transit, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut.

T: Apakah saya masih memiliki konten saya yang diproses dan disimpan oleh Amazon Transcribe?

Anda selalu memiliki hak atas konten Anda, dan kami hanya akan menggunakan konten Anda dengan persetujuan Anda.

T. Apa yang terjadi pada data saya yang digunakan dalam model bahasa kustom pelatihan? Apakah tetap menjadi milik saya?

Ketika mengirimkan data teks yang digunakan untuk melatih model kustom, pelanggan memiliki kepemilikan baik data teks asli serta sebagai model kustom yang dihasilkan. Data teks tidak akan disimpan atau digunakan untuk meningkatkan mesin pengenalan ucapan umum kami. Model yang dihasilkan menggunakan CLM bersifat mandiri, dan dapat diakses hanya oleh pelanggan.

T. Karena layanan tidak akan mempertahankan data pelatihan saya, apakah ada kelemahan atau penurunan kualitas transkripsi atau pengalaman layanan secara keseluruhan?

Tidak akan ada penurunan kualitas transkripsi akibat layanan kami tidak menyimpan data pelatihan Anda. Setelah data pelatihan digunakan untuk benar-benar menghasilkan model bahasa kustom, model ini sendiri akan tersedia untuk penggunaan berulang sesuai kebijaksanaan Anda. Rangkaian pelatihan asli yang Anda unggah dihapus dari sistem kami. Satu-satunya kelemahan adalah jika Anda membutuhkan dukungan teknis. Karena kami tidak menyimpan data pelatihan asli Anda, kami tidak akan memiliki akses yang mudah ke aset tersebut atau artefak perantara terkait, jika Anda memerlukan tim dukungan untuk menyelidiki potensi masalah layanan. Dukungan akan tetap tersedia, tetapi tidak akan mudah karena kami mungkin perlu meminta informasi tambahan dari Anda.

T. Bagaimana cara menggunakan kembali data untuk pembaruan atau peningkatan model di masa mendatang?

Karena data pelatihan tidak disimpan, set data yang sama dan data tambahan harus diunggah lagi untuk melatih model baru. Ketika ada pembaruan pada model dasar yang disediakan Amazon Transcribe, Anda akan diberi tahu. Untuk memanfaatkan model dasar terbaru, Anda harus mengirimkan data Anda untuk melatih model baru. Anda akan memiliki model kustom asli yang sebelumnya dibuat dan juga versi baru untuk digunakan.

T. Bagaimana cara menghapus model?

Pengguna dapat menghapus model bahasa pelanggan yang mereka buat atas kebijaksanaan mereka sendiri.

T: Apakah konten yang diproses oleh Amazon Transcribe dipindahkan ke luar wilayah AWS tempat saya menggunakan Amazon Transcribe?

Konten apa pun yang diproses oleh Amazon Transcribe dienkripsi dan disimpan saat tidak aktif di wilayah AWS di mana Anda menggunakan Amazon Transcribe. Beberapa bagian dari konten yang diproses oleh Amazon Transcribe dapat disimpan di wilayah AWS lain semata-mata sehubungan dengan peningkatan berkelanjutan dan pengembangan pengalaman pelanggan Amazon Transcribe Anda dan teknologi machine-learning/kecerdasan buatan Amazon lainnya. Jika Anda memilih untuk tidak menggunakan konten Anda untuk mengembangkan kualitas Amazon Transcribe dan teknologi machine-learning/kecerdasan buatan Amazon lainnya dengan menghubungi AWS Support, konten Anda tidak akan disimpan di wilayah AWS lain. Anda dapat meminta penghapusan input suara yang terkait dengan akun Anda dengan menghubungi AWS Support. Kepercayaan, privasi, dan keamanan konten Anda adalah prioritas utama kami, dan kami menerapkan kontrol teknis dan fisik yang sesuai dan canggih, termasuk enkripsi saat istirahat dan dalam perjalanan, yang dirancang untuk mencegah akses tidak sah ke, atau pengungkapan, konten Anda dan memastikan bahwa penggunaan kami sesuai dengan komitmen kami kepada Anda. Lihat https://aws.amazon.com/compliance/data-privacy-faq/ untuk informasi lebih lanjut.

T: Dapatkah saya menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan untuk anak di bawah 13 tahun dan tunduk pada Children’s Online Privacy Protection Act (COPPA)?

Ya, tunduk pada kepatuhan Anda terhadap Ketentuan Layanan Amazon Transcribe, termasuk kewajiban Anda untuk memberikan pemberitahuan yang diperlukan dan mendapatkan persetujuan orang tua yang dapat diverifikasi berdasarkan COPPA, Anda dapat menggunakan Amazon Transcribe sehubungan dengan situs web, program, atau aplikasi lain yang ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.

T: Bagaimana saya menentukan apakah situs web, program, atau aplikasi saya tunduk pada COPPA?

Untuk informasi tentang persyaratan COPPA dan panduan untuk menentukan apakah situs web, program, atau aplikasi lain Anda tunduk pada COPPA, silakan merujuk langsung ke sumber daya yang diberikan dan dipelihara oleh United States Federal Trade Commission. Situs ini juga berisi informasi mengenai cara menentukan apakah suatu layanan ditujukan atau ditargetkan, seluruhnya atau sebagian, untuk anak-anak di bawah usia 13.

Amazon Transcribe Medical

T. Apa itu Amazon Transcribe Medical?

Amazon Transcribe Medical adalah layanan pengenalan ucapan otomatis (automatic speech recognition/ASR) yang memudahkan pengembang untuk menambahkan kemampuan ucapan ke teks medis ke dalam aplikasi mereka. Dengan menggunakan Amazon Transcribe Medical, Anda dapat dengan cepat dan akurat mentranskrip pendiktean medis dan ucapan percakapan ke dalam teks untuk beragam tujuan, seperti merekam catatan dokter atau memproses analitik teks akhir untuk mengekstrak wawasan yang bermakna.

T. Apa yang dapat saya lakukan dengan Amazon Transcribe Medical?

Amazon Transcribe Medical menggunakan model machine learning lanjutan untuk mentranskrip ucapan medis ke teks secara akurat. Transcribe Medical dapat mentranskrip teks umum yang dapat digunakan untuk mendukung dalam beragam kasus penggunaan, menjangkau alur kerja dokumentasi klinis dan pemantauan keamanan obat (pharmacovigilance) untuk membuat subtitel pada telemedicine dan bahkan menghubungi analitik pusat dalam bidang layanan kesehatan dan ilmu hayat.

T. Untuk menggunakan Amazon Transcribe Medical, apakah saya perlu menjadi seorang ahli dalam pengenalan ucapan otomatis (ASR)?

Tidak, Anda tidak memerlukan keahlian ASR atau machine learning apa pun untuk menggunakan Amazon Transcribe Medical. Anda hanya perlu memanggil API Transcribe Medical, dan layanan akan menangani machine learning yang diperlukan dalam backend untuk mentranskrip ucapan medis ke teks.

T. Bagaimana saya memulai Amazon Transcribe Medical?

Anda dapat memulai Amazon Transcribe Medical dari AWS Management Console atau menggunakan SDK. Silakan lihat halaman dokumentasi teknis ini untuk detailnya.

Amazon Transcribe Medical memberikan tingkat gratis sehingga Anda dapat menguji layanannya. Lihat halaman harga untuk informasi selengkapnya.

T. Bahasa apa yang didukung oleh Amazon Transcribe Medical?

Amazon Transcribe Medical saat ini mendukung transkripsi medis dalam bahasa Inggris AS.

T. Spesialisasi medis apa yang didukung oleh Amazon Transcribe Medical?

Amazon Transcribe Medical mendukung transkripsi untuk perawatan utama, mencakup spesialisasi seperti pengobatan keluarga, pengobatan internal, pediatri, dan OB-GYN.

T. Di wilayah AWS mana Amazon Transcribe Medical tersedia?

Amazon Transcribe Medical saat ini tersedia di AS Timur (Viginia U.), AS Timur (Ohio), AS Barat (Oregon), Kanada (Pusat), UE (Irlandia), dan Asia Pasifik (Sydney).

T. Berapa harga Amazon Transcribe Medical?

Lihat halaman harga Amazon Transcribe Medical untuk mempelajari lebih lanjut tentang detail harga.

T. Apakah HIPAA Amazon Transcribe Medical memenuhi syarat?

Ya.

T. Apakah konten yang diproses oleh Amazon Transcribe Medical digunakan untuk tujuan selain untuk menyediakan layanan?

Amazon Transcribe Medical tidak menggunakan konten yang diproses oleh layanan untuk alasan selain untuk menyediakan dan memelihara layanan. Konten yang diproses oleh layanan tidak digunakan untuk mengembangkan atau meningkatkan kualitas Amazon Transcribe Medical atau teknologi kecerdasan buatan/machine learning Amazon lainnya.

T. Apakah Amazon Transcribe Medical belajar seiring waktu?

Ya, Amazon Transcribe Medical menggunakan machine learning dan secara berkelanjutan dilatih agar menjadi semakin baik untuk kasus penggunaan pengguna. Amazon Transcribe Medical tidak menyimpan atau menggunakan data pelanggan yang digunakan dengan layanan untuk melatih model

T. Apa lagi yang harus saya ketahui sebelum menggunakan layanan Amazon Transcribe Medical?

Amazon Transcribe Medical bukanlah pengganti untuk saran, diagnosis, atau perlakuan medis profesional. Anda dan pengguna akhir Anda bertanggung jawab untuk melaksanakan kebijaksanaan, pengalaman, dan penilaian Anda dalam menentukan ketepatan, kelengkapan, ketepatan waktu, dan kesesuaian informasi apa pun yang diberikan oleh Amazon Transcribe Medical. Anda dan pengguna akhir Anda bertanggung jawab sepenuhnya atas keputusan, saran, tindakan, dan/atau bukan tindakan apa pun berdasarkan penggunaan Amazon Transcribe Medical. Anda bertanggung jawab untuk meninjau output apa pun yang diberikan oleh Amazon Transcribe Medical untuk memastikan output tersebut memenuhi kebutuhan Anda.

Model Bahasa Kustom

T: Fungsionalitas apa yang disediakan Model Bahasa Kustom saat ini?

Model Bahasa Kustom (CLM) saat ini mendukung transkripsi Bahasa Inggris AS. Model Bahasa Kustom ini tersedia sebagai bagian dari API pemrosesan audio batch Amazon Transcribe. CLM tidak mendukung secara serentak penggunaan tambahan Kosakata Kustom.

T: Berapa banyak dan jenis data pelatihan apa yang saya butuhkan? Bagaimana cara memperoleh data? Apakah data tersebut memerlukan format tertentu?

Data teks harus relevan dengan audio yang akan ditranskrip menggunakan model kustom, yang harus berisi sebanyak mungkin kata, frasa, dan kombinasi kata khusus domain. Kami merekomendasikan menggunakan setidaknya 100.000 dan paling banyak 10 juta kata teks berjalan. Sumber daya data teks dapat diperoleh dari sumber internal atau publik mana pun (misalnya, menggunakan teks dari situs web pelanggan). Sebaiknya setiap file teks biasa berisi 200.000 kata atau lebih, tetapi tidak melebihi 1 GB dalam ukuran file secara keseluruhan. Teks harus UTF-8, dan menggunakan satu kalimat per baris. Setiap kalimat harus berisi tanda baca. Pengguna bertanggung jawab untuk memeriksa ejaan, menghapus karakter pemformatan, dan memvalidasi pengodean.

T: Bagaimana cara menggunakan Model Bahasa Kustom (CLM)?

Untuk melatih model bahasa kustom, pelanggan cukup menyuplai data teks di bucket Amazon S3. Pengguna kemudian dapat menggunakan konsol layanan Amazon Transcribe untuk memuat dan memproses data untuk melatih model bahasa kustom. Pelatihan sepenuhnya otomatis dan memerlukan intervensi minimal dari pengguna. Ketika model kustom final siap, model ini tersedia dalam akun AWS pelanggan untuk mentranskrip file audio khusus domain. Selain itu, pelanggan dapat melatih beberapa model kustom untuk digunakan dalam berbagai kasus penggunaan yang berbeda.

T: Apakah peningkatan dijamin? Apakah hal ini sepadan dengan upaya yang dikeluarkan untuk mengumpulkan data teks?

Peningkatan tidak dijamin - perubahan kinerja akan bergantung pada seberapa dekat data teks sesuai dengan audio, dan pada jumlah data yang disediakan. Lebih banyak data secara umum lebih baik, tetapi yang terpenting, data harus mencakup kata dan urutan kata yang diharapkan muncul dalam file audio yang ingin Anda transkripsikan. Peningkatan keakuratan transkripsi akan bergantung pada kualitas data pelatihan serta kasus penggunaan. Dalam beberapa skenario, tolok ukur umum menunjukkan peningkatan akurasi relatif sebanyak 10% hingga 15%.

T: Berapa lama waktu pelatihan model? Kapan saya dapat menggunakannya?

Pelatihan model biasanya memakan waktu antara 6 hingga 10 jam. Durasi pelatihan bergantung pada seberapa besar set data. Model kustom akan tersedia langsung setelah pelatihan selesai.

T: Bagaimana saya dapat menggunakan model tersebut? Bagaimana saya tahu apakah ini berfungsi lebih baik daripada model umum yang disediakan oleh Amazon Transcribe?

Model akan tersedia di akun pelanggan dengan ID model yang ditetapkan oleh pelanggan sebelum proses pelatihan. Untuk menggunakan model ini, tanda dengan ID model perlu ditambahkan ke permintaan transkripsi. Pelanggan harus menguji model tersebut pada file audio dan membandingkan output dengan hasil yang diperoleh dari mesin umum.

T: Berapa banyak Model Bahasa Kustom yang dapat saya latih? Dapatkah saya mengaktifkan beberapa model secara bersamaan untuk akun saya?

Anda dapat secara bersamaan melatih hingga 5 model berbeda pada waktu tertentu per akun AWS. Untuk setiap akun, Anda dapat menyimpan maksimal 10 model secara default. Jika diperlukan lebih banyak, peningkatan batas layanan dapat dilakukan di sini.

T: Apakah model akustik didukung?

Tidak. Model akustik kustom tidak didukung. Model bahasa kustom dibuat dari data teks yang relevan dengan kasus penggunaan atau domain Anda.

Pelajari lebih lanjut tentang harga Amazon Transcribe

Kunjungi halaman harga
Siap untuk memulai?
Cobalah konsol Amazon Transcribe
Ada pertanyaan lagi?
Hubungi kami