ข้อมูลทั่วไป

ถาม: Amazon Transcribe คืออะไร

Amazon Transcribe เป็นบริการของ AWS ที่ช่วยให้ลูกค้าเปลี่ยนคำพูดเป็นข้อความได้อย่างง่ายดาย การใช้เทคโนโลยี Automatic Speech Recognition (ASR) จะช่วยให้ลูกค้าเลือกใช้ Amazon Transcribe กับแอปพลิเคชันทางธุรกิจได้อย่างหลากหลาย ซึ่งครอบคลุมถึงการถอดเสีงสำหรับสายโทรบริการลูกค้าที่ใช้เสียงเป็นหลัก, การสร้างคำบรรยายใต้ภาพบนคอนเทนต์เสียง/วิดีโอ และทำการวิเคราะห์คอนเทนต์ (ที่เป็นข้อความ) บนคอนเทนต์เสียง/วิดีโอ  

ถาม: Amazon Transcribe โต้ตอบกับผลิตภัณฑ์อื่นๆ ของ AWS อย่างไร

Amazon Transcribe แปลงข้อมูลเสียงป้อนเข้าให้เป็นข้อความ ซึ่งเป็นการเปิดโอกาสให้แอปพลิเคชันการวิเคราะห์ข้อความต่างๆ สามารถทำงานกับข้อมูลเสียงขาเข้าได้ ตัวอย่างเช่น การใช้ Amazon Comprehend กับข้อมูลข้อความที่แปลงจาก Amazon Transcribe จะช่วยให้ลูกค้าสามารถทำการวิเคราะห์ความเชื่อมั่นหรือสกัดเอกลักษณ์หรือวลีสำคัญออกมาได ในกรณีคล้ายคลึงกันนี้ การผสานกับ Amazon Translate และ Amazon Polly จะช่วยให้ลูกค้าสามารถรับข้อมูลเสียงป้อนเข้าในภาษาหนึ่ง แปลเป็นอีกภาษาหนึ่ง และสร้างข้อมูลเสียงออกได้ ทำให้สร้างการสนทนาหลากภาษาได้อย่างมีประสิทธิภาพ อีกทั้งยังสามารถผสาน Amazon Transcribe เข้ากับ Amazon Elasticsearch เพื่อทำดัชนีและทำการค้นหาแบบอิงตามข้อมูลได้ทั่วทั้งไลบรารีเสียง/วิดีโอ 

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการ Amazon Transcribe

บริการ Amazon Transcribe ออกแบบมาเพื่อรับมือกับคำพูดและการแสดงออกผ่านเสียงหลากหลายรูปแบบ ซึ่งรวมถึงความดัง ระดับเสียงสูงต่ำ และความเร็วในการพูดที่แตกต่างกัน คุณภาพและคอนเทนต์ของสัญญาณเสียง (รวมถึงแต่ไม่จำกัดเพียงปัจจัยต่างๆ อาทิ เสียงรบกวนในพื้นหลัง ผู้พูดที่พูดพร้อมกัน คำพูดเน้นเสียง หรือสลับไปมาระหว่างภาษาต่างๆ ภายในไฟล์เสียงเดียว) อาจส่งผลต่อความแม่นยำของข้อมูลออกของบริการ เราอัปเดตบริการอย่างต่อเนื่องเพื่อปรับปรุงความสามารถในการปรับให้รับกับความหลากหลายทางเสียงเพิ่มเติมและประเภทคอนเทนต์ต่างๆ 

การใช้ Amazon Transcribe

ถาม: นักพัฒนาจะเข้าถึง Transcribe ได้อย่างไร

วิธีที่ง่ายที่สุดในการเริ่มต้นใช้งาน Amazon Transcribe คือให้ส่งงานโดยใช้คอนโซลเพื่อถอดความไฟล์เสียงให้เป็นข้อความ นอกจากนี้ คุณสามารถโทรหาบริการโดยตรงจาก AWS Command Line Interface หรือเลือกใช้หนึ่งใน SDK ที่รองรับที่คุณต้องการเพื่อสร้างด้วยแอปพลิเคชันของคุณ ไม่ว่าจะเลือกวิธีใดก็ตาม คุณก็สามารถเริ่มต้นใช้งาน Amazon Transcribe เพื่อสร้างทรานสคริปต์โดยอัตโนมัติสำหรับไฟล์เสียงได้โดยใช้โค้ดเพียงไม่กี่บรรทัด

ถาม: Amazon Transcribe รองรับการถอดเสียงแบบเรียลไทม์หรือไม่

รองรับ Amazon Transcribe ช่วยให้ผู้ใช้สามารถเปิดสตรีมแบบสองทิศทางผ่าน HTTP2 ได้ โดยผู้ใช้สามารถส่งสตรีมเสียงไปยังบริการขณะที่รับสตรีมข้อความคืนในแบบเรียลไทม์  

ถาม: การถอดเสียงแบบเรียลไทม์รองรับการเข้ารหัสใดบ้าง

ขณะนี้การถอดเสียงสตรีมรองรับการเข้ารหัส Linear PCM แบบ 16 บิต 

ถาม: Amazon Transcribe รองรับภาษาใดบ้าง

สำหรับข้อมูลเกี่ยวกับภาษาที่รองรับ โปรดดูที่หน้าเอกสารประกอบ 

ถาม: Amazon Transcribe ใช้งานได้กับอุปกรณ์ใดบ้าง

ส่วนมากแล้ว Amazon Transcribe ทำงานได้ไม่จำกัดอุปกรณ์ ซึ่งโดยทั่วไปแล้ว Amazon Transcribe ใช้งานได้กับอุปกรณ์ทุกเครื่องที่มีไมโครโฟนในตัว อาทิ โทรศัพท์ คอมพิวเตอร์ แท็บเล็ต และอุปกรณ์ IoT (เช่น ระบบเสียงรถยนต์) Amazon Transcribe API จะสามารถตรวจจับคุณภาพของสตรีมเสียงที่ป้อนเข้าไปยังอุปกรณ์ (8kHz เทียบกับ 16kHz) และจะเลือกโมเดลเสียงที่เหมาะสมสำหรับแปลงคำพูดเป็นข้อความ นอกจากนี้ นักพัฒนาสามารถเรียก Transcribe API ผ่านแอปพลิเคชันของตนเพื่อเข้าถึงความสามารถในการแปลงคำพูดเป็นข้อความได้ 

ถาม: มีการจำกัดขนาดของคอนเทนต์เสียงที่ Amazon Transcribe สามารถประมวลผลได้หรือไม่

สายโทรบริการ Amazon Transcribe จะจำกัดไม่เกิน 4 ชั่วโมง (หรือ 2 GB) ต่อการโทร API หนึ่งครั้งสำหรับบริการแบบเป็นชุดของเรา บริการสตรีมสามารถรองรับการเชื่อมต่อแบบเปิดได้สูงสุด 4 ชั่วโมง 

ถาม: Amazon Transcribe รองรับภาษาโปรแกรมใดบ้าง

บริการแบบเป็นชุดของ Amazon Transcribe รองรับ .NET, Go, Java, Javascript, PHP, Python และ Ruby
บริการเรียลไทม์ของ Amazon Transcribe รองรับ Java SDK, Ruby SDK และ C++ SDK บริการ SDK เพิ่มเติมจะพร้อมให้ใช้งานในไม่ช้า สามารถดูรายละเอียดเพิ่มเติมได้ในหน้าแหล่งข้อมูล 

ถาม: ระบบไม่รู้จักคำศัพท์ที่กำหนดเองของฉัน! ฉันต้องทำอย่างไร

นอกเหนือจากศัพท์แบบกำหนดเองแล้ว ข้อมูลออกของการรู้จำเสียงพูดยังขึ้นอยู่กับปัจจัยอื่นอีกหลายประการ ดังนั้นจึงไม่อาจรับประกันได้ว่าเมื่อคำศัพท์ถูกบรรจุลงในคำศัพท์แบบกำหนดเองแล้ว ระบบจะจดจำคำนั้นได้อย่างถูกต้อง
อย่างไรก็ตาม สาเหตุที่พบบ่อยสุดคือไม่มีการสร้างการออกเสียงที่ถูกต้องให้คำศัพท์ที่กำหนดเองดังกล่าว หากคุณยังไม่ได้สร้างการออกเสียงให้แก่คำศัพท์ที่กำหนดเองของคุณ โปรดลงมือสร้าง หากคุณสร้างแล้ว ให้ตรวจสอบอีกครั้งว่าถูกต้องหรือไม่ หรือเพิ่มการออกเสียงที่ต่างออกไป หากจำเป็น โดยสามารถทำได้ด้วยการสร้างหลายรายการในไฟล์คำศัพท์แบบกำหนดเองที่่แตกต่างกันไปในช่องการออกเสียง

ถาม: ทำไมฉันจึงเห็นคำที่กำหนดเองจำนวนมากเกินไปในข้อมูลออก

คำศัพท์แบบกำหนดเองเหมาะสำหรับรายการสั้นๆ ที่ประกอบด้วยคำเป้าหมายต่างๆ ซึ่งหากป้อนคำศัพท์จำนวนมากอาจส่งผลให้เกิดการสร้างคำแบบกำหนดเองเป็นจำนวนมากเกินไป โดยเฉพาะอย่างยิ่งเมื่อรายการคำศัพท์นั้นประกอบด้วยคำที่ออกเสียงคล้ายคลึงกัน หากคุณมีรายการที่ยาวมาก โปรดลองตัดให้เหลือเพียงคำที่พบยากและคำที่คาดว่าจะพบได้ในไฟล์เสียงของคุณ หากคุณมีรายการคำศัพท์ขนาดใหญ่ที่ครอบคลุมกรณีใช้งานจำนวนมาก ให้แบ่งออกเป็นรายการย่อยสำหรับกรณีใช้งานที่ต่างกัน คำสั้นๆ ที่ออกเสียงคล้ายกับคำอื่นๆ จำนวนมากอาจทำให้เกิดการสร้างมากเกินไป (มีคำศัพท์แบบกำหนดเองปรากฏเป็นจำนวนมากเกินไปในข้อมูลออก) เราขอแนะนำให้รวมคำเหล่านี้กับคำที่อยู่ใกล้เคียงแล้วเขียนเป็นวลีที่คั่นด้วยเครื่องหมายยติภังค์ ตัวอย่างเช่น คำที่กำหนดเอง “A.D.” สามารถรวมเป็นส่วนหนึ่งของวลีได้ เช่น 'A.D.-converter'

ถาม: มีวิธีให้ออกเสียงได้สองวิธี IPA หรือฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเอง แบบไหนดีกว่ากัน

IPA ช่วยให้การออกเสียงแม่นยำยิ่งขึ้น คุณควรจัดให้มีการออกเสียง IPA หากคุณสามารถสร้าง IPA ได้ (เช่น จากพจนานุกรมที่มีการออกเสียง IPA หรือเครื่องมือแปลงออนไลน์)

ถาม: ฉันต้องการใช้ IPA แต่ฉันไม่ใช่ผู้เชี่ยวชาญด้านภาษา มีเครื่องมือออนไลน์ที่ฉันสามารถใช้ได้หรือไม่

พจนานุกรมมาตรฐานหลายฉบับ เช่น Oxford English Dictionary หรือ Cambridge Dictionary (รวมถึงเวอร์ชันออนไลน์) มีการออกเสียงใน IPA นอกจากนี้ ยังมีตัวแปลงออนไลน์ (เช่น easypronunciation.com หรือ tophonetics.com สำหรับภาษาอังกฤษ) อย่างไรก็ตาม โปรดทราบว่าในกรณีส่วนใหญ่เครื่องมือเหล่านี้จะอิงตามพจนานุกรมพื้นฐานและอาจไม่สร้าง IPA ที่ถูกต้องสำหรับคำบางคำ เช่น ชื่อเฉพาะ Amazon Transcribe ไม่รับรองเครื่องมือของบริษัทอื่น

ถาม: ฉันจำเป็นต้องใช้มาตรฐาน IPA ที่แตกต่างกันที่เฉพาะเจาะจงกับสำเนียงที่แตกต่างของภาษาเดียวกัน (เช่น ภาษาอังกฤษแบบสหรัฐอเมริกากับภาษาอังกฤษแบบอังกฤษ) หรือไม่

คุณควรใช้มาตรฐาน IPA ที่เหมาะสมกับไฟล์เสียงที่คุณต้องการประมวลผล เช่น หากคุณต้องการประมวลผลเสียงจากผู้พูดภาษาอังกฤษแบบอังกฤษ ให้ใช้มาตรฐานการออกเสียงภาษาอังกฤษแบบอังกฤษ ชุดของสัญลักษณ์ IPA ที่อนุญาตอาจแตกต่างกันไปตามภาษาและภาษาถิ่นที่รองรับโดย Amazon Transcribe โปรดตรวจสอบให้แน่ใจว่าการออกเสียงของคุณมีอักขระที่อนุญาตเท่านั้น รายละเอียดเกี่ยวกับชุดอักขระ IPA สามารถพบได้ในเอกสารประกอบ: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

ถาม: ฉันจะให้การออกเสียงโดยใช้ฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเองได้อย่างไร

คุณสามารถแบ่งคำหรือวลีออกเป็นส่วนเล็กๆ และให้การออกเสียงให้แต่ละส่วนโดยใช้การสะกดคำมาตรฐานของภาษาเพื่อเลียนแบบวิธีการออกเสียงคำนั้น ตัวอย่างเช่น ในภาษาอังกฤษคุณสามารถให้คำใบ้การออกเสียงสำหรับวลี ลอสแองเจลิส ดังนี้: loss-ann-gel-es คำใบ้สำหรับคำว่า Etienne จะมีลักษณะเช่นนี้: eh-tee-en คุณคั่นแต่ละส่วนของคำใบ้ด้วยเครื่องหมายยัติภังค์ (-) คุณสามารถใช้อักขระที่อนุญาตใดก็ได้สำหรับภาษาที่ป้อน

ถาม: วิธีสองวิธีที่แตกต่างกันในการให้ตัวย่อ (มีจุดและไม่มีจุด แต่มีการออกเสียง) ทำงานอย่างไร

หากคุณใช้ตัวย่อที่มีเครื่องหมายมหัพภาค การออกเสียงสะกดจะถูกสร้างขึ้นภายใน หากคุณไม่ได้ใช้เครื่องหมายมหัพภาค โปรดให้การออกเสียงในช่องการออกเสียง สำหรับตัวย่อบางตัว ไม่ชัดเจนว่าตัวย่อเหล่านั้นมีการออกเสียงการสะกดคำหรือการออกเสียงคำที่คล้ายกัน (เช่น NATO มักจะออกเสียง ‘n eɪ t oʊ’ (nay-toh) มากกว่า ‘ɛn eɪ ti oʊ’ (N. A. T. O.))

ถาม: ฉันจะหาตัวอย่างวิธีใช้การออกเสียงแบบกำหนดเองได้ที่ไหน

คุณสามารถค้นหารูปแบบการป้อนตัวอย่างและตัวอย่างต่างๆ ได้จากเอกสารประกอบ: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html

ถาม: จะเกิดอะไรขึ้นหากฉันใช้ IPA ผิด ถ้าฉันไม่แน่ใจ ฉันควรที่จะไม่ป้อน IPA ใดๆ ดีกว่าหรือไม่

ระบบจะใช้การออกเสียงที่คุณให้ นี่จะเป็นการเพิ่มโอกาสในการจดจำคำได้อย่างถูกต้องหากการออกเสียงถูกต้องและตรงกับสิ่งที่พูด หากคุณไม่แน่ใจว่าคุณกำลังสร้าง IPA ที่ถูกต้อง โปรดทำการเปรียบเทียบโดยการประมวลผลไฟล์เสียงของคุณด้วยคำศัพท์ที่มีการออกเสียง IPA ของคุณ และที่มีคำศัพท์ที่มีเพียงคำเท่านั้น (และ เป็นทางเลือก รูปแบบตามที่แสดง) หากคุณไม่ได้ให้การออกเสียงใดๆ บริการจะใช้การประมาณ ซึ่งอาจหรืออาจไม่ทำงานได้ดีไปกว่าการป้อนข้อมูลของคุณ

ถาม: เมื่อใช้รูปแบบ DisplayAs ฉันสามารถแสดงชุดอักขระที่ไม่เกี่ยวข้องกับภาษาต้นฉบับที่ถอดเสียงได้หรือไม่ (เช่น เอาท์พุท “ถนน” เป็น“ 街道“)

ได้ แม้วลีจะสามารถใช้ชุดอักขระที่จำกัดสำหรับบางภาษาที่เจาะจงเท่านั้น แต่เราสามารถใช้อักขระ UTF-8 นอกเหนือจาก \t (TAB) ในคอลัมน์ DisplayAs ได้

ถาม: การตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทานข้อมูลที่ใช้ระบุตัวตนได้ (PII) พร้อมใช้งานกับ API ของ Transcribe ทั้งแบบกลุ่มและสตรีมมิงหรือไม่

ใช่ Amazon Transcribe รองรับการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII สำหรับ API ทั้งแบบกลุ่มและสตรีมมิง

ถาม: การตรวจทานเนื้อหา / การระบุและการตรวจทาน PII อัตโนมัติรองรับภาษาใดบ้าง

โปรดไปที่เอกสารประกอบของ Amazon Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานของการตรวจทานเนื้อหาอัตโนมัติ / การตรวจทาน PII

ถาม: การตรวจทานเนื้อหาอัตโนมัติรวบรวมข้อมูลส่วนตัวที่ละเอียดอ่อนจากเสียงต้นทางด้วยหรือไม่

ไม่ คุณสมบัตินี้จะไม่นำข้อมูลส่วนตัวที่ละเอียดอ่อนออกจากเสียงต้นทาง แต่คุณสามารถตรวจทานข้อมูลส่วนตัวจากเสียงต้นทางได้ด้วยตนเองโดยใช้ตราประทับเวลาเริ่มและสิ้นสุดที่มีให้ในทรานสคริปต์ที่ตรวจทานแล้ว เพื่อดูอินสแตนซ์แต่ละรายการของการพูด PII ที่ระบุ

ถาม: ฉันสามารถใช้การตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจทานข้อมูลส่วนตัวจากทรานสคริปต์ข้อความที่มีอยู่แล้วได้หรือไม่

ไม่ได้ การตรวจทานเนื้อหาอัตโนมัติทำงานเฉพาะกับเสียงในลักษณะอินพุตเท่านั้น

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการตรวจทานเนื้อหาอัตโนมัติ

การตรวจทานเนื้อหาอัตโนมัติออกแบบมาเพื่อระบุและนำข้อมูลที่ใช้ระบุตัวบุคคลได้ (PII) ออก แต่ตามลักษณะการทำงานเชิงคาดการณ์ของแมชชีนเลิร์นนิ่งแล้ว ก็อาจไม่สามารถนำ PII ที่ปรากฏอยู่ในทรานสคริปต์ที่บริการสร้างขึ้นออกได้ทั้งหมด คุณควรตรวจสอบเอาต์พุตจากการตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจสอบให้แน่ใจว่าตรงตามความต้องการของคุณ

ถาม: มีความแตกต่างระหว่างการตรวจทานเนื้อหาอัตโนมัติสำหรับ API ทั้งแบบกลุ่มและสตรีมมิงหรือไม่

มี จะมีความสามารถเพิ่มเติมสองรายการโดยการตรวจทานเนื้อหาอัตโนมัติหรือ API สตรีมมิงที่ไม่รองรับโดย API แบบกลุ่ม คุณสามารถตัดสินใจระบุ PII และไม่ตรวจทานเนื้อหาเมื่อใช้การสร้างการตรวจสอบเนื้อหาที่มี API สตรีมมิง นอกจากนี้ คุณมีความสามารถในการระบุหรือตรวจทานประเภท PII ที่เฉพาะเจาะจง ด้วย API สตรีมมิง ตัวอย่างเช่น คุณสามารถตรวจทานหมายเลขประกันสังคมและข้อมูลบัตรเครดิต รวมถึงเก็บ PII อื่นๆ อย่างชื่อและที่อยู่อีเมลไว้ได้

ถาม: รีเจี้ยน AWS ใดมีการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII พร้อมใช้งาน 

โปรดไปที่เอกสารประกอบของ Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานของการตรวจทานเนื้อหาอัตโนมัติและการตรวจทาน PII สำหรับ API แบบกลุ่มและสตรีมมิงในรีเจี้ยน AWS

ถาม: API ใดบ้างที่รองรับการระบุภาษาอัตโนมัติ

ในปัจจุบัน มีการรองรับการระบุภาษาอัตโนมัติสำหรับ API แบบเป็นชุด

ถาม: Amazon Transcribe สามารถระบุภาษาใดได้โดยอัตโนมัติ

Amazon Transcribe สามารถระบุทุกภาษาที่ API แบบกลุ่ม

ถาม: Amazon Transcribe ระบุภาษาหลายภาษาในไฟล์เสียงเดียวกันหรือไม่

Amazon Transcribe ระบุเฉพาะภาษาหลักในไฟล์เสียงเท่านั้น

ถาม: มีวิธีที่จะสามารถจำกัดรายการภาษาเพื่อเลือกจากการรองรับการระบุภาษาอัตโนมัติหรือไม่

มี คุณสามารถระบุรายการภาษาที่อาจมีอยู่ในไลบรารีสื่อของคุณได้ เมื่อคุณระบุรายการภาษา ระบบจะเลือกภาษาที่ระบุไว้จากรายการดังกล่าว หากไม่มีการระบุภาษา ระบบจะประมวลผลไฟล์เสียงเทียบกับภาษาทั้งหมดที่ Amazon Transcribe รองรับ และเลือกภาษาที่น่าจะเป็นไปได้มากที่สุด ความถูกต้องในการระบุภาษานั้นจะยิ่งมากขึ้น เมื่อมีการระบุรายการภาษาที่เลือกไว้

ราคาและความพร้อมใช้งาน

ถาม: ราคาเท่าไหร่

โปรดดูที่หน้าราคา Amazon Transcribe เพื่อเรียนรู้เพิ่มเติม

ถาม: มีพื้นที่ AWS ใดบ้างที่ Amazon Transcribe พร้อมให้บริการ

โปรดดูที่ตารางภูมิภาคโครงสร้างพื้นฐานโดยรวมของ AWS

ความเป็นส่วนตัวของข้อมูล

ถาม: ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดย Amazon Transcribe มีการจัดเก็บหรือไม่ และ AWS นำไปใช้อย่างไร

Amazon Transcribe อาจจัดเก็บและใช้ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดยบริการเท่านั้นในการจัดหาและบำรุงรักษาบริการและเพื่อปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ การใช้เนื้อหาของคุณเป็นสิ่งสำคัญสำหรับการปรับปรุงประสบการณ์ของลูกค้า Amazon Transcribe ของคุณอย่างต่อเนื่อง รวมถึงการพัฒนาและฝึกอบรมเทคโนโลยีที่เกี่ยวข้อง เราไม่ใช้ข้อมูลที่สามารถระบุตัวบุคคลใดๆ ที่อาจมีอยู่ในเนื้อหาของคุณเพื่อกำหนดเป้าหมายผลิตภัณฑ์ บริการ หรือการตลาดให้กับคุณหรือผู้ใช้ปลายทางของคุณ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดู https://aws.amazon.com/compliance/data-privacy-faq/ สำหรับข้อมูลเพิ่มเติม คุณอาจเลือกที่จะไม่อนุญาตให้ใช้เนื้อหาของคุณในการปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นๆ ของ Amazon ได้โดยใช้นโยบายการเลือกที่จะไม่อนุญาตของ AWS Organizations สำหรับข้อมูลเกี่ยวกับวิธีการเลือกที่จะไม่อนุญาต โปรดดูที่นโยบายการเลือกที่จะไม่อนุญาตบริการจัดการ AI

ถาม: ฉันจะลบข้อมูลและสิ่งประดิษฐ์ที่เกี่ยวข้องกับงานการถอดความซึ่ง Amazon Transcribe จัดเก็บไว้ได้หรือไม่

ได้ คุณสามารถใช้ Delete API ที่มีอยู่ในการลบข้อมูลและสิ่งประดิษฐ์อื่นๆ ที่เกี่ยวข้องกับงานการถอดความ หากคุณมีปัญหาในการดำเนินการ โปรดติดต่อ AWS Support

ถาม: ใครมีสิทธิ์เข้าถึงเนื้อหาที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้

พนักงานที่ได้รับอนุญาตเท่านั้นที่จะมีสิทธิ์เข้าถึงเนื้อหาของคุณที่ Amazon Transcribe ประมวลผลไว้ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดู https://aws.amazon.com/compliance/data-privacy-faq/ สำหรับข้อมูลเพิ่มเติม

ถาม: ฉันยังคงเป็นเจ้าของเนื้อหาของฉันที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้หรือไม่

คุณจะเป็นเจ้าของเนื้อหาของคุณเสมอ และเราจะใช้เนื้อหาของคุณเมื่อได้รับความยินยอมจากคุณเท่านั้น

ถาม: เกิดอะไรขึ้นกับข้อมูลของฉันที่ใช้ในการฝึกโมเดลภาษาแบบกำหนดเอง ฉันจะยังเป็นเจ้าของข้อมูลดังกล่าวอยู่หรือไม่

เมื่อส่งข้อมูลข้อความที่ใช้ในการฝึกโมเดลเฉพาะ ลูกค้าจะเป็นเจ้าของทั้งข้อมูลข้อความต้นฉบับและโมเดลแบบกำหนดเองที่สร้างขึ้น เราจะไม่จัดเก็บข้อมูลข้อความดังกล่าว รวมถึงไม่นำไปใช้ในการปรับปรุงเครื่องมือการรู้จำเสียงพูดทั่วไปของเราแต่อย่างใด โมเดลที่สร้างโดยใช้ CLM เป็นโมเดลแบบครบวงจรและมีเพียงลูกค้าเท่านั้นที่สามารถเข้าถึงได้

ถาม: การที่ระบบไม่เก็บข้อมูลการฝึกของฉันเอาไว้จะมีข้อเสียหรือการเสื่อมใดๆ ต่อคุณภาพการถอดเสียงหรือประสบการณ์โดยรวมในการให้บริการหรือไม่

การที่บริการของเราไม่ได้จัดเก็บข้อมูลการฝึกของคุณเอาไว้จะไม่ทำให้คุณภาพของการถอดเสียงเสื่อมลง เมื่อข้อมูลการฝึกถูกนำมาใช้ในการสร้างโมเดลภาษาแบบกำหนดเองแล้ว ตัวโมเดลดังกล่าวจะพร้อมให้คุณใช้งานซ้ำได้ตามความต้องการ ชุดข้อมูลต้นฉบับสำหรับการฝึกที่คุณอัปโหลดไว้จะถูกลบออกจากระบบของเรา ข้อเสียเพียงอย่างเดียวก็คือในกรณีที่คุณต้องการการสนับสนุนด้านเทคนิค เนื่องจากเราไม่ได้เก็บข้อมูลต้นฉบับสำหรับการฝึกของคุณเอาไว้ เราจึงไม่สามารถเข้าถึงสินทรัพย์เหล่านั้นหรือสิ่งประดิษฐ์ตัวกลางที่เกี่ยวข้องอย่างสะดวกได้ หากคุณต้องการให้ทีมสนับสนุนตรวจสอบปัญหาด้านการบริการที่อาจเกิดขึ้น การสนับสนุนจะยังคงมีอยู่ แต่จะไม่สามารถทำได้โดยสะดวกนักเนื่องจากเราอาจจำเป็นต้องขอข้อมูลจากคุณเพิ่มเติม

ถาม: ฉันจะนำข้อมูลกลับมาใช้ซ้ำเพื่อการอัปเดตหรือปรับปรุงโมเดลในอนาคตได้อย่างไร

เนื่องจากระบบไม่ได้จัดเก็บข้อมูลการฝึกเอาไว้ คุณจึงจำเป็นต้องอัปโหลดข้อมูลชุดเดิม รวมถึงข้อมูลเพิ่มเติมใดๆ อีกครั้งเพื่อฝึกโมเดลใหม่ เมื่อมีการอัปเดตโมเดลพื้นฐานโดย Amazon Transcribe เราจะแจ้งให้คุณทราบ โดยเราแนะนำให้คุณส่งข้อมูลเพื่อฝึกโมเดลใหม่เพื่อใช้ประโยชน์จากโมเดลพื้นฐานที่อัปเดตล่าสุด ซึ่งจะทำให้คุณมีทั้งโมเดลต้นฉบับแบบกำหนดเองที่สร้างไว้ก่อนหน้านี้และโมเดลเวอร์ชันใหม่ไว้ใช้งาน

ถาม: ฉันสามารถลบโมเดลได้หรือไม่

ผู้ใช้สามารถลบโมเดลภาษาแบบกำหนดเองใดๆ ที่ตนสร้างขึ้นได้ตามต้องการ

ถาม: เนื้อหาที่ Amazon Transcribe ประมวลผลถูกย้ายออกจากรีเจี้ยน AWS ที่ฉันกำลังใช้ Amazon Transcribe อยู่หรือไม่

เนื้อหาใดๆ ที่ Amazon Transcribe ประมวลผลจะถูกเข้ารหัสและจัดเก็บเป็นข้อมูลที่ไม่ใช้งานไว้ในเขต AWS ที่คุณกำลังใช้ Amazon Transcribe อยู่ เนื้อหาบางส่วนที่ Amazon Transcribe ประมวลผลอาจถูกจัดเก็บไว้ในเขต AWS อื่นที่เกี่ยวข้องกับการปรับปรุงและการพัฒนาประสบการณ์การใช้งานของลูกค้า Amazon Transcribe ของคุณและเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อย่างต่อเนื่องเท่านั้น หากคุณเลือกที่จะไม่ให้ใช้เนื้อหาของคุณในการพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ โดยการติดต่อ AWS Support เนื้อหาของคุณจะไม่ถูกจัดเก็บไว้ในเขต AWS อื่น คุณสามารถส่งคำขอในการลบข้อมูลเสียงป้อนเข้าที่เกี่ยวข้องกับบัญชีของคุณได้โดยการติดต่อ AWS Support เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดู https://aws.amazon.com/compliance/data-privacy-faq/ สำหรับข้อมูลเพิ่มเติม

ถาม: ฉันสามารถใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปี และอยู่ภายใต้กฎหมายคุ้มครองข้อมูลออนไลน์ส่วนบุคคลของเด็ก (COPPA) ได้หรือไม่

ได้ ภายใต้ข้อกำหนดการให้บริการของ Amazon Transcribe รวมถึงพันธะผูกพันของคุณในการระบุข้อมูลการแจ้งที่จำเป็นใดๆ และรับการยินยอมจากผู้ปกครองที่สามารถตรวจสอบได้ที่จำเป็นภายใต้ COPPA คุณอาจใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนได้

ถาม: ฉันจะระบุได้อย่างไรว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันของฉันอยู่ภายใต้ COPPA

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อกำหนดของ COPPA และคู่มือในการระบุว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ของคุณอยู่ภายใต้ COPPA หรือไม่ โปรดดูแหล่งข้อมูลที่คณะกรรมการพาณิชย์กลางแห่งสหรัฐอเมริกามีให้และเป็นผู้ดูแลได้โดยตรง เว็บไซต์นี้ยังมีข้อมูลเกี่ยวกับวิธีการระบุว่าการบริการถูกส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนหรือไม่อีกด้วย

Amazon Transcribe Call Analytics

ถาม: Amazon Transcribe Call Analytics คืออะไร

Amazon Transcribe Call Analytics คือ API ที่ขับเคลื่อนด้วย AI ซึ่งมอบข้อมูลการถอดเสียงการโทรที่ครบถ้วนสมบูรณ์และข้อมูลเชิงลึกการสนทนาที่นำไปใช้ได้จริง โดยคุณสามารถเพิ่มลงในแอปพลิเคชันการโทรต่างๆ เพื่อปรับปรุงประสบการณ์ของลูกค้าและประสิทธิภาพการทำงานของตัวแทนได้ โดยมีการผสมผสานรูปแบบเสียงพูดเป็นข้อความที่มีประสิทธิภาพและรูปแบบการประมวลผลภาษาธรรมชาติที่กำหนดเอง (NLP) ที่ฝึกมาโดยเฉพาะเพื่อทำความเข้าใจการดูแลลูกค้าและการโทรออกสำหรับการขาย API นี้เป็นส่วนหนึ่งของโซลูชัน AWS Contact Center Intelligence (CCI) ซึ่งไม่ขึ้นกับศูนย์ติดต่อใดๆ และช่วยให้ลูกค้าและ ISV สามารถเพิ่มคุณสมบัติการวิเคราะห์การโทรลงในแอปพลิเคชันได้อย่างง่ายดาย

ถาม: ฉันทำอะไรกับ Amazon Transcribe Call Analytics ได้บ้าง

Call Analytics ช่วยให้คุณสามารถเพิ่มข้อมูลอันมีค่าได้อย่างรวดเร็ว เช่น คะแนนความเชื่อมั่นของลูกค้าและตัวแทน ปัจจัยขับเคลื่อนการโทร และหมวดหมู่การโทรโดยตรงเป็นเอาต์พุต API ไปยังแอปพลิเคชันการโทรเข้าหรือโทรออก หัวหน้างานสามารถใช้แอปพลิเคชันเหล่านั้นเพื่อทำความเข้าใจการโต้ตอบของลูกค้าและตัวแทน ระบุปัญหาที่เกิดขึ้นบ่อย และติดตามตัวชี้วัดประสิทธิภาพในหมวดหมู่ต่างๆ ได้ดีขึ้น

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Call Analytics ได้อย่างไร

คุณสามารถใช้ Transcribe Call Analytics ได้ผ่าน API และ AWS Management Console โดยสามารถสร้าง ตรวจสอบ และลบงาน Analytics ผ่าน API หรือ Console ได้ ใน Console คุณจะเห็นรายการงานการวิเคราะห์และหน้ารายละเอียดงานพร้อมพารามิเตอร์อินพุตและตัวอย่างเอาต์พุต JSON นอกจากนี้ คุณยังสามารถสร้าง แก้ไข และลบหมวดหมู่ต่างๆ ผ่าน API หรือ Console ได้ด้วยคุณสมบัติการจัดหมวดหมู่ผู้ติดต่ออัตโนมัติ

ถาม: Amazon Transcribe Call Analytics รองรับภาษาใดบ้าง

ในขณะนี้ Amazon Transcribe Call Analytics จะรองรับภาษาอาหรับ (อ่าว), จีนแมนดาริน (จีนแผ่นดินใหญ่), อังกฤษ (สหรัฐฯ), อังกฤษ (บริเตนใหญ่), อังกฤษ (ไอร์แลนด์), อังกฤษ (สกอตแลนด์), อังกฤษ (เวลส์), อังกฤษ (ออสเตรเลีย), อังกฤษ (อินเดีย), ฝรั่งเศส (แคนาดา), ฝรั่งเศส (ฝรั่งเศส), เยอรมัน (เยอรมนี), เยอรมัน (สวิตเซอร์แลนด์), ฮินดี (อินเดีย), อิตาลี (อิตาลี), ญี่ปุ่น (ญี่ปุ่น), เกาหลี (เกาหลี), โปรตุเกส (โปรตุเกส), โปรตุเกส (บราซิล), สเปน (สหรัฐฯ) และสเปน (สเปน)

ถาม: Amazon Transcribe Call Analytics พร้อมใช้งานในรีเจี้ยน AWS ใดบ้าง

ในขณะนี้ Amazon Transcribe Call Analytics พร้อมให้บริการในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียเหนือ), แคนาดา (ภาคกลาง), สหภาพยุโรป (ลอนดอน), สหภาพยุโรป (แฟรงเฟิร์ต), เอเชียแปซิฟิก (มุมไบ), เอเชียแปซิฟิก (โซล), เอเชียแปซิฟิก (สิงคโปร์), เอเชียแปซิฟิก (ซิดนีย์) และเอเชียแปซิฟิก (โตเกียว)

ถาม: ราคาของ Amazon Transcribe Call Analytics คิดอย่างไร

ราคาของ Amazon Transcribe Call Analytics จะคิดแยกจาก Transcribe API ที่มีอยู่ โปรดดูข้อมูลเพิ่มเติมในหน้าราคาของ Transcribe

ถาม: Amazon Transcribe Call Analytics มีคุณสมบัติตรงตาม HIPAA หรือไม่

ใช่ Amazon Transcribe Call Analytics มีคุณสมบัติตรงตาม HIPAA

Amazon Transcribe Medical

ถาม: Amazon Transcribe Medical คืออะไร

Amazon Transcribe Medical คือบริการการรู้จำเสียงพูดอัตโนมัติ (ASR) ที่ช่วยให้นักพัฒนาเพิ่มความสามารถในการเปลี่ยนเสียงพูดทางการแพทย์ให้เป็นตัวอักษรลงในแอปพลิเคชันได้ การใช้ Amazon Transcribe Medical คุณสามารถคัดลอกคำสั่งทางการแพทย์และเสียงพูดจากการสนทนาให้เป็นตัวอักษรได้อย่างรวดเร็วและแม่นยำสำหรับหลากหลายวัตถุประสงค์ เช่น การบันทึกข้อความของแพทย์หรือการประมวลผลในการวิเคราะห์ข้อความแบบดาวน์สตรีมเพื่อดึงข้อมูลเชิงลึกที่มีนัยสำคัญ

ถาม: ฉันทำอะไรกับ Amazon Transcribe Medical ได้บ้าง

Amazon Transcribe Medical ใช้โมเดลแมชชีนเลิร์นนิ่งขั้นสูงในการถอดความเสียงพูดทางการแพทย์ให้เป็นตัวอักษรได้อย่างถูกต้อง Transcribe Medical สามารถถอดเสียงข้อความทั่วไปที่สามารถใช้เพื่อรองรับการใช้งานในกรณีต่างๆ โดยครอบคลุมถึงลำดับงานของเอกสารทางคลินิกและการตรวจสอบความปลอดภัยของยา (การติดตามความปลอดภัยจากการใช้ยา) เพื่อทำคำบรรยายใต้ภาพสำหรับการแพทย์ทางไกล และแม้กระทั่งการติดต่อศูนย์วิเคราะห์ในโดเมนด้านการดูแลสุขภาพและวิทยาศาสตร์สุขภาพ

ถาม: ฉันต้องเป็นผู้เชี่ยวชาญด้านการรู้จำเสียงพูดอัตโนมัติ (ASR) ในการใช้ Amazon Transcribe Medical หรือไม่

ไม่ คุณไม่ต้องมีความเชี่ยวชาญด้าน ASR หรือแมชชีนเลิร์นนิ่งในการใช้งาน Amazon Transcribe Medical คุณเพียงต้องเรียก API ของ Transcribe Medical และการบริการจะจัดการกับแมชชีนเลิร์นนิ่งที่จำเป็นในแบ็คเอนด์เพื่อถอดความเสียงพูดทางการแพทย์เป็นตัวอักษร

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Medical ได้อย่างไร

คุณสามารถเริ่มต้นใช้งาน Amazon Transcribe Medical ได้จาก AWS Management Console หรือด้วยการใช้ SDK โปรดดูรายละเอียดในเอกสารทางเทคนิคหน้านี้

Amazon Transcribe Medical มีช่วงทดลองฟรีเพื่อให้คุณสามารถทดสอบบริการได้ โปรดดูข้อมูลเพิ่มเติมในหน้าราคานี้

ถาม: Amazon Transcribe Medical รองรับภาษาใดบ้าง

ขณะนี้ Amazon Transcribe Medical รองรับการถอดความเสียงพูดทางการแพทย์ในภาษาอังกฤษแบบสหรัฐอเมริกา

ถาม: Amazon Transcribe Medical รองรับการแพทย์เฉพาะทางด้านใดบ้าง

Amazon Transcribe Medical รองรับการถอดเสียงสำหรับการรักษาแบบพื้นฐานและการรักษาแบบเฉพาะทางหลากหลายรายการ ไปที่เอกสารประกอบของเราเพื่อดูรายการของการแพทย์เฉพาะทางทั้งหมดที่รองรับ

ถาม: Amazon Transcribe Medical พร้อมใช้งานในภูมิภาค AWS ใดบ้าง

ขณะนี้ Amazon Transcribe Medical พร้อมใช้งานในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียตอนเหนือ) สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ) สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) แคนนาดา (ภาคกลาง) สหภาพยุโรป (ไอร์แลนด์) และเอเชียแปซิฟิก (ซิดนีย์)

ถาม: Amazon Transcribe Medical คิดราคาอย่างไร

โปรดดูที่หน้าราคา Amazon Transcribe Medical เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียดราคา

ถาม: Amazon Transcribe Medical มีคุณสมบัติตรงตาม HIPAA หรือไม่

มี

ถาม: มีการใช้เนื้อหาที่ประมวลผลโดย Amazon Transcribe Medical เพื่อจุดประสงค์อื่นนอกเหนือจากการให้บริการหรือไม่

Amazon Transcribe Medical ไม่ได้ใช้เนื้อหาที่ประมวลผลโดยการให้บริการสำหรับเหตุผลอื่นใดที่นอกเหนือไปจากเพื่อการให้บริการและรักษาการให้บริการ เนื้อหาที่ประมวลผลโดยบริการจะไม่ถูกนำไปใช้เพื่อพัฒนาหรือปรับปรุงคุณภาพของ Amazon Transcribe Medical หรือเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นใดของ Amazon

ถาม: Amazon Transcribe Medical มีการเรียนรู้ตลอดเวลาหรือไม่

มี Amazon Transcribe Medical ใช้แมชชีนเลิร์นนิ่งและได้รับการฝึกฝนอย่างต่อเนื่องเพื่อให้ทำงานได้ดีขึ้นสำหรับกรณีใช้งานของลูกค้า Amazon Transcribe Medical ไม่ได้จัดเก็บหรือใช้ข้อมูลลูกค้าที่ใช้กับบริการในการฝึกโมเดล

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการ Amazon Transcribe Medical

Amazon Transcribe Medical ไม่ได้ใช้แทนคำแนะนำทางการแพทย์ การวินิจฉัย หรือการรักษาจากมืออาชีพ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่ในการใช้ดุลยพินิจ ประสบการณ์ และวิจารณญาณในการพิจารณาความถูกต้อง ความครบถ้วน ความตรงต่อเวลา และความเหมาะสมของข้อมูลใดๆ ที่ Amazon Transcribe Medical มอบให้ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่แต่เพียงผู้เดียวในการตัดสินใจ ให้คำแนะนำ การดำเนินการ และ/หรือการไม่ดำเนินการใดๆ ที่อ้างอิงจากการใช้ Amazon Transcribe Medical 

Amazon Transcribe Medical อาจไม่สามารถระบุข้อมูลสุขภาพที่ได้รับการคุ้มครองได้อย่างแม่นยำในทุกสถานการณ์ และไม่เป็นตามข้อกำหนดสำหรับการไม่ระบุตัวตนของข้อมูลสุขภาพที่ได้รับการคุ้มครองซึ่งสอดคล้องกับ HIPAA คุณมีหน้าที่ในการตรวจสอบผลลัพธ์ใดๆ ที่ได้จาก Amazon Transcribe Medical เพื่อให้แน่ใจว่าตรงตามความต้องการของคุณ

โมเดลภาษาแบบกำหนดเอง

ถาม: ปัจจุบันนี้โมเดลภาษาแบบกำหนดเองมีฟังก์ชันอะไร

โมเดลภาษาแบบกำหนดเอง (CLM) ขณะนี้รองรับการถอดเสียงภาษาอังกฤษ (ออสเตรเลีย), อังกฤษ (บริติช), ฮินดู, อังกฤษ (สหรัฐอเมริกา) และสเปน (สหรัฐอเมริกา) โดยพร้อมให้ใช้งานในฐานะส่วนหนึ่งของ API การประมวลผลเสียงแบบเป็นชุดของ Amazon Transcribe และ Amazon Transcribe Call Analytics CLM รองรับการใช้งานคำศัพท์ที่กำหนดเองแบบพร้อมกัน

ถาม: ฉันจำเป็นต้องใช้ข้อมูลการฝึกอบรมมากน้อยเพียงใดและประเภทใด ฉันจะหาข้อมูลดังกล่าวมาได้อย่างไร ข้อมูลจำเป็นต้องอยู่ในรูปแบบที่เฉพาะเจาะจงหรือไม่

ข้อมูลข้อความควรมีเนื้อหาเกี่ยวข้องกับเสียงที่คุณจะถอดโดยใช้โมเดลแบบกำหนดเอง ข้อมูลควรประกอบด้วยคำศัพท์ วลี และการรวมคำเฉพาะโดเมนให้มากที่สุดเท่าที่จะเป็นไปได้ เราขอแนะนำให้ใช้ข้อความที่ต่อเนื่องกันอย่างน้อย 100,000 คำ และไม่เกิน 10 ล้านคำ ทรัพยากรข้อมูลข้อความอาจมาจากแหล่งข้อมูลในองค์กรหรือแหล่งข้อมูลสาธารณะใดๆ ก็ได้ (เช่น ใช้ข้อความจากเว็บไซต์ของลูกค้า) เราขอแนะนำให้ไฟล์ข้อความธรรมดาแต่ละไฟล์มีจำนวน 200,000 คำขึ้นไป แต่ขนาดไฟล์โดยรวมต้องไม่เกิน 1 GB ข้อความควรอยู่ในรูปแบบ UTF-8 และมีหนึ่งประโยคต่อบรรทัด แต่ละประโยคควรมีเครื่องหมายวรรคตอน ผู้ใช้มีหน้าที่ตรวจสอบการสะกด ลบอักขระการจัดรูปแบบ และตรวจสอบความถูกต้องของการเข้ารหัส

ถาม: ฉันจะใช้โมเดลภาษาแบบกำหนดเอง (CLM) ได้อย่างไร

ในการฝึกโมเดลภาษาแบบกำหนดเองนั้น ลูกค้าเพียงแค่ใส่ข้อมูลข้อความไว้ในบัคเก็ต Amazon S3 จากนั้นจึงใช้คอนโซลบริการของ Amazon Transcribe ในการโหลดและประมวลผลข้อมูลเพื่อฝึกโมเดลภาษาแบบกำหนดเอง การฝึกจะทำงานโดยอัตโนมัติอย่างเต็มรูปแบบ และต้องการการแทรกแซงจากผู้ใช้เพียงเล็กน้อยเท่านั้น โมเดลแบบกำหนดเองขั้นสุดท้ายที่เสร็จเรียบร้อยแล้วจะอยู่ในบัญชี AWS ของลูกค้าเพื่อใช้สำหรับถอดเสียงจากไฟล์เสียงเฉพาะโดเมน นอกจากนี้ ลูกค้าสามารถฝึกโมเดลแบบกำหนดเองได้หลายโมเดลเพื่อใช้กับกรณีใช้งานที่แตกต่างกันไป

ถาม: การปรับปรุงต่างๆ มีการรับประกันหรือไม่ การลงทุนไปกับความพยายามในการเก็บรวบรวมข้อมูลข้อความจะคุ้มค่าหรือไม่

การปรับปรุงต่างๆ นั้นไม่มีการรับประกัน การเปลี่ยนแปลงของประสิทธิภาพจะขึ้นอยู่กับว่าข้อมูลข้อความตรงกับไฟล์เสียงมากน้อยเพียงใด และขึ้นอยู่กับปริมาณข้อมูลที่ให้ไว้ โดยทั่วไปแล้วข้อมูลยิ่งมากก็ยิ่งดี แต่สิ่งสำคัญที่สุดคือข้อมูลควรมีเนื้อหาครอบคลุมคำศัพท์และลำดับของคำที่คาดว่าจะพบในไฟล์เสียงที่คุณตั้งใจจะถอดเสียง การปรับปรุงความแม่นยำของการถอดเสียงจะขึ้นอยู่กับคุณภาพของข้อมูลการฝึกและกรณีใช้งาน ในบางกรณี การเทียบเคียงทั่วไปบ่งชี้ว่าความแม่นยำสัมพัทธ์มีประสิทธิภาพยิ่งขึ้น 10% ถึง 15%

ถาม: การฝึกโมเดลใช้เวลานานเท่าใด ฉันจะสามารถใช้โมเดลได้เมื่อใด

โดยทั่วไป การฝึกโมเดลจะใช้เวลาระหว่าง 6 ถึง 10 ชั่วโมง ระยะเวลาในการฝึกขึ้นอยู่กับว่าชุดข้อมูลมีขนาดใหญ่เพียงใด โมเดลแบบกำหนดเองจะพร้อมให้ใช้งานได้ทันทีหลังจากที่ฝึกเสร็จเรียบร้อยแล้ว

ถาม: ฉันจะสามารถใช้โมเดลนี้ได้อย่างไร ฉันจะทราบได้อย่างไรว่าโมเดลนี้ทำงานได้ดีกว่าโมเดลทั่วไปที่ Amazon Transcribe มีให้บริการ

โมเดลจะพร้อมให้ใช้งานอยู่ในบัญชีของลูกค้าภายใต้ ID โมเดลที่ลูกค้ากำหนดก่อนที่จะเริ่มกระบวนการฝึก หากต้องการใช้โมเดลดังกล่าว ลูกค้าจะต้องเพิ่มค่าสถานะที่มี ID โมเดลไปยังคำขอการถอดเสียง ลูกค้าควรทดสอบโมเดลกับไฟล์เสียงของตน แล้วเปรียบเทียบผลลัพธ์นี้กับผลลัพธ์ที่ได้จากเครื่องมือทั่วไป

ถาม: ฉันสามารถฝึกโมเดลภาษาแบบกำหนดเองได้กี่โมเดล ฉันสามารถเปิดใช้งานหลายโมเดลพร้อมกันสำหรับบัญชีของฉันได้หรือไม่

คุณสามารถฝึกโมเดลพร้อมกันได้สูงสุดครั้งละ 5 โมเดลต่อบัญชี AWS หนึ่งบัญชี สำหรับแต่ละบัญชี คุณสามารถจัดเก็บได้สูงสุด 10 โมเดลตามค่าเริ่มต้น หากต้องการจัดเก็บโมเดลเพิ่มเติม คุณสามารถเพิ่มขีดจำกัดการใช้บริการได้ที่นี่

ถาม: ระบบสนับสนุนโมเดลเสียงแบบกำหนดเองหรือไม่

ไม่ ระบบไม่สนับสนุนโมเดลเสียงแบบกำหนดเอง โมเดลภาษาแบบกำหนดเองนั้นสร้างขึ้นมาจากข้อมูลข้อความที่เกี่ยวข้องกับกรณีใช้งานหรือโดเมนของคุณ

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Transcribe

ไปที่หน้าราคา
พร้อมเริ่มต้นใช้งานหรือยัง
ลองใช้ Amazon Transcribe Console
มีคำถามเพิ่มเติมไหม
ติดต่อเรา