ข้อมูลทั่วไป

ถาม: Amazon Transcribe คืออะไร

Amazon Transcribe คือบริการ ปัญญาประดิษฐ์ (AI) AWS ที่จะทำให้การเปลี่ยนคำพูดเป็นข้อความเป็นเรื่องง่ายสำหรับคุณ การใช้เทคโนโลยี Automatic Speech Recognition (ASR) คุณสามารถใช้ Amazon Transcribe กับแอปพลิเคชันทางธุรกิจได้อย่างหลากหลาย ซึ่งครอบคลุมถึงการถอดเสียงสำหรับสายโทรบริการลูกค้าที่ใช้เสียงเป็นหลัก, การสร้างคำบรรยายใต้ภาพบนคอนเทนต์เสียง/วิดีโอ และทำการวิเคราะห์คอนเทนต์ (ที่เป็นข้อความ) บนคอนเทนต์เสียง/วิดีโอ  

ถาม: Amazon Transcribe โต้ตอบกับผลิตภัณฑ์อื่นๆ ของ AWS อย่างไร

Amazon Transcribe แปลงข้อมูลเสียงป้อนเข้าให้เป็นข้อความ ซึ่งเป็นการเปิดโอกาสให้แอปพลิเคชันการวิเคราะห์ข้อความต่างๆ สามารถทำงานกับข้อมูลเสียงขาเข้าได้ ตัวอย่างเช่น การใช้ Amazon Comprehend กับข้อมูลข้อความที่แปลงจาก Amazon Transcribe จะช่วยให้คุณสามารถทำการวิเคราะห์ความเชื่อมั่นหรือสกัดเอกลักษณ์หรือวลีสำคัญออกมาได ในลักษณะเดียวกัน การผสานรวมกับ Amazon Translate และ Amazon Polly จะช่วยให้คุณสามารถรับข้อมูลเสียงป้อนเข้าในภาษาหนึ่ง แปลเป็นอีกภาษาหนึ่ง และสร้างข้อมูลเสียงออกได้ ซึ่งทำให้สามารถสร้างการสนทนาหลากภาษาได้อย่างมีประสิทธิภาพ อีกทั้งยังสามารถผสาน Amazon Transcribe เข้ากับ Amazon Kendra หรือ Amazon OpenSearch เพื่อทำดัชนีและทำการค้นหาแบบอิงตามข้อมูลได้ทั่วทั้งไลบรารีเสียง/วิดีโอ เพื่อเรียนรู้เพิ่มเติม กรุณาดูที่ Live Call Analytics and Agent Assist, Post Call Analytics, MediaSearch, หรือโซลูชัน Content Analysis

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้งาน Amazon Transcribe

Amazon Transcribe ออกแบบมาเพื่อรับมือกับคำพูดและการแสดงออกผ่านเสียงหลากหลายรูปแบบ ซึ่งรวมถึงความดัง ระดับเสียงสูงต่ำ และความเร็วในการพูดที่แตกต่างกัน คุณภาพและคอนเทนต์ของสัญญาณเสียง (รวมถึงแต่ไม่จำกัดเพียงปัจจัยต่างๆ อาทิ เสียงรบกวนในพื้นหลัง ผู้พูดที่พูดพร้อมกัน คำพูดเน้นเสียง หรือสลับไปมาระหว่างภาษาต่างๆ ภายในไฟล์เสียงเดียว) อาจส่งผลต่อความแม่นยำของข้อมูลออกของบริการ เราอัปเดตบริการอย่างต่อเนื่องเพื่อปรับปรุงความสามารถในการปรับให้รับกับความหลากหลายทางเสียงเพิ่มเติมและประเภทคอนเทนต์ต่างๆ

การใช้ Amazon Transcribe

ถาม: นักพัฒนาจะเข้าถึง Amazon Transcribe ได้อย่างไร

วิธีที่ง่ายที่สุดในการเริ่มต้นใช้งาน คือให้ส่งงานโดยใช้คอนโซลเพื่อถอดความไฟล์เสียงให้เป็นข้อความ นอกจากนี้ คุณสามารถโทรหาบริการโดยตรงจาก AWS Command Line Interface หรือเลือกใช้หนึ่งใน SDK ที่รองรับที่คุณต้องการเพื่อสร้างด้วยแอปพลิเคชันของคุณ ไม่ว่าจะเลือกวิธีใดก็ตาม คุณก็สามารถเริ่มต้นใช้งาน Amazon Transcribe เพื่อสร้างทรานสคริปต์โดยอัตโนมัติสำหรับไฟล์เสียงได้โดยใช้โค้ดเพียงไม่กี่บรรทัด

ถาม: Amazon Transcribe รองรับการถอดเสียงแบบเรียลไทม์หรือไม่

ได้ Amazon Transcribe ช่วยให้คุณสามารถเปิดสตรีมแบบสองทิศทางผ่าน HTTP2 ได้ โดยคุณสามารถส่งสตรีมเสียงไปยังบริการขณะที่รับสตรีมข้อความคืนในแบบเรียลไทม์ โปรดดูที่ หน้าเอกสารประกอบ สำหรับรายละเอียดเพิ่มเติม

ถาม: การถอดเสียงแบบเรียลไทม์รองรับการเข้ารหัสใดบ้าง

ประเภทสื่อที่รองรับจะแตกต่างกันระหว่างการถอดชุดเสียงและการถอดเสียงสตรีมมิ่ง แม้ว่าทั้งสองรูปแบบจะแนะนำให้ใช้รูปแบบที่ไม่สูญเสียข้อมูลก็ตาม โปรดดูที่ หน้าเอกสารประกอบ สำหรับรายละเอียดเพิ่มเติม

ถาม: Amazon Transcribe รองรับภาษาใดบ้าง

สำหรับข้อมูลเกี่ยวกับภาษาที่รองรับ โปรดดูที่หน้าเอกสารประกอบ

ถาม: Amazon Transcribe ใช้งานได้กับอุปกรณ์ใดบ้าง

ส่วนมากแล้ว Amazon Transcribe ทำงานได้ไม่จำกัดอุปกรณ์ ซึ่งโดยทั่วไปแล้ว จะใช้งานได้กับอุปกรณ์ทุกเครื่องที่มีไมโครโฟนในตัว อาทิ โทรศัพท์ คอมพิวเตอร์ แท็บเล็ต และอุปกรณ์ IoT (เช่น ระบบเสียงรถยนต์) Amazon Transcribe API จะสามารถตรวจจับคุณภาพของสตรีมเสียงที่ป้อนเข้าไปยังอุปกรณ์ (8kHz เทียบกับ 16kHz) และจะเลือกโมเดลเสียงที่เหมาะสมสำหรับแปลงคำพูดเป็นข้อความ นอกจากนี้ นักพัฒนาสามารถเรียก Amazon Transcribe API ผ่านแอปพลิเคชันของตนเพื่อเข้าถึงความสามารถในการแปลงคำพูดเป็นข้อความได้

ถาม: มีการจำกัดขนาดของคอนเทนต์เสียงที่ Amazon Transcribe สามารถประมวลผลได้หรือไม่

สายโทรบริการ Amazon Transcribe จะจำกัดไม่เกินสี่ชั่วโมง (หรือ 2 GB) ต่อการโทร API หนึ่งครั้งสำหรับบริการแบบเป็นชุดของเรา บริการสตรีมสามารถรองรับการเชื่อมต่อแบบเปิดได้สูงสุดสี่ชั่วโมง

ถาม: Amazon Transcribe รองรับภาษาโปรแกรมใดบ้าง

บริการแบบเป็นชุดของ Amazon Transcribe รองรับ .NET, Go, Java, JavaScript, PHP, Python และ Ruby บริการเรียลไทม์ของ Amazon Transcribe รองรับ Java SDK, Ruby SDK และ C++ SDK การรองรับ SDK เพิ่มเติมจะพร้อมในไม่ช้า สำหรับรายละเอียดเพิ่มเติม กรุณาดูที่ แหล่งข้อมูล และ หน้าเอกสารประกอบ

ถาม: ระบบไม่รู้จักคำศัพท์ที่กำหนดเองของฉัน! ฉันต้องทำอย่างไร

นอกเหนือจากศัพท์แบบกำหนดเองแล้ว ข้อมูลออกของการรู้จำเสียงพูดยังขึ้นอยู่กับปัจจัยอื่นอีกหลายประการ ดังนั้นจึงไม่อาจรับประกันได้ว่าเมื่อคำศัพท์ถูกบรรจุลงในคำศัพท์แบบกำหนดเองแล้ว ระบบจะจดจำคำนั้นได้อย่างถูกต้อง อย่างไรก็ตาม สาเหตุที่พบบ่อยสุดคือไม่มีการสร้างการออกเสียงที่ถูกต้องให้คำศัพท์ที่กำหนดเองดังกล่าว หากคุณยังไม่ได้สร้างการออกเสียงให้แก่คำศัพท์ที่กำหนดเองของคุณ โปรดลงมือสร้าง หากคุณสร้างแล้ว ให้ตรวจสอบอีกครั้งว่าถูกต้องหรือไม่ หรือเพิ่มการออกเสียงที่ต่างออกไป หากจำเป็น โดยสามารถทำได้ด้วยการสร้างหลายรายการในไฟล์คำศัพท์แบบกำหนดเองที่่แตกต่างกันไปในช่องการออกเสียง โปรดดูเอกสารประกอบคำศัพท์แบบกำหนดเอง สำหรับข้อมูลเพิ่มเติม

ถาม: ทำไมฉันจึงเห็นคำที่กำหนดเองจำนวนมากเกินไปในข้อมูลออก

คำศัพท์แบบกำหนดเองเหมาะสำหรับรายการสั้นๆ ที่ประกอบด้วยคำเป้าหมายต่างๆ ซึ่งหากป้อนคำศัพท์จำนวนมากอาจส่งผลให้เกิดการสร้างคำแบบกำหนดเองเป็นจำนวนมากเกินไป โดยเฉพาะอย่างยิ่งเมื่อรายการคำศัพท์นั้นประกอบด้วยคำที่ออกเสียงคล้ายคลึงกัน หากคุณมีรายการที่ยาวมาก โปรดลองตัดให้เหลือเพียงคำที่พบยากและคำที่คาดว่าจะพบได้ในไฟล์เสียงของคุณ หากคุณมีรายการคำศัพท์ขนาดใหญ่ที่ครอบคลุมกรณีใช้งานจำนวนมาก ให้แบ่งออกเป็นรายการย่อยสำหรับกรณีใช้งานที่ต่างกัน คำสั้นๆ ที่ออกเสียงคล้ายกับคำอื่นๆ จำนวนมากอาจทำให้เกิดการสร้างมากเกินไป (มีคำศัพท์แบบกำหนดเองปรากฏเป็นจำนวนมากเกินไปในข้อมูลออก) เราขอแนะนำให้รวมคำเหล่านี้กับคำที่อยู่ใกล้เคียงแล้วเขียนเป็นวลีที่คั่นด้วยเครื่องหมายยติภังค์ ตัวอย่างเช่น คำที่กำหนดเอง “A.D.” สามารถรวมเป็นส่วนหนึ่งของวลีได้ เช่น 'A.D.-converter'

ถาม: มีวิธีให้ออกเสียงได้สองวิธี IPA หรือฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเอง แบบไหนดีกว่ากัน

IPA ช่วยให้การออกเสียงแม่นยำยิ่งขึ้น คุณควรจัดให้มีการออกเสียง IPA หากคุณสามารถสร้าง IPA ได้ (เช่น จากพจนานุกรมที่มีการออกเสียง IPA หรือเครื่องมือแปลงออนไลน์)

ถาม: ฉันต้องการใช้ IPA แต่ฉันไม่ใช่ผู้เชี่ยวชาญด้านภาษา มีเครื่องมือออนไลน์ที่ฉันสามารถใช้ได้หรือไม่

พจนานุกรมมาตรฐานหลายฉบับ เช่น Oxford English Dictionary หรือ Cambridge Dictionary (รวมถึงเวอร์ชันออนไลน์) มีการออกเสียงใน IPA นอกจากนี้ ยังมีตัวแปลงออนไลน์ (ตัวอย่างเช่น easypronunciation.com หรือ tophonetics.com สำหรับภาษาอังกฤษ) อย่างไรก็ตาม โปรดทราบว่าในกรณีส่วนใหญ่เครื่องมือเหล่านี้จะอิงตามพจนานุกรมพื้นฐานและอาจไม่สร้าง IPA ที่ถูกต้องสำหรับคำบางคำ เช่น ชื่อเฉพาะ Amazon Transcribe ไม่รับรองเครื่องมือของบริษัทอื่น

ถาม: ฉันจำเป็นต้องใช้มาตรฐาน IPA ที่แตกต่างกันที่เฉพาะเจาะจงกับสำเนียงที่แตกต่างของภาษาเดียวกัน (ตัวอย่างเช่น ภาษาอังกฤษแบบสหรัฐอเมริกากับภาษาอังกฤษแบบอังกฤษ) หรือไม่

คุณควรใช้มาตรฐาน IPA ที่เหมาะสมสำหรับไฟล์เสียงที่คุณจะประมวลผล ตัวอย่างเช่นหากคุณคาดหวังการประมวลผลเสียงจากผู้พูดสำเนียงอังกฤษ ใช้มาตรฐานการออกเสียงแบบอังกฤษ ชุดของสัญลักษณ์ IPA ที่อนุญาตอาจแตกต่างกันไปตามภาษาและภาษาถิ่นที่รองรับโดย Amazon Transcribe โปรดตรวจสอบให้แน่ใจว่าการออกเสียงของคุณมีอักขระที่อนุญาตเท่านั้น สามารถดูรายละเอียดเกี่ยวกับชุดอักขระ IPA ได้ในเอกสารประกอบ คำศัพท์แบบกำหนดเอง

ถาม: ฉันจะให้การออกเสียงโดยใช้ฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเองได้อย่างไร

คุณสามารถแบ่งคำหรือวลีออกเป็นส่วนเล็กๆ และให้การออกเสียงให้แต่ละส่วนโดยใช้การสะกดคำมาตรฐานของภาษาเพื่อเลียนแบบวิธีการออกเสียงคำนั้น ตัวอย่างเช่น ในภาษาอังกฤษคุณสามารถให้คำใบ้การออกเสียงสำหรับวลี ลอสแองเจลิส ดังนี้: loss-ann-gel-es คำใบ้สำหรับคำว่า Etienne จะมีลักษณะเช่นนี้: eh-tee-en คุณคั่นแต่ละส่วนของคำใบ้ด้วยเครื่องหมายยัติภังค์ (-) คุณสามารถใช้อักขระที่อนุญาตใดก็ได้สำหรับภาษาที่ป้อน สำหรับรายละเอียดเพิ่มเติม โปรดดูที่หน้า คำศัพท์แบบกำหนดเอง

ถาม: วิธีสองวิธีที่แตกต่างกันในการให้ตัวย่อ (มีจุดและไม่มีจุด แต่มีการออกเสียง) มีการทำงานอย่างไร

หากคุณใช้ตัวย่อที่มีเครื่องหมายมหัพภาค การออกเสียงสะกดจะถูกสร้างขึ้นภายใน หากคุณไม่ได้ใช้เครื่องหมายมหัพภาค โปรดให้การออกเสียงในช่องการออกเสียง สำหรับคำย่อบางคำ จะไม่ชัดเจนว่าคำเหล่านั้นมีการออกเสียงตัวสะกดหรือออกเสียงคล้ายกับคำ ยกตัวอย่างเช่น NATO ถูกออกเสียงบ่อย ๆ ว่า ‘n eɪ t oʊ’ (nay-toh) มากกว่าจะเป็น ‘ɛn eɪ ti oʊ’ (N. A. T. O.) สำหรับรายละเอียดเพิ่มเติม โปรดดูที่หน้า คำศัพท์แบบกำหนดเอง

ถาม: ฉันจะหาตัวอย่างวิธีใช้การออกเสียงแบบกำหนดเองได้ที่ไหน

คุณสามารถหาตัวอย่างรูปแบบอิมพุตและตัวอย่างได้ใน เอกสารประกอบที่นี่.

ถาม: จะเกิดอะไรขึ้นหากฉันใช้ IPA ผิด ถ้าฉันไม่แน่ใจ ฉันควรที่จะไม่ป้อน IPA ใดๆ ดีกว่าหรือไม่

ระบบจะใช้การออกเสียงที่คุณให้ นี่จะเป็นการเพิ่มโอกาสในการจดจำคำได้อย่างถูกต้องหากการออกเสียงถูกต้องและตรงกับสิ่งที่พูด หากคุณไม่แน่ใจว่าคุณกำลังสร้าง IPA ที่ถูกต้อง โปรดทำการเปรียบเทียบโดยการประมวลผลไฟล์เสียงของคุณด้วยคำศัพท์ที่มีการออกเสียง IPA ของคุณ และที่มีคำศัพท์ที่มีเพียงคำเท่านั้น (และ เป็นทางเลือก รูปแบบตามที่แสดง) หากคุณไม่ได้ให้การออกเสียงใด ๆ บริการจะใช้การประมาณ ซึ่งอาจหรืออาจไม่ทำงานได้ดีไปกว่าการป้อนข้อมูลของคุณ

ถาม: เมื่อใช้รูปแบบ DisplayAs ฉันสามารถแสดงชุดอักขระที่ไม่เกี่ยวข้องกับภาษาต้นฉบับที่ถอดเสียงได้หรือไม่ (เช่น เอาท์พุท “ถนน” เป็น“ 街道“)

ได้ แม้วลีจะสามารถใช้ชุดอักขระที่จำกัดสำหรับบางภาษาที่เจาะจงเท่านั้น แต่เราสามารถใช้อักขระ UTF-8 นอกเหนือจาก \t (TAB) ในคอลัมน์ DisplayAs ได้

ถาม: การตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทานข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) พร้อมใช้งานกับ API ของ Transcribe ทั้งแบบกลุ่มและสตรีมมิงหรือไม่

ใช่ Amazon Transcribe รองรับการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII สำหรับ API ทั้งแบบกลุ่มและสตรีมมิ่ง

ถาม: การตรวจทานเนื้อหา / การระบุและการตรวจทาน PII อัตโนมัติรองรับภาษาใดบ้าง

โปรดไปที่เอกสารประกอบของ Amazon Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานในการตรวจทานเนื้อหาอัตโนมัติ / การตรวจทาน PII

ถาม: การตรวจทานเนื้อหาอัตโนมัติรวบรวมข้อมูลส่วนตัวที่ละเอียดอ่อนจากเสียงต้นทางด้วยหรือไม่

ไม่ คุณสมบัตินี้จะไม่นำข้อมูลส่วนตัวที่ละเอียดอ่อนออกจากเสียงต้นทาง อย่างไรก็ตาม Amazon Transcribe Call Analytics จะลบข้อมูลส่วนบุคคลที่ละเอียดออกอ่อนจากการถอดเสียงและไฟล์เสียงต้นทาง เข้าชมลิงก์สำหรับรายละเอียดเพิ่มเติมว่าการวิเคราะห์การโทรสามารถแก้ไขเสียงได้อย่างไร คุณยังสามารถตรวจทานข้อมูลส่วนตัวจากเสียงต้นทางได้ด้วยตนเองโดยใช้ตราประทับเวลาเริ่มและสิ้นสุดที่มีให้ในทรานสคริปต์ที่ตรวจทานแล้ว เพื่อดูอินสแตนซ์แต่ละรายการของการพูด PII ที่ระบุ โปรดดูที่โซลูชันการแก้ไขเสียงนี้ สำหรับมาตรฐาน Transcribe APIs

อย่างไรก็ตาม Amazon Transcribe Call Analytics APIs แบบเฉพาะทางจะลบข้อมูลส่วนบุคคลที่ละเอียดอ่อนออกจากทั้งการถอดเสียงและไฟล์เสียงต้นทาง เพื่อเรียนรู้เพิ่มเติม ดูได้ที่ เอกสารประกอบการแก้ไขเสียง Call Analytics

ถาม: ฉันสามารถใช้การตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจทานข้อมูลส่วนตัวจากทรานสคริปต์ข้อความที่มีอยู่แล้วได้หรือไม่

ไม่ได้ การตรวจทานเนื้อหาอัตโนมัติทำงานเฉพาะกับเสียงในลักษณะอินพุตเท่านั้น

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการตรวจทานเนื้อหาอัตโนมัติ

การตรวจทานเนื้อหาอัตโนมัติถูกออกแบบมาเพื่อระบุและลบข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) แต่เนื่องจากการทำงานเชิงคาดการณ์ของแมชชีนเลิร์นนิง อาจไม่สามารถระบุและนำอินสแตนซ์ทั้งหมดของ PII ที่ปรากฎอยู่ในทรานสคริปต์ที่สร้างขึ้นจากการบริการออกได้ทั้งหมด คุณควรตรวจสอบเอาต์พุตจากการตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจสอบให้แน่ใจว่าตรงตามความต้องการของคุณ

ถาม: มีความแตกต่างระหว่างการตรวจทานเนื้อหาอัตโนมัติสำหรับ API ทั้งแบบกลุ่มและสตรีมมิงหรือไม่

มี จะมีความสามารถเพิ่มเติมสองรายการโดยจะตรวจทานเนื้อหาอัตโนมัติสำหรับ API สตรีมมิ่งที่ไม่รองรับโดย API แบบกลุ่ม คุณสามารถตัดสินใจระบุ PII และไม่ตรวจทานเนื้อหาเมื่อใช้การสร้างการตรวจสอบเนื้อหาที่มี API สตรีมมิง นอกจากนี้ คุณมีความสามารถในการระบุหรือตรวจทานประเภท PII ที่เฉพาะเจาะจง ด้วย API สตรีมมิง ตัวอย่างเช่น คุณสามารถตรวจทานหมายเลขประกันสังคมและข้อมูลบัตรเครดิต รวมถึงเก็บ PII อื่นๆ อย่างชื่อและที่อยู่อีเมลไว้ได้

ถาม: AWS Region ใดมีการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII พร้อมใช้งาน

โปรดไปที่เอกสารประกอบของ Amazon Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานของการตรวจทานเนื้อหาอัตโนมัติและการตรวจทาน PII สำหรับ API แบบกลุ่มและสตรีมมิงใน AWS Region

ถาม: API ใดบ้างที่รองรับการระบุภาษาอัตโนมัติ

ในปัจจุบัน มีการรองรับการระบุภาษาอัตโนมัติสำหรับ API แบบเป็นชุดและ API การสตรีม

ถาม: Amazon Transcribe สามารถระบุภาษาใดได้โดยอัตโนมัติ

Amazon Transcribe สามารถระบุทุกภาษาที่ API แบบกลุ่มและ API การสตรีมรองรับ ไปที่นึ่สำหรับ รายละเอียดเกี่ยวฟีเจอร์ภาษาที่รองรับและภาษาแบบเฉพาะ.

ถาม: Amazon Transcribe ระบุภาษาหลายภาษาในไฟล์เสียงเดียวกันหรือไม่

Amazon Transcribe รองรับ ID ในหลายภาษาสำหรับแบตช์ ดู ลิงก์นี้ สำหรับรายละเอียดเพิ่มเติม

ถาม: มีวิธีที่จะสามารถจำกัดรายการภาษาเพื่อเลือกจากการรองรับการระบุภาษาอัตโนมัติหรือไม่

มี คุณสามารถระบุรายการภาษาที่อาจมีอยู่ในไลบรารีสื่อของคุณได้ เมื่อคุณระบุรายการภาษา ระบบจะเลือกภาษาที่ระบุไว้จากรายการดังกล่าว หากไม่มีการระบุภาษา ระบบจะประมวลผลไฟล์เสียงเทียบกับภาษาทั้งหมดที่ Amazon Transcribe รองรับ และเลือกภาษาที่น่าจะเป็นไปได้มากที่สุด ความถูกต้องในการระบุภาษานั้นจะยิ่งมากขึ้น เมื่อมีการระบุรายการภาษาที่เลือกไว้ ดู ลิงก์นี้ สำหรับรายละเอียดเพิ่มเติม

ราคาและความพร้อมใช้งาน

ถาม: ราคาเท่าไหร่

โปรดดูที่หน้าราคา Amazon Transcribe เพื่อเรียนรู้เพิ่มเติม

ถาม: มี AWS Region ใดบ้างที่ Amazon Transcribe เปิดให้บริการ

โปรดดูที่ตารางภูมิภาคโครงสร้างพื้นฐานโดยรวมของ AWS ไปที่นี่สำหรับ รายละเอียดเพิ่มเติมเกี่ยวกับตำแหน่งข้อมูล Amazon Transcribe และโควตา

ความเป็นส่วนตัวของข้อมูล

ถาม: ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดย Amazon Transcribe มีการจัดเก็บหรือไม่ และ AWS นำไปใช้อย่างไร

Amazon Transcribe อาจจัดเก็บและใช้ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดยบริการเท่านั้นในการจัดหาและบำรุงรักษาบริการและเพื่อปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ การใช้เนื้อหาของคุณเป็นสิ่งสำคัญสำหรับการปรับปรุงประสบการณ์ของลูกค้า Amazon Transcribe ของคุณอย่างต่อเนื่อง รวมถึงการพัฒนาและฝึกอบรมเทคโนโลยีที่เกี่ยวข้อง เราไม่ใช้ข้อมูลที่สามารถระบุตัวบุคคลใดๆ ที่อาจมีอยู่ในเนื้อหาของคุณเพื่อกำหนดเป้าหมายผลิตภัณฑ์ บริการ หรือการตลาดให้กับคุณหรือผู้ใช้ปลายทางของคุณ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/ คุณอาจเลือกที่จะไม่อนุญาตให้ใช้เนื้อหาของคุณในการปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นๆ ของ Amazon ได้โดยใช้นโยบายการเลือกที่จะไม่อนุญาตของ AWS Organizations ดูข้อมูลเกี่ยวกับวิธีการเลือกที่จะไม่ใช้ ได้ที่นโยบายการเลือกที่จะไม่ใช้บริการ AI

ถาม: ฉันจะลบข้อมูลและอาร์ทิแฟกต์ที่เกี่ยวข้องกับงานการถอดความซึ่ง Amazon Transcribe จัดเก็บไว้ได้หรือไม่

ได้ คุณสามารถใช้ Delete API ที่มีอยู่ในการลบข้อมูลและสิ่งประดิษฐ์อื่นๆ ที่เกี่ยวข้องกับงานด้านการถอดความได้ หากคุณมีปัญหาในการดำเนินการ โปรดติดต่อ AWS Support

ถาม: ใครมีสิทธิ์เข้าถึงเนื้อหาที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้

พนักงานที่ได้รับอนุญาตเท่านั้นที่จะมีสิทธิ์เข้าถึงเนื้อหาของคุณที่ Amazon Transcribe ประมวลผลไว้ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/

ถาม: ฉันยังคงเป็นเจ้าของเนื้อหาของฉันที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้หรือไม่

คุณจะเป็นเจ้าของเนื้อหาของคุณเสมอ และเราจะใช้เนื้อหาของคุณเมื่อได้รับความยินยอมจากคุณเท่านั้น

ถาม: เกิดอะไรขึ้นกับข้อมูลของฉันที่ใช้ในการฝึกโมเดลภาษาแบบกำหนดเอง ฉันจะยังเป็นเจ้าของข้อมูลดังกล่าวอยู่หรือไม่

เมื่อส่งข้อมูลข้อความที่ใช้ในการฝึกโมเดลเฉพาะ คุณจะเป็นเจ้าของทั้งข้อมูลข้อความดั้งเดิมและโมเดลแบบกำหนดเองที่สร้างขึ้น เราจะไม่จัดเก็บข้อมูลข้อความดังกล่าว รวมถึงไม่นำไปใช้ในการปรับปรุงเครื่องมือการรู้จำเสียงพูดทั่วไปของเราแต่อย่างใด โมเดลที่สร้างด้วยการใช้ CLM จะเป็นโมเดลแบบครบวงจรและมีเพียงคุณที่เข้าถึงได้

ถาม: การที่ระบบไม่เก็บข้อมูลการฝึกของฉันเอาไว้จะมีข้อเสียหรือการเสื่อมใดๆ ต่อคุณภาพการถอดเสียงหรือประสบการณ์โดยรวมในการให้บริการหรือไม่

การที่บริการของเราไม่ได้จัดเก็บข้อมูลการฝึกของคุณเอาไว้จะไม่ทำให้คุณภาพของการถอดเสียงเสื่อมลง เมื่อข้อมูลการฝึกถูกนำมาใช้ในการสร้างโมเดลภาษาแบบกำหนดเองแล้ว ตัวโมเดลดังกล่าวจะพร้อมให้คุณใช้งานซ้ำได้ตามความต้องการ ชุดข้อมูลต้นฉบับสำหรับการฝึกที่คุณอัปโหลดไว้จะถูกลบออกจากระบบของเรา ข้อเสียเพียงอย่างเดียวก็คือในกรณีที่คุณต้องการการสนับสนุนด้านเทคนิค เนื่องจากเราไม่ได้เก็บข้อมูลต้นฉบับสำหรับการฝึกของคุณเอาไว้ เราจึงไม่สามารถเข้าถึงสินทรัพย์เหล่านั้นหรือสิ่งประดิษฐ์ตัวกลางที่เกี่ยวข้องอย่างสะดวกได้ หากคุณต้องการให้ทีมสนับสนุนตรวจสอบปัญหาด้านการบริการที่อาจเกิดขึ้น การสนับสนุนจะยังคงมีอยู่ แต่จะไม่สามารถทำได้โดยสะดวกนักเนื่องจากเราอาจจำเป็นต้องขอข้อมูลจากคุณเพิ่มเติม

ถาม: ฉันจะนำข้อมูลกลับมาใช้ซ้ำเพื่อการอัปเดตหรือปรับปรุงโมเดลในอนาคตได้อย่างไร

เนื่องจากระบบไม่ได้จัดเก็บข้อมูลการฝึกเอาไว้ คุณจึงจำเป็นต้องอัปโหลดข้อมูลชุดเดิม รวมถึงข้อมูลเพิ่มเติมใดๆ อีกครั้งเพื่อฝึกโมเดลใหม่ เมื่อมีการอัปเดตโมเดลพื้นฐานโดย Amazon Transcribe เราจะแจ้งให้คุณทราบ โดยเราแนะนำให้คุณส่งข้อมูลเพื่อฝึกโมเดลใหม่เพื่อใช้ประโยชน์จากโมเดลพื้นฐานที่อัปเดตล่าสุด ซึ่งจะทำให้คุณมีทั้งโมเดลต้นฉบับแบบกำหนดเองที่สร้างไว้ก่อนหน้านี้และโมเดลเวอร์ชันใหม่ไว้ใช้งาน

ถาม: ฉันจะลบโมเดลได้อย่างไร

คุณสามารถลบโมเดลภาษาลูกค้าใดก็ได้ที่คุณสร้างขึ้นตามความต้องการของคุณ

ถาม: เนื้อหาที่ Amazon Transcribe ประมวลผลถูกย้ายออกจาก AWS Region ที่ฉันกำลังใช้ Amazon Transcribe อยู่หรือไม่

เนื้อหาใดๆ ที่ Amazon Transcribe ประมวลผลจะถูกเข้ารหัสและจัดเก็บเป็นข้อมูลที่ไม่ใช้งานไว้ในเขต AWS ที่คุณกำลังใช้ Amazon Transcribe อยู่ เนื้อหาบางส่วนที่ Amazon Transcribe ประมวลผลอาจถูกจัดเก็บไว้ในเขต AWS อื่นที่เกี่ยวข้องกับการปรับปรุงและการพัฒนาประสบการณ์การใช้งานของลูกค้า Amazon Transcribe ของคุณและเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อย่างต่อเนื่องเท่านั้น หากคุณเลือกที่จะไม่ให้ใช้เนื้อหาของคุณในการพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ โดยการติดต่อ AWS Support เนื้อหาของคุณจะไม่ถูกจัดเก็บไว้ในเขต AWS อื่น คุณสามารถส่งคำขอในการลบข้อมูลเสียงป้อนเข้าที่เกี่ยวข้องกับบัญชีของคุณได้โดยการติดต่อ AWS Support เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/

ถาม: ฉันสามารถใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปี และอยู่ภายใต้กฎหมายคุ้มครองข้อมูลออนไลน์ส่วนบุคคลของเด็ก (COPPA) ได้หรือไม่

ได้ ภายใต้ข้อกำหนดการให้บริการของ Amazon Transcribe รวมถึงพันธะผูกพันของคุณในการระบุข้อมูลการแจ้งที่จำเป็นใดๆ และรับการยินยอมจากผู้ปกครองที่สามารถตรวจสอบได้ที่จำเป็นภายใต้ COPPA คุณอาจใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนได้

ถาม: ฉันจะระบุได้อย่างไรว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันของฉันอยู่ภายใต้ COPPA

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อกำหนดของ COPPA และคู่มือในการระบุว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ของคุณอยู่ภายใต้ COPPA หรือไม่ โปรดดูแหล่งข้อมูลที่คณะกรรมการพาณิชย์กลางแห่งสหรัฐอเมริกามีให้และเป็นผู้ดูแลได้โดยตรง เว็บไซต์นี้ยังมีข้อมูลเกี่ยวกับวิธีการระบุว่าการบริการถูกส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนหรือไม่อีกด้วย

Amazon Transcribe Call Analytics

ถาม: Amazon Transcribe Call Analytics คืออะไร

Amazon Transcribe Call Analytics คือ API ที่ขับเคลื่อนด้วย AI ซึ่งมอบข้อมูลการถอดเสียงการโทรที่ครบถ้วนสมบูรณ์และข้อมูลเชิงลึกการสนทนาที่นำไปใช้ได้จริง โดยคุณสามารถเพิ่มลงในแอปพลิเคชันการโทรต่างๆ เพื่อปรับปรุงประสบการณ์ของลูกค้าและประสิทธิภาพการทำงานของเจ้าหน้าที่ได้ โดยมีการผสมผสานรูปแบบเสียงพูดเป็นข้อความที่มีประสิทธิภาพและรูปแบบการประมวลผลภาษาธรรมชาติที่กำหนดเอง (NLP) ที่ฝึกมาโดยเฉพาะเพื่อทำความเข้าใจการดูแลลูกค้าและการโทรออกสำหรับการขาย API นี้เป็นส่วนหนึ่งของโซลูชัน AWS Contact Center Intelligence (CCI) ซึ่งไม่ขึ้นกับศูนย์ติดต่อใดๆ และช่วยให้ลูกค้าและ ISV สามารถเพิ่มคุณสมบัติการวิเคราะห์การโทรลงในแอปพลิเคชันได้ง่ายขึ้น

ถาม: ฉันทำอะไรกับ Amazon Transcribe Call Analytics ได้บ้าง

Amazon Transcribe Call Analytics สามารถทำได้ทั้งการวิเคราะห์ตามเวลาจริงและการวิเคราะห์หลังการโทร Call Analytics ช่วยให้ผู้พัฒนาสามารถเพิ่มข้อมูลอันมีค่าได้อย่างรวดเร็ว เช่น คะแนนความเชื่อมั่นของลูกค้าและเจ้าหน้าที่ ปัจจัยขับเคลื่อนการโทร หมวดหมู่การโทร การสรุปการโทร เป็นเอาต์พุต API ไปยังแอปพลิเคชันการโทรเข้าหรือโทรออก กรณีการใช้งานที่พบบ่อยรวมถึงการช่วยเหลือเจ้าหน้าที่ การสรุป การแจ้งเตือนจากหัวหน้างาน และการวิเคราะห์การโทร ต่อไปนี้คือโซลูชันตัวอย่างแบบโอเพ่นซอร์สสองแบบที่ใช้ Transcribe Call Analytics: การวิเคราะห์การโทรตามเวลาจริงด้วยความช่วยเหลือของเจ้าหน้าที่ และการวิเคราะห์หลังการโทร

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Call Analytics ได้อย่างไร

คุณสามารถใช้ Transcribe Call Analytics ได้ผ่าน API และคอนโซลการจัดการของ AWS งานวิเคราะห์สามารถถูกสร้างและตรวจสอบได้ผ่าน API หรือคอนโซล ในคอนโซล คุณจะเห็นถึงรายชื่อของงานการวิเคราะห์ และหน้ารายละเอียดงานกับพารามิเตอร์อินพุตและตัวอย่างเอาท์พุต JSON นอกจากนี้ คุณยังสามารถสร้าง และแก้ไขหมวดหมู่ต่างๆ ผ่าน API หรือ Console ได้ด้วยคุณสมบัติการจัดหมวดหมู่ผู้ติดต่ออัตโนมัติ

ถาม: Amazon Transcribe Call Analytics รองรับภาษาใดบ้าง

โปรดดูที่เอกสารประกอบ Amazon Transcribe สำหรับข้อมูลเกี่ยวกับ ภาษาที่พร้อมใช้งานใน Amazon Transcribe Call Analytics.

ถาม: Amazon Transcribe Call Analytics พร้อมใช้งานใน AWS Region ใดบ้าง

โปรดดูที่ เอกสารประกอบการให้บริการ AWS Region สำหรับข้อมูลเกี่ยวกับความครอบคลุมของ AWS Region สำหรับ Amazon Transcribe Call Analytics โปรดทราบว่าการสรุปการโทรแบบช่วยสร้างของ Amazon Transcribe Call Analytics จะมีให้บริการเป็นคุณสมบัติตัวอย่างเฉพาะในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ) และสหรัฐอเมริกาฝั่งตะวันตก (ออริกอน) เท่านั้น

ถาม: การสรุปการโทรแบบช่วยสร้างจะใช้ได้กับ Transcribe Call Analytics API ทั้งหลังจบสายสนทนาและแบบเรียลไทม์หรือไม่

ในตอนนี้ การสรุปการโทรแบบช่วยสร้างจะมีให้บริการใน Transcribe Call Analytics API สำหรับการวิเคราะห์หลังจบสายสนทนาเท่านั้น

ถาม: ราคาของ Amazon Transcribe Call Analytics คิดอย่างไร

ราคาของ Amazon Transcribe Call Analytics API จะคิดแยกจาก Amazon Transcribe API มาตรฐาน โปรดดูที่หน้า ราคา Amazon Transcribe สำหรับรายละเอียดเพิ่มเติม

Amazon Transcribe Medical

ถาม: Amazon Transcribe Medical คืออะไร

Amazon Transcribe Medical คือบริการการรู้จำเสียงพูดอัตโนมัติ (ASR) ที่ช่วยให้นักพัฒนาเพิ่มความสามารถในการเปลี่ยนเสียงพูดทางการแพทย์ให้เป็นตัวอักษรลงในแอปพลิเคชันได้ การใช้ Amazon Transcribe Medical คุณสามารถคัดลอกคำสั่งทางการแพทย์และเสียงพูดจากการสนทนาให้เป็นตัวอักษรได้อย่างรวดเร็วและแม่นยำสำหรับหลากหลายวัตถุประสงค์ เช่น การบันทึกข้อความของแพทย์หรือการประมวลผลในการวิเคราะห์ข้อความแบบดาวน์สตรีมเพื่อดึงข้อมูลเชิงลึกที่มีนัยสำคัญ

ถาม: ฉันทำอะไรกับ Amazon Transcribe Medical ได้บ้าง

Amazon Transcribe Medical ใช้โมเดลแมชชีนเลิร์นนิ่งขั้นสูงในการถอดความเสียงพูดทางการแพทย์ให้เป็นตัวอักษรได้อย่างถูกต้อง Transcribe Medical สามารถสร้างการถอดเสียงข้อความที่สามารถใช้เพื่อรองรับการใช้งานในกรณีต่างๆ โดยครอบคลุมถึงลำดับงานของเอกสารทางคลินิกและการตรวจสอบความปลอดภัยของยา (การติดตามความปลอดภัยจากการใช้ยา) เพื่อทำคำบรรยายใต้ภาพสำหรับการแพทย์ทางไกล และแม้กระทั่งการติดต่อศูนย์วิเคราะห์ในโดเมนด้านการดูแลสุขภาพและวิทยาศาสตร์สุขภาพ

ถาม: ฉันต้องเป็นผู้เชี่ยวชาญด้านการรู้จำเสียงพูดอัตโนมัติ (ASR) ในการใช้ Amazon Transcribe Medical หรือไม่

ไม่ คุณไม่ต้องมีความเชี่ยวชาญด้าน ASR หรือแมชชีนเลิร์นนิ่งในการใช้งาน Amazon Transcribe Medical คุณเพียงต้องเรียก API ของ Transcribe Medical และการบริการจะจัดการกับแมชชีนเลิร์นนิ่งที่จำเป็นในแบ็คเอนด์เพื่อถอดความเสียงพูดทางการแพทย์เป็นตัวอักษร

ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Medical ได้อย่างไร

คุณสามารถเริ่มต้นใช้งาน Amazon Transcribe Medical ได้จาก AWS Management Console หรือด้วยการใช้ SDK โปรดดูรายละเอียดในเอกสารทางเทคนิคหน้านี้

Amazon Transcribe Medical มีช่วงทดลองฟรีเพื่อให้คุณสามารถทดสอบบริการได้ โปรดดูข้อมูลเพิ่มเติมในหน้าราคานี้

ถาม: Amazon Transcribe Medical รองรับภาษาใดบ้าง

ขณะนี้ Amazon Transcribe Medical รองรับการถอดความเสียงพูดทางการแพทย์ในภาษาอังกฤษแบบสหรัฐอเมริกา

ถาม: Amazon Transcribe Medical รองรับการแพทย์เฉพาะทางด้านใดบ้าง

Amazon Transcribe Medical รองรับการถอดเสียงสำหรับการรักษาแบบพื้นฐานและการรักษาแบบเฉพาะทางหลากหลายรายการ ไปที่เอกสารประกอบของเราเพื่อดูรายการของการแพทย์เฉพาะทางทั้งหมดที่รองรับ

ถาม: Amazon Transcribe Medical พร้อมใช้งานใน AWS Region ใดบ้าง

โปรดดูที่ เอกสารประกอบการให้บริการ AWS Region สำหรับข้อมูลเกี่ยวกับความครอบคลุมของ AWS Region สำหรับ Amazon Transcribe Medical

ถาม: Amazon Transcribe Medical คิดราคาอย่างไร

โปรดดูที่หน้าราคา Amazon Transcribe Medical เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียดราคา

ถาม: Amazon Transcribe Medical มีคุณสมบัติตรงตาม HIPAA หรือไม่

มี

ถาม: มีการใช้เนื้อหาที่ประมวลผลโดย Amazon Transcribe Medical เพื่อจุดประสงค์อื่นนอกเหนือจากการให้บริการหรือไม่

Amazon Transcribe Medical ไม่ได้ใช้เนื้อหาที่ประมวลผลโดยการให้บริการสำหรับเหตุผลอื่นใดที่นอกเหนือไปจากเพื่อการให้บริการและรักษาการให้บริการ เนื้อหาที่ประมวลผลโดยบริการจะไม่ถูกนำไปใช้เพื่อพัฒนาหรือปรับปรุงคุณภาพของ Amazon Transcribe Medical หรือเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นใดของ Amazon

ถาม: Amazon Transcribe Medical มีการเรียนรู้ตลอดเวลาหรือไม่

มี Amazon Transcribe Medical ใช้แมชชีนเลิร์นนิ่งและได้รับการฝึกฝนอย่างต่อเนื่องเพื่อให้ทำงานได้ดีขึ้นสำหรับกรณีใช้งานของลูกค้า Amazon Transcribe Medical ไม่ได้จัดเก็บหรือใช้ข้อมูลลูกค้าที่ใช้กับบริการในการฝึกโมเดล

ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการ Amazon Transcribe Medical

Amazon Transcribe Medical ไม่ได้ใช้แทนคำแนะนำทางการแพทย์ การวินิจฉัย หรือการรักษาจากมืออาชีพ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่ในการใช้ดุลยพินิจ ประสบการณ์ และวิจารณญาณในการพิจารณาความถูกต้อง ความครบถ้วน ความตรงต่อเวลา และความเหมาะสมของข้อมูลใดๆ ที่ Amazon Transcribe Medical มอบให้ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่แต่เพียงผู้เดียวในการตัดสินใจ ให้คำแนะนำ การดำเนินการ และ/หรือการไม่ดำเนินการใดๆ ที่อ้างอิงจากการใช้ Amazon Transcribe Medical 

Amazon Transcribe Medical อาจไม่สามารถระบุข้อมูลสุขภาพที่ได้รับการคุ้มครองได้อย่างแม่นยำในทุกสถานการณ์ และไม่เป็นตามข้อกำหนดสำหรับการไม่ระบุตัวตนของข้อมูลสุขภาพที่ได้รับการคุ้มครองซึ่งสอดคล้องกับ HIPAA คุณมีหน้าที่ในการตรวจสอบผลลัพธ์ใดๆ ที่ได้จาก Amazon Transcribe Medical เพื่อให้แน่ใจว่าตรงตามความต้องการของคุณ

โมเดลภาษาแบบกำหนดเอง

ถาม: ปัจจุบันนี้โมเดลภาษาแบบกำหนดเองมีฟังก์ชันอะไรบ้าง

คุณสามารถใช้โมเดลภาษาแบบกำหนดเอง (CLM) เพื่อฝึกฝนและพัฒนาโมเดลภาษาเฉพาะแวดวงที่คุณต้องการได้ ขณะนี้ CLM รองรับการถอดเสียงเป็นชุดในภาษาอังกฤษ (ออสเตรเลีย), อังกฤษ (บริติช), ฮินดู, อังกฤษ (สหรัฐอเมริกา) และสเปน (สหรัฐอเมริกา) และการถอดเสียงสำหรับการสตรีมในภาษาอังกฤษแบบอเมริกัน CLM จะรองรับการใช้งานคำศัพท์แบบกำหนดเองพร้อมกันสำหรับการถอดเสียงเป็นชุด

ถาม: ฉันจำเป็นต้องใช้ข้อมูลการฝึกอบรมมากน้อยเพียงใดและต้องให้ข้อมูลประเภทใด ฉันจะหาข้อมูลดังกล่าวมาได้อย่างไร ข้อมูลจำเป็นต้องอยู่ในรูปแบบที่เฉพาะเจาะจงหรือไม่

ข้อมูลข้อความควรมีเนื้อหาเกี่ยวข้องกับเสียงที่คุณจะถอดโดยใช้โมเดลแบบกำหนดเอง ข้อมูลควรประกอบด้วยคำศัพท์ วลี และการรวมคำเฉพาะโดเมนให้มากที่สุดเท่าที่จะเป็นไปได้ เราขอแนะนำให้ใช้ข้อความที่ต่อเนื่องกันอย่างน้อย 100,000 คำ และไม่เกิน 10 ล้านคำ ทรัพยากรข้อมูลข้อความอาจมาจากแหล่งข้อมูลในองค์กรหรือแหล่งข้อมูลสาธารณะใดๆ ก็ได้ (เช่น ใช้ข้อความจากเว็บไซต์ของลูกค้า) เราขอแนะนำให้ไฟล์ข้อความธรรมดาแต่ละไฟล์มีจำนวน 200,000 คำขึ้นไป แต่ขนาดไฟล์โดยรวมต้องไม่เกิน 1 GB ข้อความควรอยู่ในรูปแบบ UTF-8 และมีหนึ่งประโยคต่อบรรทัด แต่ละประโยคควรมีเครื่องหมายวรรคตอน ผู้ใช้มีหน้าที่ตรวจสอบการสะกด ลบอักขระการจัดรูปแบบ และตรวจสอบความถูกต้องของการเข้ารหัส

ถาม: ฉันจะใช้โมเดลภาษาแบบกำหนดเอง (CLM) ได้อย่างไร

ในการฝึกโมเดลภาษาแบบกำหนดเองนั้น ลูกค้าเพียงแค่ใส่ข้อมูลข้อความไว้ในบัคเก็ต Amazon S3 ก็สามารถใช้งานได้แล้ว จากนั้นจึงใช้คอนโซลบริการของ Amazon Transcribe ในการโหลดและประมวลผลข้อมูลเพื่อฝึกโมเดลภาษาแบบกำหนดเอง การฝึกจะทำงานโดยอัตโนมัติอย่างเต็มรูปแบบ และต้องการการแทรกแซงจากผู้ใช้เพียงเล็กน้อยเท่านั้น โมเดลแบบกำหนดเองขั้นสุดท้ายที่เสร็จเรียบร้อยแล้วจะอยู่ในบัญชี AWS ของลูกค้าเพื่อใช้สำหรับถอดเสียงจากไฟล์เสียงเฉพาะโดเมน นอกจากนี้ ลูกค้าสามารถฝึกโมเดลแบบกำหนดเองได้หลายโมเดลเพื่อใช้กับกรณีใช้งานที่แตกต่างกันไป

ถาม: การปรับปรุงต่างๆ มีการรับประกันหรือไม่ การลงทุนไปกับความพยายามในการเก็บรวบรวมข้อมูลข้อความจะคุ้มค่าหรือไม่

การปรับปรุงต่างๆ นั้นไม่มีการรับประกัน การเปลี่ยนแปลงของประสิทธิภาพจะขึ้นอยู่กับว่าข้อมูลข้อความตรงกับไฟล์เสียงมากน้อยเพียงใด และขึ้นอยู่กับปริมาณข้อมูลที่ให้ไว้ โดยทั่วไปแล้วข้อมูลยิ่งมากก็ยิ่งดี แต่สิ่งสำคัญที่สุดคือข้อมูลควรมีเนื้อหาครอบคลุมคำศัพท์และลำดับของคำที่คาดว่าจะพบในไฟล์เสียงที่คุณตั้งใจจะถอดเสียง การปรับปรุงความแม่นยำของการถอดเสียงจะขึ้นอยู่กับคุณภาพของข้อมูลการฝึกและกรณีใช้งาน ในบางกรณี การเทียบเคียงทั่วไปบ่งชี้ว่าความแม่นยำสัมพัทธ์มีประสิทธิภาพยิ่งขึ้น 10% ถึง 15%

ถาม: การฝึกโมเดลใช้เวลานานเท่าใด ฉันจะสามารถใช้โมเดลได้เมื่อใด

โดยทั่วไป การฝึกโมเดลจะใช้เวลาระหว่าง 6 ถึง 10 ชั่วโมง ระยะเวลาในการฝึกขึ้นอยู่กับว่าชุดข้อมูลมีขนาดใหญ่เพียงใด โมเดลแบบกำหนดเองจะพร้อมให้ใช้งานได้ทันทีหลังจากที่ฝึกเสร็จเรียบร้อยแล้ว

ถาม: ฉันจะสามารถใช้โมเดลนี้ได้อย่างไร ฉันจะทราบได้อย่างไรว่าโมเดลนี้ทำงานได้ดีกว่าโมเดลทั่วไปที่ Amazon Transcribe มีให้บริการ

โมเดลจะพร้อมใช้งานในบัญชีของคุณภายใต้ ID โมเดลที่คุณกำหนดก่อนกระบวนการในการฝึก หากต้องการใช้โมเดลดังกล่าว ลูกค้าจะต้องเพิ่มค่าสถานะที่มี ID โมเดลไปยังคำขอการถอดเสียง คุณควรทดสอบโมเดลกับไฟล์เสียงของคุณและเปรียบเทียบเอาท์พุตกับผลลัพธ์ที่ได้จากเครื่องมือทั่วไป

ถาม: ฉันสามารถฝึกโมเดลภาษาแบบกำหนดเองได้กี่โมเดล ฉันสามารถเปิดใช้งานหลายโมเดลพร้อมกันสำหรับบัญชีของฉันได้หรือไม่

คุณสามารถฝึกโมเดลพร้อมกันได้สูงสุดครั้งละ 5 โมเดลต่อบัญชี AWS หนึ่งบัญชี สำหรับแต่ละบัญชี คุณสามารถจัดเก็บได้สูงสุด 10 โมเดลตามค่าเริ่มต้น หากต้องการจัดเก็บโมเดลเพิ่มเติม คุณสามารถเพิ่มขีดจำกัดการใช้บริการได้ที่นี่

ถาม: ระบบสนับสนุนโมเดลเสียงแบบกำหนดเองหรือไม่

ไม่ ระบบไม่สนับสนุนโมเดลเสียงแบบกำหนดเอง โมเดลภาษาแบบกำหนดเองนั้นสร้างขึ้นมาจากข้อมูลข้อความที่เกี่ยวข้องกับกรณีใช้งานหรือโดเมนของคุณ

เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Transcribe

ไปที่หน้าราคา
พร้อมเริ่มต้นใช้งานหรือยัง
ลองใช้ Amazon Transcribe Console
มีคำถามเพิ่มเติมไหม
ติดต่อเรา