ข้อมูลทั่วไป
ถาม: Amazon Transcribe คืออะไร
Amazon Transcribe คือบริการ ปัญญาประดิษฐ์ (AI) AWS ที่จะทำให้การเปลี่ยนคำพูดเป็นข้อความเป็นเรื่องง่ายสำหรับคุณ การใช้เทคโนโลยี Automatic Speech Recognition (ASR) คุณสามารถใช้ Amazon Transcribe กับแอปพลิเคชันทางธุรกิจได้อย่างหลากหลาย ซึ่งครอบคลุมถึงการถอดเสียงสำหรับสายโทรบริการลูกค้าที่ใช้เสียงเป็นหลัก, การสร้างคำบรรยายใต้ภาพบนคอนเทนต์เสียง/วิดีโอ และทำการวิเคราะห์คอนเทนต์ (ที่เป็นข้อความ) บนคอนเทนต์เสียง/วิดีโอ
ถาม: Amazon Transcribe โต้ตอบกับผลิตภัณฑ์อื่นๆ ของ AWS อย่างไร
Amazon Transcribe แปลงข้อมูลเสียงป้อนเข้าให้เป็นข้อความ ซึ่งเป็นการเปิดโอกาสให้แอปพลิเคชันการวิเคราะห์ข้อความต่างๆ สามารถทำงานกับข้อมูลเสียงขาเข้าได้ ตัวอย่างเช่น การใช้ Amazon Comprehend กับข้อมูลข้อความที่แปลงจาก Amazon Transcribe จะช่วยให้คุณสามารถทำการวิเคราะห์ความเชื่อมั่นหรือสกัดเอกลักษณ์หรือวลีสำคัญออกมาได ในลักษณะเดียวกัน การผสานรวมกับ Amazon Translate และ Amazon Polly จะช่วยให้คุณสามารถรับข้อมูลเสียงป้อนเข้าในภาษาหนึ่ง แปลเป็นอีกภาษาหนึ่ง และสร้างข้อมูลเสียงออกได้ ซึ่งทำให้สามารถสร้างการสนทนาหลากภาษาได้อย่างมีประสิทธิภาพ อีกทั้งยังสามารถผสาน Amazon Transcribe เข้ากับ Amazon Kendra หรือ Amazon OpenSearch เพื่อทำดัชนีและทำการค้นหาแบบอิงตามข้อมูลได้ทั่วทั้งไลบรารีเสียง/วิดีโอ เพื่อเรียนรู้เพิ่มเติม กรุณาดูที่ Live Call Analytics and Agent Assist, Post Call Analytics, MediaSearch, หรือโซลูชัน Content Analysis
ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้งาน Amazon Transcribe
Amazon Transcribe ออกแบบมาเพื่อรับมือกับคำพูดและการแสดงออกผ่านเสียงหลากหลายรูปแบบ ซึ่งรวมถึงความดัง ระดับเสียงสูงต่ำ และความเร็วในการพูดที่แตกต่างกัน คุณภาพและคอนเทนต์ของสัญญาณเสียง (รวมถึงแต่ไม่จำกัดเพียงปัจจัยต่างๆ อาทิ เสียงรบกวนในพื้นหลัง ผู้พูดที่พูดพร้อมกัน คำพูดเน้นเสียง หรือสลับไปมาระหว่างภาษาต่างๆ ภายในไฟล์เสียงเดียว) อาจส่งผลต่อความแม่นยำของข้อมูลออกของบริการ เราอัปเดตบริการอย่างต่อเนื่องเพื่อปรับปรุงความสามารถในการปรับให้รับกับความหลากหลายทางเสียงเพิ่มเติมและประเภทคอนเทนต์ต่างๆ
การใช้ Amazon Transcribe
ถาม: นักพัฒนาจะเข้าถึง Amazon Transcribe ได้อย่างไร
วิธีที่ง่ายที่สุดในการเริ่มต้นใช้งาน คือให้ส่งงานโดยใช้คอนโซลเพื่อถอดความไฟล์เสียงให้เป็นข้อความ นอกจากนี้ คุณสามารถโทรหาบริการโดยตรงจาก AWS Command Line Interface หรือเลือกใช้หนึ่งใน SDK ที่รองรับที่คุณต้องการเพื่อสร้างด้วยแอปพลิเคชันของคุณ ไม่ว่าจะเลือกวิธีใดก็ตาม คุณก็สามารถเริ่มต้นใช้งาน Amazon Transcribe เพื่อสร้างทรานสคริปต์โดยอัตโนมัติสำหรับไฟล์เสียงได้โดยใช้โค้ดเพียงไม่กี่บรรทัด
ถาม: Amazon Transcribe รองรับการถอดเสียงแบบเรียลไทม์หรือไม่
ได้ Amazon Transcribe ช่วยให้คุณสามารถเปิดสตรีมแบบสองทิศทางผ่าน HTTP2 ได้ โดยคุณสามารถส่งสตรีมเสียงไปยังบริการขณะที่รับสตรีมข้อความคืนในแบบเรียลไทม์ โปรดดูที่ หน้าเอกสารประกอบ สำหรับรายละเอียดเพิ่มเติม
ถาม: การถอดเสียงแบบเรียลไทม์รองรับการเข้ารหัสใดบ้าง
ประเภทสื่อที่รองรับจะแตกต่างกันระหว่างการถอดชุดเสียงและการถอดเสียงสตรีมมิ่ง แม้ว่าทั้งสองรูปแบบจะแนะนำให้ใช้รูปแบบที่ไม่สูญเสียข้อมูลก็ตาม โปรดดูที่ หน้าเอกสารประกอบ สำหรับรายละเอียดเพิ่มเติม
ถาม: Amazon Transcribe รองรับภาษาใดบ้าง
สำหรับข้อมูลเกี่ยวกับภาษาที่รองรับ โปรดดูที่หน้าเอกสารประกอบ
ถาม: Amazon Transcribe ใช้งานได้กับอุปกรณ์ใดบ้าง
ส่วนมากแล้ว Amazon Transcribe ทำงานได้ไม่จำกัดอุปกรณ์ ซึ่งโดยทั่วไปแล้ว จะใช้งานได้กับอุปกรณ์ทุกเครื่องที่มีไมโครโฟนในตัว อาทิ โทรศัพท์ คอมพิวเตอร์ แท็บเล็ต และอุปกรณ์ IoT (เช่น ระบบเสียงรถยนต์) Amazon Transcribe API จะสามารถตรวจจับคุณภาพของสตรีมเสียงที่ป้อนเข้าไปยังอุปกรณ์ (8kHz เทียบกับ 16kHz) และจะเลือกโมเดลเสียงที่เหมาะสมสำหรับแปลงคำพูดเป็นข้อความ นอกจากนี้ นักพัฒนาสามารถเรียก Amazon Transcribe API ผ่านแอปพลิเคชันของตนเพื่อเข้าถึงความสามารถในการแปลงคำพูดเป็นข้อความได้
ถาม: มีการจำกัดขนาดของคอนเทนต์เสียงที่ Amazon Transcribe สามารถประมวลผลได้หรือไม่
สายโทรบริการ Amazon Transcribe จะจำกัดไม่เกินสี่ชั่วโมง (หรือ 2 GB) ต่อการโทร API หนึ่งครั้งสำหรับบริการแบบเป็นชุดของเรา บริการสตรีมสามารถรองรับการเชื่อมต่อแบบเปิดได้สูงสุดสี่ชั่วโมง
ถาม: Amazon Transcribe รองรับภาษาโปรแกรมใดบ้าง
บริการแบบเป็นชุดของ Amazon Transcribe รองรับ .NET, Go, Java, JavaScript, PHP, Python และ Ruby บริการเรียลไทม์ของ Amazon Transcribe รองรับ Java SDK, Ruby SDK และ C++ SDK การรองรับ SDK เพิ่มเติมจะพร้อมในไม่ช้า สำหรับรายละเอียดเพิ่มเติม กรุณาดูที่ แหล่งข้อมูล และ หน้าเอกสารประกอบ
ถาม: ระบบไม่รู้จักคำศัพท์ที่กำหนดเองของฉัน! ฉันต้องทำอย่างไร
นอกเหนือจากศัพท์แบบกำหนดเองแล้ว ข้อมูลออกของการรู้จำเสียงพูดยังขึ้นอยู่กับปัจจัยอื่นอีกหลายประการ ดังนั้นจึงไม่อาจรับประกันได้ว่าเมื่อคำศัพท์ถูกบรรจุลงในคำศัพท์แบบกำหนดเองแล้ว ระบบจะจดจำคำนั้นได้อย่างถูกต้อง อย่างไรก็ตาม สาเหตุที่พบบ่อยสุดคือไม่มีการสร้างการออกเสียงที่ถูกต้องให้คำศัพท์ที่กำหนดเองดังกล่าว หากคุณยังไม่ได้สร้างการออกเสียงให้แก่คำศัพท์ที่กำหนดเองของคุณ โปรดลงมือสร้าง หากคุณสร้างแล้ว ให้ตรวจสอบอีกครั้งว่าถูกต้องหรือไม่ หรือเพิ่มการออกเสียงที่ต่างออกไป หากจำเป็น โดยสามารถทำได้ด้วยการสร้างหลายรายการในไฟล์คำศัพท์แบบกำหนดเองที่่แตกต่างกันไปในช่องการออกเสียง โปรดดูเอกสารประกอบคำศัพท์แบบกำหนดเอง สำหรับข้อมูลเพิ่มเติม
ถาม: ทำไมฉันจึงเห็นคำที่กำหนดเองจำนวนมากเกินไปในข้อมูลออก
คำศัพท์แบบกำหนดเองเหมาะสำหรับรายการสั้นๆ ที่ประกอบด้วยคำเป้าหมายต่างๆ ซึ่งหากป้อนคำศัพท์จำนวนมากอาจส่งผลให้เกิดการสร้างคำแบบกำหนดเองเป็นจำนวนมากเกินไป โดยเฉพาะอย่างยิ่งเมื่อรายการคำศัพท์นั้นประกอบด้วยคำที่ออกเสียงคล้ายคลึงกัน หากคุณมีรายการที่ยาวมาก โปรดลองตัดให้เหลือเพียงคำที่พบยากและคำที่คาดว่าจะพบได้ในไฟล์เสียงของคุณ หากคุณมีรายการคำศัพท์ขนาดใหญ่ที่ครอบคลุมกรณีใช้งานจำนวนมาก ให้แบ่งออกเป็นรายการย่อยสำหรับกรณีใช้งานที่ต่างกัน คำสั้นๆ ที่ออกเสียงคล้ายกับคำอื่นๆ จำนวนมากอาจทำให้เกิดการสร้างมากเกินไป (มีคำศัพท์แบบกำหนดเองปรากฏเป็นจำนวนมากเกินไปในข้อมูลออก) เราขอแนะนำให้รวมคำเหล่านี้กับคำที่อยู่ใกล้เคียงแล้วเขียนเป็นวลีที่คั่นด้วยเครื่องหมายยติภังค์ ตัวอย่างเช่น คำที่กำหนดเอง “A.D.” สามารถรวมเป็นส่วนหนึ่งของวลีได้ เช่น 'A.D.-converter'
ถาม: มีวิธีให้ออกเสียงได้สองวิธี IPA หรือฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเอง แบบไหนดีกว่ากัน
IPA ช่วยให้การออกเสียงแม่นยำยิ่งขึ้น คุณควรจัดให้มีการออกเสียง IPA หากคุณสามารถสร้าง IPA ได้ (เช่น จากพจนานุกรมที่มีการออกเสียง IPA หรือเครื่องมือแปลงออนไลน์)
ถาม: ฉันต้องการใช้ IPA แต่ฉันไม่ใช่ผู้เชี่ยวชาญด้านภาษา มีเครื่องมือออนไลน์ที่ฉันสามารถใช้ได้หรือไม่
พจนานุกรมมาตรฐานหลายฉบับ เช่น Oxford English Dictionary หรือ Cambridge Dictionary (รวมถึงเวอร์ชันออนไลน์) มีการออกเสียงใน IPA นอกจากนี้ ยังมีตัวแปลงออนไลน์ (ตัวอย่างเช่น easypronunciation.com หรือ tophonetics.com สำหรับภาษาอังกฤษ) อย่างไรก็ตาม โปรดทราบว่าในกรณีส่วนใหญ่เครื่องมือเหล่านี้จะอิงตามพจนานุกรมพื้นฐานและอาจไม่สร้าง IPA ที่ถูกต้องสำหรับคำบางคำ เช่น ชื่อเฉพาะ Amazon Transcribe ไม่รับรองเครื่องมือของบริษัทอื่น
ถาม: ฉันจำเป็นต้องใช้มาตรฐาน IPA ที่แตกต่างกันที่เฉพาะเจาะจงกับสำเนียงที่แตกต่างของภาษาเดียวกัน (ตัวอย่างเช่น ภาษาอังกฤษแบบสหรัฐอเมริกากับภาษาอังกฤษแบบอังกฤษ) หรือไม่
คุณควรใช้มาตรฐาน IPA ที่เหมาะสมสำหรับไฟล์เสียงที่คุณจะประมวลผล ตัวอย่างเช่นหากคุณคาดหวังการประมวลผลเสียงจากผู้พูดสำเนียงอังกฤษ ใช้มาตรฐานการออกเสียงแบบอังกฤษ ชุดของสัญลักษณ์ IPA ที่อนุญาตอาจแตกต่างกันไปตามภาษาและภาษาถิ่นที่รองรับโดย Amazon Transcribe โปรดตรวจสอบให้แน่ใจว่าการออกเสียงของคุณมีอักขระที่อนุญาตเท่านั้น สามารถดูรายละเอียดเกี่ยวกับชุดอักขระ IPA ได้ในเอกสารประกอบ คำศัพท์แบบกำหนดเอง
ถาม: ฉันจะให้การออกเสียงโดยใช้ฟิลด์ SoundsLike ในตารางคำศัพท์ที่กำหนดเองได้อย่างไร
คุณสามารถแบ่งคำหรือวลีออกเป็นส่วนเล็กๆ และให้การออกเสียงให้แต่ละส่วนโดยใช้การสะกดคำมาตรฐานของภาษาเพื่อเลียนแบบวิธีการออกเสียงคำนั้น ตัวอย่างเช่น ในภาษาอังกฤษคุณสามารถให้คำใบ้การออกเสียงสำหรับวลี ลอสแองเจลิส ดังนี้: loss-ann-gel-es คำใบ้สำหรับคำว่า Etienne จะมีลักษณะเช่นนี้: eh-tee-en คุณคั่นแต่ละส่วนของคำใบ้ด้วยเครื่องหมายยัติภังค์ (-) คุณสามารถใช้อักขระที่อนุญาตใดก็ได้สำหรับภาษาที่ป้อน สำหรับรายละเอียดเพิ่มเติม โปรดดูที่หน้า คำศัพท์แบบกำหนดเอง
ถาม: วิธีสองวิธีที่แตกต่างกันในการให้ตัวย่อ (มีจุดและไม่มีจุด แต่มีการออกเสียง) มีการทำงานอย่างไร
หากคุณใช้ตัวย่อที่มีเครื่องหมายมหัพภาค การออกเสียงสะกดจะถูกสร้างขึ้นภายใน หากคุณไม่ได้ใช้เครื่องหมายมหัพภาค โปรดให้การออกเสียงในช่องการออกเสียง สำหรับคำย่อบางคำ จะไม่ชัดเจนว่าคำเหล่านั้นมีการออกเสียงตัวสะกดหรือออกเสียงคล้ายกับคำ ยกตัวอย่างเช่น NATO ถูกออกเสียงบ่อย ๆ ว่า ‘n eɪ t oʊ’ (nay-toh) มากกว่าจะเป็น ‘ɛn eɪ ti oʊ’ (N. A. T. O.) สำหรับรายละเอียดเพิ่มเติม โปรดดูที่หน้า คำศัพท์แบบกำหนดเอง
ถาม: ฉันจะหาตัวอย่างวิธีใช้การออกเสียงแบบกำหนดเองได้ที่ไหน
คุณสามารถหาตัวอย่างรูปแบบอิมพุตและตัวอย่างได้ใน เอกสารประกอบที่นี่.
ถาม: จะเกิดอะไรขึ้นหากฉันใช้ IPA ผิด ถ้าฉันไม่แน่ใจ ฉันควรที่จะไม่ป้อน IPA ใดๆ ดีกว่าหรือไม่
ระบบจะใช้การออกเสียงที่คุณให้ นี่จะเป็นการเพิ่มโอกาสในการจดจำคำได้อย่างถูกต้องหากการออกเสียงถูกต้องและตรงกับสิ่งที่พูด หากคุณไม่แน่ใจว่าคุณกำลังสร้าง IPA ที่ถูกต้อง โปรดทำการเปรียบเทียบโดยการประมวลผลไฟล์เสียงของคุณด้วยคำศัพท์ที่มีการออกเสียง IPA ของคุณ และที่มีคำศัพท์ที่มีเพียงคำเท่านั้น (และ เป็นทางเลือก รูปแบบตามที่แสดง) หากคุณไม่ได้ให้การออกเสียงใด ๆ บริการจะใช้การประมาณ ซึ่งอาจหรืออาจไม่ทำงานได้ดีไปกว่าการป้อนข้อมูลของคุณ
ถาม: เมื่อใช้รูปแบบ DisplayAs ฉันสามารถแสดงชุดอักขระที่ไม่เกี่ยวข้องกับภาษาต้นฉบับที่ถอดเสียงได้หรือไม่ (เช่น เอาท์พุท “ถนน” เป็น“ 街道“)
ได้ แม้วลีจะสามารถใช้ชุดอักขระที่จำกัดสำหรับบางภาษาที่เจาะจงเท่านั้น แต่เราสามารถใช้อักขระ UTF-8 นอกเหนือจาก \t (TAB) ในคอลัมน์ DisplayAs ได้
ถาม: การตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทานข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) พร้อมใช้งานกับ API ของ Transcribe ทั้งแบบกลุ่มและสตรีมมิงหรือไม่
ใช่ Amazon Transcribe รองรับการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII สำหรับ API ทั้งแบบกลุ่มและสตรีมมิ่ง
ถาม: การตรวจทานเนื้อหา / การระบุและการตรวจทาน PII อัตโนมัติรองรับภาษาใดบ้าง
โปรดไปที่เอกสารประกอบของ Amazon Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานในการตรวจทานเนื้อหาอัตโนมัติ / การตรวจทาน PII
ถาม: การตรวจทานเนื้อหาอัตโนมัติรวบรวมข้อมูลส่วนตัวที่ละเอียดอ่อนจากเสียงต้นทางด้วยหรือไม่
ไม่ คุณสมบัตินี้จะไม่นำข้อมูลส่วนตัวที่ละเอียดอ่อนออกจากเสียงต้นทาง อย่างไรก็ตาม Amazon Transcribe Call Analytics จะลบข้อมูลส่วนบุคคลที่ละเอียดออกอ่อนจากการถอดเสียงและไฟล์เสียงต้นทาง เข้าชมลิงก์สำหรับรายละเอียดเพิ่มเติมว่าการวิเคราะห์การโทรสามารถแก้ไขเสียงได้อย่างไร คุณยังสามารถตรวจทานข้อมูลส่วนตัวจากเสียงต้นทางได้ด้วยตนเองโดยใช้ตราประทับเวลาเริ่มและสิ้นสุดที่มีให้ในทรานสคริปต์ที่ตรวจทานแล้ว เพื่อดูอินสแตนซ์แต่ละรายการของการพูด PII ที่ระบุ โปรดดูที่โซลูชันการแก้ไขเสียงนี้ สำหรับมาตรฐาน Transcribe APIs
อย่างไรก็ตาม Amazon Transcribe Call Analytics APIs แบบเฉพาะทางจะลบข้อมูลส่วนบุคคลที่ละเอียดอ่อนออกจากทั้งการถอดเสียงและไฟล์เสียงต้นทาง เพื่อเรียนรู้เพิ่มเติม ดูได้ที่ เอกสารประกอบการแก้ไขเสียง Call Analytics
ถาม: ฉันสามารถใช้การตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจทานข้อมูลส่วนตัวจากทรานสคริปต์ข้อความที่มีอยู่แล้วได้หรือไม่
ไม่ได้ การตรวจทานเนื้อหาอัตโนมัติทำงานเฉพาะกับเสียงในลักษณะอินพุตเท่านั้น
ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการตรวจทานเนื้อหาอัตโนมัติ
การตรวจทานเนื้อหาอัตโนมัติถูกออกแบบมาเพื่อระบุและลบข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) แต่เนื่องจากการทำงานเชิงคาดการณ์ของแมชชีนเลิร์นนิง อาจไม่สามารถระบุและนำอินสแตนซ์ทั้งหมดของ PII ที่ปรากฎอยู่ในทรานสคริปต์ที่สร้างขึ้นจากการบริการออกได้ทั้งหมด คุณควรตรวจสอบเอาต์พุตจากการตรวจทานเนื้อหาอัตโนมัติเพื่อตรวจสอบให้แน่ใจว่าตรงตามความต้องการของคุณ
ถาม: มีความแตกต่างระหว่างการตรวจทานเนื้อหาอัตโนมัติสำหรับ API ทั้งแบบกลุ่มและสตรีมมิงหรือไม่
มี จะมีความสามารถเพิ่มเติมสองรายการโดยจะตรวจทานเนื้อหาอัตโนมัติสำหรับ API สตรีมมิ่งที่ไม่รองรับโดย API แบบกลุ่ม คุณสามารถตัดสินใจระบุ PII และไม่ตรวจทานเนื้อหาเมื่อใช้การสร้างการตรวจสอบเนื้อหาที่มี API สตรีมมิง นอกจากนี้ คุณมีความสามารถในการระบุหรือตรวจทานประเภท PII ที่เฉพาะเจาะจง ด้วย API สตรีมมิง ตัวอย่างเช่น คุณสามารถตรวจทานหมายเลขประกันสังคมและข้อมูลบัตรเครดิต รวมถึงเก็บ PII อื่นๆ อย่างชื่อและที่อยู่อีเมลไว้ได้
ถาม: AWS Region ใดมีการตรวจทานเนื้อหาอัตโนมัติหรือการตรวจทาน PII พร้อมใช้งาน
โปรดไปที่เอกสารประกอบของ Amazon Transcribe เพื่อดูข้อมูลเกี่ยวกับภาษาที่พร้อมใช้งานของการตรวจทานเนื้อหาอัตโนมัติและการตรวจทาน PII สำหรับ API แบบกลุ่มและสตรีมมิงใน AWS Region
ถาม: API ใดบ้างที่รองรับการระบุภาษาอัตโนมัติ
ในปัจจุบัน มีการรองรับการระบุภาษาอัตโนมัติสำหรับ API แบบเป็นชุดและ API การสตรีม
ถาม: Amazon Transcribe สามารถระบุภาษาใดได้โดยอัตโนมัติ
Amazon Transcribe สามารถระบุทุกภาษาที่ API แบบกลุ่มและ API การสตรีมรองรับ ไปที่นึ่สำหรับ รายละเอียดเกี่ยวฟีเจอร์ภาษาที่รองรับและภาษาแบบเฉพาะ.
ถาม: Amazon Transcribe ระบุภาษาหลายภาษาในไฟล์เสียงเดียวกันหรือไม่
Amazon Transcribe รองรับ ID ในหลายภาษาสำหรับแบตช์ ดู ลิงก์นี้ สำหรับรายละเอียดเพิ่มเติม
ถาม: มีวิธีที่จะสามารถจำกัดรายการภาษาเพื่อเลือกจากการรองรับการระบุภาษาอัตโนมัติหรือไม่
มี คุณสามารถระบุรายการภาษาที่อาจมีอยู่ในไลบรารีสื่อของคุณได้ เมื่อคุณระบุรายการภาษา ระบบจะเลือกภาษาที่ระบุไว้จากรายการดังกล่าว หากไม่มีการระบุภาษา ระบบจะประมวลผลไฟล์เสียงเทียบกับภาษาทั้งหมดที่ Amazon Transcribe รองรับ และเลือกภาษาที่น่าจะเป็นไปได้มากที่สุด ความถูกต้องในการระบุภาษานั้นจะยิ่งมากขึ้น เมื่อมีการระบุรายการภาษาที่เลือกไว้ ดู ลิงก์นี้ สำหรับรายละเอียดเพิ่มเติม
ราคาและความพร้อมใช้งาน
ถาม: ราคาเท่าไหร่
โปรดดูที่หน้าราคา Amazon Transcribe เพื่อเรียนรู้เพิ่มเติม
ถาม: มี AWS Region ใดบ้างที่ Amazon Transcribe เปิดให้บริการ
โปรดดูที่ตารางภูมิภาคโครงสร้างพื้นฐานโดยรวมของ AWS ไปที่นี่สำหรับ รายละเอียดเพิ่มเติมเกี่ยวกับตำแหน่งข้อมูล Amazon Transcribe และโควตา
ความเป็นส่วนตัวของข้อมูล
ถาม: ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดย Amazon Transcribe มีการจัดเก็บหรือไม่ และ AWS นำไปใช้อย่างไร
Amazon Transcribe อาจจัดเก็บและใช้ข้อมูลเสียงป้อนเข้าที่ประมวลผลโดยบริการเท่านั้นในการจัดหาและบำรุงรักษาบริการและเพื่อปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ การใช้เนื้อหาของคุณเป็นสิ่งสำคัญสำหรับการปรับปรุงประสบการณ์ของลูกค้า Amazon Transcribe ของคุณอย่างต่อเนื่อง รวมถึงการพัฒนาและฝึกอบรมเทคโนโลยีที่เกี่ยวข้อง เราไม่ใช้ข้อมูลที่สามารถระบุตัวบุคคลใดๆ ที่อาจมีอยู่ในเนื้อหาของคุณเพื่อกำหนดเป้าหมายผลิตภัณฑ์ บริการ หรือการตลาดให้กับคุณหรือผู้ใช้ปลายทางของคุณ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/ คุณอาจเลือกที่จะไม่อนุญาตให้ใช้เนื้อหาของคุณในการปรับปรุงและพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นๆ ของ Amazon ได้โดยใช้นโยบายการเลือกที่จะไม่อนุญาตของ AWS Organizations ดูข้อมูลเกี่ยวกับวิธีการเลือกที่จะไม่ใช้ ได้ที่นโยบายการเลือกที่จะไม่ใช้บริการ AI
ถาม: ฉันจะลบข้อมูลและอาร์ทิแฟกต์ที่เกี่ยวข้องกับงานการถอดความซึ่ง Amazon Transcribe จัดเก็บไว้ได้หรือไม่
ได้ คุณสามารถใช้ Delete API ที่มีอยู่ในการลบข้อมูลและสิ่งประดิษฐ์อื่นๆ ที่เกี่ยวข้องกับงานด้านการถอดความได้ หากคุณมีปัญหาในการดำเนินการ โปรดติดต่อ AWS Support
ถาม: ใครมีสิทธิ์เข้าถึงเนื้อหาที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้
พนักงานที่ได้รับอนุญาตเท่านั้นที่จะมีสิทธิ์เข้าถึงเนื้อหาของคุณที่ Amazon Transcribe ประมวลผลไว้ เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/
ถาม: ฉันยังคงเป็นเจ้าของเนื้อหาของฉันที่ Amazon Transcribe ประมวลผลและจัดเก็บไว้หรือไม่
คุณจะเป็นเจ้าของเนื้อหาของคุณเสมอ และเราจะใช้เนื้อหาของคุณเมื่อได้รับความยินยอมจากคุณเท่านั้น
ถาม: เกิดอะไรขึ้นกับข้อมูลของฉันที่ใช้ในการฝึกโมเดลภาษาแบบกำหนดเอง ฉันจะยังเป็นเจ้าของข้อมูลดังกล่าวอยู่หรือไม่
เมื่อส่งข้อมูลข้อความที่ใช้ในการฝึกโมเดลเฉพาะ คุณจะเป็นเจ้าของทั้งข้อมูลข้อความดั้งเดิมและโมเดลแบบกำหนดเองที่สร้างขึ้น เราจะไม่จัดเก็บข้อมูลข้อความดังกล่าว รวมถึงไม่นำไปใช้ในการปรับปรุงเครื่องมือการรู้จำเสียงพูดทั่วไปของเราแต่อย่างใด โมเดลที่สร้างด้วยการใช้ CLM จะเป็นโมเดลแบบครบวงจรและมีเพียงคุณที่เข้าถึงได้
ถาม: การที่ระบบไม่เก็บข้อมูลการฝึกของฉันเอาไว้จะมีข้อเสียหรือการเสื่อมใดๆ ต่อคุณภาพการถอดเสียงหรือประสบการณ์โดยรวมในการให้บริการหรือไม่
การที่บริการของเราไม่ได้จัดเก็บข้อมูลการฝึกของคุณเอาไว้จะไม่ทำให้คุณภาพของการถอดเสียงเสื่อมลง เมื่อข้อมูลการฝึกถูกนำมาใช้ในการสร้างโมเดลภาษาแบบกำหนดเองแล้ว ตัวโมเดลดังกล่าวจะพร้อมให้คุณใช้งานซ้ำได้ตามความต้องการ ชุดข้อมูลต้นฉบับสำหรับการฝึกที่คุณอัปโหลดไว้จะถูกลบออกจากระบบของเรา ข้อเสียเพียงอย่างเดียวก็คือในกรณีที่คุณต้องการการสนับสนุนด้านเทคนิค เนื่องจากเราไม่ได้เก็บข้อมูลต้นฉบับสำหรับการฝึกของคุณเอาไว้ เราจึงไม่สามารถเข้าถึงสินทรัพย์เหล่านั้นหรือสิ่งประดิษฐ์ตัวกลางที่เกี่ยวข้องอย่างสะดวกได้ หากคุณต้องการให้ทีมสนับสนุนตรวจสอบปัญหาด้านการบริการที่อาจเกิดขึ้น การสนับสนุนจะยังคงมีอยู่ แต่จะไม่สามารถทำได้โดยสะดวกนักเนื่องจากเราอาจจำเป็นต้องขอข้อมูลจากคุณเพิ่มเติม
ถาม: ฉันจะนำข้อมูลกลับมาใช้ซ้ำเพื่อการอัปเดตหรือปรับปรุงโมเดลในอนาคตได้อย่างไร
เนื่องจากระบบไม่ได้จัดเก็บข้อมูลการฝึกเอาไว้ คุณจึงจำเป็นต้องอัปโหลดข้อมูลชุดเดิม รวมถึงข้อมูลเพิ่มเติมใดๆ อีกครั้งเพื่อฝึกโมเดลใหม่ เมื่อมีการอัปเดตโมเดลพื้นฐานโดย Amazon Transcribe เราจะแจ้งให้คุณทราบ โดยเราแนะนำให้คุณส่งข้อมูลเพื่อฝึกโมเดลใหม่เพื่อใช้ประโยชน์จากโมเดลพื้นฐานที่อัปเดตล่าสุด ซึ่งจะทำให้คุณมีทั้งโมเดลต้นฉบับแบบกำหนดเองที่สร้างไว้ก่อนหน้านี้และโมเดลเวอร์ชันใหม่ไว้ใช้งาน
ถาม: ฉันจะลบโมเดลได้อย่างไร
คุณสามารถลบโมเดลภาษาลูกค้าใดก็ได้ที่คุณสร้างขึ้นตามความต้องการของคุณ
ถาม: เนื้อหาที่ Amazon Transcribe ประมวลผลถูกย้ายออกจาก AWS Region ที่ฉันกำลังใช้ Amazon Transcribe อยู่หรือไม่
เนื้อหาใดๆ ที่ Amazon Transcribe ประมวลผลจะถูกเข้ารหัสและจัดเก็บเป็นข้อมูลที่ไม่ใช้งานไว้ในเขต AWS ที่คุณกำลังใช้ Amazon Transcribe อยู่ เนื้อหาบางส่วนที่ Amazon Transcribe ประมวลผลอาจถูกจัดเก็บไว้ในเขต AWS อื่นที่เกี่ยวข้องกับการปรับปรุงและการพัฒนาประสบการณ์การใช้งานของลูกค้า Amazon Transcribe ของคุณและเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อย่างต่อเนื่องเท่านั้น หากคุณเลือกที่จะไม่ให้ใช้เนื้อหาของคุณในการพัฒนาคุณภาพของ Amazon Transcribe และเทคโนโลยีด้านแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์ของ Amazon อื่นๆ โดยการติดต่อ AWS Support เนื้อหาของคุณจะไม่ถูกจัดเก็บไว้ในเขต AWS อื่น คุณสามารถส่งคำขอในการลบข้อมูลเสียงป้อนเข้าที่เกี่ยวข้องกับบัญชีของคุณได้โดยการติดต่อ AWS Support เราให้ความสำคัญสูงสุดด้านความไว้วางใจ ความเป็นส่วนตัว และความปลอดภัยของเนื้อหาของคุณ และเราใช้การควบคุมทางเทคนิคและกายภาพที่เหมาะสมและซับซ้อน รวมถึงการเข้ารหัสข้อมูลที่ไม่ใช้งานและขณะรับส่งข้อมูล ซึ่งออกแบบมาเพื่อป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตหรือเปิดเผยเนื้อหาของคุณ และเพื่อให้มั่นใจว่าการใช้งานของเราเป็นไปตามข้อผูกมัดที่ให้ไว้กับคุณ โปรดดูข้อมูลเพิ่มเติมที่ https://aws.amazon.com/compliance/data-privacy-faq/
ถาม: ฉันสามารถใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปี และอยู่ภายใต้กฎหมายคุ้มครองข้อมูลออนไลน์ส่วนบุคคลของเด็ก (COPPA) ได้หรือไม่
ได้ ภายใต้ข้อกำหนดการให้บริการของ Amazon Transcribe รวมถึงพันธะผูกพันของคุณในการระบุข้อมูลการแจ้งที่จำเป็นใดๆ และรับการยินยอมจากผู้ปกครองที่สามารถตรวจสอบได้ที่จำเป็นภายใต้ COPPA คุณอาจใช้ Amazon Transcribe กับเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ที่ส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนได้
ถาม: ฉันจะระบุได้อย่างไรว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันของฉันอยู่ภายใต้ COPPA
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อกำหนดของ COPPA และคู่มือในการระบุว่าเว็บไซต์ โปรแกรม หรือแอปพลิเคชันอื่นๆ ของคุณอยู่ภายใต้ COPPA หรือไม่ โปรดดูแหล่งข้อมูลที่คณะกรรมการพาณิชย์กลางแห่งสหรัฐอเมริกามีให้และเป็นผู้ดูแลได้โดยตรง เว็บไซต์นี้ยังมีข้อมูลเกี่ยวกับวิธีการระบุว่าการบริการถูกส่งไปยังหรือมีเป้าหมายที่เด็กอายุต่ำกว่า 13 ปีทั้งหมดหรือบางส่วนหรือไม่อีกด้วย
Amazon Transcribe Call Analytics
ถาม: Amazon Transcribe Call Analytics คืออะไร
Amazon Transcribe Call Analytics คือ API ที่ขับเคลื่อนด้วย AI ซึ่งมอบข้อมูลการถอดเสียงการโทรที่ครบถ้วนสมบูรณ์และข้อมูลเชิงลึกการสนทนาที่นำไปใช้ได้จริง โดยคุณสามารถเพิ่มลงในแอปพลิเคชันการโทรต่างๆ เพื่อปรับปรุงประสบการณ์ของลูกค้าและประสิทธิภาพการทำงานของเจ้าหน้าที่ได้ โดยมีการผสมผสานรูปแบบเสียงพูดเป็นข้อความที่มีประสิทธิภาพและรูปแบบการประมวลผลภาษาธรรมชาติที่กำหนดเอง (NLP) ที่ฝึกมาโดยเฉพาะเพื่อทำความเข้าใจการดูแลลูกค้าและการโทรออกสำหรับการขาย API นี้เป็นส่วนหนึ่งของโซลูชัน AWS Contact Center Intelligence (CCI) ซึ่งไม่ขึ้นกับศูนย์ติดต่อใดๆ และช่วยให้ลูกค้าและ ISV สามารถเพิ่มคุณสมบัติการวิเคราะห์การโทรลงในแอปพลิเคชันได้ง่ายขึ้น
ถาม: ฉันทำอะไรกับ Amazon Transcribe Call Analytics ได้บ้าง
Amazon Transcribe Call Analytics สามารถทำได้ทั้งการวิเคราะห์ตามเวลาจริงและการวิเคราะห์หลังการโทร Call Analytics ช่วยให้ผู้พัฒนาสามารถเพิ่มข้อมูลอันมีค่าได้อย่างรวดเร็ว เช่น คะแนนความเชื่อมั่นของลูกค้าและเจ้าหน้าที่ ปัจจัยขับเคลื่อนการโทร และหมวดหมู่การโทรโดยตรงเป็นเอาต์พุต API ไปยังแอปพลิเคชันการโทรเข้าหรือโทรออก กรณีการใช้งานที่พบบ่อยรวมถึงการช่วยเหลือเจ้าหน้าที่ การแจ้งเตือนจากหัวหน้างาน และการวิเคราะห์การโทร ต่อไปนี้คือโซลูชันตัวอย่างแบบโอเพ่นซอร์สสองแบบที่ใช้ Transcribe Call Analytics: การวิเคราะห์การโทรตามเวลาจริงด้วยความช่วยเหลือของเจ้าหน้าที่ และการวิเคราะห์หลังการโทร
ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Call Analytics ได้อย่างไร
คุณสามารถใช้ Transcribe Call Analytics ได้ผ่าน API และคอนโซลการจัดการของ AWS งานวิเคราะห์สามารถถูกสร้างและตรวจสอบได้ผ่าน API หรือคอนโซล ในคอนโซล คุณจะเห็นถึงรายชื่อของงานการวิเคราะห์ และหน้ารายละเอียดงานกับพารามิเตอร์อินพุตและตัวอย่างเอาท์พุต JSON นอกจากนี้ คุณยังสามารถสร้าง และแก้ไขหมวดหมู่ต่างๆ ผ่าน API หรือ Console ได้ด้วยคุณสมบัติการจัดหมวดหมู่ผู้ติดต่ออัตโนมัติ
ถาม: Amazon Transcribe Call Analytics รองรับภาษาใดบ้าง
โปรดดูที่เอกสารประกอบ Amazon Transcribe สำหรับข้อมูลเกี่ยวกับ ภาษาที่พร้อมใช้งานใน Amazon Transcribe Call Analytics.
ถาม: Amazon Transcribe Call Analytics พร้อมใช้งานใน AWS Region ใดบ้าง
โปรดดูที่ เอกสารประกอบการให้บริการ AWS Region สำหรับข้อมูลเกี่ยวกับความครอบคลุมของ AWS Region สำหรับ Amazon Transcribe Call Analytics
ถาม: ราคาของ Amazon Transcribe Call Analytics คิดอย่างไร
ราคาของ Amazon Transcribe Call Analytics API จะคิดแยกจาก Amazon Transcribe API มาตรฐาน โปรดดูที่หน้า ราคา Amazon Transcribe สำหรับรายละเอียดเพิ่มเติม
Amazon Transcribe Medical
ถาม: Amazon Transcribe Medical คืออะไร
Amazon Transcribe Medical คือบริการการรู้จำเสียงพูดอัตโนมัติ (ASR) ที่ช่วยให้นักพัฒนาเพิ่มความสามารถในการเปลี่ยนเสียงพูดทางการแพทย์ให้เป็นตัวอักษรลงในแอปพลิเคชันได้ การใช้ Amazon Transcribe Medical คุณสามารถคัดลอกคำสั่งทางการแพทย์และเสียงพูดจากการสนทนาให้เป็นตัวอักษรได้อย่างรวดเร็วและแม่นยำสำหรับหลากหลายวัตถุประสงค์ เช่น การบันทึกข้อความของแพทย์หรือการประมวลผลในการวิเคราะห์ข้อความแบบดาวน์สตรีมเพื่อดึงข้อมูลเชิงลึกที่มีนัยสำคัญ
ถาม: ฉันทำอะไรกับ Amazon Transcribe Medical ได้บ้าง
Amazon Transcribe Medical ใช้โมเดลแมชชีนเลิร์นนิ่งขั้นสูงในการถอดความเสียงพูดทางการแพทย์ให้เป็นตัวอักษรได้อย่างถูกต้อง Transcribe Medical สามารถสร้างการถอดเสียงข้อความที่สามารถใช้เพื่อรองรับการใช้งานในกรณีต่างๆ โดยครอบคลุมถึงลำดับงานของเอกสารทางคลินิกและการตรวจสอบความปลอดภัยของยา (การติดตามความปลอดภัยจากการใช้ยา) เพื่อทำคำบรรยายใต้ภาพสำหรับการแพทย์ทางไกล และแม้กระทั่งการติดต่อศูนย์วิเคราะห์ในโดเมนด้านการดูแลสุขภาพและวิทยาศาสตร์สุขภาพ
ถาม: ฉันต้องเป็นผู้เชี่ยวชาญด้านการรู้จำเสียงพูดอัตโนมัติ (ASR) ในการใช้ Amazon Transcribe Medical หรือไม่
ไม่ คุณไม่ต้องมีความเชี่ยวชาญด้าน ASR หรือแมชชีนเลิร์นนิ่งในการใช้งาน Amazon Transcribe Medical คุณเพียงต้องเรียก API ของ Transcribe Medical และการบริการจะจัดการกับแมชชีนเลิร์นนิ่งที่จำเป็นในแบ็คเอนด์เพื่อถอดความเสียงพูดทางการแพทย์เป็นตัวอักษร
ถาม: ฉันจะเริ่มต้นใช้งาน Amazon Transcribe Medical ได้อย่างไร
คุณสามารถเริ่มต้นใช้งาน Amazon Transcribe Medical ได้จาก AWS Management Console หรือด้วยการใช้ SDK โปรดดูรายละเอียดในเอกสารทางเทคนิคหน้านี้
Amazon Transcribe Medical มีช่วงทดลองฟรีเพื่อให้คุณสามารถทดสอบบริการได้ โปรดดูข้อมูลเพิ่มเติมในหน้าราคานี้
ถาม: Amazon Transcribe Medical รองรับภาษาใดบ้าง
ขณะนี้ Amazon Transcribe Medical รองรับการถอดความเสียงพูดทางการแพทย์ในภาษาอังกฤษแบบสหรัฐอเมริกา
ถาม: Amazon Transcribe Medical รองรับการแพทย์เฉพาะทางด้านใดบ้าง
Amazon Transcribe Medical รองรับการถอดเสียงสำหรับการรักษาแบบพื้นฐานและการรักษาแบบเฉพาะทางหลากหลายรายการ ไปที่เอกสารประกอบของเราเพื่อดูรายการของการแพทย์เฉพาะทางทั้งหมดที่รองรับ
ถาม: Amazon Transcribe Medical พร้อมใช้งานใน AWS Region ใดบ้าง
โปรดดูที่ เอกสารประกอบการให้บริการ AWS Region สำหรับข้อมูลเกี่ยวกับความครอบคลุมของ AWS Region สำหรับ Amazon Transcribe Medical
ถาม: Amazon Transcribe Medical คิดราคาอย่างไร
โปรดดูที่หน้าราคา Amazon Transcribe Medical เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียดราคา
ถาม: Amazon Transcribe Medical มีคุณสมบัติตรงตาม HIPAA หรือไม่
มี
ถาม: มีการใช้เนื้อหาที่ประมวลผลโดย Amazon Transcribe Medical เพื่อจุดประสงค์อื่นนอกเหนือจากการให้บริการหรือไม่
Amazon Transcribe Medical ไม่ได้ใช้เนื้อหาที่ประมวลผลโดยการให้บริการสำหรับเหตุผลอื่นใดที่นอกเหนือไปจากเพื่อการให้บริการและรักษาการให้บริการ เนื้อหาที่ประมวลผลโดยบริการจะไม่ถูกนำไปใช้เพื่อพัฒนาหรือปรับปรุงคุณภาพของ Amazon Transcribe Medical หรือเทคโนโลยีแมชชีนเลิร์นนิ่ง/ปัญญาประดิษฐ์อื่นใดของ Amazon
ถาม: Amazon Transcribe Medical มีการเรียนรู้ตลอดเวลาหรือไม่
มี Amazon Transcribe Medical ใช้แมชชีนเลิร์นนิ่งและได้รับการฝึกฝนอย่างต่อเนื่องเพื่อให้ทำงานได้ดีขึ้นสำหรับกรณีใช้งานของลูกค้า Amazon Transcribe Medical ไม่ได้จัดเก็บหรือใช้ข้อมูลลูกค้าที่ใช้กับบริการในการฝึกโมเดล
ถาม: มีอะไรอีกบ้างที่ฉันควรรู้ก่อนใช้บริการ Amazon Transcribe Medical
Amazon Transcribe Medical ไม่ได้ใช้แทนคำแนะนำทางการแพทย์ การวินิจฉัย หรือการรักษาจากมืออาชีพ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่ในการใช้ดุลยพินิจ ประสบการณ์ และวิจารณญาณในการพิจารณาความถูกต้อง ความครบถ้วน ความตรงต่อเวลา และความเหมาะสมของข้อมูลใดๆ ที่ Amazon Transcribe Medical มอบให้ คุณและผู้ใช้ปลายทางของคุณมีหน้าที่แต่เพียงผู้เดียวในการตัดสินใจ ให้คำแนะนำ การดำเนินการ และ/หรือการไม่ดำเนินการใดๆ ที่อ้างอิงจากการใช้ Amazon Transcribe Medical
Amazon Transcribe Medical อาจไม่สามารถระบุข้อมูลสุขภาพที่ได้รับการคุ้มครองได้อย่างแม่นยำในทุกสถานการณ์ และไม่เป็นตามข้อกำหนดสำหรับการไม่ระบุตัวตนของข้อมูลสุขภาพที่ได้รับการคุ้มครองซึ่งสอดคล้องกับ HIPAA คุณมีหน้าที่ในการตรวจสอบผลลัพธ์ใดๆ ที่ได้จาก Amazon Transcribe Medical เพื่อให้แน่ใจว่าตรงตามความต้องการของคุณ
โมเดลภาษาแบบกำหนดเอง
ถาม: ปัจจุบันนี้โมเดลภาษาแบบกำหนดเองมีฟังก์ชันอะไรบ้าง
คุณสามารถใช้โมเดลภาษาแบบกำหนดเอง (CLM) เพื่อฝึกฝนและพัฒนาโมเดลภาษาเฉพาะแวดวงที่คุณต้องการได้ ขณะนี้ CLM รองรับการถอดเสียงเป็นชุดในภาษาอังกฤษ (ออสเตรเลีย), อังกฤษ (บริติช), ฮินดู, อังกฤษ (สหรัฐอเมริกา) และสเปน (สหรัฐอเมริกา) และการถอดเสียงสำหรับการสตรีมในภาษาอังกฤษแบบอเมริกัน CLM จะรองรับการใช้งานคำศัพท์แบบกำหนดเองพร้อมกันสำหรับการถอดเสียงเป็นชุด
ถาม: ฉันจำเป็นต้องใช้ข้อมูลการฝึกอบรมมากน้อยเพียงใดและต้องให้ข้อมูลประเภทใด ฉันจะหาข้อมูลดังกล่าวมาได้อย่างไร ข้อมูลจำเป็นต้องอยู่ในรูปแบบที่เฉพาะเจาะจงหรือไม่
ข้อมูลข้อความควรมีเนื้อหาเกี่ยวข้องกับเสียงที่คุณจะถอดโดยใช้โมเดลแบบกำหนดเอง ข้อมูลควรประกอบด้วยคำศัพท์ วลี และการรวมคำเฉพาะโดเมนให้มากที่สุดเท่าที่จะเป็นไปได้ เราขอแนะนำให้ใช้ข้อความที่ต่อเนื่องกันอย่างน้อย 100,000 คำ และไม่เกิน 10 ล้านคำ ทรัพยากรข้อมูลข้อความอาจมาจากแหล่งข้อมูลในองค์กรหรือแหล่งข้อมูลสาธารณะใดๆ ก็ได้ (เช่น ใช้ข้อความจากเว็บไซต์ของลูกค้า) เราขอแนะนำให้ไฟล์ข้อความธรรมดาแต่ละไฟล์มีจำนวน 200,000 คำขึ้นไป แต่ขนาดไฟล์โดยรวมต้องไม่เกิน 1 GB ข้อความควรอยู่ในรูปแบบ UTF-8 และมีหนึ่งประโยคต่อบรรทัด แต่ละประโยคควรมีเครื่องหมายวรรคตอน ผู้ใช้มีหน้าที่ตรวจสอบการสะกด ลบอักขระการจัดรูปแบบ และตรวจสอบความถูกต้องของการเข้ารหัส
ถาม: ฉันจะใช้โมเดลภาษาแบบกำหนดเอง (CLM) ได้อย่างไร
ในการฝึกโมเดลภาษาแบบกำหนดเองนั้น ลูกค้าเพียงแค่ใส่ข้อมูลข้อความไว้ในบัคเก็ต Amazon S3 ก็สามารถใช้งานได้แล้ว จากนั้นจึงใช้คอนโซลบริการของ Amazon Transcribe ในการโหลดและประมวลผลข้อมูลเพื่อฝึกโมเดลภาษาแบบกำหนดเอง การฝึกจะทำงานโดยอัตโนมัติอย่างเต็มรูปแบบ และต้องการการแทรกแซงจากผู้ใช้เพียงเล็กน้อยเท่านั้น โมเดลแบบกำหนดเองขั้นสุดท้ายที่เสร็จเรียบร้อยแล้วจะอยู่ในบัญชี AWS ของลูกค้าเพื่อใช้สำหรับถอดเสียงจากไฟล์เสียงเฉพาะโดเมน นอกจากนี้ ลูกค้าสามารถฝึกโมเดลแบบกำหนดเองได้หลายโมเดลเพื่อใช้กับกรณีใช้งานที่แตกต่างกันไป
ถาม: การปรับปรุงต่างๆ มีการรับประกันหรือไม่ การลงทุนไปกับความพยายามในการเก็บรวบรวมข้อมูลข้อความจะคุ้มค่าหรือไม่
การปรับปรุงต่างๆ นั้นไม่มีการรับประกัน การเปลี่ยนแปลงของประสิทธิภาพจะขึ้นอยู่กับว่าข้อมูลข้อความตรงกับไฟล์เสียงมากน้อยเพียงใด และขึ้นอยู่กับปริมาณข้อมูลที่ให้ไว้ โดยทั่วไปแล้วข้อมูลยิ่งมากก็ยิ่งดี แต่สิ่งสำคัญที่สุดคือข้อมูลควรมีเนื้อหาครอบคลุมคำศัพท์และลำดับของคำที่คาดว่าจะพบในไฟล์เสียงที่คุณตั้งใจจะถอดเสียง การปรับปรุงความแม่นยำของการถอดเสียงจะขึ้นอยู่กับคุณภาพของข้อมูลการฝึกและกรณีใช้งาน ในบางกรณี การเทียบเคียงทั่วไปบ่งชี้ว่าความแม่นยำสัมพัทธ์มีประสิทธิภาพยิ่งขึ้น 10% ถึง 15%
ถาม: การฝึกโมเดลใช้เวลานานเท่าใด ฉันจะสามารถใช้โมเดลได้เมื่อใด
โดยทั่วไป การฝึกโมเดลจะใช้เวลาระหว่าง 6 ถึง 10 ชั่วโมง ระยะเวลาในการฝึกขึ้นอยู่กับว่าชุดข้อมูลมีขนาดใหญ่เพียงใด โมเดลแบบกำหนดเองจะพร้อมให้ใช้งานได้ทันทีหลังจากที่ฝึกเสร็จเรียบร้อยแล้ว
ถาม: ฉันจะสามารถใช้โมเดลนี้ได้อย่างไร ฉันจะทราบได้อย่างไรว่าโมเดลนี้ทำงานได้ดีกว่าโมเดลทั่วไปที่ Amazon Transcribe มีให้บริการ
โมเดลจะพร้อมใช้งานในบัญชีของคุณภายใต้ ID โมเดลที่คุณกำหนดก่อนกระบวนการในการฝึก หากต้องการใช้โมเดลดังกล่าว ลูกค้าจะต้องเพิ่มค่าสถานะที่มี ID โมเดลไปยังคำขอการถอดเสียง คุณควรทดสอบโมเดลกับไฟล์เสียงของคุณและเปรียบเทียบเอาท์พุตกับผลลัพธ์ที่ได้จากเครื่องมือทั่วไป
ถาม: ฉันสามารถฝึกโมเดลภาษาแบบกำหนดเองได้กี่โมเดล ฉันสามารถเปิดใช้งานหลายโมเดลพร้อมกันสำหรับบัญชีของฉันได้หรือไม่
คุณสามารถฝึกโมเดลพร้อมกันได้สูงสุดครั้งละ 5 โมเดลต่อบัญชี AWS หนึ่งบัญชี สำหรับแต่ละบัญชี คุณสามารถจัดเก็บได้สูงสุด 10 โมเดลตามค่าเริ่มต้น หากต้องการจัดเก็บโมเดลเพิ่มเติม คุณสามารถเพิ่มขีดจำกัดการใช้บริการได้ที่นี่
ถาม: ระบบสนับสนุนโมเดลเสียงแบบกำหนดเองหรือไม่
ไม่ ระบบไม่สนับสนุนโมเดลเสียงแบบกำหนดเอง โมเดลภาษาแบบกำหนดเองนั้นสร้างขึ้นมาจากข้อมูลข้อความที่เกี่ยวข้องกับกรณีใช้งานหรือโดเมนของคุณ
เรียนรู้เพิ่มเติมเกี่ยวกับราคา Amazon Transcribe