ما المقصود بمحول الصوت إلى نص؟

محول الصوت إلى نص هو برنامج تفريغ صوتي يتعرف تلقائيًا على الكلام وينسخ ما يُقال في تنسيق مكتوب مكافئ. يستمع عادةً الإنسان إلى الملف الصوتي ويكتبه في ملف نصي لإعادة استخدام المحتوى المنطوق في وسائط مختلفة. ولكن الآن، باستخدام الذكاء الاصطناعي، يمكن لأجهزة الكمبيوتر بسهولة تحويل الصوت إلى نص في وقت قصير وجعل المحتوى قابلاً للاستخدام لأغراض مختلفة مثل البحث والترجمة والرؤى. محول الصوت إلى نص هو برنامج تفريغ صوتي يتعرف تلقائيًا على الكلام وينسخ ما يُقال في تنسيق مكتوب مكافئ. يستمع عادةً الإنسان إلى الملف الصوتي ويكتبه في ملف نصي لإعادة استخدام المحتوى المنطوق في وسائط مختلفة. أمّا الآن، فأصبح ممكنًا استخدام الذكاء الاصطناعي لجعل أجهزة الكمبيوتر تحوّل الصوت إلى نص بسهولة وبسرعة، وبالتالي جعل المحتوى قابلاً للاستخدام لأغراض مختلفة، مثل البحث والترجمة والرؤى.

ما بعض حالات الاستخدام لمحولات الصوت إلى النص؟

يعمل محول الصوت إلى نص على تقليل وقت التفريغ الصوتي، ويزيد من الكفاءة والإنتاجية، ويحسن إمكانية الوصول إلى الوسائط الرقمية. فيما يلي بعض الأسباب التي تجعل الشركات تستخدم البرامج لتحويل ملفات الصوت والفيديو إلى نص.

تحسين إتاحة المحتوى والوصول إليه

يمكن أن يصل محتوى الفيديو إلى جمهور أوسع ويحسن التفاعل إذا أضفت ترجمات. يمكن لغير الناطقين باللغة الإنجليزية فهم مقاطع الفيديو هذه بسهولة أكبر. علاوةً على ذلك، تنشط منصات الوسائط الاجتماعية في دعم موجزات وسائط الفيديو عند كتم الصوت لأن العديد من مستخدمي الإنترنت يفضلون مشاهدة مقاطع الفيديو القصيرة بصمت أثناء قراءة الترجمة.

قد يكون من الصعب تفريغ ملف الفيديو لأنك قد تحتاج إلى قضاء ساعات في مشاهدة لقطات الفيديو والتفريغ الصوتي يدويًا. تعمل محولات الصوت إلى نص على تسهيل العملية وتوفير وقت التحرير حتى تتمكن من إنشاء المزيد من المحتوى.

استخلاص رؤى قابلة للتنفيذ

يُمكّنك التفريغ الصوتي من استخراج الرؤى من المعلومات الموجودة في ملفات الصوت والفيديو. على سبيل المثال، يُمكنك تحويل تقييمات العملاء ومكالمات العملاء والمقابلات إلى بيانات رقمية. يُمكنك تسجيل المعلومات المتكررة أو عمليات الإلحاق الشائعة كملف صوتي ثم نسخها في مستند. على سبيل المثال، تستخدم Intuit، وهي شركة مراكز اتصال، برنامج تحويل الصوت إلى نص لتفريغ الصوت تلقائيًا من المكالمات وتحليل النصوص لقياس أداء مراكز الاتصال.

 

إنشاء المحتوى بشكل أسرع

هناك أنواع عديدة من قنوات التسويق التي قد يستخدمها جمهورك. تقوم الشركات اليوم بإنشاء ملفات بودكاست ومقالات وصور ومحتوى فيديو ووسائل التواصل الاجتماعي للتفاعل مع العملاء. تحويل الصوت إلى نص يزيد من كفاءة إنشاء مجموعة من المحتوى من نفس الفكرة. على سبيل المثال، يُمكن لمنشئي المحتوى تسجيل الصوت في مقابلات البودكاست مع خبراء الصناعة، ثم تفريغ الملفات الصوتية إلى نص وإعادة استخدام المحتوى في مقالة أو مستند فني.

أتمتة تدوين الملاحظات

تحتاج في الغالب إلى إعادة النظر في المحتوى المنطوق في مرحلة لاحقة، بدايةً من الاجتماعات وحتى المحاضرات الطويلة والخطب والجلسات التدريبية. بدلاً من إضاعة ساعات العمل عن طريق تفريغ الملفات الصوتية يدويًا، يمكنك تحويل الصوت إلى نص في بضع دقائق فقط باستخدام البرنامج، حتى أثناء التسجيل. من السهل أيضًا الرجوع إلى المستند النصي الناتج، على عكس الملفات الصوتية التي يجب عليك إيقافها مؤقتًا وتشغيلها بشكل متكرر. يمكنك توفير الوقت والموارد عن طريق تقليل الوثائق الورقية مثل الوثائق السريرية والملاحظات وما إلى ذلك.

ما مزايا استخدام محولات الصوت إلى نص؟

محولات الصوت إلى نص تجلب كثيرًا من المزايا في التحليلات والوثائق الشاملة. فيما يلي بعض الأمثلة.

محتوى وسائط قابل للبحث

من الصعب تصنيف البيانات وفرزها في الأرشيفات التي تحتوي على عدد كبير من ملفات الفيديو والصوت. من خلال تحويل الصوت إلى نص، يمكنك استخدام أرشيف البيانات هذا كمرجع والبحث فيه. على سبيل المثال، يستخدم Audioburst برنامج تفريغ صوتي تلقائي لإنشاء مستودع تسجيل صوتي لبرامجها الحوارية من خلال محتوى يمكن لأي شخص البحث عنه ومشاركته.

وثائق أسرع

يمكن أن تكون الوثائق بطيئةً إذا قمت بتحويل الصوت إلى ملاحظات نصية يدويًا. على سبيل المثال، يسجل الأطباء المحادثات السريرية، ولكن قد يستغرق الأمر وقتًا طويلاً لتحويل الكميات الكبيرة من النص المُملَي إلى مستندات. بدلاً من ذلك، يُمكنك استخدام التفريغ التلقائي للصوت إلى نص لتحويل ملفك الصوتي إلى مستند بسرعة فائقة.

بيانات العملاء الآمنة

يمكن للتفريغ التلقائي من الصوت إلى نص أن يؤمّن بيانات العملاء بدقة أكبر من التي يوفرها التفريغ اليدوي. يمكنك تعيين قواعد في النظام لتنقيح المعلومات الشخصية الحساسة تلقائيًا، أو إزالة الألفاظ النابية، أو إزالة الخلط في الأرقام الخاصة أثناء تحويل الملفات الصوتية إلى نص.

ما كيفية عمل محولات الصوت إلى نص؟

يتعرف برنامج النسخ التلقائي على الكلام باستخدام تعلم الآلة (ML) والذكاء الاصطناعي (AI). تعلم الآلة هو تقنية تدرب أجهزة الكمبيوتر على التعرف على الكلام من خلال تخزين وتحليل كمية كبيرة جدًا من بيانات كلامية. تعطي محولات الصوت إلى نص نتائج دقيقة لأنها تقارن أنماط الكلام المسجلة بقاعدة البيانات الضخمة هذه. عند تحميل ملفات صوتية، يقوم المحول بتحليلها باستخدام مكونين رئيسيين.

مكون صوتي

المكون الصوتي هو البرنامج الذي يحول الملف الصوتي إلى تسلسل من الوحدات الصوتية. الوحدات الصوتية هي الإشارات الرقمية التي تمثل الموجات الصوتية أو الاهتزازات الصوتية التي تقوم بها عند التحدث. 

تقوم تقنية التعرف على الكلام الصوتية بمطابقة الوحدات الصوتية مع الأصوات التي تكوّن اللغة البشرية والتي تسمى الصوتيات. على سبيل المثال، تحتوي اللغة الإنجليزية على 44 صوتًا التي تتحد لتشكيل جميع الكلمات في اللغة. يمكنك استخدام الصوتيات لتحويل الصوت تلقائيًا إلى نص بالعديد من اللغات.

مكون لغوي

في حين أن المكون الصوتي يسمع الكلمة، فإن المكون اللغوي يفهمها ويستنتج هجاءها. على سبيل المثال، تبدو العديد من الكلمات باللغة الإنجليزية متشابهةً ولكن هجاؤها مختلف. الكلمات to، وtwo، وtoo تبدو كلها متشابهة، ولكن يجب على الشخص أو الكمبيوتر الذي يقوم بتفريغ الصوت أن يفهمها في السياق.

يحلل المكون اللغوي جميع الكلمات السابقة وعلاقاتها لتقدير الكلمة التي من المحتمل أن تأتي بعد ذلك. ثم يحول تسلسل الوحدات الصوتية إلى كلمات وجمل وفقرات تؤدي معنىً للبشر. تشبه تقنية التعرف على الكلام هذه وظيفة الاقتراح التلقائي في هاتفك الذكي والتي تقترح الكلمات تلقائيًا عند كتابة نص.

ما المقصود بـ Amazon Transcribe؟

Amazon Transcribe هي خدمة تحويل صوت إلى نص مُدارة بالكامل تستخدم تعلم الآلة للتفريغ بسرعة ودقة. يتضمن Transcribe ميزاتٍ يُمكنك استخدامها في إدخال إدخالات الصوت، وإنتاج نصوص سهلة القراءة، وتحسين الدقة حسب المجال مع التخصيص، وتنقيح المعلومات الشخصية الحساسة لضمان خصوصية العميل. يتضمن خدمات التعرف التلقائي على الكلام الإضافية هذه:

  • Amazon Transcribe Call Analytics، التي يمكنك استخدامها لاستخراج رؤى المحادثة التي تساعدك في تحسين تجربة العملاء وإنتاجية الوكلاء.
  • Amazon Transcribe Medical، الذي يتضمن إمكانات تحويل الصوت إلى نص في التطبيقات التي تدعم الصوت الخاصة بالرعاية الصحية.

ابدأ استخدام Amazon Transcribe عن طريق إنشاء حساب AWS اليوم.

 

الخطوات التالية لمحول الصوت إلى نص من AWS

التحقق من الموارد الإضافية المتعلقة بالمنتج
معرفة المزيد حول خدمات تعلّم الآلة 
تسجيل الاشتراك للحصول على حساب مجاني

تمتع بالوصول الفوري إلى الطبقة المجانية من AWS.

تسجيل الاشتراك 
بدء الإنشاء في وحدة التحكم

بدء الإنشاء في وحدة إدارة تحكم AWS.

تسجيل الدخول