توفر Amazon Comprehend معالجة اللغة الطبيعية، واكتشاف معلومات التعريف الشخصية (PII) وتنقيحها، والتصنيف المخصص واكتشاف الكيانات، ونمذجة الموضوعات، وهذا يتيح مجموعةً كبيرةً من التطبيقات التي تحلل النص الخام، وباستخدام بعض واجهات برمجة التطبيقات تحلل المستندات بتنسيقات مثل PDF وWord.

  • معالجة اللغات الطبيعية : يُمكن استخدام واجهات برمجة التطبيقات المتاحة في خدمة Amazon Comprehend الخاصة بإجراء عمليات التعرف على الكيانات، وتحليل المشاعر، وتحليل بناء الجملة، واستخراج العبارات الأساسية، واكتشاف اللغة في استخلاص الرؤى من نص اللغات الطبيعية. تُقاس هذه الطلبات بوحدات تبلغ 100 حرف (الوحدة الواحدة = 100 حرف)، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
  • معلومات تعريف الشخصية (PII): تبحث الواجهة detect PII API (واجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية) عن مواقع كيانات معلومات تعريف الشخصية ("PII") المختارة داخل مستند ويمكن استخدامها في إنشاء نسخ منقّحة من المستندات. تُخبرك الواجهة contains PII API (واجهة برمجة التطبيقات الخاصة باحتواء معلومات تعريف الشخصية) ما إذا كان المستند يحتوي على معلومات تعريف الشخصية (PII) المختارة أم لا. تُقاس هذه الطلبات أيضًا بوحدات تبلغ 100 حرف (الوحدة الواحدة = 100 حرف)، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.
  • خدمة Comprehend المخصصة: يمكن لواجهة برمجة التطبيقات الخاصة بميزة التصنيف المخصص وواجهة برمجة التطبيقات الخاصة بميزة الكيانات أن تقوما بتدريب نموذج معالجة لغة طبيعية (NLP) مخصص لتصنيف النص واستخراج الكيانات المخصصة. تُقاس طلبات الاستدلال غير المتزامنة بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب. تتحمل تكلفة تُقدَّر بـ 3 USD في الساعة مقابل التدريب الخاص بالنموذج (يتم إعداد الفاتورة بالثواني) و0.50 USD شهريًا لإدارة النموذج المخصص. بالنسبة إلى طلبات الاستدلال المتزامنة الخاصة بالتصنيف المخصص والكيانات، يمكنك توفير نقطة نهاية ذات معدل نقل مناسب. يتم احتساب التكلفة التي تتحملها من وقت بدء نقطة النهاية حتى يتم حذفها.
  • بناء نماذج الموضوعات: تقوم ميزة بناء نماذج الموضوعات (Topic Modeling) بتحديد المصطلحات أو الموضوعات ذات الصلة من بين مجموعة من المستندات المخزَّنة في Amazon S3. وتحدد هذه الميزة الموضوعات الأكثر شيوعًا في المجموعة، وتقوم بتنظيمها في مجموعات ثم تقوم بتعيين المستندات إلى الموضوعات التي تنتمي إليها. يتم احتساب التكلفة عليك بناءً على إجمالي حجم المستندات التي تتم معالجتها في كل مهمة. ويتم احتساب تكلفة ثابتة على أول 100 ميجابايت. بعد تخطي 100 ميجابايت، يتم احتساب التكلفة نظير كل ميجابايت.
  • لمعرفة تسعير Amazon Comprehend Medical، تعرّف على المزيد هنا.
  • يمكنك تقدير قيمة تكاليفك باستخدام حاسبة تسعير AWS.
بالنسبة للأحجام التي تزيد عن 100 ميجا لكل شهر، يُرجى الاتصال بنا لمعرفة التسعير.
تُقاس طلبات معالجة اللغات الطبيعية (NLP) بوحدات تبلغ كل منها 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.

مع واجهات برمجة تطبيقات Amazon Comprehend، يُمكنك معالجة النص الخام غير المهيكل، باستخدام بعض واجهات برمجة التطبيقات، وكذلك معالجة ملفات نصية مثل مستندات PDF ومستندات Word. 

Custom Comprehend

الكيانات المخصصة والتصنيف
للتعرف على الكيانات غير المتزامنة بمستندات PDF* وWord والمستندات النصية العادية

يتم قياس طلبات الاستنباط بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.

للتصنيف المتزامن

يتم قياس طلبات الاستنباط بوحدات تبلغ 100 حرف، مع فرض حد أدنى للتكلفة يبلغ 3 وحدات (أي 300 حرف) لكل طلب.

للتصنيف والتعرف على الكيانات المتزامنين

يتم إعداد فواتير تكلفة نقاط النهاية بزيادات تبلغ ثانية واحدة، وبحدٍّ أدنى 60 ثانية. سيستمر احتساب التكاليف من وقت بدء نقطة النهاية إلى أن يتم حذفها حتى وإن لم يتم تحليل أي مستندات.

توفر وحدة استدلال (IU) واحدة معدل نقل يبلغ 100 حرف في الثانية على نقطة النهاية المُدارة. يمكنك توفير وحدات استدلال إضافية لزيادة معدل النقل. ستتحمل كل وحدة استدلال تكلفة قدرها 0.0005 USD في الثانية.

3 USD في الساعة للتدريب الخاص بالنموذج

*لاستخراج نص من مستندات PDF ممسوحة ضوئيًا، يجري استدعاء واجهة برمجة التطبيقات الخاصة باكتشاف نصوص المستندات في Amazon Textract.

بناء نماذج الموضوعات

لأول 100 ميجابايت

لكل ميجابايت تتعدى أول 100 ميجابايت

يتم احتساب التكلفة عليك بناءً على إجمالي حجم المستندات التي تتم معالجتها لبناء نماذج للموضوعات في كل مهمة. ويتم احتساب تكلفة ثابتة على أول 100 ميجابايت. بعد تخطي 100 ميجابايت، يتم احتساب التكلفة نظير كل ميجابايت.

طبقة مجانية

50 ألف وحدة نص (5 ملايين حرف)

تقدم Amazon Comprehend طبقةً مجانيةً تتضمن 50 ألف وحدة نص (5 ملايين حرف) لكل واجهة برمجة تطبيقات في الشهر.

تتضمن واجهات برمجة التطبيقات المؤهلة استخراج العبارات الأساسية، وتحليل المشاعر، والمشاعر الموجّهة، والتعرف على الكيانات، واكتشاف اللغة، واكتشاف الأحداث، وتحليل بناء الجملة، وواجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية (Detect PII)، وواجهة برمجة التطبيقات الخاصة باحتواء معلومات تعريف الشخصية (Contains PII).

ملاحظة: لا تقدم Custom Comprehend (الكيانات المخصصة والتصنيف المخصص) طبقةً مجانيةً. وهذا يشمل تدريب النماذج، والاستدلال، وإدارة النماذج.

5 مهام حجم كل منها 1 ميجابايت (نماذج الموضوعات)

تتوفر الطبقة المجانية من خدمة Amazon Comprehend لكلٍّ من عملاء AWS الجدد والحاليين لمدة 12 شهرًا، بدءًا من تاريخ أول طلب لخدمة Amazon Comprehend‏.

أمثلة على تسعير Amazon Comprehend

مثال 1 - تحليل تعليقات العملاء

لنفترض أنك قمت بتطوير أحد التطبيقات باستخدام Amazon Comprehend لتحليل تعليقات العملاء على متجرك المتاح عبر الإنترنت. وقد تلقيت 10,000 تعليق من العملاء يصل طول كل منها إلى 550 حرفًا، كما أنك تستخدم الخدمة للعام الثاني.

حساب التكلفة الإجمالية:

حجم كل طلب = 550 حرفًا

عدد الوحدات للطلب = 6

إجمالي الوحدات: 10,000 (طلب) × 6 (وحدات لكل طلب) = 60,000

السعر لكل وحدة = 0.0001 USD‏

إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة] = 60,000 × 0.0001 ‏USD ‏= 6.00 USD‏


مثال 2 - تصنيف المستندات حسب الموضوعات

لنقل إن لديك مجموعة من المستندات البحثية يبلغ إجمالي حجمها 240 ميجابايت والتي ترغب في تصنيفها حسب الموضوع والتوصية بالمستندات لعملائك بناءً على مجال اهتمامهم. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية.

حساب التكلفة الإجمالية:

إجمالي وحدات الميجابايت المُعالَجة = 240

وحدات الميجابايت التي تمت المحاسبة عليها بسعر ثابت يبلغ 1 USD ‏= 100

وحدات الميجابايت التي تمت المحاسبة عليها بسعر 0.004 USD/ميجابايت ‏= 140 [240‏-100]

إجمالي تكلفة المهمة = 1.00‏ USD + [‏140 × 0.004 USD‏] = 1.00 ‏USD‏ + 0.56 USD‏ = 1.56 ‏USD


مثال 3 - تصنيف تعليقات العملاء باستخدام API للتصنيف المخصص

دعنا نقل إنك ترغب في تدريب أحد المُصنِّفين من أجل تنظيم ملاحظات العملاء الجدد تلقائيًا والتي تَرِد من موقعك الإلكتروني. يُدخِل 10 عملاء الملاحظات كل دقيقة، ويبلغ كل جزء من الملاحظات 300 حرف. ويستغرق الأمر ساعةً واحدةً لتدريب النموذج المخصص، كما أنك تخطط للاحتفاظ بهذا النموذج لمدة شهر. ولذلك، ستبلغ تكاليف التدريب الخاص بالنموذج 3 USD وستكون تكاليف تخزين النموذج 0.5 USD في الشهر. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية. 

لتصنيف الملاحظات بشكل غير متزامن، تقوم بالدفع حسب عدد الأحرف الوارد في مستنداتك. وللتصنيف في الوقت الفعلي، يمكنك توفير نقطة نهاية ذات معدل نقل كافٍ للتعامل مع حالة الاستخدام الخاصة بك والدفع مقابل وقت انتهاء نقطة النهاية.

حساب تكلفة الاستدلال للتصنيف غير المتزامن:

حجم كل طلب في اليوم = 4,320,000 حرف [300 حرف × 10 مستندات × 1,440 دقيقة]

عدد الوحدات لكل الطلب = 43,200 وحدة [432,000 حرف ÷ 100 حرف لكل وحدة]

السعر لكل وحدة = 0.0005 USD

إجمالي تكلفة الاستدلال للوحدات = 21.60‏ USD [‏43,200 وحدة × 0.0005 USD‏]

التكلفة الإجمالية = 25.10 USD [21.60 USD للاستدلال + 3 USD للتدريب الخاص بالنموذج + 0.50 USD لتخزين النموذج]

حساب التكلفة الإجمالية للتصنيف المتزامن:

أولاً، لنحسب معدل النقل المطلوب. نحن نصنِّف 10 مستندات يحتوي كل منها على 300 حرف كل دقيقة. ومن ثمَّ، يرِد الحساب كما يلي:

50 حرفًا في الثانية [300 حرف × 10 مستندات ÷ 60 ثانية]

لذلك، سيتعيَّن عليك توفير نقطة نهاية ذات وحدة استدلال (IU) واحدة، والتي تقدّم معدل نقل يبلغ 100 حرف في الثانية.

السعر لوحدة استدلال واحدة = 0.0005 USD في الثانية

ستتحمل التكاليف اعتمادًا على المدة التي استخدمت فيها نقطة نهاية التصنيف في الوقت الفعلي، بغض النظر عن عدد طلبات استدعاء الاستدلال التي تم إجراؤها.

إذا كنت تُشغِّل نقطة نهاية التصنيف في الوقت الفعلي لمدة 12 ساعة في اليوم:

إجمالي تكلفة الاستدلال = 21.60 USD [USD 0.0005‏ × 3600 ثانية × 12 ساعة]

التكلفة الإجمالية = 25.10 USD [21.60 USD للاستدلال + 3 USD للتدريب الخاص بالنموذج + 0.50 USD لتخزين النموذج]

لاحظ أنك تتحمل تكاليف معدل النقل المتوفِّر ومقدار الوقت الذي تستخدم فيه نقطة النهاية. إذا كنت بحاجة إلى توفير المزيد من معدل النقل، فسيكون السعر كما يلي:

السعر لوحدتَي استدلال = 0.001 USD في الثانية [0.0005 USD‏ × 2]

السعر لعدد 3 وحدات استدلال = 0.0015 USD في الثانية [0.0005 USD‏ × 3]


مثال 4 - تحليل تعليقات العملاء باستخدام واجهة برمجة التطبيقات الخاصة بالكيانات المخصصة

لنقل إنك ترغب في تدريب نموذج كيانات مخصصة لاستخراج مصطلحات مخصصة من تعليقات العملاء التي تَرِد من موقعك الإلكتروني. تستغرق مهمة التدريب 1.5 ساعة، كما أنك تقوم بتحليل 10,000 وحدة من تعليقات العملاء يبلغ طول كل منها 550. وأنت تخطط للاحتفاظ بهذا النموذج لمدة شهر. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية.

حساب التكلفة الإجمالية:

حجم كل طلب = 5,500,000 حرف

عدد الوحدات للطلب = 55,000 وحدة [5,500,000 حرف ÷ 100 حرف للوحدة]

السعر لكل وحدة = 0.0005 USD‏

إجمالي تكلفة الوحدات = 27.5‏ USD [‏55000 وحدة × 0.0005 USD‏]

إجمالي عدد الساعات لتدريب النموذج = 1.5 ساعة

السعر لكل ساعة = 3 ‏USD

إجمالي التكلفة لتدريب النموذج = 4.5 USD [‏1.5 ساعة × 3 ‏USD‏]

عدد الشهور لإدارة النموذج = شهر واحد

السعر في الشهر = 0.50 ‏USD 

إجمالي التكلفة لإدارة النموذج = 0.50 ‏USD [شهر واحد × 0.50 ‏USD‏]

إجمالي التكلفة = 37 ‏USD [‏27.5 ‏USD ‏+ 4.5 ‏USD +‏ 0.50 ‏USD‏]


مثال 5 – استخراج الأحداث والمعلومات المرتبطة بها باستخدام ميزة اكتشاف الأحداث

لنفترض أنك تريد استخراج 3 أنواع من الأحداث من 3000 مقالة كل منها مكونة من 500 حرف وأنت في السنة الثانية من استخدامك للخدمة.

حساب التكلفة الإجمالية:

عدد الأحرف المعالجَة = 1500000 حرف [3000 مقالة × 500 حرف]

عدد الوحدات المعالجَة = 45000 وحدة [1500000 × 3 أنواع أحداث ÷ 100 حرف لكل وحدة]

السعر لكل وحدة = 0.003 USD

إجمالي تكلفة الوحدات = 135 USD [45000 وحدة x ‏0.003 USD]


مثال 6 – تحديد المستندات المشتملة على معلومات تعريف الشخصية (PII) باستخدام الواجهة Contains PII API (واجهة برمجة التطبيقات الخاصة باحتواء معلومات تعريف الشخصية)

لنفترض أنك قمت بتطوير أحد التطبيقات باستخدام Amazon Comprehend لتحليل تعليقات العملاء على متجرك المتاح عبر الإنترنت. لقد تلقيت 10000 تعليق من العملاء يبلغ طول كل منها 550 حرفًا، وتحتاج إلى تحديد المستندات التي تحتوي على معلومات تعريف الشخصية (PII) كي يتم تخزينها في مكان آمن. ولنفرض أنك في السنة الثانية من استخدامك للخدمة.

حساب التكلفة الإجمالية:

حجم كل طلب = 550 حرفًا

عدد الوحدات للطلب = 6

إجمالي الوحدات = 60000 [10000 طلب x 6 وحدات وحدة لكل طلب]

السعر لكل وحدة = 0.000002 USD

التكلفة الإجمالية = 0.12 USD [60000 وحدة x 0.000002 USD]


مثال 7 – تنقيح معلومات تعريف الشخصية (PII) من المستندات باستخدام الواجهة Detect PII API (واجهة برمجة التطبيقات الخاصة باكتشاف معلومات تعريف الشخصية)

لنفترض أنك قمت بتطوير أحد التطبيقات باستخدام Amazon Comprehend لتحليل تعليقات العملاء على متجرك المتاح عبر الإنترنت. لقد تلقيت 10000 تعليق من العملاء يبلغ طول كل منها 550 حرفًا، وتحتاج إلى إنشاء نسخ منقحة من المستندات قبل أرشفتها. ولنفرض أنك في السنة الثانية من استخدامك للخدمة.

حساب التكلفة الإجمالية:

حجم كل طلب = 550 حرفًا

عدد الوحدات للطلب = 6

إجمالي الوحدات = 60000 [10000 طلب x 6 وحدات وحدة لكل طلب]

السعر لكل وحدة = 0.0001 USD‏

التكلفة الإجمالية = 6 USD [60000 وحدة x ‏0.0001 USD]

مثال 8 - استخراج كيانات طلبات الرهن العقاري باستخدام واجهة برمجة التطبيقات الخاصة بالكيانات المخصصة

لنفترض أنك تريد تدريب نموذج استخراج كيانات مخصصة لاستخراج 10 كيانات مخصصة من طلب رهن عقاري. يتقدم مائة عميل كل يوم، حيث يقدم كل منهم مستند PDF ممسوحًا ضوئيًا مكون من 10 صفحات تحتوي كل صفحة على 2500 حرف. باستخدام Amazon Textract، لنفترض أننا بحاجة إلى استخراج النص من كل صفحة تمت معالجتها قبل استخراج الكيانات باستخدام واجهة برمجة التطبيقات الخاصة باكتشاف نصوص المستندات. ويستغرق الأمر ساعةً واحدةً لتدريب النموذج المخصص، كما أنك تخطط للاحتفاظ بهذا النموذج لمدة شهر. ولذلك، ستبلغ تكاليف تدريب النموذج 3 USD وستكون تكاليف تخزين النموذج 0.50 USD في الشهر. ودعنا نفترض أيضًا أنك في العام الثاني لاستخدام الخدمة وأنك لست مؤهلاً للحصول على عرض الطبقة المجانية. لاستخراج الكيانات المخصصة بشكل غير متزامن، تدفع حسب عدد الأحرف الوارد في مستنداتك. ولاستخراج الكيانات في الوقت الفعلي، يمكنك توفير نقطة نهاية ذات معدل نقل كافٍ للتعامل مع حالة الاستخدام والدفع مقابل وقت انتهاء نقطة النهاية.

حساب تكلفة الاستدلال للتصنيف غير المتزامن:

حجم كل طلب في اليوم = 2500000 حرف [100 تطبيق/يوم * 10 مستندات * 2500 حرف]

عدد الوحدات لكل الطلب = 25000 وحدة [2500000 حرف ÷ 100 حرف لكل وحدة]

السعر لكل وحدة = 0.0005 USD

إجمالي تكلفة الاستدلال للوحدات = 12.50‏ USD [‏25000 وحدة × 0.0005 USD‏]

تكلفة Amazon Textract لواجهة برمجة التطبيقات الخاصة باكتشاف نصوص المستندات = 1.50 USD [100 طلب/يوم * 10 مستندات * 0.0015 السعر لكل صفحة، حتى مليون صفحة]

التكلفة الإجمالية = 17.50 USD [12.50 ‏USD للاستدلال + 1.50 USD لـ Textract ‏+ 3 USD لتدريب النموذج + 0.50 USD لتخزين النموذج]

 

مثال 9 – تحليل الإجابات على استبيانات الموظفين

لنفترض أنك أنشأت تطبيقًا باستخدام Amazon Comprehend Targeted Sentiment لتحليل إجابات استبيانات الموظفين بشركتك. وقد تلقيت 100000 إجابة استبيان يصل طول كل منها إلى 350 حرفًا، كما أنك تستخدم الخدمة للعام الثاني.

حساب التكلفة الإجمالية:

حجم كل طلب = 350 حرفًا

عدد الوحدات للطلب = 4

إجمالي الوحدات: 100000 (طلب) × 4 (وحدات وحدة لكل طلب) = 400000

السعر لكل وحدة = 0.0001 USD (من 0 إلى 10 مليون وحدة)

إجمالي التكلفة = [عدد الوحدات] × [تكلفة الوحدة] = 400000 × 0.0001 ‏USD ‏= 40.00 USD‏

 

تعرَّف على المزيد حول ميزات Amazon Comprehend

زيارة صفحة الميزات
هل أنت مستعد للبدء؟
التسجيل
هل لديك مزيد من الأسئلة؟
تواصل معنا