Apa yang dimaksud dengan NLP?

Pemrosesan bahasa alami (NLP) adalah sebuah teknologi machine learning yang memberi komputer kemampuan untuk menginterpretasikan, memanipulasi, dan memahami bahasa manusia. Banyak organisasi dewasa ini memiliki begitu banyak data suara dan teks dari berbagai saluran komunikasi seperti email, pesan teks, umpan berita media sosial, video, audio, dan banyak lagi. Organisasi tersebut menggunakan perangkat lunak NLP untuk memproses data ini secara otomatis, menganalisis maksud atau sentimen dalam pesan, dan merespons komunikasi manusia dalam waktu nyata.

Mengapa NLP penting?

Pemrosesan bahasa alami sangat penting untuk sepenuhnya menganalisis data teks dan ucapan secara efisien. Teknologi ini dapat menjelajahi berbagai perbedaan dalam dialek, bahasa gaul, dan penyimpangan tata bahasa yang khas dalam percakapan sehari-hari. Banyak perusahaan menggunakan teknologi ini untuk berbagai tugas otomatis, seperti untuk:


•    Memproses, menganalisis, dan mengarsipkan dokumen besar
•    Menganalisis umpan balik pelanggan atau rekaman pusat panggilan
•    Menjalankan chatbot untuk layanan pelanggan otomatis
•    Menjawab pertanyaan seputar siapa-apa-kapan-di mana
•    Menglasifikasikan dan mengekstraksi teks


Anda juga dapat mengintegrasikan NLP dalam aplikasi yang berhubungan langsung dengan pelanggan untuk berkomunikasi secara lebih efektif dengan pelanggan. Misalnya, chatbot akan menganalisis dan menyortir pertanyaan pelanggan, menjawab pertanyaan-pertanyaan umum secara otomatis, dan mengarahkan kueri yang kompleks ke dukungan pelanggan. Otomatisasi ini membantu mengurangi biaya, mencegah agen menghabiskan waktu dalam kueri-kueri berulang, dan meningkatkan kepuasan pelanggan.

Apa saja kasus penggunaan NLP untuk bisnis?

Bisnis menggunakan perangkat lunak dan alat NLP untuk menyederhanakan, mengotomatiskan, dan menyederhanakan operasional secara efisien dan akurat. Kami memberikan beberapa contoh kasus penggunaan di bawah ini. 

Redaksi data sensitif

Bisnis di sektor asuransi, hukum, dan perawatan kesehatan memproses, menyortir, dan mengambil sejumlah besar dokumen sensitif seperti catatan medis, data keuangan, dan data privat. Sebagai ganti meninjau informasi secara manual, perusahaan menggunakan teknologi NLP untuk menyunting informasi pengidentifikasi pribadi dan melindungi data sensitif. Sebagai contoh, Chisel AI membantu banyak operator asuransi mengekstraksi nomor polis, tanggal kedaluwarsa, dan atribut nasabah pribadi lainnya dari dokumen yang tidak terstruktur dengan Amazon Comprehend.

Interaksi pelanggan

Teknologi NLP memungkinkan chatbot dan bot suara makin terdengar seperti manusia saat bercakap-cakap dengan pelanggan. Banyak bisnis menggunakan chatbot untuk menskalakan kemampuan dan kualitas layanan pelanggan sambil menjaga biaya operasional tetap seminimal mungkin. PubNub, yang membangun perangkat lunak chatbot, menggunakan Amazon Comprehend untuk memperkenalkan fungsionalitas obrolan yang dilokalkan untuk para pelanggan globalnya. T-Mobile menggunakan NLP untuk mengidentifikasi kata kunci tertentu dalam pesan teks pelanggan dan menawarkan rekomendasi yang dipersonalisasi. Oklahoma State University melakukan deployment solusi chatbot Tanya Jawab untuk menjawab pertanyaan siswa menggunakan teknologi machine learning (ML)

Analitik bisnis

Tenaga pemasaran menggunakan alat NLP seperti Amazon Comprehend dan Amazon Lex untuk mendapatkan persepsi teredukasi tentang apa yang pelanggan rasakan mengenai produk atau layanan suatu perusahaan. Dengan memindai frasa tertentu, para tenaga pemasaran ini dapat mengukur suasana hati dan emosi pelanggan dalam umpan balik tertulis. Sebagai contoh, Success KPI menyediakan solusi pemrosesan bahasa alami yang membantu bisnis fokus pada area yang ditargetkan dalam analisis sentimen dan membantu pusat kontak mendapatkan wawasan yang dapat ditindaklanjuti dari analitik panggilan.

Bagaimana cara kerja NLP?

Pemrosesan bahasa alami menggabungkan model linguistik komputasional, machine learning, dan deep learning untuk memproses bahasa manusia.

Linguistik komputasional

Linguistik komputasional adalah ilmu memahami dan membangun model bahasa manusia dengan alat komputer dan perangkat lunak. Para peneliti menggunakan metode linguistik komputasional, seperti analisis sintaksis dan semantik, untuk menciptakan kerangka kerja yang membantu mesin memahami bahasa manusia yang digunakan dalam percakapan. Alat seperti penerjemah bahasa, synthesizer teks-ke-ucapan, dan perangkat lunak pengenalan ucapan didasarkan pada linguistik komputasional. 

Machine learning

Machine learning adalah teknologi yang melatih komputer dengan data sampel untuk meningkatkan efisiensinya. Bahasa manusia memiliki sejumlah fitur seperti sarkasme, metafora, variasi dalam struktur kalimat, ditambah tata bahasa dan pengecualian penggunaan yang perlu waktu bertahun-tahun untuk dipelajari oleh manusia. Programmer menggunakan metode machine learning untuk mengajari aplikasi NLP mengenali dan memahami fitur-fitur ini secara akurat sejak awal.

Deep learning

Deep learning adalah sebuah bidang machine learning spesifik yang mengajari komputer untuk belajar dan berpikir seperti manusia. Deep learning melibatkan jaringan neural yang terdiri dari node pemrosesan data menyerupai operasi otak manusia. Dengan deep learning, komputer mengenali, menglasifikasikan, dan menghubungkan pola kompleks dalam data input.

Langkah-langkah implementasi NLP

Biasanya, proses NLP dimulai dengan mengumpulkan dan menyiapkan data teks atau ucapan yang tidak terstruktur dari sumber seperti gudang data cloud, survei, email, atau aplikasi proses bisnis internal.

Prapemrosesan

Perangkat lunak NLP menggunakan teknik prapemrosesan seperti tokenisasi, stemming, lemmatisasi, dan penghapusan kata henti guna menyiapkan data untuk berbagai aplikasi. 

  • Tokenisasi memecah sebuah kalimat menjadi unit kata atau frasa inividual. 
  • Stemming dan lemmatisasi menyederhanakan kata ke dalam bentuk akarnya. Misalnya, proses ini mengubah starting menjadi start
  • Penghapusan kata henti memastikan kata yang tidak menambahkan makna siginifikan ke sebuah kalimat, seperti for dan with, dihapus. 

Pelatihan

Para peneliti menggunakan data yang diproses sebelumnya untuk melatih model NLP dengan machine learning guna melakukan aplikasi spesifik berdasarkan informasi tekstual yang disediakan. Melatih algoritme NLP membutuhkan mengumpan perangkat lunak dengan sampel data besar untuk meningkatkan akurasinya. 

Deployment dan Inferensi

Ahli machine learning kemudian melakukan deployment model atau mengintegrasikan model tersebut ke dalam lingkungan produksi yang sudah ada. Model NLP menerima input dan memprediksi output untuk kasus penggunaan spesifik yang didesain untuk model tersebut. Anda dapat menjalankan aplikasi NLP di data langsung dan mendapatkan output yang diperlukan.

Apa saja tugas NLP?

Teknik NLP, atau tugas NLP, memecah teks atau ucapan manusia menjadi bagian-bagian lebih kecil yang dapat dengan mudah dipahami oleh program komputer. Kemampuan pemrosesan dan analisis teks umum di NLP diberikan di bawah ini. 

Penandaan bagian ucapan

Dalam proses ini, perangkat lunak NLP menandai kata-kata individual dalam sebuah kalimat menurut penggunaan kontekstual, seperti kata benda, kata kerja, kata sifat, atau kata keterangan. Proses ini membantu komputer memahami bagaimana kata-kata membentuk hubungan yang bermakna satu sama lain. 

Disambiguasi makna kata

Beberapa kata mungkin memiliki arti yang berbeda saat digunakan dalam skenario yang berbeda. Misalnya, kata bat berarti banyak hal dalam kalimat ini:

  • A bat is a nocturnal creature.
  • Baseball players use a bat to hit the ball. 

Dengan disambiguasi makna kata, perangkat lunak NLP mengidentifikasi makna kata yang dimaksud, baik dengan melatih model bahasanya atau mengacu ke definisi kamus. 

Pengenalan suara

Pengenalan suara mengubah data suara menjadi teks. Prosesnya melibatkan pemecahan kata ke dalam beberapa bagian yang lebih kecil dan mengatasi tantangan seperti aksen, ucapan yang kurang jelas, intonasi, dan penggunaan tata bahasa yang tidak tepat dalam percakapan sehari-hari. Penerapan penting pengenalan suara adalah transkripsi, yang dapat dilakukan dengan menggunakan layanan ucapan-ke-teks seperti Amazon Transcribe.

Terjemahan mesin

Perangkat lunak terjemahan mesin menggunakan pemrosesan bahasa alami untuk mengonversi teks atau ucapan dari satu bahasa ke bahasa lain sambil mempertahankan akurasi kontekstual. Layanan AWS yang mendukung terjemahan mesin adalah Amazon Translate.

Named entity recognition (pengenalan entitas bernama)

Proses ini mengidentifikasi nama unik untuk orang, tempat, event, perusahaan, dan banyak lagi. Perangkat lunak NLP menggunakan pengenalan entitas bernama untuk menentukan hubungan antara entitas yang berbeda dalam kalimat. Perhatikan contoh berikut. 

Jane pergi ke Prancis untuk liburan, dan dia mencicipi banyak hidangan lokal.

Perangkat lunak NLP akan memilih Jane dan Prancis sebagai entitas khusus dalam kalimat tersebut. Ini dapat diperluas lebih lanjut dengan resolusi referensi bersama, menentukan apakah kata yang berbeda digunakan untuk menggambarkan entitas yang sama. Dalam contoh di atas, baik Jane dan dia menunjuk ke orang yang sama. 

Analisis sentimen

Analisis sentimen adalah pendekatan berbasis AI untuk menginterpretasikan emosi yang disampaikan oleh data tekstual. Perangkat lunak NLP menganalisis teks untuk kata atau frasa yang menunjukkan ketidakpuasan, kebahagiaan, keraguan, penyesalan, dan emosi tersembunyi lainnya. 

Apa saja pendekatan untuk pengolahan bahasa alami?

Kami memberikan beberapa pendekatan umum untuk pemrosesan bahasa alami di bawah ini.

NLP dengan pengawasan

Metode NLP dengan pengawasan melatih perangkat lunak dengan satu set input dan output berlabel atau diketahui. Pertama-tama, program ini memproses begitu banyak data yang diketahui dan belajar bagaimana menghasilkan output yang benar dari input yang tidak diketahui. Misalnya, perusahaan melatih alat NLP untuk mengategorikan dokumen sesuai dengan label tertentu. 

NLP tanpa pengawasan

NLP tanpa pengawasan menggunakan model bahasa statistik untuk memprediksi pola yang terjadi saat diumpankan oleh input yang tidak berlabel. Misalnya, fitur lengkapi otomatis dalam pesan teks menyarankan kata-kata yang relevan yang masuk akal untuk kalimat dengan memantau respons pengguna.  

Pemahaman bahasa alami

Pemahaman bahasa alami (NLU) adalah subset NLP yang berfokus di analisis makna di balik kalimat. NLU memungkinkan perangkat lunak menemukan makna yang sama dalam kalimat berbeda atau memproses kata yang memiliki makna berbeda. 

Pembuatan bahasa alami

Pembuatan bahasa alami (NLG) berfokus di pembuatan teks percakapan seperti yang dilakukan manusia berdasarkan kata kunci atau topik tertentu. Misalnya, chatbot cerdas dengan kemampuan NLG dapat berkomunikasi dengan pelanggan dengan cara yang sama seperti yang dilakukan staf dukungan pelanggan. 

Bagaimana AWS dapat membantu tugas NLP Anda?

AWS menyediakan set layanan AI/ML terluas dan terlengkap untuk pelanggan dari berbagai level keahlian yang terhubung ke set sumber data yang komprehensif.

Untuk pelanggan yang tidak memiliki keterampilan ML, perlu waktu lebih cepat untuk memasuki pasar, atau ingin menambahkan kecerdasan ke proses atau aplikasi yang sudah ada, AWS menawarkan berbagai layanan bahasa berbasis machine learning yang memungkinkan perusahaan dengan mudah menambahkan kecerdasan ke aplikasi AI mereka melalui API yang dilatih sebelumnya untuk fungsionalitas ucapan, transkripsi, terjemahan, analisis teks, dan chatbot. Layanan mencakup Amazon Comprehend untuk menemukan wawasan dan hubungan dalam teks, Amazon Transcribe untuk pengenalan ucapan otomatis, Amazon Translate untuk terjemahan teks yang nyaman dibaca, Amazon Polly teks ke ucapan yang terdengar natural, Amazon Lex untuk membangun chatbot untuk interaksi dengan pelanggan, dan Amazon Kendra untuk melakukan pencarian cerdas sistem perusahaan untuk dengan cepat menemukan konten yang dicari.

Untuk pelanggan yang ingin membuat solusi NLP standar di seluruh bisnis mereka, Amazon SageMaker memudahkan Anda menyiapkan data serta membangun, melatih, dan melakukan deployment model ML untuk kasus penggunaan apa pun dengan infrastruktur, alat, dan alur kerja terkelopa penuh, termasuk penawaran tanpa kode untuk analis bisnis. Dengan Hugging Face di Amazon SageMaker, Anda dapat melakukan deployment dan menyetel model yang dilatih sebelumnya dari Hugging Face, penyedia model pemrosesan bahasa alami (NLP) sumber terbuka yang dikenal sebagai Transformers, mengurangi waktu yang dibutuhkan untuk menyiapkan dan menggunakan model NLP ini dari hitungan minggu ke menit.

Mulailah menggunakan pemrosesan bahasa alami (NLP) dengan membuat akun AWS sekarang juga.

Langkah berikutnya Pemrosesan Bahasa Alami AWS

Lihat sumber daya terkait produk tambahan
Layanan Machine Learning Gratis di AWS 
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis. 

Daftar 
Mulai membangun di konsol

Mulai membangun di Konsol Manajemen AWS.

Masuk