AWS Türkçe Blog
Amazon SageMaker Canvas Generative AI kullanarak işletmenizdeki kullanıcıların şirket belgelerinden içgörüler elde etmesini sağlayın
Orijinal makale : Link (Davide Gallitelli, Bilal Alam, Dan Sinnreich ve Pashmeen Mistry)
İşletmeler, karmaşık sorunları çözmek ve sonuçları iyileştirmek için makine öğreniminin (machine learning – ML) potansiyelinden faydalanmaya çalışıyor. Yakın zamana kadar, makine öğrenimi modellerini oluşturmak ve uygulamak, modellerde ince ayar yapmak ve operasyonel işlem hatlarını sürdürmek de dahil olmak üzere derin düzeyde teknik ve kodlama becerileri gerektiriyordu. Amazon SageMaker Canvas, 2021’de kullanıma sunulduğundan bu yana iş analistlerinin kod yazmadan tablo, bilgisayarlı görü ve doğal dil işleme dahil olmak üzere çeşitli makine öğrenimi modelleri oluşturmasına, dağıtmasına ve kullanmasına olanak tanıdı. Böylelikle işletmelerin zaman serisi ve müşteri kaybı tahmini, duygu analizi, endüstriyel hata tespiti ve daha pek çok kullanım senaryosuna makine öğrenimi uygulama becerileri hızlandı.
SageMaker Canvas, 5 Ekim 2023‘te duyurulduğu üzere desteklediği modelleri, içerik oluşturmak ve özetlemek için kullanılan büyük dil modelleri olan temel modellerle (FM’ler) genişletti. 12 Ekim 2023 tarihli sürümle birlikte SageMaker Canvas, kullanıcıların soru sormasına ve kurumsal verilerine dayanan yanıtlar almasına olanak tanır. Böylece sonuçların bağlama özgü olması sağlanarak, iş sorunlarını çözmek için kodsuz makine öğreniminin uygulanabileceği ek kullanım durumları ortaya çıkar. Örneğin, iş ekipleri artık bir kuruluşun belirli kelime dağarcığı ve ilkeleriyle tutarlı yanıtlar formüle edebilir ve bu belgelerin içeriğine özgü ve temelli yanıtlar almak için uzun belgeleri daha hızlı sorgulayabilir. Tüm bu içerik özel ve güvenli bir şekilde gerçekleştirilir ve tüm hassas verilere uygun yönetişim ve koruma önlemleri ile erişilmesini sağlar.
Başlangıç için bir bulut sistem yöneticisi, Amazon Kendra indekslerini SageMaker Canvas için veri kaynakları olarak kurumsal verilerle yapılandırır ve doldurur. Canvas kullanıcıları, belgelerinin bulunduğu indeksi seçer ve çıktının her zaman gerçek kaynakları tarafından destekleneceğini bilerek fikir üretebilir, araştırma yapabilir ve keşfedebilir. SageMaker Canvas, Amazon Bedrock ve Amazon SageMaker JumpStart’ın son teknoloji FM’lerini kullanır. Diyaloglar birden fazla FM ile yan yana başlatılabilir, çıktılar karşılaştırılabilir ve üretken yapay zeka herkes için gerçekten erişilebilir hale getirilebilir.
Bu yazıda, yakın zamanda yayınlanan bu özelliği inceleyecek, mimariyi tartışacak ve aşağıdaki ekran görüntüsünde gösterildiği gibi SageMaker Canvas’ın bilgi tabanınızdaki belgeleri sorgulamasını sağlamak için adım adım bir kılavuz sunacağız.
Çözüme genel bakış
Temel modeller halüsinasyonlar üretebilir – bunlar genel, belirsiz, ilgisiz veya gerçekte yanlış olan yanıtlardır. Retrieval Augmented Generation (RAG) halüsinasyonları azaltmak için sıklıkla kullanılan bir yaklaşımdır. RAG mimarileri, FM’nin dışındaki verileri almak için kullanılır ve bu veriler daha sonra kullanıcının sorgusunu yanıtlamak üzere bağlam içi öğrenme gerçekleştirmek için kullanılır. Bu, FM’nin güvenilir bir bilgi tabanından veri kullanabilmesini ve bu bilgiyi kullanıcıların sorularını yanıtlamak için kullanabilmesini sağlayarak halüsinasyon riskini azaltır.
RAG sayesinde FM’nin dışında bulunan ve kullanıcı istemlerini güçlendirmek için kullanılan veriler belge havuzları, veritabanları veya API’ler gibi birden fazla farklı veri kaynağından gelebilir. İlk adım, belgelerinizi ve tüm kullanıcı sorgularını anlamsal arama yapmak için uyumlu bir biçime dönüştürmektir. Formatları uyumlu hale getirmek için, bir belge koleksiyonu veya bilgi kütüphanesi ve kullanıcı tarafından gönderilen sorgular, yerleştirme modelleri kullanılarak sayısal temsillere dönüştürülür.
Bu sürümle birlikte, RAG işlevselliği kodsuz ve sorunsuz bir şekilde sağlanmaktadır. İşletmeler, Canvas’taki diyalog deneyimini temel bilgi yönetim sistemi olarak Amazon Kendra ile zenginleştirebilir. Aşağıdaki şemada çözüm mimarisi gösterilmektedir.
SageMaker Canvas’ı Amazon Kendra’ya bağlamak için tek seferlik bir kurulum gerekir. Kurulum sürecini “Belgeleri sorgulamak için Canvas’ı ayarlama” bölümünde ayrıntılı olarak açıklıyoruz. SageMaker Domain’inizi henüz kurmadıysanız “Amazon SageMaker Domain’e Giriş” bölümüne bakın.
Domain yapılandırmasının bir parçası olarak bulut sistem yöneticisi, SageMaker Canvas aracılığıyla FM ile etkileşim kurarken iş analistinin sorgulayabileceği bir veya daha fazla Kendra indeksi seçebilir.
Kendra indeksleri hazırlandıktan ve yapılandırıldıktan sonra, iş analistleri yeni bir sohbet başlatıp “Query Documents” seçeneğini işaretleyerek indeksleri SageMaker Canvas ile kullanabilir. SageMaker Canvas daha sonra aşağıdaki işlemleri gerçekleştirmek için Amazon Kendra ve tercih edilen FM arasındaki temel iletişimi yönetecektir:
- Kullanıcıdan gelen soru ile Kendra indekslerinin sorgulanması
- Kendra dizinlerinden parçaçıkların (snippets) ve kaynakların alınması
- Temel modelin erişilen belgelerden bir yanıt oluşturabilmesi için soruyu orijinal sorgunun parçacıklarla birlikte yapılandırılması.
- Oluşturulan yanıtın, yanıtı formüle etmek için kullanılan sayfalara/belgelere referanslarla birlikte kullanıcıya sağlanması.
Belgeleri sorgulamak için Canvas’ı ayarlama
Bu bölümde, Kendra indeksleri aracılığıyla sunulan belgeleri sorgulamak için Canvas’ı ayarlama adımlarında size yol göstereceğiz. Aşağıdaki ön koşullara sahip olmalısınız:
- SageMaker Domain kurulumunu takip edin – “Amazon SageMaker Domain’e Giriş“
- Bir (veya birden fazla) Kendra indeksi oluşturun
- Kendra Amazon S3 bağlayıcısını kurun – Amazon S3 Connector takip edin – ve PDF dosyalarını ve diğer belgeleri Kendra diziniyle ilişkili Amazon S3 klasörüne yükleyin
- IAM servisini, Canvas’ın Amazon Bedrock ve/veya SageMaker uç noktalarını çağırmak için gerekenler de dahil olmak üzere uygun izinlere sahip olacağı şekilde ayarlayın – Canvas Sohbetini Kurma dokümanını izleyin
Şimdi Domain’i istediğiniz indekslere erişebilecek şekilde güncelleyebilirsiniz. SageMaker konsolunda, verilen Domain için Domain Settings sekmesi altında Edit’i seçin. Canvas Ayarları adımında bulunan “Enable query documents with Amazon Kendra” düğmesini etkinleştirin. Etkinleştirildikten sonra, Canvas ile kullanmak istediğiniz bir veya daha fazla Kendra indeksi seçin.
Canvas belge sorgulama özelliğini yapılandırmak için gereken tek şey bunlardır. Kullanıcılar artık Canvas içindeki bir konuşmaya başlayabilir ve Kendra indeksleri aracılığıyla Domain’e eklenmiş olan bilgi tabanlarını kullanmaya başlayabilir. Bilgi tabanı sorumluları doğruluk kaynağını güncellemeye devam edebilir ve Kendra’daki senkronizasyon özelliği sayesinde sohbet kullanıcıları otomatik olarak güncel bilgileri sorunsuz bir şekilde kullanabilir.
Sohbet için Belge Sorgulama özelliğini kullanma
Bir SageMaker Canvas kullanıcısı olarak, Belge Sorgulama (Query Documents) özelliğine bir sohbet içinden erişilebilir. Sohbet oturumunu başlatmak için SageMaker Canvas’taki Ready-to-use models sekmesinden “Generate, extract and summarize content” butonuna tıklayın veya arama yapın.
Bu aşamaya geldiğinizde, ekranın üst kısmındaki geçiş düğmesini kullanarak Belge Sorgulama özelliğini açıp kapatabilirsiniz. Özellik hakkında daha fazla bilgi edinmek için bilgi istemine göz atın.
Belge Sorgulama etkinleştirildiğinde, bulut sistem yöneticisi tarafından etkinleştirilen Kendra indeksleri listesi arasından seçim yapabilirsiniz.
Yeni bir sohbet başlatırken bir indeks seçebilirsiniz. Daha sonra kullanıcı arayüzünde bir soru sorabilirsiniz ve bilgi otomatik olarak seçilen indeksten kaynaklanır. Belirli bir indekse karşı bir sohbet başlatıldıktan sonra başka bir indekse geçmenin mümkün olmadığını unutmayın.
Sorulan sorular için sohbet, FM tarafından oluşturulan cevabı ve cevabın oluşturulmasına katkıda bulunan kaynak belgeleri gösterecektir. Kaynak belgelerden herhangi birine tıklandığında Canvas, FM tarafından kullanılan alıntıyı vurgulayarak belgenin bir önizlemesini açar.
Sonuç
Diyaloğa dayalı yapay zeka, aşağıdaki gibi doğal ve sezgisel etkileşimlerle insan benzeri bir asistan sağlayarak müşteri ve çalışan deneyimini dönüştürmek için büyük bir potansiyele sahiptir:
- Bir konu hakkında araştırma yapmak veya kuruluşun bilgi tabanında arama ve tarama yapmak
- İçgörüleri hızla toplamak için çok sayıda içeriği özetlemek
- Varlıklar, Konular, PII ve diğer faydalı verileri aramak ve yapılandırılmamış içeriğin iş değerini artırmak
- Belgeler ve iş yazışmaları için taslaklar oluşturmak
- Farklı iç kaynaklardan (olaylar, sohbet günlükleri, wiki’ler) bilgi makaleleri oluşturmak
Sohbet arayüzlerinin, bilgi erişiminin ve FM’lerin yenilikçi entegrasyonu, kurumların kendi alan bilgilerini ve gerçek kaynaklarını kullanarak kullanıcı sorularına doğru ve ilgili yanıtlar vermelerini sağlar.
SageMaker Canvas’ı Amazon Kendra’daki bilgi tabanlarına bağlayarak kuruluşlar, FM’lerin son teknoloji doğal dil yeteneklerinden faydalanmaya devam ederken özel verilerini kendi ortamlarında tutabilirler. SageMaker Canvas’ın Belge Sorgulama özelliğinin kullanıma sunulmasıyla, tüm kurumların güvenli bir sohbet deneyimine güç sağlamak için LLM’leri ve kurumsal bilgilerini doğruluk kaynağı olarak kullanmalarını kolaylaştırıyoruz. Tüm bu işlevsellik, işletmelerin tekrarlayan ve uzmanlık gerektirmeyen görevlerle uğraşmaktan kaçınmasına olanak tanıyan kodsuz bir formatta mevcuttur.
SageMaker Canvas hakkında daha fazla bilgi edinmek ve herkesin Makine Öğrenimi kullanmaya başlamasını nasıl kolaylaştırdığını öğrenmek için SageMaker Canvas duyurusuna göz atın. SageMaker Canvas’ın veri bilimcileri ve iş analistleri arasındaki işbirliğini nasıl geliştirdiği hakkında daha fazla bilgi edinmek için Build, Share & Deploy yazısını okuyun. Son olarak, kendi Retrieval Augmented Generation iş akışınızı nasıl oluşturacağınızı öğrenmek için SageMaker JumpStart RAG linkine göz atın.
Referanslar
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems, 33, 9459-9474.