Bộ chuyển đổi trong trí tuệ nhân tạo là gì?

Tạo tài khoản AWS

Khám phá các ưu đãi máy học miễn phí

Xây dựng, triển khai và chạy miễn phí ứng dụng máy học trên đám mây

Tìm hiểu về các dịch vụ máy học

Đổi mới sáng tạo nhanh hơn với bộ dịch vụ AI và ML toàn diện nhất

Duyệt xem các khóa đào tạo máy học

Bắt đầu đào tạo về máy học với nội dung được các chuyên gia AWS xây dựng

Đọc blog về máy học

Đọc các tin tức sản phẩm mới nhất và biện pháp thực hành tốt nhất về Máy học trên AWS

Bộ chuyển đổi trong trí tuệ nhân tạo là gì?

Bộ chuyển đổi là một loại kiến trúc mạng nơ-ron có khả năng biến đổi hoặc thay đổi một trình tự đầu vào thành một trình tự đầu ra. Bộ chuyển đổi thực hiện điều này bằng cách tìm hiểu ngữ cảnh và theo dõi mối quan hệ giữa các thành phần trong trình tự. Ví dụ: hãy xem xét trình tự đầu vào "Bầu trời có màu gì?" Mô hình bộ chuyển đổi sử dụng biểu diễn toán học nội bộ để xác định mức độ liên quan và mối quan hệ giữa các từ màu sắc, bầu trời và xanh lam. Mô hình này sử dụng kiến thức đó để tạo ra đầu ra: "Bầu trời có màu xanh lam".

Các tổ chức sử dụng mô hình bộ chuyển đổi cho tất cả các loại chuyển đổi trình tự, từ nhận dạng giọng nói đến dịch máy và phân tích trình tự protein.

Tìm hiểu về mạng nơ-ron

Tìm hiểu về trí tuệ nhân tạo (AI)

Tại sao bộ chuyển đổi lại quan trọng?

Các mô hình học sâu ban đầu tập trung nhiều vào các nhiệm vụ xử lý ngôn ngữ tự nhiên (NLP) nhằm giúp máy tính hiểu và phản ứng với ngôn ngữ tự nhiên của con người. Họ đoán từ tiếp theo trong một trình tự dựa trên từ trước đó.

Để hiểu rõ hơn, hãy xem xét tính năng tự động hoàn thành trên điện thoại thông minh của bạn. Nó đưa ra đề xuất dựa trên tần suất của các cặp từ mà bạn gõ. Ví dụ: nếu bạn thường xuyên gõ “Tôi ổn”, điện thoại của bạn sẽ tự động đề xuất ổnsau khi bạn gõ Tôi.

Các mô hình máy học (ML) ban đầu áp dụng công nghệ tương tự trên quy mô rộng hơn. Chúng ánh xạ tần suất mối quan hệ giữa các cặp từ hoặc nhóm từ khác nhau trong tập dữ liệu đào tạo của mình và cố gắng đoán từ tiếp theo. Tuy nhiên, công nghệ ban đầu không thể giữ lại bối cảnh vượt quá độ dài đầu vào nhất định. Ví dụ: mô hình ML ban đầu không thể tạo một đoạn có ý nghĩa vì nó không thể giữ lại bối cảnh giữa câu đầu tiên và câu cuối cùng trong một đoạn. Để tạo một đầu ra như "Tôi đến từ Ý. Tôi thích cưỡi ngựa. Tôi nói tiếng Ý.", mô hình cần ghi nhớ mối liên hệ giữa nước Ý và tiếng Ý, điều mà các mạng nơ-ron ban đầu không thể làm được.

Các mô hình bộ chuyển đổi đã thay đổi cơ bản các công nghệ NLP bằng cách cho phép các mô hình xử lý các phụ thuộc tầm xa như vậy trong văn bản. Sau đây là các lợi ích khác của bộ chuyển đổi.

Kích hoạt mô hình quy mô lớn

Bộ chuyển đổi xử lý toàn bộ các chuỗi dài bằng tính toán song song, giúp giảm đáng kể cả thời gian đào tạo lẫn xử lý. Điều này đã cho phép đào tạo các mô hình ngôn ngữ rất lớn (LLM), chẳng hạn như GPT và BERT, có thể học các dạng trình bày ngôn ngữ phức tạp. Chúng có hàng tỷ thông số nắm bắt nhiều ngôn ngữ và kiến thức của con người, và chúng đang thúc đẩy nghiên cứu các hệ thống AI tổng quát hơn.

Tìm hiểu về các mô hình ngôn ngữ lớn

Tìm hiểu về GPT

Cho phép tùy chỉnh nhanh hơn

Với các mô hình bộ chuyển đổi, bạn có thể sử dụng các kỹ thuật như học chuyển tiếp và tạo tăng cường truy xuất (RAG). Những kỹ thuật này cho phép tùy chỉnh các mô hình hiện có cho các ứng dụng dành riêng cho tổ chức ngành. Các mô hình có thể được đào tạo trước trên các tập dữ liệu lớn rồi tinh chỉnh trên các tập dữ liệu nhỏ hơn, dành riêng cho nhiệm vụ. Cách tiếp cận này đã dân chủ hóa việc sử dụng các mô hình tinh vi và loại bỏ các hạn chế về tài nguyên hữu hạn trong việc đào tạo các mô hình lớn từ đầu. Các mô hình có thể hoạt động hiệu quả trên nhiều miền và nhiệm vụ cho các trường hợp sử dụng khác nhau.

Tạo điều kiện cho các hệ thống AI đa phương thức

Với bộ chuyển đổi, bạn có thể dùng AI cho các nhiệm vụ kết hợp các tập dữ liệu phức tạp. Ví dụ: các mô hình như DALL-E cho thấy bộ chuyển đổi có thể tạo ra hình ảnh từ mô tả văn bản, kết hợp các khả năng NLP và thị giác máy tính. Với bộ chuyển đổi, bạn có thể tạo các ứng dụng AI tích hợp các loại thông tin khác nhau cũng như bắt chước sự hiểu biết và sáng tạo của con người chặt chẽ hơn.

Tìm hiểu về tầm nhìn máy tính

Nghiên cứu AI và đổi mới ngành

Bộ chuyển đổi đã tạo ra một thế hệ mới của công nghệ AI và nghiên cứu AI, vượt qua ranh giới của những gì có thể có trong ML. Thành công của chúng đã truyền cảm hứng cho các kiến trúc và ứng dụng mới giải quyết các vấn đề sáng tạo. Chúng đã cho phép máy móc hiểu và tạo ra ngôn ngữ của con người, mang đến các ứng dụng nâng cao trải nghiệm khách hàng và tạo ra cơ hội kinh doanh mới.

Các trường hợp sử dụng bộ chuyển đổi là gì?

Bạn có thể đào tạo các mô hình chuyển đổi lớn trên bất kỳ dữ liệu chuỗi nào như ngôn ngữ con người, tác phẩm âm nhạc, ngôn ngữ lập trình, v.v. Sau đây là một số trường hợp sử dụng điển hình.

Kỹ thuật xử lý ngôn ngữ tự nhiên

Bộ chuyển đổi cho phép máy hiểu, giải thích và tạo ra ngôn ngữ của con người theo cách chính xác hơn bao giờ hết. Họ có thể tóm tắt các tài liệu lớn cũng như tạo ra văn bản mạch lạc và phù hợp với ngữ cảnh cho mọi trường hợp sử dụng. Trợ lý ảo như Alexa sử dụng công nghệ bộ chuyển đổi để hiểu và phản hồi các lệnh thoại.

Máy dịch

Các ứng dụng dịch thuật sử dụng bộ chuyển đổi để cung cấp bản dịch chính xác, thời gian thực giữa các ngôn ngữ. Bộ chuyển đổi đã cải thiện đáng kể độ lưu loát và chính xác của các bản dịch so với các công nghệ trước đây.

Tìm hiểu về dịch máy

Phân tích trình tự DNA

Bằng cách xử lý các đoạn DNA như một chuỗi tương tự như ngôn ngữ, bộ chuyển đổi có thể dự đoán ảnh hưởng của đột biến gen, hiểu được các kiểu di truyền và giúp xác định các vùng DNA chịu trách nhiệm cho một số bệnh nhất định. Khả năng này rất quan trọng đối với y học cá nhân hóa, nơi việc hiểu được cấu tạo gen của một cá nhân có thể dẫn đến các cách điều trị hiệu quả hơn.

Phân tích cấu trúc protein

Các mô hình bộ chuyển đổi có thể xử lý dữ liệu tuần tự, điều này làm cho chúng rất phù hợp để mô hình hóa các chuỗi dài axit amin gấp lại thành những cấu trúc protein phức tạp. Hiểu được cấu trúc protein là điều quan trọng để khám phá thuốc và nắm được các quá trình sinh học. Bạn cũng có thể dùng bộ chuyển đổi trong các ứng dụng dự đoán cấu trúc 3D của protein dựa trên trình tự axit amin của chúng.

Bộ chuyển đổi hoạt động như thế nào?

Mạng nơ-ron đã là phương pháp hàng đầu trong các nhiệm vụ AI khác nhau như nhận dạng hình ảnh và NLP kể từ đầu những năm 2000. Chúng bao gồm các lớp các nút tính toán được kết nối với nhau, hoặc nơ-ron, bắt chước não bộ con người và phối hợp với nhau để giải quyết các vấn đề phức tạp.

Các mạng nơ-ron truyền thống xử lý các chuỗi dữ liệu thường dùng mô hình kiến trúc bộ mã hóa/giải mã. Bộ mã hóa đọc và xử lý toàn bộ chuỗi dữ liệu đầu vào, chẳng hạn như một câu tiếng Anh, và chuyển đổi nó thành một dạng trình bày toán học nhỏ gọn. Dạng trình bày này là một bản tóm tắt nắm bắt bản chất của đầu vào. Sau đó, bộ giải mã thực hiện bản tóm tắt này và từng bước tạo ra chuỗi đầu ra, đây có thể là cùng một câu được dịch sang tiếng Pháp.

Quá trình này xảy ra theo tuần tự, có nghĩa là nó phải xử lý lần lượt từng từ hoặc một phần của dữ liệu. Quá trình này diễn ra chậm và có thể mất một số chi tiết nhỏ hơn về lâu dài.

Cơ chế tự chú ý

Các mô hình chuyển đổi chỉnh sửa quá trình này bằng cách kết hợp một thứ gọi là cơ chế tự chú ý. Thay vì xử lý dữ liệu theo thứ tự, cơ chế cho phép mô hình xem xét các phần khác nhau của chuỗi cùng một lúc và xác định phần nào là quan trọng nhất.

Hãy tưởng tượng rằng bạn đang ở trong một căn phòng bận rộn và cố gắng lắng nghe ai đó nói chuyện. Não bộ của bạn tự động tập trung vào giọng nói của họ trong khi điều chỉnh những tiếng ồn ít quan trọng hơn. Sự tự chú ý cho phép mô hình làm điều tương tự: nó chú ý nhiều hơn đến các bit thông tin có liên quan và kết hợp chúng để đưa ra dự đoán đầu ra tốt hơn. Cơ chế này làm cho bộ chuyển đổi hiệu quả hơn, cho phép chúng được đào tạo trên các tập dữ liệu lớn hơn. Nó cũng hiệu quả hơn, đặc biệt là khi xử lý các đoạn văn bản dài trong đó ngữ cảnh từ xa có thể ảnh hưởng đến ý nghĩa của nội dung sắp tới.

Các thành phần của kiến trúc bộ chuyển đổi là gì?

Kiến trúc mạng nơ-ron chuyển đổi có một số lớp phần mềm hoạt động cùng nhau để tạo đầu ra cuối cùng. Hình ảnh sau đây hiển thị các thành phần của kiến trúc chuyển đổi, như được giải thích trong nội dung còn lại của phần này.

Nhúng đầu vào

Giai đoạn này chuyển đổi chuỗi đầu vào thành miền toán học mà các thuật toán phần mềm nắm bắt được. Lúc đầu, chuỗi đầu vào được chia thành một loạt các mã thông báo hoặc thành phần chuỗi riêng lẻ. Ví dụ: nếu đầu vào là một câu, các mã thông báo sẽ là từ. Sau đó, tùy chọn nhúng sẽ chuyển đổi chuỗi mã thông báo thành một chuỗi vectơ toán học. Các vectơ mang thông tin ngữ nghĩa và cú pháp, được thể hiện dưới dạng số và các thuộc tính của chúng được học trong quá trình đào tạo.

Bạn có thể trực quan hóa vectơ dưới dạng một chuỗi tọa độ trong một không gian n chiều. Ví dụ đơn giản, hãy nghĩ về một biểu đồ hai chiều, trong đó x là giá trị chữ và số của chữ cái đầu tiên trong từ và y là các danh mục của chúng. Từ chuối có giá trị (2,2) vì nó bắt đầu bằng chữ b và nằm trong danh mục trái cây. Từ xoài có giá trị (13,2) vì nó bắt đầu bằng chữ m và cũng nằm trong danh mục trái cây. Theo cách này, vectơ (x, y) cho mạng nơ-ron biết rằng các từ chuối và xoài nằm trong cùng một danh mục.

Bây giờ, hãy tưởng tượng một không gian n chiều với hàng nghìn thuộc tính về ngữ pháp, ý nghĩa và cách sử dụng của bất kỳ từ nào trong các câu được ánh xạ thành một chuỗi số. Phần mềm có thể dùng các con số để tính mối quan hệ giữa các từ trong các thuật ngữ toán học và hiểu mô hình ngôn ngữ của con người. Nhúng cung cấp một cách để thể hiện các mã thông báo rời rạc dưới dạng vectơ liên tục mà mô hình có thể xử lý và học hỏi.

Mã hóa vị trí

Mã hóa vị trí là một thành phần quan trọng trong kiến trúc chuyển đổi vì chính mô hình không xử lý dữ liệu chuỗi theo thứ tự. Bộ chuyển đổi cần một cách để xem xét thứ tự của các mã thông báo trong chuỗi đầu vào. Mã hóa vị trí thêm thông tin vào tùy chọn nhúng của mỗi mã thông báo để thể hiện vị trí của nó trong chuỗi. Điều này thường được thực hiện bằng một tập chức năng tạo ra một tín hiệu vị trí duy nhất được thêm vào tùy chọn nhúng của mỗi mã thông báo. Với mã hóa vị trí, mô hình có thể giữ lại thứ tự của các mã thông báo và hiểu được ngữ cảnh chuỗi.

Khối chuyển đổi

Một mô hình chuyển đổi thông thường có nhiều khối chuyển đổi xếp chồng lên nhau. Mỗi khối chuyển đổi có hai thành phần chính: cơ chế tự chú ý nhiều đầu và mạng nơ-ron truyền thẳng theo vị trí. Cơ chế tự chú ý cho phép mô hình cân nhắc tầm quan trọng của các mã thông báo khác nhau trong chuỗi. Nó tập trung vào các phần liên quan của đầu vào khi đưa ra dự đoán.

Ví dụ: hãy xem xét các câu "Speak no lies" và "He lies down." Trong cả hai câu, bạn không thể hiểu được ý nghĩa của từ lies nếu không nhìn vào các từ bên cạnh nó. Các từ speak và down là điều cần thiết để hiểu ý nghĩa chính xác. Sự tự chú ý cho phép nhóm các mã thông báo liên quan cho bối cảnh.

Lớp truyền thẳng có các thành phần bổ sung giúp mô hình chuyển tiếp đào tạo và hoạt động hiệu quả hơn. Ví dụ: mỗi khối chuyển tiếp bao gồm:

Kết nối xung quanh hai thành phần chính hoạt động như phím tắt. Chúng cho phép luồng thông tin từ phần này sang phần khác của mạng, bỏ qua một số hoạt động ở giữa.
Chuẩn hóa lớp giữ các số, cụ thể là đầu ra của các lớp khác nhau trong mạng, trong một phạm vi nhất định để mô hình đào tạo một cách trơn tru.
Các chuyển đổi tuyến tính hoạt động để mô hình điều chỉnh các giá trị nhằm thực hiện tốt hơn nhiệm vụ mà nó đang được đào tạo — giống như tóm tắt tài liệu thay vì dịch thuật.

Khối tuyến tính và softmax

Cuối cùng, mô hình cần đưa ra một dự đoán cụ thể, chẳng hạn như chọn từ tiếp theo trong một chuỗi. Đây là nơi khối tuyến tính xuất hiện. Đó là một lớp được kết nối hoàn toàn khác, còn được gọi là một lớp dày đặc, trước giai đoạn cuối cùng. Nó thực hiện ánh xạ tuyến tính được học từ không gian vectơ đến miền đầu vào ban đầu. Lớp quan trọng này là nơi phần ra quyết định của mô hình lấy các dạng trình bày bên trong phức tạp và biến chúng trở lại thành các dự đoán cụ thể mà bạn có thể giải thích và sử dụng. Đầu ra của lớp này là một tập hợp các điểm (thường được gọi là logit) cho mỗi mã thông báo tiềm ẩn.

Hàm softmax là giai đoạn cuối cùng lấy điểm logit và bình thường hóa chúng thành một tùy chọn phân phối xác suất. Mỗi thành phần của đầu ra softmax thể hiện sự tin cậy của mô hình đối với một lớp hoặc mã thông báo cụ thể.

Bộ chuyển đổi khác với các kiến trúc mạng nơ-ron khác như thế nào?

Mạng nơ-ron hồi quy (RNN) và mạng nơ-ron tích chập (CNN) là các mạng nơ-ron khác thường được dùng trong các nhiệm vụ máy học và học sâu. Sau đây, hãy khám phá mối quan hệ của chúng với bộ chuyển đổi.

Bộ chuyển đổi so với RNN

Mô hình bộ chuyển đổi và RNN đều là kiến trúc được dùng để xử lý dữ liệu tuần tự.

RNN xử lý chuỗi dữ liệu một thành phần tại một thời điểm trong các lần lặp theo chu kỳ. Quá trình bắt đầu với lớp đầu vào nhận thành phần đầu tiên của chuỗi. Sau đó, thông tin được chuyển đến một lớp ẩn, xử lý đầu vào và chuyển đầu ra sang bước thời gian tiếp theo. Đầu ra này, kết hợp với thành phần tiếp theo của chuỗi, được đưa trở lại lớp ẩn. Chu kỳ này lặp lại cho từng thành phần trong chuỗi, với RNN duy trì một vectơ trạng thái ẩn được cập nhật tại mỗi bước thời gian. Quá trình này cho phép RNN ghi nhớ thông tin từ các đầu vào trước đó một cách hiệu quả.

Ngược lại, bộ chuyển đổi xử lý toàn bộ chuỗi một cách đồng thời. Sự song song này cho phép thời gian đào tạo nhanh hơn nhiều và khả năng xử lý các chuỗi dài hơn nhiều so với RNN. Cơ chế tự chú ý trong bộ chuyển đổi cũng cho phép mô hình xem xét toàn bộ chuỗi dữ liệu một cách đồng thời. Điều này loại bỏ sự cần thiết phải lặp lại hoặc vectơ ẩn. Thay vào đó, mã hóa vị trí duy trì thông tin về vị trí của từng thành phần trong chuỗi.

Bộ chuyển đổi phần lớn đã thay thế RNN trong nhiều ứng dụng, đặc biệt là trong các nhiệm vụ NLP, bởi vì chúng có thể xử lý các phụ thuộc tầm xa hiệu quả hơn. Ngoài ra, chúng có khả năng điều chỉnh quy mô và hiệu quả cao hơn RNN. RNN vẫn rất hữu ích trong một số bối cảnh nhất định, đặc biệt là khi kích thước mô hình và hiệu quả tính toán quan trọng hơn so với việc nắm bắt các tương tác đường dài.

Bộ chuyển đổi so với CNN

CNN được thiết kế cho dữ liệu giống như lưới, chẳng hạn như hình ảnh, trong đó phân cấp không gian và vị trí là mấu chốt. Chúng dùng các lớp tích chập để áp dụng bộ lọc trên một đầu vào, nắm bắt các mẫu cục bộ thông qua các chế độ xem được lọc này. Ví dụ: trong quá trình xử lý hình ảnh, các lớp ban đầu có thể phát hiện các cạnh hoặc kết cấu và các lớp sâu hơn nhận ra các cấu trúc phức tạp hơn như hình dạng hoặc đối tượng.

Bộ chuyển đổi chủ yếu được thiết kế để xử lý dữ liệu tuần tự và không thể xử lý hình ảnh. Các mô hình chuyển đổi tầm nhìn hiện đang xử lý hình ảnh bằng cách chuyển đổi chúng thành định dạng tuần tự. Tuy nhiên, CNN tiếp tục là một lựa chọn năng suất và hiệu quả cao cho nhiều ứng dụng tầm nhìn máy tính thực tế.

Các loại mô hình chuyển đổi khác nhau là gì?

Bộ chuyển đổi đã phát triển thành một nhóm kiến trúc đa dạng. Sau đây là một số loại mô hình bộ chuyển đổi.

Bộ chuyển đổi hai chiều

Các biểu diễn bộ mã hóa hai chiều từ các mô hình bộ chuyển đổi (BERT) sửa đổi kiến trúc cơ sở để xử lý các từ liên quan đến tất cả các từ khác trong một câu chứ không phải tách rời. Về mặt kỹ thuật, nó sử dụng một cơ chế gọi là mô hình ngôn ngữ bị che hai chiều (MLM). Trong quá trình đào tạo trước, BERT ẩn ngẫu nhiên một số phần trăm mã thông báo đầu vào và dự đoán các mã thông báo bị che này dựa trên ngữ cảnh của chúng. Khía cạnh hai chiều xuất phát từ thực tế là BERT tính đến cả chuỗi mã thông báo từ trái sang phải và phải sang trái trong cả hai lớp để hiểu rõ hơn.

Bộ chuyển đổi tạo sinh được đào tạo sẵn

Các mô hình GPT sử dụng bộ giải mã chuyển đổi xếp chồng được đào tạo trước trên một kho văn bản lớn bằng cách sử dụng các mục tiêu mô hình hóa ngôn ngữ. Chúng tự hồi quy, có nghĩa là chúng thoái lui hoặc dự đoán giá trị tiếp theo trong một chuỗi dựa trên tất cả các giá trị trước đó. Bằng cách sử dụng hơn 175 tỷ tham số, các mô hình GPT có thể tạo ra chuỗi văn bản được điều chỉnh theo kiểu và tông màu. Các mô hình GPT đã thúc đẩy nghiên cứu về AI hướng tới việc đạt được trí tuệ nhân tạo tổng quát. Điều này có nghĩa là các tổ chức có thể đạt đến mức năng suất mới trong khi phát minh lại các ứng dụng và trải nghiệm khách hàng của họ.

Bộ chuyển đổi hai chiều và tự hồi quy

Bộ chuyển đổi hai chiều và tự động hồi quy (BART) là một kiểu mô hình chuyển đổi có kết hợp các thuộc tính hai chiều và tự hồi quy. Nó giống như một sự pha trộn giữa bộ mã hóa hai chiều của BERT và bộ giải mã tự động hồi quy của GPT. Nó đọc toàn bộ chuỗi đầu vào cùng một lúc và có tính hai chiều giống như BERT. Tuy nhiên, nó tạo cho chuỗi đầu ra một mã thông báo tại một thời điểm, điều kiện dựa trên các mã thông báo đã tạo trước đó và đầu vào do bộ mã hóa cung cấp.

Bộ chuyển tiếp cho các nhiệm vụ đa phương thức

Các mô hình chuyển đổi đa phương thức như ViLBERT và VisualBERT được thiết kế để xử lý nhiều loại dữ liệu đầu vào, thông thường là văn bản và hình ảnh. Chúng mở rộng kiến trúc bộ chuyển đổi bằng mạng luồng kép xử lý riêng các đầu vào hình ảnh và văn bản trước khi hợp nhất thông tin. Thiết kế này cho phép mô hình học các dạng trình bày đa phương thức. Ví dụ: ViLBERT sử dụng các lớp chuyển tiếp đồng chú ý để các luồng riêng biệt có thể tương tác. Điều này rất quan trọng đối với các tình huống trong đó việc hiểu mối quan hệ giữa văn bản và hình ảnh là chìa khóa, chẳng hạn như các nhiệm vụ trả lời câu hỏi trực quan.

Bộ chuyển tiếp thị giác

Bộ chuyển đổi tầm nhìn (ViT) tái sử dụng kiến trúc bộ chuyển tiếp cho các nhiệm vụ phân loại hình ảnh. Thay vì xử lý hình ảnh dưới dạng lưới pixel, chúng xem dữ liệu hình ảnh như một chuỗi các bản vá có kích thước cố định, tương tự như cách xử lý các từ trong một câu. Mỗi bản vá được làm phẳng, nhúng tuyến tính rồi được xử lý tuần tự bởi bộ mã hóa chuyển đổi tiêu chuẩn. Nhúng vị trí được thêm vào để duy trì thông tin về không gian. Với tùy chọn sử dụng tự chú ý toàn cầu này, mô hình có thể nắm bắt các mối quan hệ giữa bất kỳ cặp vá lỗi nào, bất kể vị trí của chúng là gì.

AWS có thể hỗ trợ các yêu cầu về mô hình công cụ chuyển đổi như thế nào?

Amazon Web Services (AWS) cung cấp cho bạn các dịch vụ trí tuệ nhân tạo/máy học (AI/ML) sau đây để đáp ứng các yêu cầu về mô hình công cụ chuyển đổi.

Với trung tâm máy học Amazon SageMaker JumpStart, bạn có thể truy cập các mô hình công cụ chuyển đổi được đào tạo trước để thực hiện các tác vụ như tóm tắt bài viết và tạo hình ảnh. Các mô hình được đào tạo trước có thể tùy chỉnh hoàn toàn cho trường hợp sử dụng của bạn với dữ liệu riêng của bạn và bạn có thể dễ dàng triển khai các mô hình này vào môi trường sản xuất bằng giao diện người dùng hoặc SDK.

Amazon Bedrock là dịch vụ được quản lý đầy đủ, mang đến sự lựa chọn về mô hình công cụ chuyển đổi hiệu quả cao từ các công ty AI hàng đầu như AI21 Labs, Anthropic, Cohere, Meta, Stability AI và Amazon thông qua một API duy nhất. Với một loạt các khả năng mà bạn cần để xây dựng ứng dụng AI tạo sinh, Amazon Bedrock giúp đơn giản hóa việc phát triển mà vẫn đảm bảo quyền riêng tư và tính bảo mật. Chẳng hạn, bạn có thể:

Dễ dàng kiểm thử với nhiều mô hình nền tảng hàng đầu và tùy chỉnh chúng một cách riêng tư với dữ liệu của bạn
Tạo các tác nhân được quản lý để thực hiện các tác vụ kinh doanh phức tạp, tất cả đều không cần viết bất kỳ mã nào
Tích hợp và triển khai một cách an toàn các khả năng của AI tạo sinh vào các ứng dụng của bạn mà không cần quản lý cơ sở hạ tầng

Bạn cũng có thể đào tạo các mô hình công cụ chuyển đổi nhanh hơn bằng AWS Trainium, bộ tăng tốc máy học (ML) thế hệ thứ hai được AWS xây dựng để đào tạo học sâu hơn 100 tỷ mô hình tham số. Mỗi phiên bản Trn1 của Đám mây điện toán linh hoạt của Amazon (Amazon EC2) triển khai tối đa 16 bộ tăng tốc Trainium để mang đến giải pháp hiệu quả cao mà mất ít chi phí cho hoạt động đào tạo học sâu trên đám mây.

Hãy tạo tài khoản ngay hôm nay để bắt đầu sử dụng mô hình công cụ chuyển đổi trên AWS.

Các bước tiếp theo trên AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm

Đổi mới sáng tạo nhanh hơn với bộ dịch vụ Máy học toàn diện nhất

Đăng ký một tài khoản miễn phí

Nhận ngay quyền sử dụng Bậc miễn phí của AWS.

Đăng ký

Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng trong AWS Management Console.

Đăng nhập

Bộ chuyển đổi trong trí tuệ nhân tạo là gì?

Bộ chuyển đổi trong trí tuệ nhân tạo là gì?

Tại sao bộ chuyển đổi lại quan trọng?

Kích hoạt mô hình quy mô lớn

Cho phép tùy chỉnh nhanh hơn

Tạo điều kiện cho các hệ thống AI đa phương thức

Nghiên cứu AI và đổi mới ngành

Các trường hợp sử dụng bộ chuyển đổi là gì?

Kỹ thuật xử lý ngôn ngữ tự nhiên

Máy dịch

Phân tích trình tự DNA

Phân tích cấu trúc protein

Bộ chuyển đổi hoạt động như thế nào?

Cơ chế tự chú ý

Các thành phần của kiến trúc bộ chuyển đổi là gì?

Nhúng đầu vào

Mã hóa vị trí

Khối chuyển đổi

Khối tuyến tính và softmax

Bộ chuyển đổi khác với các kiến trúc mạng nơ-ron khác như thế nào?

Bộ chuyển đổi so với RNN

Bộ chuyển đổi so với CNN

Các loại mô hình chuyển đổi khác nhau là gì?

Bộ chuyển đổi hai chiều

Bộ chuyển đổi tạo sinh được đào tạo sẵn

Bộ chuyển đổi hai chiều và tự hồi quy

Bộ chuyển tiếp cho các nhiệm vụ đa phương thức

Bộ chuyển tiếp thị giác

AWS có thể hỗ trợ các yêu cầu về mô hình công cụ chuyển đổi như thế nào?

Các bước tiếp theo trên AWS

Ngừng hỗ trợ cho Internet Explorer