GPT là gì?

Tạo tài khoản AWS

Khám phá các dịch vụ AI tạo sinh

Xây dựng, triển khai và chạy các ứng dụng AI tạo sinh trên AWS

Xem AI tạo sinh trên AWS

Đổi mới nhanh hơn với bộ dịch vụ AI tạo sinh toàn diện nhất

Duyệt tìm các khóa đào tạo AI tạo sinh

Bắt đầu chương trình đào tạo về AI tạo sinh với nội dung được các chuyên gia AWS xây dựng

Đọc blog về AI tạo sinh

Nhận tin tức sản phẩm mới nhất và biện pháp thực hành tốt nhất về AI tạo sinh của AWS

GPT là gì?

Generative Pre-trained Transformer, thường được gọi là GPT, là một dòng mô hình mạng nơ-ron sử dụng kiến trúc của bộ chuyển đổi và là một tiến bộ quan trọng trong lĩnh vực trí tuệ nhân tạo (AI), hỗ trợ cho các ứng dụng AI tạo sinh như ChatGPT. Mô hình GPT cung cấp cho các ứng dụng khả năng tạo văn bản và nội dung giống con người (ảnh, âm nhạc, v.v.) và trả lời các câu hỏi theo cách trò chuyện. Các tổ chức trong các ngành đang sử dụng mô hình GPT và AI tạo sinh cho bot Hỏi đáp, tóm tắt văn bản, tạo nội dung và tìm kiếm.

Tại sao GPT lại quan trọng?

Các mô hình GPT, và đặc biệt là kiến trúc dịch chuyển đổi mà họ sử dụng, đại diện cho một bước đột phá đáng kể trong nghiên cứu AI. Sự gia tăng của các mô hình GPT là một điểm biến đổi trong việc áp dụng rộng rãi ML vì ngày nay công nghệ này có thể được sử dụng để tự động hóa và cải thiện một loạt các tác vụ khác nhau, từ dịch ngôn ngữ và tóm tắt tài liệu đến viết bài viết blog, xây dựng trang web, thiết kế hình ảnh, tạo hình ảnh động, viết mã, nghiên cứu các chủ đề phức tạp, và thậm chí soạn thơ. Giá trị của các mô hình này nằm ở tốc độ và quy mô mà chúng có thể hoạt động. Ví dụ, khi bạn có thể cần vài giờ để nghiên cứu, viết và chỉnh sửa một bài viết về vật lý hạt nhân, một mô hình GPT có thể tạo ra một bài viết trong vài giây. Các mô hình GPT đã khơi dậy sự nghiên cứu về AI hướng tới việc đạt được trí tuệ tổng quát nhân tạo, có nghĩa là máy móc có thể giúp các tổ chức đạt đến mức năng suất mới và tái tạo lại các ứng dụng và trải nghiệm khách hàng của họ.

Các trường hợp sử dụng của GPT là gì?

Các mô hình GPT là các mô hình ngôn ngữ có mục đích chung có thể thực hiện một loạt các tác vụ từ tạo nội dung gốc để viết mã, tóm tắt văn bản và trích xuất dữ liệu từ tài liệu.

Dưới đây là một số cách bạn có thể sử dụng các mô hình GPT:

Tạo nội dung truyền thông xã hội

Các nhà tiếp thị kỹ thuật số, được hỗ trợ bởi trí tuệ nhân tạo (AI), có thể tạo nội dung cho các chiến dịch truyền thông xã hội của họ. Ví dụ, các nhà tiếp thị có thể nhắc một mô hình GPT tạo ra một kịch bản video giải thích. Phần mềm xử lý hình ảnh được hỗ trợ GPT có thể tạo ra memes, video, bản sao tiếp thị và các nội dung khác từ hướng dẫn văn bản.

Chuyển đổi văn bản sang các kiểu khác nhau

Các mô hình GPT tạo ra văn bản theo phong cách giản dị, hài hước, chuyên nghiệp và các phong cách khác. Các mô hình cho phép các chuyên gia kinh doanh viết lại một văn bản cụ thể theo một định dạng khác. Ví dụ, các luật sư có thể sử dụng mô hình GPT để biến các bản sao hợp pháp thành các ghi chú giải thích đơn giản.

Viết và học mã

Là mô hình ngôn ngữ, các mô hình GPT có thể hiểu và viết mã máy tính bằng các ngôn ngữ lập trình khác nhau. Các mô hình có thể giúp người học bằng cách giải thích các chương trình máy tính cho họ bằng ngôn ngữ hàng ngày. Ngoài ra, các nhà phát triển có kinh nghiệm có thể sử dụng các công cụ GPT để tự động đề xuất các đoạn mã liên quan.

Phân tích dữ liệu

Mô hình GPT có thể giúp các nhà phân tích kinh doanh biên dịch khối lượng lớn dữ liệu một cách hiệu quả. Các mô hình ngôn ngữ tìm kiếm dữ liệu cần thiết và tính toán và hiển thị các kết quả trong một bảng dữ liệu hoặc bảng tính. Một số ứng dụng có thể vẽ kết quả trên một biểu đồ hoặc tạo báo cáo toàn diện.

Tạo ra tài liệu học tập

Các nhà giáo dục có thể sử dụng phần mềm dựa trên GPT để tạo ra các tài liệu học tập như các bài kiểm tra và hướng dẫn. Tương tự, họ có thể sử dụng các mô hình GPT để đánh giá các câu trả lời.

Xây dựng các trợ lý thoại tương tác

Các mô hình GPT cho phép bạn xây dựng các trợ lý thoại tương tác thông minh. Trong khi nhiều chatbot chỉ trả lời các lời nhắc bằng lời nói cơ bản, các mô hình GPT có thể tạo ra chatbot bằng khả năng AI đàm thoại. Ngoài ra, những chatbot này có thể trò chuyện bằng lời nói như con người khi kết hợp với các công nghệ AI khác.

GPT hoạt động như thế nào?

Mặc dù việc mô tả các mô hình GPT là trí thông minh nhân tạo (AI) là chính xác nhưng đây là một mô tả rộng. Cụ thể hơn, các mô hình GPT là các mô hình dự đoán ngôn ngữ dựa trên mạng nơ-ron được xây dựng trên kiến trúc Transformer. Các mô hình phân tích truy vấn ngôn ngữ tự nhiên, được gọi là lời nhắc và dự đoán phản ứng tốt nhất có thể dựa trên hiểu biết của họ về ngôn ngữ.

Để làm được điều đó, các mô hình GPT dựa vào kiến thức mà họ có được sau khi được đào tạo với hàng trăm tỷ tham số trên các tập dữ liệu ngôn ngữ khổng lồ. Các mô hình có thể tính đến ngữ cảnh nhập liệu và tự động tham gia vào các phần khác nhau của nhập liệu, khiến cho chúng có khả năng tạo ra các phản hồi dài, không chỉ là từ tiếp theo trong một trình tự. Ví dụ, khi được yêu cầu tạo ra một đoạn nội dung lấy cảm hứng từ Shakespeare, mô hình GPT làm như vậy bằng cách ghi nhớ và tái tạo lại các cụm từ và toàn bộ câu mới bằng phong cách văn học tương tự.

Có nhiều loại mạng nơ-ron khác nhau, như hồi quy và tích chập. Các mô hình GPT là các mạng nơ-ron biến đổi. Kiến trúc mạng nơ-ron biến đổi sử dụng các cơ chế tự tập trung để tập trung vào các phần khác nhau của văn bản nhập liệu trong mỗi bước xử lý. Mô hình biến đổi nắm bắt nhiều bối cảnh hơn và cải thiện hiệu suất trên các tác vụ xử lý ngôn ngữ tự nhiên (NLP). Mô hình này có hai mô-đun chính, mà chúng tôi sẽ giải thích ở phần sau.

Tìm hiểu về mạng nơ-ron »

Tìm hiểu về xử lý ngôn ngữ tự nhiên (NLP) »

Bộ mã hóa

Transformers xử lý trước các nhập liệu văn bản dưới dạng nhúng, biểu diễn một từ trên phương diện toán học. Khi được mã hóa trong không gian vectơ, các từ gần nhau hơn dự kiến sẽ có nghĩa gần giống nhau. Những phần nhúng này được xử lý thông qua thành phần bộ mã hóa, nắm bắt thông tin ngữ cảnh từ một trình tự nhập liệu. Khi nhận được dữ liệu nhập, bộ mã hóa của mạng biến đổi tách các từ thành nhúng và gán trọng số cho mỗi từ. Trọng số là các tham số biểu thị sự liên quan của các từ trong một câu.

Ngoài ra, bộ mã hóa vị trí cho phép các mô hình GPT ngăn chặn các nghĩa mơ hồ khi một từ được sử dụng trong các phần khác của câu. Ví dụ, mã hóa vị trí cho phép mô hình biến đổi phân biệt sự khác biệt về ngữ nghĩa giữa các câu này:

Một con chó đuổi theo một con mèo
Một con mèo đuổi theo một con chó

Vì vậy, bộ mã hóa xử lý câu nhập liệu và tạo ra một biểu diễn vectơ có độ dài cố định, được gọi là phần nhúng. Biểu diễn này được sử dụng bởi mô-đun bộ giải mã.

Bộ giải mã

Bộ giải mã sử dụng biểu diễn vectơ để dự đoán đầu ra theo yêu cầu. Bộ giải mã có các cơ chế tự tập trung để tập trung vào các phần nhập liệu khác nhau và đoán đầu ra phù hợp. Các kỹ thuật toán học phức tạp giúp bộ giải mã ước tính một số đầu ra khác nhau và dự đoán đầu ra chính xác nhất.

So với các phiên bản tiền nhiệm của bộ giải mã, như mạng nơ-ron hồi quy, các transformer có thể song song hơn vì chúng không xử lý các từ tuần tự từng từ một, mà thay vào đó, sẽ xử lý toàn bộ đầu vào cùng một lúc trong chu kỳ học. Do đó và hàng nghìn giờ làm việc của các kỹ sư để tinh chỉnh và đào tạo các mô hình GPT, họ có thể đưa ra câu trả lời lưu loát cho hầu hết các dữ liệu đầu vào bạn cung cấp.

GPT-3 được đào tạo như thế nào?

Trong một bài báo nghiên cứu được công bố, các nhà nghiên cứu đã mô tả tiền huấn luyện tạo sinh là khả năng đào tạo các mô hình ngôn ngữ với dữ liệu không gắn nhãn và đạt được dự đoán chính xác. Mô hình GPT đầu tiên, GPT-1, được phát triển vào năm 2018. GPT-4 được giới thiệu vào tháng 3 năm 2023 như là một phiên bản kế thừa của GPT-3.

GPT-3 được đào tạo với hơn 175 tỷ tham số hoặc trọng số. Các kỹ sư đã đào tạo mô hình này trên hơn 45 terabyte dữ liệu từ các nguồn như văn bản web, Common Crawl, sách và Wikipedia. Trước khi đào tạo, chất lượng trung bình của các tập dữ liệu đã được cải thiện khi mô hình phát triển từ phiên bản 1 lên phiên bản 3.

GPT-3 được đào tạo ở chế độ bán giám sát. Đầu tiên, các kỹ sư máy học cung cấp cho mô hình học sâu dữ liệu đào tạo không được dán nhãn. GPT-3 sẽ hiểu các câu, phân tách chúng và tái tạo chúng thành các câu mới. Trong đào tạo không giám sát, GPT-3 đã cố gắng tự tạo ra kết quả chính xác và thực tế. Sau đó, các kỹ sư máy học sẽ tinh chỉnh kết quả trong đào tạo có giám sát, một quá trình được gọi là tăng cường học tập với phản hồi của con người (RLHF).

Bạn có thể sử dụng các mô hình GPT mà không cần đào tạo thêm, hoặc bạn có thể tùy chỉnh chúng với một vài ví dụ cho một tác vụ cụ thể.

Ví dụ về một số ứng dụng sử dụng GPT là gì?

Kể từ khi ra mắt, các mô hình GPT đã mang trí tuệ nhân tạo (AI) đến nhiều ứng dụng trong các ngành công nghiệp khác nhau. Dưới đây là một số ví dụ:

Có thể sử dụng các mô hình GPT để phân tích phản hồi của khách hàng và tóm tắt thành văn bản dễ hiểu. Trước tiên, bạn có thể thu thập dữ liệu cảm xúc của khách hàng từ các nguồn như khảo sát, đánh giá và trò chuyện trực tiếp, sau đó bạn có thể yêu cầu mô hình GPT tóm tắt dữ liệu.
Có thể sử dụng các mô hình GPT để cho phép các nhân vật ảo trò chuyện một cách tự nhiên với người tham gia trong môi trường thực tế ảo.
Có thể sử dụng các mô hình GPT để cung cấp trải nghiệm tìm kiếm tốt hơn cho nhân viên bộ phận trợ giúp. Họ có thể truy vấn cơ sở kiến thức sản phẩm bằng ngôn ngữ đàm thoại để truy xuất thông tin sản phẩm liên quan.

AWS có thể giúp bạn chạy các mô hình ngôn ngữ lớn như GPT-3 như thế nào?

Amazon Bedrock là cách dễ nhất để xây dựng và mở rộng quy mô các ứng dụng AI tạo sinh bằng các mô hình ngôn ngữ lớn, còn được gọi là mô hình nền tảng (FM), tương tự như GPT-3. Amazon Bedrock cho phép bạn truy cập thông qua API vào các mô hình nền tảng từ các công ty khởi nghiệp AI hàng đầu, bao gồm AI21 Labs, Anthropic và Stability AI—cùng với dòng mô hình nền tảng mới nhất của Amazon, Amazon Titan FMs. Với trải nghiệm phi máy chủ của Bedrock, bạn có thể bắt đầu nhanh chóng, tùy chỉnh FM riêng bằng dữ liệu của riêng bạn và dễ dàng tích hợp và triển khai chúng vào các ứng dụng của bạn bằng các công cụ và khả năng AWS mà bạn đã quen thuộc (bao gồm tích hợp với các tính năng Amazon SageMaker ML như Experiments để kiểm tra các mô hình khác nhau và Kênh truyền để quản lý FM của bạn ở quy mô lớn) mà không cần phải quản lý bất kỳ cơ sở hạ tầng nào. Tìm hiểu thêm về việc xây dựng bằng các mô hình nền tảng trên Amazon Bedrock.

GPT là gì?

GPT là gì?

Tại sao GPT lại quan trọng?

Các trường hợp sử dụng của GPT là gì?

Tạo nội dung truyền thông xã hội

Chuyển đổi văn bản sang các kiểu khác nhau

Viết và học mã

Phân tích dữ liệu

Tạo ra tài liệu học tập

Xây dựng các trợ lý thoại tương tác

GPT hoạt động như thế nào?

Bộ mã hóa

Bộ giải mã

GPT-3 được đào tạo như thế nào?

Ví dụ về một số ứng dụng sử dụng GPT là gì?

AWS có thể giúp bạn chạy các mô hình ngôn ngữ lớn như GPT-3 như thế nào?

Các bước tiếp theo để sử dụng máy học

Ngừng hỗ trợ cho Internet Explorer