Ý nghĩa của từ Zero-shot là gì? | Bảng thuật ngữ Newsverso

Zero-shot là thuật ngữ được sử dụng trong machine learning và xử lý ngôn ngữ tự nhiên để mô tả một loại mô hình có khả năng thực hiện các nhiệm vụ mà không cần đào tạo cụ thể cho từng nhiệm vụ riêng lẻ.

Nói cách khác, một mô hình không bắn có thể thực hiện một số nhiệm vụ khác nhau mà không cần tiếp xúc với các ví dụ cụ thể về từng nhiệm vụ trong quá trình đào tạo.

QUẢNG CÁO

Khả năng này đạt được thông qua các kỹ thuật học chuyển giao, trong đó mô hình được đào tạo về một nhiệm vụ chung, rộng bao gồm nhiều thông tin và bối cảnh. Nhiệm vụ rộng này được thiết kế để cho phép mô hình tìm hiểu thêm các mẫu và cách biểu diễn trừu tượng của ngôn ngữ.

Khi áp dụng mô hình zero-shot cho một nhiệm vụ cụ thể, nó có thể sử dụng kiến ​​thức có sẵn này để suy ra câu trả lời hoặc thực hiện nhiệm vụ mà không cần được đào tạo về các ví dụ trực tiếp về nhiệm vụ đó. Khả năng này cực kỳ hữu ích vì nó làm giảm nhu cầu đào tạo chuyên sâu và nỗ lực của con người để gắn nhãn lượng lớn dữ liệu cho từng nhiệm vụ riêng lẻ.

Nói chung, các mô hình zero-shot có khả năng thực hiện các nhiệm vụ như phân loại văn bản, dịch thuật, tạo phản hồi và nhiều nhiệm vụ khác mà không cần đào tạo cụ thể cho từng nhiệm vụ. GPT-3, phiên bản cũ hơn của mô hình này dựa trên kiến ​​trúc GPT-3.5, cũng có khả năng thực hiện các tác vụ không bắn, thể hiện tính linh hoạt và tính tổng quát của nó.

QUẢNG CÁO

Người giới thiệu:

  • Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Mô hình ngôn ngữ là những người học đa nhiệm không được giám sát. OpenAI.
  • Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Mô hình ngôn ngữ là những người học ít cơ hội. OpenAI.

*Văn bản của bài viết này được tạo ra một phần bởi ChatGPT, một mô hình ngôn ngữ dựa trên trí tuệ nhân tạo được phát triển bởi OpenAI. Các mục văn bản được tạo bởi Curto Tin tức và phản hồi được cố ý sao chép đầy đủ. Những câu trả lời từ ChatGPT được tạo tự động và không đại diện cho ý kiến ​​của OpenAI hoặc những người liên quan đến mô hình. Mọi trách nhiệm về nội dung được xuất bản thuộc về Curto Tin tức.

Cũng biết:

Cuộn lên