Какво означава терминът Zero-shot? | Речник на Newsverso

Zero-shot е термин, използван в машинното обучение и обработката на естествен език, за да опише тип модел, който е способен да изпълнява задачи без необходимост от специфично обучение за всяка отделна задача.

С други думи, моделът с нулев удар може да изпълнява няколко различни задачи, без да е бил изложен на конкретни примери за всяка от тях по време на обучението.

ПУБЛИЧНОСТ

Тази способност се постига чрез техники за трансфер на обучение, при които моделът се обучава на широка, обща задача, която обхваща множество информация и контексти. Тази широка задача е предназначена да позволи на модела да научи повече абстрактни модели и представяния на езика.

Когато модел с нулев удар се приложи към конкретна задача, той може да използва това предварително знание, за да направи извод за отговора или да изпълни задачата, без да е бил обучен на директни примери за тази задача. Тази възможност е изключително полезна, тъй като намалява необходимостта от интензивно обучение и човешки усилия за етикетиране на големи количества данни за всяка отделна задача.

Като цяло zero-shot моделите са в състояние да изпълняват задачи като класифициране на текст, превод, генериране на отговор и много други, без да е необходимо специално обучение за всяка от тях. GPT-3, по-ранна версия на този модел, базирана на архитектурата GPT-3.5, също има способността да изпълнява задачи с нулев удар, демонстрирайки своята гъвкавост и общоприетост.

ПУБЛИЧНОСТ

Препратки:

  • Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Езиковите модели са многозадачни обучаеми без надзор. OpenAI.
  • Браун, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Езиковите модели се учат малко. OpenAI.

*Текстът на тази статия е частично генериран от ChatGPT, базиран на изкуствен интелект езиков модел, разработен от OpenAI. Текстовите записи са създадени от Curto Новините и отговорите са умишлено възпроизведени изцяло. Отговорите от ChatGPT се генерират автоматично и не представляват мнението на OpenAI или хора, свързани с модела. Цялата отговорност за публикуваното съдържание се носи от Curto News.

Знайте също:

превъртете нагоре