Zero-shot Prompting

No Comments

Các mô hình ngôn ngữ lớn (LLM) ngày nay, chẳng hạn như GPT-3.5 Turbo, GPT-4 và Claude 3, được điều chỉnh để tuân theo các hướng dẫn và được đào tạo trên lượng dữ liệu lớn. Đào tạo quy mô lớn giúp các mô hình này có khả năng thực hiện một số tác vụ theo cách “zero-shot”. Nhắc nhở zero-shot có nghĩa là lời nhắc được sử dụng để tương tác với mô hình sẽ không chứa các ví dụ hoặc bản trình diễn. Lời nhắc zero-shot hướng dẫn trực tiếp mô hình thực hiện một tác vụ mà không có bất kỳ ví dụ bổ sung nào để điều khiển.

Chúng tôi đã thử một vài ví dụ zero-shot trong phần trước. Sau đây là một trong những ví dụ (tức là phân loại văn bản) mà chúng tôi đã sử dụng:

Prompt:

Classify the text into neutral, negative or positive.

Text: I think the vacation is okay.
Sentiment:

Output: Neutral

Lưu ý rằng trong lời nhắc ở trên, chúng tôi không cung cấp cho mô hình bất kỳ ví dụ nào về văn bản bên cạnh các phân loại của chúng, LLM đã hiểu “cảm xúc” — đó là khả năng zero-shot đang hoạt động.

Điều chỉnh hướng dẫn đã được chứng minh là cải thiện việc học zero-shot Wei et al. (2022). Điều chỉnh hướng dẫn về cơ bản là khái niệm tinh chỉnh các mô hình trên các tập dữ liệu được mô tả thông qua các hướng dẫn. Hơn nữa, RLHF (học tăng cường từ phản hồi của con người) đã được áp dụng để mở rộng quy mô điều chỉnh hướng dẫn trong đó mô hình được căn chỉnh để phù hợp hơn với sở thích của con người. Sự phát triển gần đây này cung cấp năng lượng cho các mô hình như ChatGPT. Chúng tôi sẽ thảo luận về tất cả các cách tiếp cận và phương pháp này trong các phần sắp tới.

Khi zero-shot không hoạt động, bạn nên cung cấp các bản trình diễn hoặc ví dụ trong lời nhắc dẫn đến lời nhắc few-shot. Trong phần tiếp theo, chúng tôi sẽ trình bày lời nhắc few-shot.

About us and this blog

We are a digital marketing company with a focus on helping our customers achieve great results across several key areas.

Request a free quote

We offer professional SEO services that help websites increase their organic search score drastically in order to compete for the highest rankings even when it comes to highly competitive keywords.

Subscribe to our newsletter!

More from our blog

See all posts

Leave a Comment