LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

27:15

Информация о загрузке и деталях видео LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Автор:

3Blue1Brown

Дата публикации:

01.04.2024

Просмотров:

8.9M

Загрузить Видео

Описание:

В этом видео автор объясняет, как работают большие языковые модели, раскрывая их внутреннюю архитектуру и ключевые концепции, такие как предсказание, выборка, повторение, самовнимание, слои трансформера, эмбеддинги слов и их расширения, декодирование, применение softmax с температурой и дальнейшие шаги. Видеоряд сопровождается анимациями, созданными с помощью библиотеки Manim, и включает следующие временные отметки: 0:00 – Predict, sample, repeat; 3:03 – Inside a transformer; 6:36 – Chapter layout; 7:20 – The premise of Deep Learning; 12:27 – Word embeddings; 18:25 – Embeddings beyond words; 20:22 – Unembedding; 22:22 – Softmax with temperature; 26:03 – Up next.

Похожие видео: LLM и GPT

03:53:53

SEQUENCE AND SERIES in One Shot : All Concepts & PYQs Covered || JEE Main & Advanced

04:29:45

OSCILLATIONS in One Shot: All Concepts & PYQs Covered | JEE Main & Advanced

01:30:21

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Информация о загрузке и деталях видео LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Автор:

Дата публикации:

Просмотров:

Описание:

Похожие видео: LLM и GPT

Machine Learning for Everybody – Full Course

Spline Flow – Parametric Spline Modeling Plugin - #3dmax #3dmodeling #archviz

Part 7: Prediction Sense | "Alien: Isolation" Smart AI in UE5

SEQUENCE AND SERIES in One Shot : All Concepts & PYQs Covered || JEE Main & Advanced

OSCILLATIONS in One Shot: All Concepts & PYQs Covered | JEE Main & Advanced

MOTION IN A PLANE in 90 Minutes || Full Chapter Revision || Class 11th JEE