Каталог
+7 (8652) 26-59-97
+7 (8652) 29-72-29
+7 (8652) 26-59-97 Выбрать город: Ставрополь
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Книга Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. ПИТЕР, 2020 год издания <978-5-4461-1079-7>

Книга "Глубокое обучение с подкреплением. AlphaGo и другие технологии" (Максим Лапань)
Артикул: #565282 Сравнить
Книга Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. ПИТЕР, 2020 год издания <978-5-4461-1079-7>
Назад Книга Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. ПИТЕР, 2020 год издания <978-5-4461-1079-7>, вид основной Книга Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. ПИТЕР, 2020 год издания <978-5-4461-1079-7>, вид спереди вид сзади упаковка маркировка фото isbn Вперед
Глаз орла
Перемещаться по товарам:
Предыдущий товарСледующий товар

Оформить заказ в городе: СТАВРОПОЛЬ

email iconПозиции временно нет на складе, но со временем она может вновь появиться в продаже. Вы можете cоздать оповещение о приходе товара, чтобы получить письмо с уведомлением о поступлении товара в продажу.

Характеристики

Основные характеристики
Серия Для профессионаловнайти похожую книгу
Издательство ПИТЕР
Автор Лапань М.
Название Глубокое обучение с подкреплением. AlphaGo и другие технологии
Год издания 2020
Формат книги 165 x 233 мм
Обложка Мягкая обложка
Количество страниц 496
Рекомендуемый возраст 16+
ISBN 978-5-4461-1079-7
Описание Эта книга - подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропиии итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.
Прочие характеристики
Страна изготовления товара Россия
Логистика
Размеры (ширина x высота x глубина) 165 х 233 х 23 мм
Вес 0.634 кг
Размеры упаковки (измерено в НИКСе) 23.3 x 16.6 x 2.1 см
Вес брутто (измерено в НИКСе) 0.644 кг
Служебные
краткое_описание Эта книга - подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропиии итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Характеристики, комплект поставки и внешний вид данного товара могут отличаться от указанных или могут быть изменены производителем без отражения в каталоге НИКС - Компьютерный Супермаркет.
Информация о ценах товара и комплектации указанная на сайте не является офертой в смысле, определяемом положениями ст. 435 Гражданского Кодекса РФ.

Отзывы

Отзывов еще нет, ваш может стать первым!
Книга Прайс М. C# 9 и .NET 5. Разработка и оптимизация. ПИТЕР, 2022 год издания <978-5-4461-2921-8>