 【PyTorch深度学习-龙龙老师】-测试版202112游戏平台中的 49 个游戏上取得了 与人类相当甚至超越人类的水平;在围棋领域,DeepMind 提出的 AlphaGo 和 AlphaGo Zero 智能程序相继打败人类顶级围棋专家李世石、柯洁等;在多智能体协作的 Dota2 游戏 平台,OpenAI 开发的 OpenAI Five 智能程序在受限游戏环境中打败了 TI8 冠军队伍 OG 队,展现出了大量专业级的高层智能操作。图 1.9 列出了 2006 年~2019 Imitation Learning、Meta Learning、Few-shot Learning 等方向上取得 了不少进展。美国波士顿动力公司在机器人应用中取得喜人的成就,其制造的机器人在复 杂地形行走、多智能体协作等任务上表现良好(图 1.19)。 自动驾驶(Autonomous Driving) 被认为是强化学习短期内能技术落地的一个应用方 向,很多公司投入大量资源在自动驾驶上,如百度、Uber、Google [3];2019 年,OpenAI Five 程序以 2:0 战胜 Dota2 世界冠军 OG 队伍,尽管这 次比赛的游戏规则有所限制,但是对于 Dota2 这种对于需要超强个体智能水平和良好团队 协作的游戏,这次胜利无疑再次坚定了人类对于 AGI 的信念。 本章我们将介绍强化学习中的主流算法,其中包含在太空入侵者等游戏上取得类人水 平的 DQN 算法、制胜 Dota2 的主要功臣 PPO 算法等。0 码力 | 439 页 | 29.91 MB | 1 年前3 【PyTorch深度学习-龙龙老师】-测试版202112游戏平台中的 49 个游戏上取得了 与人类相当甚至超越人类的水平;在围棋领域,DeepMind 提出的 AlphaGo 和 AlphaGo Zero 智能程序相继打败人类顶级围棋专家李世石、柯洁等;在多智能体协作的 Dota2 游戏 平台,OpenAI 开发的 OpenAI Five 智能程序在受限游戏环境中打败了 TI8 冠军队伍 OG 队,展现出了大量专业级的高层智能操作。图 1.9 列出了 2006 年~2019 Imitation Learning、Meta Learning、Few-shot Learning 等方向上取得 了不少进展。美国波士顿动力公司在机器人应用中取得喜人的成就,其制造的机器人在复 杂地形行走、多智能体协作等任务上表现良好(图 1.19)。 自动驾驶(Autonomous Driving) 被认为是强化学习短期内能技术落地的一个应用方 向,很多公司投入大量资源在自动驾驶上,如百度、Uber、Google [3];2019 年,OpenAI Five 程序以 2:0 战胜 Dota2 世界冠军 OG 队伍,尽管这 次比赛的游戏规则有所限制,但是对于 Dota2 这种对于需要超强个体智能水平和良好团队 协作的游戏,这次胜利无疑再次坚定了人类对于 AGI 的信念。 本章我们将介绍强化学习中的主流算法,其中包含在太空入侵者等游戏上取得类人水 平的 DQN 算法、制胜 Dota2 的主要功臣 PPO 算法等。0 码力 | 439 页 | 29.91 MB | 1 年前3
 动手学深度学习 v2.0Kaggle Kaggle72是一个当今流行举办机器学习比赛的平台,每场比赛都以至少一个数据集为中心。许多比赛有赞助 方,他们为获胜的解决方案提供奖金。该平台帮助用户通过论坛和共享代码进行互动,促进协作和竞争。虽然 排行榜的追逐往往令人失去理智:有些研究人员短视地专注于预处理步骤,而不是考虑基础性问题。但一个 客观的平台有巨大的价值:该平台促进了竞争方法之间的直接定量比较,以及代码共享。这便于每个人都可以0 码力 | 797 页 | 29.45 MB | 1 年前3 动手学深度学习 v2.0Kaggle Kaggle72是一个当今流行举办机器学习比赛的平台,每场比赛都以至少一个数据集为中心。许多比赛有赞助 方,他们为获胜的解决方案提供奖金。该平台帮助用户通过论坛和共享代码进行互动,促进协作和竞争。虽然 排行榜的追逐往往令人失去理智:有些研究人员短视地专注于预处理步骤,而不是考虑基础性问题。但一个 客观的平台有巨大的价值:该平台促进了竞争方法之间的直接定量比较,以及代码共享。这便于每个人都可以0 码力 | 797 页 | 29.45 MB | 1 年前3
共 2 条
- 1













