精通Docker第三版第九章更新中...

第二章 像机器那样思考

Coding Alan 3周前 (03-31) 131次浏览 0个评论

本文为Python之 AI人工智能初学者指南第二章。

第一章通过DQN所使用的Q动作值函数来讲解了强化学习算法。其中代理是一个驱动。你已然处于AI的DeepMind方法的核心。

DeepMind无疑是应用人工智能的全球领先者。科学、数学和应用研究驱动着它的策略。

DeepMind成立于2010年,并于2014年被Google收购,现是Google整合后的母公司Alphabet的旗下公司。

DeepMind的一个研究重心是强化学习。他们推出一个强化学习的创新版本,称之为DQN,并使用Q函数(贝尔曼方程)来引用深度神经网络。《自然》杂志2015年2月所发表的一篇学术文章(本章结尾处有链接)显示了DQN是如何超越其它人工智能技术并将自己变成为人类游戏的玩家的。DQN随后又打败了真实的人类游戏玩家。

本章中,代理将成为一个自动化导航车辆(automated guided vehicle (AGV))。AGV接管一家仓库的运输任务。案例研究打开了使用DQN来工作和其商业性的一个美好前景。成千上万的仓库需要复杂的强化学习和自定义的运输优化。

本章着重讲解创建回报矩阵,这也是第一章中Python示例的entry point。要完成这一讲解,本章涵盖了如何在TensorFlow中加入原始的麦卡洛克-皮特斯神经元,来创建一个智能适配网络以及将N(网络)加入到Q模型中。这里讲的是小N,在第四章 成为一个打破惯例的创新者中将成为前馈神经网络。目标不是复制DQN,而是使用该模型的强大概念来创建各种解决方案。

本章的挑战是要真的像机器一样思考问题。我们不是致力于模仿人类的思维,而是通过机器来打败人类。本章会将你从人类推理带到遥远的机器思维的腹地。

本章将涵盖如下内容:

  • AGV
  • 麦卡洛克-皮特斯神经元
  • 创建一个回报矩阵
  • 逻辑分类器
  • softmax函数
  • 独热(one-hot)函数
  • 如何在现实生活问题如仓库管理中应用机器学习工具

技术准备

  • Python 3.6x 64位,官网地址:https://www.python.org/
  • Python 3.6x的NumPy
  • 来自https://deepmind.com/带有TensorBoard的TensorFlow

以下文件:

进入以下视频来查看代码实操:

https://goo.gl/jMWLg8

设计数据集  – 梦想止步和体力活开始的地方

 

在自然语言会议中设计数据集

使用麦卡洛克-皮特斯神经元

麦卡洛克-皮特斯神经元(McCulloch-Pitts neuron)

Python TensorFlow的架构

逻辑激活函数和分类器

整体架构

逻辑分类器

逻辑函数

Softmax

总结

正在更新中…

喜欢 (0)
[]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址