网站推广.NET

网站推广.NET

深度学习框架之TensorFlow的概念及安装

来源:互联网

2015年11月9日,google发布人工智能系统tensorflow并宣布开源。

1.TensorFlow的概念

TensorFlow 是使用数据流图进行数值计算的开源软件库。也就是说,TensorFlow 使用图(graph)来表示计算任务。图中的节点表示数学运算,边表示运算之间用来交流的多维数组(也就是tensor,张量)。TensorFlow 灵活的架构使得你可以将计算过程部署到一个或多个CPU或GPU上。

TensorFlow 最初是由 Google Brain Team 的研究人员和工程师开发的,主要是 Google’s Machine Intelligence research organization 用来进行机器学习和深度神经网络研究的,但是这个系统在其它很多领域也是通用的。

模型的抽象表示是由框架自动处理的,这使得TensorFlow 及 Theano 特别适合发展基于梯度优化算法的新模型。

Theano 的主要缺点是对上述符号模型进行编译的时间较长,而 TensorFlow 有效地改善了这一点,也就是编译时间较短。

TensorFlow 的另一个优点是它的支持工具——TensorBoard ,将模型的训练过程可视化。这样,用户可以交互式地考察模型的结构,也可以观察参数和模型性能的改变。

TensorFlow 的开源版本只能运行在一台机器上,不过它支持多处理器(CPUs或GPUs)并行运算。

1.1 什么是数据流图?

数据流图用有向图来描述数学计算,图中有点和边。

节点通常进行数学计算,但也可以作为终点来表示结果,或者读/写持久变量(persistent variables)。

边用来描述节点之间的输入/输出关系。这些边携带不定大小的多维数组或张量。

这些节点被分配到计算装置上,异步执行。一旦所有的tensor同时到达了,就会进行并行计算。

由于图中张量(tensor)的流动(flow),所以我们称之为 TensorFlow。

1.2 TensorFlow的特点

  1. Deep Flexibility,灵活性。TensorFlow并不是一个死板的神经网络的库,只要你可以将你的计算过程表示成数据流图,你就可以使用TensorFlow。定义新的计算就像写一个Python函数那么简单,成本并不大。如果你看不见你需要的底层的数据操作,可以通过C++来添加。

  2. True Portability,可移植性。TensorFlow在CPU或GPU上运行,可以在笔记本、服务器、或移动计算平台运行。不需要特殊硬件,不需要改变代码,就可以在移动设备上训练模型,封装Docker 和 TensorFlow 就可以在云上进行计算。

  3. Connect Research and Production,学术和工业兼得。在Google,科学家们用 TensorFlow 测试新的算法,产品团队用 TensorFlow 训练模型为用户服务。

  4. Auto-Differentiation,自动辨别。TensorFlow 的自动辨别能力 有益于实现那些基于梯度的机器学习算法。当你使用TensorFlow时,你为自己的预测模型定义计算的框架结构,再加上目标函数,接着只需要添加数据,TensorFlow 就会为你计算导数,也就是梯度。

  5. Language Options,语言选择。TensorFlow中可以使用Python接口,以及简单的C++接口,来构建和执行你的计算图(computational graphs)。如果你有兴趣,也可以提供自己所喜爱语言的接口——Lua, JavaScript, 或 R 等等。

  6. Maximize Performance,性能最大化。TensorFlow 允许你充分利用你可用的硬件:32 CPU cores and 4 GPU cards,线程、队列及异步计算等。你可以将TensorFlow图中的计算元素自由分配到不同的设备上,交给TensorFlow来处理。

1.3 谁可以用TensorFlow?

学生、研究人员、爱好者、黑客、工程师、开发者、发明者及创新者等等。

TensorFlow目前并不完整,它需要扩展。Google只是给了一个初始版本的源代码,他们希望建立一个活跃的开源社区,以使得TensorFlow越来越好。

目前在使用 TensorFlow 的公司有:Google、Uber、Twitter、DeepMind、京东等等。

1.4 为什么谷歌将TensorFlow开源呢?

「TensorFlow」是 Google 多年以来内部的机器学习系统。如今,Google 正将此系统作为开源系统,并将此系统的参数公布给业界工程师、学者和拥有大量编程能力的技术人员,这意味着什么呢?

答案很简单:Google认为,机器学习是未来创新的关键成分,这一领域的研究是全球范围的,并且发展很迅速,但就是缺乏标准工具。Google的工程师们用TensorFlow在做面向用户的产品和服务,Google的研究团队也打算分享TensorFlow的实现历程,他们希望TensorFlow能成为机器学习的最好工具之一。

打个不太恰当的比喻,如今 Google 对待 TensorFlow 系统,有点类似于对待旗下移动操作系统 Android。如果更多的数据科学家开始使用 Google 的系统来从事机器学习方面的研究,那么这将有利于 Google 对日益发展的机器学习行业拥有更多的主导权。

1.5 TensorFlow 与计算生物学

使用当前的深度学习的方法有一个先决条件:拥有许多样本的数据集。

像 识别与特定疾病相关的基因或 methylation probes,样本集很少,所以就不能用深度学习进行分析。【哭……我就是想用深度学习做疾病基因识别啊……】

想要使用深度学习模型,第一步就是解决如何表示数据的问题。如:剪接点、RNA-蛋白质结合位点、或甲基化。也就是说,你的样本的数量要远远超过变量的数量。

所以说,只要这关键的一步解决了,TensorFlow 就会为你打开深度学习的大门。

2.Tensorflow的安装(基于pip)

Pip 是一个 Python 的软件包安装与管理工具。并且,Tensorflow只能在Linux环境下进行安装,具体在VMware下安装Linux系统详情可以参看我另外一篇博客。

2.1 安装pip(需要在超级管理员权限下进行安装)

  1. sudo apt-get install python-pip python-dev

注:出现以上界面表示pip已经安装成功!

2.2 安装Tensorflow

  1. sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl

 

2.3 测试

  1. >>> import tensorflow as tf

  2. >>> hello = tf.constant('Hello, TensorFlow!')

  3. >>> sess = tf.Session()

  4. >>> print sess.run(hello)

  5. Hello, TensorFlow!

注:Linux下退出Python方法:Ctrl+D

 2.4 安装IDE Pycharm

官网下载Community版 for Linux,根据官网教程的步骤进行安装。

注:可以直接在Linux中的浏览器中进行下载。

首先,将文件拷贝到希望安装的位置。

  1. cd /home/andy

然后解压缩文件:

  1. tar xfz pycharm-community-2016.3.tar.gz

打开 pycharm.sh 文件所在目录:

  1. cd pycharm-community-2016.3/bin

运行 pycharm.sh 文件以安装 pycharm:

  1. ./pycharm.sh

 

安装好后会自动打开pycharm,接下来进行一系列的设置:

 

出现下面界面时,说明安装成功了。

选择“Create New Project”,创建新的工程。默认编译器是python 2.7。

然后在新创建的工程上,右键选择“New->Python File ”,创建一个新的python文件Py01。

在文件Py01中写入一段代码进行测试。

可见,测试结果正确,可以在 Pycharm 上 import tensorflow了!

2.5 将Pycharm锁定到启动器

在Ubuntu下,每次都需要找到 pycharm.sh 所在的文件夹,执行 ./pycharm.sh,打开pycharm,非常麻烦。

所以,我们最好能创建一个快捷方式。Ubuntu 的快捷方式都放在“计算机/usr/share/applications” 下。

首先在该目录下创建一个Pycharm.desktop:

  1. sudo gedit /usr/share/applications/Pycharm.desktop

然后输入以下内容,注意 exec 和 Icon 需要找到你自己电脑中正确的路径,GenericName 和 Comment 中关于Pycharm的版本号你也需要根据实际情况定:

  1. [Desktop Entry]

  2. Type=Application

  3. Name=Pycharm

  4. GenericName=Pycharm2017

  5. Comment=Pycharm2017:The Python IDE

  6. exec="/home/wangfang/Pycham/pycharm-community-2017.1.3/bin/pycharm.sh" %f

  7. Icon=/home/wangfang/Pycham/pycharm-community-2017.1.3/bin/pycharm.png

  8. Terminal=pycharm

  9. Categories=Pycharm;

保存后,通过路径/usr/share/applications/路径即可找到对应桌面Pycharm.desktop文件,然后双击打开,再锁定到启动器就好了。

 

参考文献:

  1. TensorFlow 官网

  2. 极客学院——TensorFlow 官方文档中文版

  3. 极客学院——下载与安装

  4. 极客学院——MNIST机器学习入门(构建softmax回归模型)

  5. 极客学院——深入MNIST(构建深度卷积神经网络)

  6. Ladislav Rampasek and Anna Goldenberg, TensorFlow: Biology’s Gateway to Deep Learning?

  7. werm520的专栏:Ubuntu安装PyCharm

  8. Ubuntu下安装Anaconda

  9. Linux(Ubuntu14.04)下安装Anaconda和Spyder

  10. Ubuntu下如何安装TensorFlow

tensorflow安装教程