论文提出了 \(R^2AM\) 模型用来在自然图片中的OCR。 主要有三个贡献:
i. 用recursive cnn 来用同样多的参数却增加了网络的层数,即增加了特征提取能力。 ii. 用RNN来model character-level language。 iii. 用 soft-attention来选择更好的特征组合,并且可以end-to-end的backpropagation训练。
本文推导了RNN的前馈和反馈过程公式。
近年来,深度学习是机器学习的一大潮流。它在计算机视觉CV,自然语言处理NLP等领域取得了极大的成就。本文以深度学习框架Caffe作为工具简要讲解深度学习入门。
对深度学习和CNN比较了解的可以直接跳至第四节,对caffe比较了解的可以直接跳过本教程。
深度学习在linux上面会比windows上面方便很多,在windows上那叫个折腾。本文将会介绍centos7.0 的 安装,cuda和cudnn的安装,anaconda安装,以及各种深度学习框架的安装。
深度学习是计算密集型任务,不推荐在虚拟机中运行,装cuda和cudnn需要有nvidia显卡。
linux paper reading deep learning Digital Image Forensics engineering
Copyright © 2015 Powered by MWeb, Theme used GitHub CSS.