论文提出了 \(R^2AM\) 模型用来在自然图片中的OCR。 主要有三个贡献:
i. 用recursive cnn 来用同样多的参数却增加了网络的层数,即增加了特征提取能力。 ii. 用RNN来model character-level language。 iii. 用 soft-attention来选择更好的特征组合,并且可以end-to-end的backpropagation训练。
linux paper reading deep learning Digital Image Forensics engineering
Copyright © 2015 Powered by MWeb, Theme used GitHub CSS.