ハイブリッドOCR

with コメントはまだありません

これまでの流れを汲んでOCRかけるクラスを完成させるで。
まだまだ改良の余地はあるけど、いつまでもこんなことばっかりやってられへんから一旦これでOCRは完結や。

流れは

1)白紙のセル判定 ->白紙なら終了
2)文字の部分だけ切り取る
3)tesseractにかける
4)数字ならそれで終了,数字以外ならvisionAPIにかける

簡単に実装するとこんな感じやで。

(input)
f:id:deeptoneworks:20160930050552p:plain
(output)
DetectText(kind=<CellKind.number: 3>, text=42.1)

(input)
f:id:deeptoneworks:20160930050600p:plain
(output)
DetectText(kind=<CellKind.string: 2>, text=’住宅の所有の関係(6区分)’)

(input)
f:id:deeptoneworks:20160930050606p:plain

(output)
DetectText(kind=<CellKind.empty: 1>, text=”)

ええ感じやな!次は素性作成器の実装や!

Leave a Reply