はるみちゃんのてっくぶろぐ

はるみちゃんのブログだよ。主に技術系の記事を書くよ。

機械学習

マルコフモデル,隠れマルコフモデルとコネクショニスト時系列分類法

マルコフモデル,隠れマルコフモデルとコネクショニスト時系列分類法についての資料。 EMアルゴリズムについて、HMMのパラメータの最尤推定について、コネクショニスト時系列分類法についてはもう少し詳しくこのブログで書けたらいいなって思ってます(願望…

LSTMの解説(をしようと思った)

LSTMの解説をしようと思ったけど、なかなか重い腰があがらなかった。 なので、以前に輪講で使用した資料をそのまま貼り付けて記事にしようと思う。。。 MLP深層学習 LSTM from Shuhei Sowa 間違っている点もあると思います。随時ご指摘願えたら嬉しいです。 …

ディープネットの事前学習・その他の自己符号化器

MLPシリーズ「深層学習」の5.6ディープネットの事前学習と5.7その他の自己符号化器のまとめです。 ディープネットの事前学習 多層の順伝播型ネットワークには勾配消失という現象が起こるため、学習が難しい。 これを解決するのが事前学習。 一般にネットワー…

データの白色化

MLPシリーズ「深層学習」の5.5節「データの白色化」についてのまとめです。 白色化とは? 成分間(データの特徴間)の相関をなくす処理のこと。 自己符号化器が良い特徴を学習できるかどうかを大きく左右することがある。 考え方 データxの任意の2成分間で相…

ハイブリッドOCR

これまでの流れを汲んでOCRかけるクラスを完成させるで。 まだまだ改良の余地はあるけど、いつまでもこんなことばっかりやってられへんから一旦これでOCRは完結や。 流れは 1)白紙のセル判定 ->白紙なら終了 2)文字の部分だけ切り取る 3)tesseractにかける 4…

再びtesseractでOCR

前回、高解像度の綺麗なデータを作る事ができたんや。 せやったらtesseract、結構いけるんちゃうか?って話やで。 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) 番号 解答 正負 (1) 持 ち 家 o (2) ー 0 3 1 113 x (3) ー 773 0 53 5 3 x (4) 5…

pdf->pngを変換を高画質に行いたい

初回あたりからずっと使ってる画質が粗いセルの画像やけど、そもそもpdf->png変換を高画質に出力できたらええんちゃうか?っていう話。 最初からこうしたらよかったんや、迷走しすぎやなあ。 さて、pdf->png変換を綺麗に行う為にはImageMagickを使うで。 con…

めっちゃ粗い画像の数字を認識したい-試行錯誤編-

この画像↓を鮮鋭化するために試行錯誤するで。粗いなあ・・5か6かわからんで・・。 知り合いの人に色々なフィルタリング方法を教えてもらったんや。それをほぼそのまま貼るで。 アンシャープマスキング k = 4.0 op = np.array([ [-k, -k, -k], [-k, 1 + 8 * …

Google Cloud Vision APIでOCRを試してみる

なんか前回か前々回か忘れたけど、日本語全然認識できひんかったから、Google様の力を借りるで・・。 毎月1000回以上のリクエストやったら無料や。 あ、正確には1000unitやな。例えば文字認識と物体認識を同時にやったら1リクエスト2unitsや。 1000unitsを超…

tesseractでOCR〜数字だけでも〜

前回全然日本語や数字認識ができなかったtesseract、せめて数字だけでも認識できひんか?と思って再チャレンジ。 前回はあまりに工夫がなさすぎた。 今回実験に使うセルはこれ。 pyocrのbuilderを変えてみる どうやら、数字だけの認識に対応したbuilderがあ…

PythonでOCRがんばる(1)

tesseractでOCR これ(https://github.com/tesseract-ocr/tesseract)を入れる Pythonで使いたいのでラッパーを入れる。 https://github.com/jflesch/pyocr 日本語に対応させるためにここ(https://github.com/tesseract-ocr/tessdata)からjapn.traineddata…