JKになりたい

何か書きたいことを書きます。主にWeb方面の技術系記事が多いかも。

機械学習

PPOにまつわる備忘録

何の記事か 最近、HuggingFaceの強化学習チュートリアルをみてたんですよ。 で、PPOのこの最後の目的関数の意味がわからなかったんですよね。 これ。 (1) 各項は「クリップされた代理方策目的関数 - 価値関数の目的関数 + エントロピーボーナス」となってい…

AI Blitzは機械学習入門に最適?年末年始に参加したのでレポ。

AIcrowd が主催しているコンペ、AI Blitzの#12に参加したのでそのときの結果と解法を記録としてブログに残しておこうと思います。 AIcrowdで開催されるコンペってKaggleよりエンターテイメント性のあるユニークなコンペが多く、前々から興味はあったんですよ…

stable baselines3+imitationで模倣学習(BC&AIRL)

stable baselines3では、模倣学習のfeatureがimitationというライブラリに移譲されることになりました。 stable-baselines3.readthedocs.io github.com これにより、(過渡期である事も要因であるとは思いますが)以前は非常に簡単にできていた模倣学習に一…

ExpectedSarsaでOpenAI GymのTaxi問題を解く

OpenAI Gym gym.openai.com 強化学習アルゴリズムを開発して比較するためのツールキット。 シンプルなものからAtariのゲームのような複雑なものまで、様々なシチュエーションが用意されています。 今回は、そこから「Taxi-v2」環境を使って、強化学習によるA…

DCGANで遊んでみたメモ(2)

DCGANによる顔画像の生成 データセットはみんな使ってるこれ。 mmlab.ie.cuhk.edu.hk 画像サイズを28x28x3(RGB)に整形して入力とする。 ポイントは、batch_normalizationを導入すること、らしい。 これは、ミニバッチ毎にデータを標準化する手法。 各レイヤ…

DCGANで遊んだメモ(1)

GANってなんや GAN => 敵対的生成ネットワーク 敵対的、とあるように2つの異[なった役割のネットワークが競い合う。 よく説明で使われるのは警察と偽札を作ろうとする偽造者の例。 警察は特定の紙幣を調べ、本物か偽札かを判別する。 偽造者は本物とそっくり…

マルコフモデル,隠れマルコフモデルとコネクショニスト時系列分類法

マルコフモデル,隠れマルコフモデルとコネクショニスト時系列分類法についての資料。 EMアルゴリズムについて、HMMのパラメータの最尤推定について、コネクショニスト時系列分類法についてはもう少し詳しくこのブログで書けたらいいなって思ってます(願望…

LSTMの解説(をしようと思った)

LSTMの解説をしようと思ったけど、なかなか重い腰があがらなかった。 なので、以前に輪講で使用した資料をそのまま貼り付けて記事にしようと思う。。。 MLP深層学習 LSTM from Shuhei Sowa 間違っている点もあると思います。随時ご指摘願えたら嬉しいです。 …

ディープネットの事前学習・その他の自己符号化器

MLPシリーズ「深層学習」の5.6ディープネットの事前学習と5.7その他の自己符号化器のまとめです。 ディープネットの事前学習 多層の順伝播型ネットワークには勾配消失という現象が起こるため、学習が難しい。 これを解決するのが事前学習。 一般にネットワー…

データの白色化

MLPシリーズ「深層学習」の5.5節「データの白色化」についてのまとめです。 白色化とは? 成分間(データの特徴間)の相関をなくす処理のこと。 自己符号化器が良い特徴を学習できるかどうかを大きく左右することがある。 考え方 データxの任意の2成分間で相…

ハイブリッドOCR

これまでの流れを汲んでOCRかけるクラスを完成させるで。 まだまだ改良の余地はあるけど、いつまでもこんなことばっかりやってられへんから一旦これでOCRは完結や。 流れは 1)白紙のセル判定 ->白紙なら終了 2)文字の部分だけ切り取る 3)tesseractにかける 4…

再びtesseractでOCR

前回、高解像度の綺麗なデータを作る事ができたんや。 せやったらtesseract、結構いけるんちゃうか?って話やで。 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) 番号 解答 正負 (1) 持 ち 家 o (2) ー 0 3 1 113 x (3) ー 773 0 53 5 3 x (4) 5…

pdf->pngを変換を高画質に行いたい

初回あたりからずっと使ってる画質が粗いセルの画像やけど、そもそもpdf->png変換を高画質に出力できたらええんちゃうか?っていう話。 最初からこうしたらよかったんや、迷走しすぎやなあ。 さて、pdf->png変換を綺麗に行う為にはImageMagickを使うで。 con…

めっちゃ粗い画像の数字を認識したい-試行錯誤編-

この画像↓を鮮鋭化するために試行錯誤するで。粗いなあ・・5か6かわからんで・・。 知り合いの人に色々なフィルタリング方法を教えてもらったんや。それをほぼそのまま貼るで。 アンシャープマスキング k = 4.0 op = np.array([ [-k, -k, -k], [-k, 1 + 8 * …

Google Cloud Vision APIでOCRを試してみる

なんか前回か前々回か忘れたけど、日本語全然認識できひんかったから、Google様の力を借りるで・・。 毎月1000回以上のリクエストやったら無料や。 あ、正確には1000unitやな。例えば文字認識と物体認識を同時にやったら1リクエスト2unitsや。 1000unitsを超…

tesseractでOCR〜数字だけでも〜

前回全然日本語や数字認識ができなかったtesseract、せめて数字だけでも認識できひんか?と思って再チャレンジ。 前回はあまりに工夫がなさすぎた。 今回実験に使うセルはこれ。 pyocrのbuilderを変えてみる どうやら、数字だけの認識に対応したbuilderがあ…

PythonでOCRがんばる(1)

tesseractでOCR これ(https://github.com/tesseract-ocr/tesseract)を入れる Pythonで使いたいのでラッパーを入れる。 https://github.com/jflesch/pyocr 日本語に対応させるためにここ(https://github.com/tesseract-ocr/tessdata)からjapn.traineddata…