Macky1991’s blog

ブログを始めて3週間、アドセンスが合格しました!今後ともよろしくお願いいたしますm(__)m

Online OCRについて

f:id:Macky1991:20190722200421p:plain

 

どうもこんばんわ

 

せっかく続いた晴れ日和もまた曇り空に覆われてしまいました。

小雨も不定期に降るので洗濯物が外に干せませんし、

部屋干しは部屋中湿気っぽくなるので好きではありません。

子供の頃から夏という季節は好きで

地元の夏祭りや花火大会に友達と遊びに出かけたり

市民プールで友達と水泳競争や水遊びなどをよくしました。

しかし梅雨だけは社会人になった今でも慣れません(汗)

 

 OCR

 

憂鬱に浸っててもしょうがないので本日も学習を進めます。

Kindleで購入した書籍が仕様上ハイライトやコピペができないため

今後の学習が手打ちでしか進めなくなりましたが

何としてでもコーディングを効率化したい私はふと思いました。

 

「何らかのアプリでコピペできるようにならないのか」

 

iPhoneのiOSアプリにGoogle翻訳という

単語を入力すると翻訳したい言語に翻訳してくれる

便利なアプリがありますが

カメラモードにすると画面に映っている単語を

翻訳したい言語に翻訳して映っている単語を

翻訳した単語に変換してくれるという

大変ユニークで便利な機能があります。

 

このiOSアプリの存在を知っていた私は推察しました。

 

「Google翻訳のカメラモードのように

 画面の文字が読み取れるアプリがあるのなら

 その機能を応用したテキスト書き起こしアプリがあるのでは?」

 

ネットの検索サイトにてMac OS向けで画像ファイルから

テキスト書き起こしアプリはないのか調べていくと

次のことがわかりました。

 

前途のGoogle翻訳のカメラモードのような技術のことを

「OCR」と呼ばれており光学的文字認識を意味してます。

光学的文字認識とはデジタルカメラやプリンタのスキャナーなどで

手書きや印刷された文字を読み取り、

コンピュータなどで利用できる文字データに変換する技術のことであります。

 ちなみに「OCR」とはOptical Character Recognition/Readerの略称でなります。

 

そのOCRが無償でしかもダウンロード不要で利用できるサイトがあります。

 

 

Online OCR

 

f:id:Macky1991:20190722200421p:plain

 

この「Online OCR」ではテキストを抽出したいPDFやJPEGなどの画像ファイルを

アップロードすることでMicrosoft Wordのdocxファイルやtxtファイルに出力することができます。

また無料会員登録することで様々な制限が無くなり

さらに高機能なOCRとして活用することができるようになります。

 

f:id:Macky1991:20190722200953j:plain

 

今回は「スラスラわかるHTML&CSSのきほん 第2版」の116ページにある

ソースコードをテキスト化したいと思います。

 

f:id:Macky1991:20190722212936p:plain

 

Online OCR」にアクセスしたらページ中央に入力画面がありますので

次の手順からアップロード作業を進めていきます。

 

f:id:Macky1991:20190722200425p:plain

 

1.左にある「Select file...」をクリックするとテキストを抽出したい画像ファイルを選択します。 

 f:id:Macky1991:20190722200530p:plain

 

2.画像ファイルを選択したら抽出したい言語を選択します。

 本書籍は日本語で書かれているので「JAPANESE」にします。

 

f:id:Macky1991:20190722200537p:plain

 

3.抽出したい言語を選択したら出力したいファイル形式を選択します。

 今回はコピペしやすいようにtxtファイルで出力したいので

 「Text Plain(txt)」を選択します。

 選択したら右にある「CONVERT」をクリックします。

 

f:id:Macky1991:20190722200602p:plain

 

4.抽出が完了すると下にファイルのダウンロード先と

 抽出されたテキストが表示されます。

 これで画像ファイルから文字を読み込みテキスト化する処理が完了しました。

 

f:id:Macky1991:20190722200740p:plain

 

では実際にダウンロードしてファイルを開いてみると...

何か怖い文章になって出力されてしまいました。

 

おそらくソースコード以外の文章を含めた画像にしたために

周りの文字列や記号なども認識されて抽出されたと思われます。

 

f:id:Macky1991:20190722200933j:plain

 

では気を取り直して

今度はソースコードの箇所だけトリミングして

再度「Online OCR」にかけてみたいと思います。


f:id:Macky1991:20190722200832p:plain

 

結果はご覧の通り

前回よりも改善はされているものの

「/」がカタカナの「ノ」として認識されてたり

インデントもうまく反映されていません(汗)

 

どうやら画像ファイルにある文字の書式が一風変わったものの場合だと

うまく認識してもらえないようです。

このサイトではあまり書籍などの画像からソースコードの抽出は避けた方がいいみたいです。

 

今回紹介したサイト以外にもOCRが利用できるところもまだあるので

今度使い勝手のいいものを探してみたいと思います。

 

ここまで読んでいただきありがとうございます。

次回の記事の更新をお楽しみに。