(Translated by https://www.hiragana.jp/)
[6ページ] OCRの人気記事 288件 - はてなブックマーク

検索けんさく対象たいしょう

ならじゅん

ブックマークすう

期間きかん指定してい

  • から
  • まで

201 - 240 けん / 288けん

OCRの検索けんさく結果けっか201 - 240 けん / 288けん

  • AppleのVisionフレームワークを利用りようし、オフラインでもキャプチャした画像がぞうないのテキストをコピーできるオープンソースのMacようOCRアプリ「TRex」がリリース。

    AppleのVisionフレームワークを利用りようし、オフラインでもキャプチャしたテキストやQR情報じょうほうをクリップボードにコピーしてくれるオープンソースのMacようOCRアプリ「TRex」がリリースされています。詳細しょうさい以下いかから。 Appleは2017ねん06がつ開催かいさいしたWWDC2017で、撮影さつえいした写真しゃしん画像がぞうからかおやテキスト、バーコードの検出けんしゅつ、オブジェクトのトラッキングをオンデバイスで実行じっこうできるVisionフレームワークを発表はっぴょうし、この機能きのうはCore MLとともにAppleのメモや写真しゃしんアプリで利用りようされていますが、このVisionフレームワークを利用りようし、Macでキャプチャした画像がぞうからテキストを抽出ちゅうしゅつしてくれるOCRアプリ「TRex」がリリースされています。 TRex makes OCR easy and accessible on a Mac.But what is OCR anyway? Imagine you

      AppleのVisionフレームワークを利用し、オフラインでもキャプチャした画像内のテキストをコピーできるオープンソースのMac用OCRアプリ「TRex」がリリース。
    • I blew $720 on 100 notebooks from Alibaba and started a Paper Website business | Tiny Projects

      I blew $720 on 100 notebooks from Alibaba and started a Paper Website business December 14th 2021 TLDR; I started a business that lets you build websites using pen & paper. In the process I went viral on Twitter, made $1,000 in two days, and blew $720 on 100 paper notebooks from Alibaba. 📖 Can you build a website from a piece of paper? One day, a riddle popped into my brain: "Can you build a webs

        I blew $720 on 100 notebooks from Alibaba and started a Paper Website business | Tiny Projects
      • バクラクOCRにおける機械きかい学習がくしゅうモデルの検証けんしょうから本番ほんばん投入とうにゅうまでのみ - LayerX エンジニアブログ

        機械きかい学習がくしゅうエンジニアの吉田よしだです。今年ことしの3がつにLayerXに入社にゅうしゃおも機械きかい学習がくしゅう活用かつようしたOCRの開発かいはつをしています。それまでルールベースで実装じっそうされていた工程こうてい一部いちぶ機械きかい学習がくしゅうベースの実装じっそうえつつあり実際じっさい本番ほんばんでも稼働かどうしています。この記事きじではどのように検証けんしょう開発かいはつすすめてきたのかご紹介しょうかいします。 背景はいけい LayerXで提供ていきょうしているバクラクでは帳票ちょうひょうをアップロードするだけで支払しはらい金額きんがく支払しはらい期日きじつなどを自動じどう補完ほかんしてくれるOCR機能きのうがあります。このOCRはおもにルールベースで実装じっそうされていましたが、リリースから継続けいぞくてき改善かいぜんおこなわれていたことでかなり精度せいどたかることができるようになっていました。しかし導入どうにゅう企業きぎょうさまえるにつれて次第しだい精度せいど改善かいぜん困難こんなんになり、いち箇所かしょ修正しゅうせいするとこれまでれていたものがれなくなるなどコードの修正しゅうせい困難こんなんになってきている状況じょうきょうでした。 一方いっぽうでリリースから1ねん以上いじょう経過けいかあつめられ

          バクラクOCRにおける機械学習モデルの検証から本番投入までの取り組み - LayerX エンジニアブログ
        • PaddleOCRで日本語にほんご

          PaddleOCRについて Deep Learningを使つかったOCRです。Baiduが開発かいはつしているようで、軽量けいりょう(lightweight)をりにしています。 論文ろんぶんはこちらで確認かくにんできます。 2020ねんの9がつごろにみみにしまして、簡単かんたんれるような手引てびきやDockerイメージとう充実じゅうじつしていることもあり、ためしてみることにしました。 日本語にほんごにも対応たいおうしています。さきもうしますと日本語にほんごのOCRにすこ苦戦くせんしたので、このように記事きじとしてのこしておきます。 導入どうにゅう GitHubにある説明せつめいとおりです。リンクからご参照さんしょうください。ほん記事きじではDockerを使つかい、かつばやくCPUでうごかすことにします。 sudo docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gp

            PaddleOCRで日本語を読む
          • Google Drive APIでOCRをしよう! - Qiita

            はじめに アクセンチュアのあかせきです。必要ひつようがあって、OCR機能きのうをいろいろ調しらべています。 Google では、Google Vision APIとGoogle Driveの機能きのうがあります。 Google Vision APIの記事きじ Google Driveの記事きじ 大量たいりょうにOCRをしたい場合ばあいは、普通ふつうかんがえるとAPIとして使つかえるGoogle Vision API一択いったくなわけですが、どうもかるくテストしたかぎり、Google Drive APIのほう認識にんしき精度せいどたかいみたいなのです。そもそも、おなじグーグルでおな機能きのうのエンジンがふたつあることからしてなぞなのですが。。。 それで、普通ふつうであればUI経由けいゆ使つかうGoogle DriveのOCR機能きのうをAPIで使つかいたいとおもってしまったわけです。 結論けつろんとして、頑張がんばればGoogle DriveのOCR機能きのうをAPIで使つかうことは可能かのうでした。 とう記事きじは、そのための手順てじゅんしめすものとなります

              Google Drive APIでOCRをしよう! - Qiita
            • 日本語にほんご対応たいおうオープンソースOCRの比較ひかく

              結果けっか 処理しょり時間じかん Tesseract(0.85s) > PaddleOCR(1.52s) > EasyOCR(3.90s) 精度せいど主観しゅかんあり。。。) PaddleOCR > EasyOCR > Tesseract 処理しょり時間じかん Tesseract(7.42s) > PaddleOCR(9.60s) > EasyOCR(51.34s) 精度せいど主観しゅかんあり。。。) PaddleOCR > EasyOCR > Tesseract 参考さんこう - Google Cloud Vision ポイ捨ぽいす禁止きんし! NO LITTER 清潔せいけつできれいなみなとみなと MINATO CITY マル とく まつのや サービスけん コロッケ 1個いっこ 無料むりょう! 有効ゆうこう期限きげん:2023ねん4がつ30にち15まで ※メインメニュー1しょくにつきつづりの1まいがご利用りよういただけます。 ※ご希望きぼうのサービスひん切取きりとり、店舗てんぽ従業じゅうぎょういん直接ちょくせつわたください。 ※配布はいふのご利用りよういただけません

                日本語対応オープンソースOCRの比較
              • 手書てがきや印刷いんさつされた数式すうしきをカメラで撮影さつえいするだけでLaTeX形式けいしき変換へんかんしてくれる「Mathpix Snip for Mac/Windows/iOS」が数式すうしきだけでなく文章ぶんしょうんでくれる「OCR 2.0」エンジンを搭載とうさい

                手書てがきや印刷いんさつされた数式すうしきをカメラで撮影さつえいするだけでLaTeX形式けいしき変換へんかんしてくれる「Mathpix Snip for Mac/Windows/iOS」が数式すうしきだけでなく文章ぶんしょうんでくれる「OCR 2.0」エンジンを搭載とうさいしています。詳細しょうさい以下いかから。 Mathpix Snipシリーズはスタンフォード大学だいがく博士はかせ課程かていでディープラーニングを専攻せんこうしていたNico Jimenezさんらが設立せつりつしたMathpix, Inc.が開発かいはつ公開こうかいしている数式すうしき専用せんようのOCRアプリで、スクリーンショットや写真しゃしんから数式すうしき判別はんべつ、LaTeX形式けいしき変換へんかんしてくれる機能きのうがありますが、このMathpix SnipのデスクトップばんとiOSばんがアップデートし、あらたにOCRエンジン「OCR 1.0」と「OCR 2.0」を選択せんたくできるようになっています。 OCR 2.0 OCR 2.0 is optimized to scan Snips with

                  手書きや印刷された数式をカメラで撮影するだけでLaTeX形式に変換してくれる「Mathpix Snip for Mac/Windows/iOS」が数式だけでなく文章も取り込んでくれる「OCR 2.0」エンジンを搭載。
                • かみ資料しりょうひょうをExcelのデータに変換へんかんする方法ほうほう。Officeのスマホアプリでスキャンできる

                  新聞しんぶん書籍しょせき、パンフレットなど、かみ資料しりょう印刷いんさつされたひょうをデジタルしたいときは、iPhoneやAndroid、Chromebookで使つかえる[Office]アプリが便利べんりです。ひょう構造こうぞう内容ないようってデータを自動じどう生成せいせいし、Excelのひょう変換へんかんすることができます。 スマートフォンで手軽てがるにOCRができる パソコンで作成さくせいちゅうのビジネス文書ぶんしょなかに、かみ資料しりょうのデータを引用いんようしたいことがあります。たとえば、新聞しんぶん書籍しょせき、パンフレットなどに掲載けいさいされているひょう該当がいとうします。 そのようなとき、普通ふつうならかみ資料しりょうながら入力にゅうりょくしようとおもいますが......じつは、もっとスマートな方法ほうほうがあります。iPhoneやAndroidスマートフォン、そして最近さいきん人気にんきのChromebookでも使つかえるアプリを使つかいましょう。 Microsoftの提供ていきょうする[Office]アプリには、かみ資料しりょうをきれいに写真しゃしん画像がぞう)としてるスキャン機能きのうくわえて、その

                    紙資料の表をExcelのデータに変換する方法。Officeのスマホアプリでスキャンできる
                  • Google Cloud Vision APIのOCRを使つかってPythonから文字もじ認識にんしきする方法ほうほう

                    こんにちは、業務ぎょうむ自動じどうツール開発かいはつ担当たんとう吉池よしいけ(@valmore_myoshi)です。 今回こんかいはGoogle Cloud Vision APIのOCRを使用しようして画像がぞうから文字もじ認識にんしきする方法ほうほう解説かいせつします。さまざまな言語げんごあつかえますがほん記事きじではPythonを使つかいたいとおもいます。 Cloud Vision APIの精度せいどためしたり、使つかかたまなぶときにお役立やくだててください。 Cloud Vision APIとは? Cloud Vision APIは画像がぞう認識にんしきとくしたAPIです。画像がぞうからかお検出けんしゅつしたり、うつっているものを識別しきべつできます。ほん記事きじではそのなかでもOCRを使つかったテキスト検出けんしゅつしぼって解説かいせつします。 REST APIやさまざまな言語げんごごとに用意よういされているクライアントライブラリをとおしてCloud Vision APIを使用しようできます。Cloud Vision APIでできることや精度せいどりたいほう画像がぞうをアップロードするだけ

                      Google Cloud Vision APIのOCRを使ってPythonから文字認識する方法
                    • QuickOCR - kほんてき無料むりょうソフト・フリーソフト

                      Windows 10 に内蔵ないぞうされている OCR エンジンを利用りようしたシンプルな OCR ツール。 マウスドラッグでかこんだ領域りょういきないうつっているテキストをり、結果けっか専用せんようのウインドウない一発いっぱつ抽出ちゅうしゅつしてくれます。 日本語にほんご英語えいご のテキストに対応たいおうしているようです。 「QuickOCR」は、Windows 10 内蔵ないぞうの OCR エンジンを利用りようした OCR ツールです。 マウスドラッグでかこんだ領域りょういきないのテキストをり、結果けっか専用せんようのウインドウない抽出ちゅうしゅつしてくれる OCR ツールで、スクリーンキャプチャーをおこなうような感覚かんかく手軽てがるに OCR をおこなうことができます。 Windows 10 に内蔵ないぞうされている OCR エンジンを使用しようしているため、特別とくべつ準備じゅんびなしで使つかうことができ、また回数かいすう制限せいげんなどもなく無料むりょう使つかうことが可能かのうとなっています。 (ただし、精度せいどはそこまでたかくないとも...) 普段ふだん、“ 画像がぞうやコピーできな

                        QuickOCR - k本的に無料ソフト・フリーソフト
                      • GPT-4V(ision) System Cardをざっくりやくした - Qiita

                        はじめに OpenAIが3がつ発表はっぴょうしていたものの実装じっそうしていなかった、画像がぞうおよび音声おんせいあつかうことのできるマルチモーダルモデル「GPT4-V」のdeployが発表はっぴょうされました。本当ほんとう全部ぜんぶこの会社かいしゃがやればいいんじゃないか? ChatGPTのPlus/Enterpriseユーザーに2週間しゅうかんかけて提供ていきょうするそうです。最近さいきんChatGPTのほうの処理しょり能力のうりょくちつつあってGPT-4のAPIばっかり使つかってるんですが、ChatGPT Plusは解約かいやくできそうにないですね。 GPT4-Vを中心ちゅうしんとしたV&LのLLMはDocumentUnderstandingの文脈ぶんみゃくでの活用かつよう期待きたいされており、先日せんじつGoogleを中心ちゅうしんとしたグループもLMDX: Language Model-based Document Information Extraction and Localizationという論文ろんぶん発表はっぴょうしていました。Geminiなん

                          GPT-4V(ision) System Cardをざっくり訳した - Qiita
                        • モルフォ、近代きんだい書籍しょせき可能かのうなAI-OCRソフト「FROG AI-OCR」をリリース

                          モルフォグループにおいてAIの事業じぎょうになう、モルフォAIソリューションズは、近代きんだい書籍しょせきにも対応たいおうしたAI-OCRソフトウェア「FROG AI-OCR」を2022ねん7がつ1にちより販売はんばい開始かいしします。 このAIニュースのポイント モルフォAIソリューションズがAI-OCRソフトウェア「FROG AI-OCR」を販売はんばい予定よてい 自社じしゃ開発かいはつしたNDLOCRを活用かつようしており、近代きんだい書籍しょせき読取よみと可能かのう クラウドでの利用りよう可能かのうで、OCR処理しょりほかにも校正こうせい・テキスト出力しゅつりょく機能きのう搭載とうさい モルフォグループにおいてAIの事業じぎょうになう、株式会社かぶしきがいしゃモルフォAIソリューションズは、近代きんだい書籍しょせきにも対応たいおうしたAI-OCRソフトウェア「FROG AI-OCR」を2022ねん7がつ1にちかね)より販売はんばい開始かいしします。 モルフォAIソリューションズは、れい3ねんから国立こくりつ国会図書館こっかいとしょかん(NDL)の委託いたく事業じぎょうとして図書館としょかんけAI-OCRの開発かいはつ従事じゅうじしてきました。開発かいはつしたNDLOCRは

                            モルフォ、近代書籍も読み取り可能なAI-OCRソフト「FROG AI-OCR」をリリース
                          • 【C#】文字もじ認識にんしきをWindows10のOCRでやってみた!

                            C# で画像がぞうデータのなかにある文字もじ認識にんしきするにはどうしたらいいか調しらべた結果けっか、Windows10 に OCR(文字もじ認識にんしき機能きのう標準ひょうじゅんそなわっていることがかりました。 ほん記事きじでは Windows10 の文字もじ認識にんしき機能きのうもちいて、画像がぞうデータの文字もじ認識にんしきしてテキストデータとして出力しゅつりょくするプログラミング方法ほうほうをまとめてみました。

                              【C#】文字認識をWindows10のOCRでやってみた!
                            • バクラクのAI-OCR機能きのうささえるアノテーションの仕組しく

                              2021ねんのプロダクトリリースからやく2ねんはん導入どうにゅうしゃすうは6000しゃ突破とっぱしデータすう急速きゅうそくえるなか、AI-OCR機能きのう精度せいど担保たんぽをするために様々さまざまみをしてきました。今回こんかいはデータのアノテーションという観点かんてんでリリースまえから現在げんざいまでのみの変遷へんせん紹介しょうかいします。

                                バクラクのAI-OCR機能を支えるアノテーションの仕組み
                              • Human Eyes Only

                                Why?!? Prevent the dark web from scanning leaked files easily. Secure your documents in legal discovery Makes it harder for people to steal intellectual property More Info Resistant to Optical Character Recognition (OCR), most laypeople will need to print+rescan to OCR Works on the vast majority of PDFs with embedded fonts PDFs using the 14 base fonts do not work yet, but they will soon Only works

                                • だい770かい UbuntuとOCRmyPDFでスキャンした内容ないようたいして自動的じどうてきにOCRを実行じっこうする | gihyo.jp

                                  今回こんかいはブラザーのスキャナーでスキャンした結果けっか自動的じどうてきにOCRを実行じっこうします。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成こうせいします。 かみ書類しょるいをなんとかしたい ペーパーレスなんて言葉ことばはもうききてしまいましたが、実際じっさいにペーパーレスが達成たっせいされたかというとそういうわけでもないことはみなさんも日々ひびかんじていることでしょう。 なにかのサービスに契約けいやくしたらユーザーめいとパスワードは郵送ゆうそうされてくるなんてことはむしろ最近さいきんえています。本人ほんにん確認かくにんのためにはいたかたないところではありますが。 むかしのWi-Fiルーターはメーカーによって初期しょきユーザーめいとパスワードがまっていましたが、セキュリティてきには問題もんだいしかありません。そのため最近さいきんはWi-Fiルーターのはこにユーザーめいとパスワードがかれたかみ某社ぼうしゃだとシール)がはいっています。たしかにこれだと安心あんしんですが、こんなのしつくすにけつ

                                    第770回 UbuntuとOCRmyPDFでスキャンした内容に対して自動的にOCRを実行する | gihyo.jp
                                  • GitHub - ndl-lab/pdmocrdataset-part1: デジタル資料しりょうOCRテキスト事業じぎょうにおいて作成さくせいされたOCR学習がくしゅうようデータセット

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
                                    • Torishima @izutorishima 漫画まんがのセリフとうのテキストを OCR するためにつくられたらしい Manga-OCR、ルビたて横書よこがりょう対応たいおうくわえて多様たようなフォントへの堅牢けんろうせいそなえているらしく、シンプルに OSS の日本語にほんご AI OCR ツールとして最高さいこうレベルなのでは? Transformers を使つかってるんだと(以下いかスレッド⏬) https://github.com/kha-white/manga-ocr…

                                      • 《2022ねん決定けっていばん》AI OCRツールのおすすめ5せん比較ひかくえらかたのポイントも紹介しょうかい | AI専門せんもんニュースメディア AINOW

                                        最終さいしゅう更新こうしん: 2022ねん2がつ8にち 近年きんねん、DXを推進すいしんする企業きぎょうえています。 DXを実現じつげんするためには、かみなどのアナログデータをデジタル形式けいしき変換へんかんするプロセス、いわゆる「デジタイゼーション」がかせません。 ▼ DX(デジタルトランスフォーメーション)についてくわしくはこちら

                                          《2022年決定版》AI OCRツールのおすすめ5選を比較!選び方のポイントも紹介 | AI専門ニュースメディア AINOW
                                        • Windows 10に搭載とうさいされているMicrosoft OCRを使つかって文字もじ認識にんしきする – RIALAB.

                                          Windows 10に搭載とうさいされているMicrosoft OCRを使つかって文字もじ認識にんしきする 木曜日もくようび , 11, 3月 2021 makoto .NET, Windows, 技術ぎじゅつてきなメモ 1 Comment 文字もじ認識にんしき必要ひつようになりそうなお仕事しごとで、実装じっそう方法ほうほうむずかしさ、文字もじ認識にんしき精度せいど調しらべるためにつくった簡易かんいOCRツールです。 Windows 10に標準ひょうじゅん搭載とうさいされているOCR( Microsoft OCR / Windows.Media.Ocr )を使つかっただけなのですが、機能きのうとして面白おもしろかったのでプログラムとソースを公開こうかいします。 ※実行じっこう画面がめんのサンプルとして、青空あおぞら文庫ぶんこ公開こうかいされている『吾輩わがはいねこである』のスクリーンショットを使用しようしました。 ※2022/02/05 『GUI対応たいおうしたPDFをページごとに画像がぞう変換へんかん(PNG/BMP/JPEG/GIF/TIFF形式けいしき)するツール [WPF]』で応用おうようアプリケーションを掲載けいさいしました。

                                          • 「バクラク請求せいきゅうしょ財務ざいむ会計かいけいシステムとの連携れんけいでさらに業務ぎょうむ効率こうりつアップ!

                                            LayerXは、クラウド請求せいきゅうしょ受領じゅりょうソフト「バクラク請求せいきゅうしょ」が、OSKが提供ていきょうする財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとのデータ連携れんけい可能かのうになったことを発表はっぴょうしました。 このAIニュースのポイント バクラク請求せいきゅうしょ財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとデータ連携れんけい アップデートによりりょうシステムあいだにおいてCSV形式けいしきでスムーズなやりりが可能かのうに ユーザーの効率こうりつてき請求せいきゅうしょ処理しょり業務ぎょうむ実現じつげん LayerXは、クラウド請求せいきゅうしょ受領じゅりょうソフト「バクラク請求せいきゅうしょ」が、OSKが提供ていきょうする財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとのデータ連携れんけい可能かのうになったことを発表はっぴょうしました。 バクラク請求せいきゅうしょは、AI-OCRを活用かつようし、受領じゅりょう請求せいきゅうしょにかかる業務ぎょうむ効率こうりつできるクラウドサービスです。請求せいきゅうしょ回収かいしゅうする機能きのうくわえ、仕訳しわけデータや、振込ふりこみデータを自動じどう作成さくせいできます。 JIIMAの「でんちょうほう

                                              「バクラク請求書」財務会計システムとの連携でさらに業務効率アップ!
                                            • LayerXにおける機械きかい学習がくしゅう活用かつようしたOCR機能きのう改善かいぜんかんするみ / layerx-jsai-2023

                                              2023.06.06 - 2023.06.09に開催かいさいされた2023年度ねんど 人工じんこう知能ちのう学会がっかい全国ぜんこく大会たいかいだい37かい)のインダストリアルセッションで登壇とうだんした内容ないようです。 LayerXにおけるOCR機能きのう改善かいぜん歴史れきしについて説明せつめいしました。

                                                LayerXにおける機械学習を活用したOCR機能の改善に関する取り組み / layerx-jsai-2023
                                              • https://jp.techcrunch.com/2019/12/26/ai-inside-is-listed-on-the-mothers-market-of-the-tse/

                                                  https://jp.techcrunch.com/2019/12/26/ai-inside-is-listed-on-the-mothers-market-of-the-tse/
                                                • GitHub - open-mmlab/mmocr: OpenMMLab Text Detection, Recognition and Understanding Toolbox

                                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                    GitHub - open-mmlab/mmocr: OpenMMLab Text Detection, Recognition and Understanding Toolbox
                                                  • 自然しぜん災害さいがい伝承でんしょう」にはなにかれているのか? 「一太郎いちたろうPad」で碑文ひぶんをOCR処理しょりしてみた【地図ちずウォッチ】

                                                      「自然災害伝承碑」には何が書かれているのか? 「一太郎Pad」で碑文をOCR処理してみた【地図ウォッチ】
                                                    • 無料むりょうChrome 拡張かくちょう機能きのう「Copyfish Free OCR Software」がちょう便利べんりだった

                                                      最近さいきんわけあってアメリカの特許とっきょ情報じょうほう調しらべているのだが、なんともなげかわしいことに、ここで公開こうかいされているPDFファイルには文字もじ情報じょうほうふくまれていない。 つまり画像がぞうをPDFにしただけなので文字もじとしてコピーできず、資料しりょうにまとめようとしても入力にゅうりょくなおさないといけない。流石さすが手間てまがかかりすぎる。 (↑いちれい文字もじのようにえるが画像がぞうデータなので文字もじをコピーできない) そこで色々いろいろとググっててみたら、便利べんりなChrome拡張かくちょう機能きのうつけた。 Copyfish Free OCR Software - Chrome ウェブストア そのとおりOCRソフトウェアなのだが、Chromeじょう表示ひょうじしているものならなんでも文字もじ認識にんしきしてくれるすぐれもの。 (しかもChromeがいのものも文字もじ認識にんしきできるオプションもある) 使つかかた非常ひじょう簡単かんたん 使つかかたはとっても簡単かんたん。 ①この拡張かくちょう機能きのうをChromeにインストールし ②OCR文字もじ検出けんしゅつしたいペー

                                                        無料Chrome 拡張機能「Copyfish Free OCR Software」が超便利だった
                                                      • 【Colab】Vision APIでレシートOCR - Qiita

                                                        はじめに GoogleのVision APIを使用しようしてレシートのOCRをしてみました。 言語げんごはPython、環境かんきょうはGoogle Colaboratoryを使用しようしています。 実装じっそう 入力にゅうりょく画像がぞう OCRする画像がぞう表示ひょうじしてみます。 import cv2 import matplotlib.pyplot as plt %matplotlib inline import matplotlib img = cv2.imread(input_file) # input_fileは画像がぞうのパス plt.figure(figsize=[10,10]) plt.axis('off') plt.imshow(img[:,:,::-1])

                                                          【Colab】Vision APIでレシートOCR - Qiita
                                                        • 東芝とうしばデジタルソリューションズ、ディープラーニングで手書てが文字もじ認識にんしき精度せいど向上こうじょうさせた「AI OCR文字もじ認識にんしきサービスV2.0」提供ていきょう開始かいし

                                                            東芝デジタルソリューションズ、ディープラーニングで手書き文字認識精度を向上させた「AI OCR文字認識サービスV2.0」提供開始
                                                          • 一太郎いちたろうPad

                                                            カメラ&しょう入力にゅうりょく素早すばやくメモ作成さくせい カメラ・写真しゃしんから自動じどう文字もじおこしで、かんたんメモ作成さくせい! キー入力にゅうりょくでのメモ作成さくせいはぶけ入力にゅうりょくツールでスムーズに。 シンプルな操作そうさで、時短じたん入力にゅうりょく特長とくちょうのメモアプリです。 ■こんな使つかかたがオススメ ・いつでも、どこでも、おもいついたらすぐにメモ。 ・文書ぶんしょをテキストし、データさい利用りよう検索けんさくせいアップ。 ・掲示けいじぶつ看板かんばんからテキスト資料しりょう・レポートに。 ・げん在日ざいにちがワンタッチ。日記にっき日報にっぽうに。 ・会話かいわぶん、……、―― もスムーズ。小説しょうせつ執筆しっぴつ取材しゅざいメモに。 ・見出みだし # を入力にゅうりょくあきらての文書ぶんしょに。 ■一太郎いちたろうPadの機能きのう ・カメラで撮影さつえいした画像がぞう写真しゃしんから自動じどう文字もじおこしをし、メモを作成さくせいします。たてきもたか精度せいど文字もじ変換へんかんおこないます。 ・キー入力にゅうりょくをアシストする「しょう入力にゅうりょくツール」で、時短じたん入力にゅうりょく可能かのうです。 ■しょう入力にゅうりょくツール 5種類しゅるいのボタンセットからえらべます。 ・げん在日ざいにち 「2021/02/05 12:

                                                              ‎一太郎Pad
                                                            • OpenAIのGPT-4 Turbo with visionを日本語にほんごOCRとして使つかってみる

                                                              先日せんじつのOpenAI DevDayで、GPT-4 Turbo with visionというものが発表はっぴょうされました。Chat Completions APIで画像がぞうファイルをインプットとしてわたして、画像がぞう解析かいせきをしてくれるAPIです。 わたし以前いぜん、「Azure Computer Vision APIの日本語にほんごOCR機能きのう使つかってみる」や「Google Cloud Vision APIの日本語にほんごOCR機能きのう使つかってみる」で、かくクラウドの画像がぞう認識にんしきAPIの日本語にほんごOCR機能きのう検証けんしょうするエントリーをきました。OpenAIも画像がぞう認識にんしきAPIが使つかえるようになったので、まったくおな検証けんしょう方法ほうほう評価ひょうかしてみました。 GPT-4 Turbo with vision OCR機能きのう利用りよう OpenAIのAPI Keyを準備じゅんびします。API Keyを取得しゅとくされていないほうは、「OpenAI API Key取得しゅとく」で検索けんさくしてください。 今回こんかい検証けんしょうコードは

                                                                OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる
                                                              • #PowerAutomate Desktop の OCR アクションをためしてみた - Qiita

                                                                Power Automate Desktop とは ローコード開発かいはつプラットフォームの Power Platform のうち自動じどう担当たんとうする Power Automate ですが、APIがない、既存きそんのデスクトップアプリケーションやWebサービスなども、クラウド連携れんけいしたいという要望ようぼうこたえるために、RPA機能きのうとして追加ついかされたものが、Power Automate Desktop です。 このようなかたちで、アプリケーションの操作そうさ指定していし、クラウドサービスである、Power Automate からし、実行じっこう結果けっか取得しゅとくすることで、既存きそんのアプリケーションも簡単かんたんにクラウド連携れんけいができるようになりました。 Power Automate Desktop は、アプリケーションの代行だいこう操作そうさ以外いがいにも、様々さまざまなアクションが用意よういされています。 そのなかで、OCRというアクションがあるのでひらいてみましょう。 アクションをかぎ

                                                                  #PowerAutomate Desktop の OCR アクションを試してみた - Qiita
                                                                • インターンとしてOCR処理しょり実装じっそうおよび精度せいど上昇じょうしょう尽力じんりょくしたはなし - Retty Tech Blog

                                                                  タイトルのとおり、8/10-27の3週間しゅうかんRettyの広告こうこくコンテンツチームでインターンをさせていただきました。かなりたくさんのことをおこない、かんがえてきたので思考しこうプロセスってったらおおげさなんですけどわらい備忘録びぼうろくかせていただきます。 自己じこ紹介しょうかい インターンのタスク タスクの目的もくてき 具体ぐたいてき内容ないよう 手法しゅほう選定せんてい Vision APIの使用しようについて 機械きかい学習がくしゅうモデルの構築こうちく 学習がくしゅうよう画像がぞうのアノテーション 機械きかい学習がくしゅうぜん準備じゅんび ResNetとは? 学習がくしゅうスタート! 推論すいろん Endpoint 作成さくせい OCRをおこな形態素けいたいそ解析かいせきとは 形態素けいたいそ解析かいせきおこなった 今後こんご方向ほうこうせい 今回こんかい使用しようしなかったデータへの範囲はんい拡大かくだい OCRのパラメータについて インターンちゅう業務ぎょうむ以外いがいかんして 感想かんそう Rettyでインターンをしたいひと最後さいご自己じこ紹介しょうかい 東京工業大学とうきょうこうぎょうだいがく大学院だいがくいん情報じょうほう理工りこう学院がくいん 数理すうり計算けいさん科学かがくけい1年生ねんせい森脇もりわきもうします。大学院だいがくいんほうでは分散ぶんさん学習がくしゅう研究けんきゅうおこなっておりま

                                                                    インターンとしてOCR処理の実装および精度上昇に尽力した話 - Retty Tech Blog
                                                                  • AI-OCRとは?OCRとのちがいや種類しゅるい導入どうにゅうメリット・比較ひかくのポイントを解説かいせつ

                                                                    AIとOCR技術ぎじゅつわせたソリューションがビジネスプロセスの自動じどう効率こうりつ推進すいしんしています。この技術ぎじゅつは、手書てがきや活字かつじ文書ぶんしょからテキストデータを正確せいかくり、デジタルすることで、手作業てさぎょうによるデータ入力にゅうりょく時間じかんとコストを大幅おおはば削減さくげんします。 また、RPA(ロボティック・プロセス・オートメーション)と連携れんけいすることで、業務ぎょうむ効率こうりつがさらにすすみます。デジタル変革へんかく(DX)を推進すいしんするじょうで、業務ぎょうむ効率こうりつ向上こうじょうさせることが可能かのうです。 ほん記事きじではAI-OCRの特徴とくちょうやメリット、デメリットや製品せいひん比較ひかくポイントとう紹介しょうかいします。この記事きじがAI-OCR導入どうにゅう検討けんとうしている方々かたがた有用ゆうよう情報じょうほう提供ていきょうできればさいわいです。 AI-OCRとは? AI-OCRとは、AI(人工じんこう知能ちのう)を活用かつようしたOCR(光学こうがくてき文字もじ認識にんしき)のことをします。OCRとは、スキャナなどでんだ画像がぞうえがかれた文字もじをテキストデータに変換へんかんする技術ぎじゅつです。AI-OCRはOC

                                                                      AI-OCRとは?OCRとの違いや種類・導入メリット・比較のポイントを解説
                                                                    • Zaim、購入こうにゅう内容ないよう詳細しょうさいのこせる「レシート履歴りれき置換ちかん」。クレカとレシート情報じょうほうひも

                                                                        Zaim、購入内容の詳細を残せる「レシート履歴置換」。クレカとレシート情報を紐付け
                                                                      • 画像がぞうやドキュメントファイルからAIでテキストを抽出ちゅうしゅつするオープンソースのOCRツール・「EasyOCR」 - かちびと.net

                                                                        EasyOCRは画像がぞうやドキュメントファイルからAIでテキストを抽出ちゅうしゅつするオープンソースのAI-OCR(Optical Character Recognition)ツールです。80ヵ国かこく以上いじょう言語げんごがサポートされています。もちろん日本語にほんごふくまれています。 身近みぢかなものだとGoogleドライブにもOCR機能きのういていますね。おなじように、任意にんい画像がぞうやドキュメントからテキストをアップロードし、抽出ちゅうしゅつしたい言語げんご指定してい英語えいごならen、日本語にほんごならja)するだけでテキストに変換へんかんしてくれます。 また、回数かいすうかさねること学習がくしゅうし、よりたか精度せいどになっていくよう設計せっけいされているそうです。pythonでかれています。ブラウザで動作どうさ確認かくにんもできますので精度せいどをおためしになってみてはいかがでしょう。ライセンスはApache-2.0とのこと。 EasyOCR

                                                                        • 読取よみと革命かくめいVer.16

                                                                          読取よみと革命かくめい」は11ねん連続れんぞく販売はんばい本数ほんすうシェアだい1 2013~2023ねん(1がつ~12がつ全国ぜんこく有力ゆうりょく家電かでん量販りょうはんてん販売はんばい実績じっせきデータの「PCソフト/ビジネス」、「OCR・翻訳ほんやく」カテゴリを抽出ちゅうしゅつして自社じしゃ集計しゅうけい読取よみと革命かくめい」は書類しょるいのスキャン画像がぞうなどの文字もじ画像がぞう編集へんしゅう可能かのうなテキストデータに変換へんかんするソフトです。 搭載とうさいするOCR(Optical Character Recognition)エンジンの精度せいどたかさには定評ていひょうがあり、企業きぎょう中心ちゅうしんおおくのユーザーに使つかわれています。 FAXやコピーした文書ぶんしょ手書てが文字もじなどてい品質ひんしつ文字もじ認識にんしきつよく、英語えいご文書ぶんしょりにも対応たいおうしています。

                                                                            読取革命Ver.16
                                                                          • 熊本大学くまもとだいがくとTOPPAN、くずし対応たいおうのAI-OCRをもちいて「細川ほそかわ文書ぶんしょやく5まんまい全文ぜんぶんテキスト成功せいこう

                                                                              熊本大学とTOPPAN、くずし字対応のAI-OCRを用いて「細川家文書」約5万枚の全文テキスト化に成功
                                                                            • Deep Learning Based OCR for Text in the Wild

                                                                              We live in times when any organization or company to scale and to stay relevant has to change how they look at technology and adapt to the changing landscapes swiftly. We already know how Google has digitized books. Or how Google earth is using NLP (or NER) to identify addresses. Or how it is possible to read text in digital documents like invoices, legal paperwork, etc. But how does it work exact

                                                                                Deep Learning Based OCR for Text in the Wild
                                                                              • iPhoneで日本語にほんごOCR、文字もじ認識にんしき使つかえる - Qiita

                                                                                文字もじ認識にんしきをかんたんにつかえる iPhoneで文字もじ認識にんしきできたら、板書ばんしょこしや、標識ひょうしき認識にんしきアプリなど便利べんりにつかえます。 2022ねんのアップデートで日本語にほんご利用りよう可能かのうに 2022ねんのiOS16から、日本語にほんご文字もじ認識にんしき可能かのうになりました。 みのフレームワークのみで可能かのうです。 精度せいどもかなりく、さまざまなアプリで実用じつようえるレベルだと個人こじんてきにはおもいます。 つかいかた VisionのVNRecognizeTextRequestをつかいます。 recognitionLanguages に "ja" を指定していします。 macOS13、Xcode14、iOS16以降いこう必要ひつようです。 let request = VNRecognizeTextRequest() request.recognitionLanguages = ["ja"] // 日本語にほんご指定してい let handler = VNImageReques

                                                                                  iPhoneで日本語OCR、文字認識が使える - Qiita
                                                                                • 【TIPS】海外かいがいフリゲを自動じどう翻訳ほんやくしながらあそ手順てじゅん(Screen Translator, PCOT)|ソルト

                                                                                  英語えいご苦手にがてだけどになるゲームがあるというなやみにこたえてくれる素敵すてきなソフトについて使用しよう手順てじゅんなどをメモします。つぎの2つのソフトをさわりました。どちらも無料むりょう使用しようできます。制作せいさくしゃさま感謝かんしゃ。ヘビーユーズするようなら寄付きふなどしたいです。 ①Screen Translator たぶん定番ていばんなソフトだとおもいます。海外かいがいほう開発かいはつしているので、「英語えいごまったくわからん」という場合ばあい使つかいにくいですが、「アイキャンノットスピークイングリッシュ(ちょっとだけかる)」という場合ばあい補助ほじょとしては十分じゅうぶん機能きのうだとかんじました。 ②PCOT 2020ねんごろに個人こじん開発かいはつされたソフトみたいです。一時期いちじき配布はいふ制限せいげんされていましたが、2021ねん7がつ現在げんざい配布はいふ再開さいかいしています。各所かくしょ話題わだいになっているとおり、使つかいやすいです。また、設定せってい画面がめんなどがすべ日本語にほんごなのもありがたいです。おススメ。 ◆はじめに◇そもそもなにのために使つかうものなの? 「あそびたいゲー

                                                                                    【TIPS】海外フリゲを自動翻訳しながら遊ぶ手順(Screen Translator, PCOT)|ソルト

                                                                                  新着しんちゃく記事きじ