[6ページ] OCRの人気記事 288件 - はてなブックマーク

201 - 240 件けん / 288件けん

新着しんちゃく順じゅん人気にんき順じゅん

絞しぼり込こみ

検索けんさく対象たいしょう
ブックマーク数すう
期間きかん
セーフサーチ

OCRの検索けんさく結果けっか201 - 240 件けん / 288件けん

AppleのVisionフレームワークを利用りようし、オフラインでもキャプチャした画像がぞう内ないのテキストをコピーできるオープンソースのMac用ようOCRアプリ「TRex」がリリース。
- 6 users
- applech2.com
- テクノロジー
- 2021/06/01
AppleのVisionフレームワークを利用りようし、オフラインでもキャプチャしたテキストやQR情報じょうほうをクリップボードにコピーしてくれるオープンソースのMac用ようOCRアプリ「TRex」がリリースされています。詳細しょうさいは以下いかから。 Appleは2017年ねん06月がつに開催かいさいしたWWDC2017で、撮影さつえいした写真しゃしんや画像がぞうから顔かおやテキスト、バーコードの検出けんしゅつ、オブジェクトのトラッキングをオンデバイスで実行じっこうできるVisionフレームワークを発表はっぴょうし、この機能きのうはCore MLと共ともにAppleのメモや写真しゃしんアプリで利用りようされていますが、このVisionフレームワークを利用りようし、Macでキャプチャした画像がぞうからテキストを抽出ちゅうしゅつしてくれるOCRアプリ「TRex」がリリースされています。 TRex makes OCR easy and accessible on a Mac.But what is OCR anyway? Imagine you
I blew $720 on 100 notebooks from Alibaba and started a Paper Website business | Tiny Projects
- 6 users
- daily.tinyprojects.dev
- 政治せいじと経済けいざい
- 2021/12/15
I blew $720 on 100 notebooks from Alibaba and started a Paper Website business December 14th 2021 TLDR; I started a business that lets you build websites using pen & paper. In the process I went viral on Twitter, made $1,000 in two days, and blew $720 on 100 paper notebooks from Alibaba. 📖 Can you build a website from a piece of paper? One day, a riddle popped into my brain: "Can you build a webs
- メモ
- ビジネス
バクラクOCRにおける機械きかい学習がくしゅうモデルの検証けんしょうから本番ほんばん投入とうにゅうまでの取とり組くみ - LayerX エンジニアブログ
- 6 users
- tech.layerx.co.jp
- テクノロジー
- 2022/12/07
機械きかい学習がくしゅうエンジニアの吉田よしだです。今年ことしの3月がつにLayerXに入社にゅうしゃし主おもに機械きかい学習がくしゅうを活用かつようしたOCRの開発かいはつをしています。それまでルールベースで実装じっそうされていた工程こうていを一部いちぶ機械きかい学習がくしゅうベースの実装じっそうに置おき換かえつつあり実際じっさいに本番ほんばんでも稼働かどうしています。この記事きじではどのように検証けんしょうや開発かいはつを進すすめてきたのかご紹介しょうかいします。背景はいけい LayerXで提供ていきょうしているバクラクでは帳票ちょうひょうをアップロードするだけで支払しはらい金額きんがくや支払しはらい期日きじつなどを自動じどうで読よみ取とり補完ほかんしてくれるOCR機能きのうがあります。このOCRは主おもにルールベースで実装じっそうされていましたが、リリースから継続けいぞく的てきに改善かいぜんが行おこなわれていたことでかなり精度せいど高たかく読よみ取とることができるようになっていました。しかし導入どうにゅう企業きぎょう様さまが増ふえるにつれて次第しだいに精度せいどの改善かいぜんが困難こんなんになり、一いち箇所かしょ修正しゅうせいするとこれまで読よみ取とれていたものが読よみ取とれなくなるなどコードの修正しゅうせいも困難こんなんになってきている状況じょうきょうでした。一方いっぽうでリリースから1年ねん以上いじょう経過けいかし集あつめられ
PaddleOCRで日本語にほんごを読よむ
- 6 users
- zenn.dev/shimat
- テクノロジー
- 2020/11/16
PaddleOCRについて Deep Learningを使つかったOCRです。Baiduが開発かいはつしているようで、軽量けいりょう(lightweight)を売うりにしています。論文ろんぶんはこちらで確認かくにんできます。 2020年ねんの9月がつごろに耳みみにしまして、簡単かんたんに触ふれるような手引てびきやDockerイメージ等とうが充実じゅうじつしていることもあり、試ためしてみることにしました。日本語にほんごにも対応たいおうしています。先さきに申もうしますと日本語にほんごのOCRに少すこし苦戦くせんしたので、このように記事きじとして残のこしておきます。導入どうにゅう GitHubにある説明せつめいの通とおりです。リンクからご参照さんしょうください。本ほん記事きじではDockerを使つかい、かつ手てっ取とり早ばやくCPUで動うごかすことにします。 sudo docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gp
- ocr
- oss

Google Drive APIでOCRをしよう！ - Qiita
- 6 users
- qiita.com/makaishi2
- テクノロジー
- 2022/04/17
はじめにアクセンチュアの赤あか石せきです。必要ひつようがあって、OCR機能きのうをいろいろ調しらべています。 Google では、Google Vision APIとGoogle Driveの機能きのうがあります。 Google Vision APIの記事きじ Google Driveの記事きじ大量たいりょうにOCRをしたい場合ばあいは、普通ふつうに考かんがえるとAPIとして使つかえるGoogle Vision API一択いったくなわけですが、どうも軽かるくテストした限かぎり、Google Drive APIの方ほうが認識にんしき精度せいどが高たかいみたいなのです。そもそも、同おなじグーグルで同おなじ機能きのうのエンジンが２ふたつあることからして謎なぞなのですが。。。それで、普通ふつうであればUI経由けいゆで使つかうGoogle DriveのOCR機能きのうをAPIで使つかいたいと思おもってしまったわけです。結論けつろんとして、頑張がんばればGoogle DriveのOCR機能きのうをAPIで使つかうことは可能かのうでした。当とう記事きじは、そのための手順てじゅんを示しめすものとなります
日本語にほんご対応たいおうオープンソースOCRの比較ひかく
- 6 users
- zenn.dev/piment
- テクノロジー
- 2023/08/04
結果けっか処理しょり時間じかん Tesseract(0.85s) > PaddleOCR(1.52s) > EasyOCR(3.90s) 精度せいど（主観しゅかんあり。。。） PaddleOCR > EasyOCR > Tesseract 処理しょり時間じかん Tesseract(7.42s) > PaddleOCR(9.60s) > EasyOCR(51.34s) 精度せいど（主観しゅかんあり。。。） PaddleOCR > EasyOCR > Tesseract 参考さんこう - Google Cloud Vision ポイ捨ぽいすて禁止きんし! NO LITTER 清潔せいけつできれいな港みなと区くを港みなと区く MINATO CITY マル得とく松まつのやサービス券けんコロッケ 1個いっこ無料むりょう! 有効ゆうこう期限きげん:2023年ねん4月がつ30日にち15時じまで ※メインメニュー1食しょくにつき綴つづりの1枚まいがご利用りよう頂いただけます。 ※ご希望きぼうのサービス品ひんを切取きりとり、店舗てんぽで従業じゅうぎょう員いんへ直接ちょくせつお渡わたし下ください。 ※配布はいふ時じのご利用りようは頂いただけません
- OCR
手書てがきや印刷いんさつされた数式すうしきをカメラで撮影さつえいするだけでLaTeX形式けいしきに変換へんかんしてくれる「Mathpix Snip for Mac/Windows/iOS」が数式すうしきだけでなく文章ぶんしょうも取とり込こんでくれる「OCR 2.0」エンジンを搭載とうさい。
- 6 users
- applech2.com
- テクノロジー
- 2019/12/20
手書てがきや印刷いんさつされた数式すうしきをカメラで撮影さつえいするだけでLaTeX形式けいしきに変換へんかんしてくれる「Mathpix Snip for Mac/Windows/iOS」が数式すうしきだけでなく文章ぶんしょうも取とり込こんでくれる「OCR 2.0」エンジンを搭載とうさいしています。詳細しょうさいは以下いかから。 Mathpix Snipシリーズはスタンフォード大学だいがくの博士はかせ課程かていでディープラーニングを専攻せんこうしていたNico Jimenezさんらが設立せつりつしたMathpix, Inc.が開発かいはつ＆公開こうかいしている数式すうしき専用せんようのOCRアプリで、スクリーンショットや写真しゃしんから数式すうしきを判別はんべつ、LaTeX形式けいしきに変換へんかんしてくれる機能きのうがありますが、このMathpix Snipのデスクトップ版ばんとiOS版ばんがアップデートし、新あらたにOCRエンジン「OCR 1.0」と「OCR 2.0」を選択せんたくできるようになっています。 OCR 2.0 OCR 2.0 is optimized to scan Snips with
- math
- iOS
- アプリ
- Mac
- Windows
紙かみ資料しりょうの表ひょうをExcelのデータに変換へんかんする方法ほうほう。Officeのスマホアプリでスキャンできる
- 6 users
- dekiru.net
- テクノロジー
- 2021/06/24
新聞しんぶんや書籍しょせき、パンフレットなど、紙かみの資料しりょうに印刷いんさつされた表ひょうをデジタル化かしたいときは、iPhoneやAndroid、Chromebookで使つかえる［Office］アプリが便利べんりです。表ひょうの構造こうぞうや内容ないようを読よみ取とってデータを自動じどう生成せいせいし、Excelの表ひょうに変換へんかんすることができます。スマートフォンで手軽てがるにOCRができるパソコンで作成さくせい中ちゅうのビジネス文書ぶんしょの中なかに、紙かみの資料しりょうのデータを引用いんようしたいことがあります。例たとえば、新聞しんぶんや書籍しょせき、パンフレットなどに掲載けいさいされている表ひょうが該当がいとうします。そのようなとき、普通ふつうなら紙かみ資料しりょうを見みながら手て入力にゅうりょくしようと思おもいますが......実じつは、もっとスマートな方法ほうほうがあります。iPhoneやAndroidスマートフォン、そして最近さいきん人気にんきのChromebookでも使つかえるアプリを使つかいましょう。 Microsoftの提供ていきょうする［Office］アプリには、紙かみ資料しりょうをきれいに写真しゃしん（画像がぞう）として読よみ取とるスキャン機能きのうに加くわえて、その
- Excel
Google Cloud Vision APIのOCRを使つかってPythonから文字もじ認識にんしきする方法ほうほう
- 6 users
- valmore.work
- テクノロジー
- 2019/10/25
こんにちは、業務ぎょうむ自動じどう化かツール開発かいはつ担当たんとうの吉池よしいけ（@valmore_myoshi）です。今回こんかいはGoogle Cloud Vision APIのOCRを使用しようして画像がぞうから文字もじ認識にんしきする方法ほうほうを解説かいせつします。さまざまな言語げんごで扱あつかえますが本ほん記事きじではPythonを使つかいたいと思おもいます。 Cloud Vision APIの精度せいどを試ためしたり、使つかい方かたを学まなぶときにお役立やくだててください。 Cloud Vision APIとは？ Cloud Vision APIは画像がぞう認識にんしきに特とく化かしたAPIです。画像がぞうから顔かおを検出けんしゅつしたり、写うつっているものを識別しきべつできます。本ほん記事きじではそのなかでもOCRを使つかったテキスト検出けんしゅつに絞しぼって解説かいせつします。 REST APIやさまざまな言語げんごごとに用意よういされているクライアントライブラリを通とおしてCloud Vision APIを使用しようできます。Cloud Vision APIでできることや精度せいどを知しりたい方ほうは画像がぞうをアップロードするだけ
- Python
- api
- google
QuickOCR - ｋ本ほん的てきに無料むりょうソフト・フリーソフト
- 6 users
- www.gigafree.net
- テクノロジー
- 2019/12/09
Windows 10 に内蔵ないぞうされている OCR エンジンを利用りようしたシンプルな OCR ツール。マウスドラッグで囲かこんだ領域りょういき内ないに写うつっているテキストを読よみ取とり、結果けっかを専用せんようのウインドウ内ないに一発いっぱつ抽出ちゅうしゅつしてくれます。日本語にほんご＆英語えいごのテキストに対応たいおうしているようです。「QuickOCR」は、Windows 10 内蔵ないぞうの OCR エンジンを利用りようした OCR ツールです。マウスドラッグで囲かこんだ領域りょういき内ないのテキストを読よみ取とり、結果けっかを専用せんようのウインドウ内ないに抽出ちゅうしゅつしてくれる OCR ツールで、スクリーンキャプチャーを行おこなうような感覚かんかくで手軽てがるに OCR を行おこなうことができます。 Windows 10 に内蔵ないぞうされている OCR エンジンを使用しようしているため、特別とくべつな準備じゅんびなしで使つかうことができ、また回数かいすう制限せいげんなどもなく無料むりょうで使つかうことが可能かのうとなっています。（ただし、読よみ取とり精度せいどはそこまで高たかくないとも...）普段ふだん、“ 画像がぞうやコピーできな
- OCR
- ツール
- windows
GPT-4V(ision) System Cardをざっくり訳やくした - Qiita
- 5 users
- qiita.com/Ikwus
- テクノロジー
- 2023/09/28
はじめに OpenAIが3月がつに発表はっぴょうしていたものの実装じっそうしていなかった、画像がぞうおよび音声おんせいを取とり扱あつかうことのできるマルチモーダルモデル「GPT4-V」のdeployが発表はっぴょうされました。本当ほんとうに全部ぜんぶこの会社かいしゃがやればいいんじゃないか？ ChatGPTのPlus/Enterpriseユーザーに2週間しゅうかんかけて提供ていきょうするそうです。最近さいきんChatGPTのほうの処理しょり能力のうりょくが落おちつつあってGPT-4のAPIばっかり使つかってるんですが、ChatGPT Plusは解約かいやくできそうにないですね。 GPT4-Vを中心ちゅうしんとしたV&LのLLMはDocumentUnderstandingの文脈ぶんみゃくでの活用かつようが期待きたいされており、先日せんじつGoogleを中心ちゅうしんとしたグループもLMDX: Language Model-based Document Information Extraction and Localizationという論文ろんぶんを発表はっぴょうしていました。Geminiなん
- AI
- GPT-4V
モルフォ、近代きんだい書籍しょせきも読よみ取とり可能かのうなAI-OCRソフト「FROG AI-OCR」をリリース
- 5 users
- aismiley.co.jp
- テクノロジー
- 2022/06/23
モルフォグループにおいてAIの事業じぎょう化かを担になう、モルフォAIソリューションズは、近代きんだい書籍しょせきにも対応たいおうしたAI-OCRソフトウェア「FROG AI-OCR」を2022年ねん7月がつ1日にちより販売はんばい開始かいしします。このAIニュースのポイントモルフォAIソリューションズがAI-OCRソフトウェア「FROG AI-OCR」を販売はんばい予定よてい自社じしゃ開発かいはつしたNDLOCRを活用かつようしており、近代きんだい書籍しょせきの読取よみとが可能かのうクラウドでの利用りようが可能かのうで、OCR処理しょりの他ほかにも校正こうせい・テキスト出力しゅつりょく機能きのうも搭載とうさいモルフォグループにおいてAIの事業じぎょう化かを担になう、株式会社かぶしきがいしゃモルフォAIソリューションズは、近代きんだい書籍しょせきにも対応たいおうしたAI-OCRソフトウェア「FROG AI-OCR」を2022年ねん7月がつ1日にち（金かね）より販売はんばい開始かいしします。モルフォAIソリューションズは、令れい和わ3年ねんから国立こくりつ国会図書館こっかいとしょかん(NDL)の委託いたく事業じぎょうとして図書館としょかん向むけAI-OCRの開発かいはつに従事じゅうじしてきました。開発かいはつしたNDLOCRは
- ビジネス
【C#】文字もじ認識にんしきをWindows10のOCRでやってみた！
- 5 users
- marunaka-blog.com
- テクノロジー
- 2022/03/01
C# で画像がぞうデータの中なかにある文字もじを認識にんしきするにはどうしたらいいか調しらべた結果けっか、Windows10 に OCR（文字もじ認識にんしき）機能きのうが標準ひょうじゅんで備そなわっていることが分わかりました。本ほん記事きじでは Windows10 の文字もじ認識にんしき機能きのうを用もちいて、画像がぞうデータの文字もじを認識にんしきしてテキストデータとして出力しゅつりょくするプログラミング方法ほうほうをまとめてみました。
- あとで読よむ
バクラクのAI-OCR機能きのうを支ささえるアノテーションの仕組しくみ
- 5 users
- speakerdeck.com/tomoaki25
- テクノロジー
- 2023/09/21
2021年ねんのプロダクトリリースから約やく2年ねん半はん、導入どうにゅう者しゃ数すうは6000社しゃを突破とっぱしデータ数すうも急速きゅうそくに増ふえる中なか、AI-OCR機能きのうの精度せいどを担保たんぽをするために様々さまざまな取とり組くみをしてきました。今回こんかいはデータのアノテーションという観点かんてんでリリース前まえから現在げんざいまでの取とり組くみの変遷へんせんを紹介しょうかいします。
- あとで読よむ
Human Eyes Only
- 5 users
- www.humaneyesonly.com
- テクノロジー
- 2022/07/07
Why?!? Prevent the dark web from scanning leaked files easily. Secure your documents in legal discovery Makes it harder for people to steal intellectual property More Info Resistant to Optical Character Recognition (OCR), most laypeople will need to print+rescan to OCR Works on the vast majority of PDFs with embedded fonts PDFs using the 14 base fonts do not work yet, but they will soon Only works
- tool
- security
第だい770回かい　UbuntuとOCRmyPDFでスキャンした内容ないように対たいして自動的じどうてきにOCRを実行じっこうする | gihyo.jp
- 5 users
- gihyo.jp
- テクノロジー
- 2023/07/12
今回こんかいはブラザーのスキャナーでスキャンした結果けっかを自動的じどうてきにOCRを実行じっこうします。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成こうせいします。紙かみの書類しょるいをなんとかしたいペーパーレスなんて言葉ことばはもうききてしまいましたが、実際じっさいにペーパーレスが達成たっせいされたかというとそういうわけでもないことはみなさんも日々ひび感かんじていることでしょう。なにかのサービスに契約けいやくしたらユーザー名めいとパスワードは郵送ゆうそうされてくるなんてことはむしろ最近さいきん増ふえています。本人ほんにん確認かくにんのためには致いたし方かたないところではありますが。昔むかしのWi-Fiルーターはメーカーによって初期しょきユーザー名めいとパスワードが決きまっていましたが、セキュリティ的てきには問題もんだいしかありません。そのため最近さいきんはWi-Fiルーターの箱はこにユーザー名めいとパスワードが書かかれた紙かみ（某社ぼうしゃだとシール）が入はいっています。たしかにこれだと安心あんしんですが、こんなの失しつくすに決けつ
- ubuntu
- OCR
- pdf
- article
GitHub - ndl-lab/pdmocrdataset-part1: デジタル化か資料しりょうOCRテキスト化か事業じぎょうにおいて作成さくせいされたOCR学習がくしゅう用ようデータセット
- 5 users
- github.com/ndl-lab
- テクノロジー
- 2022/04/26
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- OCR
- github
Torishima @izutorishima 漫画まんがのセリフ等とうのテキストを OCR するために作つくられたらしい Manga-OCR、ルビ付つき縦たて書がき横書よこがき両りょう対応たいおう、加くわえて多様たようなフォントへの堅牢けんろう性せいを備そなえているらしく、シンプルに OSS の日本語にほんご AI OCR ツールとして最高さいこうレベルなのでは？ Transformers を使つかってるんだと（以下いかスレッド⏬） https://github.com/kha-white/manga-ocr…
- 5 users
- twitter.com
- テクノロジー
- 2023/06/14
- Tools
- comic
- twitter
《2022年ねん決定けってい版ばん》AI OCRツールのおすすめ5選せんを比較ひかく！選えらび方かたのポイントも紹介しょうかい | AI専門せんもんニュースメディア AINOW
- 5 users
- ainow.ai
- テクノロジー
- 2022/02/04
最終さいしゅう更新こうしん日び： 2022年ねん2月がつ8日にち近年きんねん、DXを推進すいしんする企業きぎょうが増ふえています。 DXを実現じつげんするためには、紙かみなどのアナログデータをデジタル形式けいしきに変換へんかんするプロセス、いわゆる「デジタイゼーション」が欠かかせません。 ▼ DX（デジタルトランスフォーメーション）について詳くわしくはこちら
Windows 10に搭載とうさいされているMicrosoft OCRを使つかって文字もじ認識にんしきする – RIALAB.
- 5 users
- www.ria-lab.com
- テクノロジー
- 2021/09/13
Windows 10に搭載とうさいされているMicrosoft OCRを使つかって文字もじ認識にんしきする木曜日もくようび , 11, 3月 2021 makoto .NET, Windows, 技術ぎじゅつ的てきなメモ 1 Comment 文字もじ認識にんしきが必要ひつようになりそうなお仕事しごとで、実装じっそう方法ほうほうと難むずかしさ、文字もじ認識にんしきの精度せいどを調しらべるために作つくった簡易かんいOCRツールです。 Windows 10に標準ひょうじゅん搭載とうさいされているOCR( Microsoft OCR / Windows.Media.Ocr )を使つかっただけなのですが、機能きのうとして面白おもしろかったのでプログラムとソースを公開こうかいします。 ※実行じっこう画面がめんのサンプルとして、青空あおぞら文庫ぶんこで公開こうかいされている『吾輩わがはいは猫ねこである』のスクリーンショットを使用しようしました。 ※2022/02/05 『GUI対応たいおうしたPDFをページごとに画像がぞう変換へんかん(PNG/BMP/JPEG/GIF/TIFF形式けいしき)するツール [WPF]』で応用おうようアプリケーションを掲載けいさいしました。
- ocr
「バクラク請求せいきゅう書しょ」財務ざいむ会計かいけいシステムとの連携れんけいでさらに業務ぎょうむ効率こうりつアップ！
- 5 users
- aismiley.co.jp
- テクノロジー
- 2022/06/09
LayerXは、クラウド請求せいきゅう書しょ受領じゅりょうソフト「バクラク請求せいきゅう書しょ」が、OSKが提供ていきょうする財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとのデータ連携れんけいが可能かのうになったことを発表はっぴょうしました。このAIニュースのポイントバクラク請求せいきゅう書しょが財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとデータ連携れんけいアップデートにより両りょうシステム間あいだにおいてCSV形式けいしきでスムーズなやり取とりが可能かのうにユーザーの効率こうりつ的てきな請求せいきゅう書しょ処理しょり業務ぎょうむが実現じつげん LayerXは、クラウド請求せいきゅう書しょ受領じゅりょうソフト「バクラク請求せいきゅう書しょ」が、OSKが提供ていきょうする財務ざいむ会計かいけいシステムSMILE V 2nd Edition会計かいけいとのデータ連携れんけいが可能かのうになったことを発表はっぴょうしました。バクラク請求せいきゅう書しょは、AI-OCRを活用かつようし、受領じゅりょう請求せいきゅう書しょにかかる業務ぎょうむを効率こうりつ化かできるクラウドサービスです。請求せいきゅう書しょを回収かいしゅうする機能きのうに加くわえ、仕訳しわけデータや、振込ふりこみデータを自動じどうで作成さくせいできます。 JIIMAの「電でん帳ちょう法ほう
LayerXにおける機械きかい学習がくしゅうを活用かつようしたOCR機能きのうの改善かいぜんに関かんする取とり組くみ / layerx-jsai-2023
- 5 users
- speakerdeck.com/shimacos
- テクノロジー
- 2023/06/09
2023.06.06 - 2023.06.09に開催かいさいされた2023年度ねんど人工じんこう知能ちのう学会がっかい全国ぜんこく大会たいかい（第だい37回かい）のインダストリアルセッションで登壇とうだんした内容ないようです。 LayerXにおけるOCR機能きのうの改善かいぜんの歴史れきしについて説明せつめいしました。
https://jp.techcrunch.com/2019/12/26/ai-inside-is-listed-on-the-mothers-market-of-the-tse/
- 5 users
- jp.techcrunch.com
- テクノロジー
- 2019/12/27
- AI
GitHub - open-mmlab/mmocr: OpenMMLab Text Detection, Recognition and Understanding Toolbox
- 5 users
- github.com/open-mmlab
- テクノロジー
- 2021/04/08
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- PyTorch
- OCR
- tech
「自然しぜん災害さいがい伝承でんしょう碑ひ」には何なにが書かかれているのか？「一太郎いちたろうPad」で碑文ひぶんをOCR処理しょりしてみた【地図ちずウォッチ】
- 5 users
- internet.watch.impress.co.jp
- テクノロジー
- 2020/03/12
無料むりょうChrome 拡張かくちょう機能きのう「Copyfish Free OCR Software」が超ちょう便利べんりだった
- 5 users
- 7mc.org
- テクノロジー
- 2020/05/04
最近さいきん、訳わけあってアメリカの特許とっきょ情報じょうほうを調しらべているのだが、何なんとも嘆なげかわしいことに、ここで公開こうかいされているPDFファイルには文字もじ情報じょうほうが含ふくまれていない。つまり画像がぞうをPDFにしただけなので文字もじとしてコピーできず、資料しりょうにまとめようとしても手てで入力にゅうりょくし直なおさないといけない。流石さすがに手間てまがかかりすぎる。（↑一いち例れい。文字もじのように見みえるが画像がぞうデータなので文字もじをコピーできない）そこで色々いろいろとググっててみたら、便利べんりなChrome拡張かくちょう機能きのうを見みつけた。 Copyfish Free OCR Software - Chrome ウェブストアその名なの通とおりOCRソフトウェアなのだが、Chrome上じょうに表示ひょうじしているものなら何なんでも文字もじ認識にんしきしてくれる優すぐれもの。（しかもChrome外がいのものも文字もじ認識にんしきできるオプションもある）使つかい方かたは非常ひじょうに簡単かんたん使つかい方かたはとっても簡単かんたん。 ①この拡張かくちょう機能きのうをChromeにインストールし ②OCR文字もじ検出けんしゅつしたいペー
- chrome
【Colab】Vision APIでレシートOCR - Qiita
- 4 users
- qiita.com/ayuma
- テクノロジー
- 2020/06/15
はじめに GoogleのVision APIを使用しようしてレシートのOCRをしてみました。言語げんごはPython、環境かんきょうはGoogle Colaboratoryを使用しようしています。実装じっそう入力にゅうりょく画像がぞう OCRする画像がぞうを表示ひょうじしてみます。 import cv2 import matplotlib.pyplot as plt %matplotlib inline import matplotlib img = cv2.imread(input_file) # input_fileは画像がぞうのパス plt.figure(figsize=[10,10]) plt.axis('off') plt.imshow(img[:,:,::-1])
東芝とうしばデジタルソリューションズ、ディープラーニングで手書てがき文字もじ認識にんしき精度せいどを向上こうじょうさせた「AI OCR文字もじ認識にんしきサービスV2.0」提供ていきょう開始かいし
- 4 users
- cloud.watch.impress.co.jp
- テクノロジー
- 2020/01/30
- ビジネス
- あとで読よむ
‎一太郎いちたろうPad
- 4 users
- apps.apple.com
- テクノロジー
- 2020/02/08
カメラ＆省しょう入力にゅうりょくで素早すばやくメモ作成さくせいカメラ・写真しゃしんから自動じどう文字もじおこしで、かんたんメモ作成さくせい！キー入力にゅうりょくでのメモ作成さくせいも省はぶけ入力にゅうりょくツールでスムーズに。シンプルな操作そうさで、時短じたん入力にゅうりょくが特長とくちょうのメモアプリです。 ■こんな使つかい方かたがオススメ・いつでも、どこでも、思おもいついたらすぐにメモ。・紙しの文書ぶんしょをテキスト化かし、データ再さい利用りよう・検索けんさく性せいアップ。・掲示けいじ物ぶつや看板かんばんからテキスト化か。資料しりょう・レポートに。・現げん在日ざいにち時じがワンタッチ。日記にっき・日報にっぽうに。・会話かいわ文ぶん、……、―― もスムーズ。小説しょうせつ執筆しっぴつや取材しゅざいメモに。・見出みだし # を入力にゅうりょく。章あきら立だての文書ぶんしょに。 ■一太郎いちたろうPadの機能きのう・カメラで撮影さつえいした画像がぞうや写真しゃしんから自動じどうで文字もじおこしをし、メモを作成さくせいします。縦たて書がきも高たかい精度せいどで文字もじ変換へんかんを行おこないます。・キー入力にゅうりょくをアシストする「省しょう入力にゅうりょくツール」で、時短じたん入力にゅうりょくが可能かのうです。 ■省しょう入力にゅうりょくツール 5種類しゅるいのボタンセットから選えらべます。・現げん在日ざいにち時じ「2021/02/05 12:
- iOS
OpenAIのGPT-4 Turbo with visionを日本語にほんごOCRとして使つかってみる
- 4 users
- zenn.dev/tomioka
- テクノロジー
- 2023/11/13
先日せんじつのOpenAI DevDayで、GPT-4 Turbo with visionというものが発表はっぴょうされました。Chat Completions APIで画像がぞうファイルをインプットとして渡わたして、画像がぞう解析かいせきをしてくれるAPIです。私わたしは以前いぜん、「Azure Computer Vision APIの日本語にほんごOCR機能きのうを使つかってみる」や「Google Cloud Vision APIの日本語にほんごOCR機能きのうを使つかってみる」で、各かくクラウドの画像がぞう認識にんしきAPIの日本語にほんごOCR機能きのうを検証けんしょうするエントリーを書かきました。OpenAIも画像がぞう認識にんしきAPIが使つかえるようになったので、まったく同おなじ検証けんしょう方法ほうほうで評価ひょうかしてみました。 GPT-4 Turbo with vision OCR機能きのうの利用りよう OpenAIのAPI Keyを準備じゅんびします。API Keyを取得しゅとくされていない方ほうは、「OpenAI API Key取得しゅとく」で検索けんさくしてください。今回こんかいの検証けんしょうコードは
- 人工じんこう知能ちのう
#PowerAutomate Desktop の OCR アクションを試ためしてみた - Qiita
- 4 users
- qiita.com/rnakamuramartiny
- テクノロジー
- 2021/04/08
Power Automate Desktop とはローコード開発かいはつプラットフォームの Power Platform のうち自動じどう化かを担当たんとうする Power Automate ですが、APIがない、既存きそんのデスクトップアプリケーションやWebサービスなども、クラウド連携れんけいしたいという要望ようぼうに応こたえるために、RPA機能きのうとして追加ついかされたものが、Power Automate Desktop です。このような形かたちで、アプリケーションの操作そうさを指定していし、クラウドサービスである、Power Automate から呼よび出だし、実行じっこう結果けっかを取得しゅとくすることで、既存きそんのアプリケーションも簡単かんたんにクラウド連携れんけいができるようになりました。 Power Automate Desktop は、アプリケーションの代行だいこう操作そうさ以外いがいにも、様々さまざまなアクションが用意よういされています。その中なかで、OCRというアクションがあるので開ひらいてみましょう。アクションを見みる限かぎり
インターンとしてOCR処理しょりの実装じっそうおよび精度せいど上昇じょうしょうに尽力じんりょくした話はなし - Retty Tech Blog
- 4 users
- engineer.retty.me
- テクノロジー
- 2021/09/21
タイトルの通とおり、8/10-27の3週間しゅうかんRettyの広告こうこくコンテンツチームでインターンをさせていただきました。かなりたくさんのことを行おこない、考かんがえてきたので思考しこうプロセスって言いったら大おおげさなんですけど笑わらい備忘録びぼうろくを書かかせていただきます。自己じこ紹介しょうかいインターンのタスクタスクの目的もくてき具体ぐたい的てきな内容ないよう手法しゅほうの選定せんてい Vision APIの使用しようについて機械きかい学習がくしゅうモデルの構築こうちく学習がくしゅう用よう画像がぞうのアノテーション機械きかい学習がくしゅうの前ぜん準備じゅんび ResNetとは？学習がくしゅうスタート！推論すいろん Endpoint 作成さくせい OCRを行おこなう形態素けいたいそ解析かいせきとは形態素けいたいそ解析かいせきを行おこなった今後こんごの方向ほうこう性せい今回こんかい使用しようしなかったデータへの範囲はんい拡大かくだい OCRのパラメータについてインターン中ちゅうの業務ぎょうむ以外いがいに関かんして感想かんそう Rettyでインターンをしたい人ひとへ最後さいごに自己じこ紹介しょうかい東京工業大学とうきょうこうぎょうだいがく大学院だいがくいん情報じょうほう理工りこう学院がくいん数理すうり・計算けいさん科学かがく系けい1年生ねんせいの森脇もりわきと申もうします。大学院だいがくいんの方ほうでは分散ぶんさん学習がくしゅうの研究けんきゅうを行おこなっておりま
- ocr
- python
AI-OCRとは？OCRとの違ちがいや種類しゅるい・導入どうにゅうメリット・比較ひかくのポイントを解説かいせつ
- 4 users
- aismiley.co.jp
- テクノロジー
- 2021/02/26
AIとOCR技術ぎじゅつを組くみ合あわせたソリューションがビジネスプロセスの自動じどう化かと効率こうりつ化かを推進すいしんしています。この技術ぎじゅつは、手書てがきや活字かつじの文書ぶんしょからテキストデータを正確せいかくに読よみ取とり、デジタル化かすることで、手作業てさぎょうによるデータ入力にゅうりょくの時間じかんとコストを大幅おおはばに削減さくげんします。また、RPA（ロボティック・プロセス・オートメーション）と連携れんけいすることで、業務ぎょうむ効率こうりつ化かがさらに進すすみます。デジタル変革へんかく（DX）を推進すいしんする上じょうで、業務ぎょうむ効率こうりつを向上こうじょうさせることが可能かのうです。本ほん記事きじではAI-OCRの特徴とくちょうやメリット、デメリットや製品せいひんの比較ひかくポイント等とうを紹介しょうかいします。この記事きじがAI-OCR導入どうにゅうを検討けんとうしている方々かたがたに有用ゆうような情報じょうほうを提供ていきょうできれば幸さいわいです。 AI-OCRとは？ AI-OCRとは、AI(人工じんこう知能ちのう)を活用かつようしたOCR（光学こうがく的てき文字もじ認識にんしき）のことを指さします。OCRとは、スキャナなどで読よみ込こんだ画像がぞうに描えがかれた文字もじをテキストデータに変換へんかんする技術ぎじゅつです。AI-OCRはOC
Zaim、購入こうにゅう内容ないようの詳細しょうさいを残のこせる「レシート履歴りれき置換ちかん」。クレカとレシート情報じょうほうを紐ひも付づけ
- 4 users
- www.watch.impress.co.jp
- テクノロジー
- 2020/10/27
- Finance
- Webサービス
画像がぞうやドキュメントファイルからAIでテキストを抽出ちゅうしゅつするオープンソースのOCRツール・「EasyOCR」 - かちびと.net
- 4 users
- kachibito.net
- テクノロジー
- 2021/05/26
EasyOCRは画像がぞうやドキュメントファイルからAIでテキストを抽出ちゅうしゅつするオープンソースのAI-OCR(Optical Character Recognition)ツールです。80ヵ国かこく以上いじょうの言語げんごがサポートされています。もちろん日本語にほんごも含ふくまれています。身近みぢかなものだとGoogleドライブにもOCR機能きのうが付ついていますね。同おなじように、任意にんいの画像がぞうやドキュメントからテキストをアップロードし、抽出ちゅうしゅつしたい言語げんごを指定してい（英語えいごならen、日本語にほんごならja）するだけでテキストに変換へんかんしてくれます。また、回数かいすうを重かさねる事ことで学習がくしゅうし、より高たかい精度せいどになっていくよう設計せっけいされているそうです。pythonで書かかれています。ブラウザで動作どうさ確認かくにんもできますので精度せいどをお試ためしになってみてはいかがでしょう。ライセンスはApache-2.0との事こと。 EasyOCR
読取よみと革命かくめいVer.16
- 4 users
- www.sourcenext.com
- 世よの中なか
- 2021/01/24
「読取よみと革命かくめい」は11年ねん連続れんぞく販売はんばい本数ほんすうシェア第だい1位い 2013～2023年ねん（1月がつ～12月がつ）全国ぜんこくの有力ゆうりょく家電かでん量販りょうはん店てん販売はんばい実績じっせきデータの「PCソフト/ビジネス」、「OCR・翻訳ほんやく」カテゴリを抽出ちゅうしゅつして自社じしゃ集計しゅうけい「読取よみと革命かくめい」は書類しょるいのスキャン画像がぞうなどの文字もじ画像がぞうを編集へんしゅう可能かのうなテキストデータに変換へんかんするソフトです。搭載とうさいするOCR(Optical Character Recognition)エンジンの精度せいどの高たかさには定評ていひょうがあり、企業きぎょうを中心ちゅうしんに多おおくのユーザーに使つかわれています。 FAXやコピーした文書ぶんしょ、手書てがき文字もじなど低てい品質ひんしつ文字もじの認識にんしきに強つよく、英語えいご文書ぶんしょの読よみ取とりにも対応たいおうしています。
- pdf
熊本大学くまもとだいがくとTOPPAN、くずし字じ対応たいおうのAI-OCRを用もちいて「細川ほそかわ家か文書ぶんしょ」約やく5万まん枚まいの全文ぜんぶんテキスト化かに成功せいこう
- 4 users
- cloud.watch.impress.co.jp
- テクノロジー
- 2024/07/29
- 研究けんきゅう
Deep Learning Based OCR for Text in the Wild
- 4 users
- nanonets.com
- テクノロジー
- 2019/11/16
We live in times when any organization or company to scale and to stay relevant has to change how they look at technology and adapt to the changing landscapes swiftly. We already know how Google has digitized books. Or how Google earth is using NLP (or NER) to identify addresses. Or how it is possible to read text in digital documents like invoices, legal paperwork, etc. But how does it work exact
iPhoneで日本語にほんごOCR、文字もじ認識にんしきが使つかえる - Qiita
- 4 users
- qiita.com/john-rocky
- テクノロジー
- 2022/06/23
文字もじ認識にんしきをかんたんにつかえる iPhoneで文字もじ認識にんしきできたら、板書ばんしょの書がき起おこしや、標識ひょうしき認識にんしきアプリなど便利べんりにつかえます。２０２２年ねんのアップデートで日本語にほんごが利用りよう可能かのうに２０２２年ねんのiOS16から、日本語にほんごの文字もじ認識にんしきが可能かのうになりました。組くみ込こみのフレームワークのみで可能かのうです。精度せいどもかなり良よく、さまざまなアプリで実用じつように耐たえるレベルだと個人こじん的てきには思おもいます。つかいかた VisionのVNRecognizeTextRequestをつかいます。 recognitionLanguages に "ja" を指定していします。 macOS13、Xcode14、iOS16以降いこうが必要ひつようです。 let request = VNRecognizeTextRequest() request.recognitionLanguages = ["ja"] // 日本語にほんごを指定してい let handler = VNImageReques
- iOS
【TIPS】海外かいがいフリゲを自動じどう翻訳ほんやくしながら遊あそぶ手順てじゅん（Screen Translator, PCOT）｜ソルト
- 4 users
- note.com/salt40
- おもしろ
- 2021/07/28
英語えいごは苦手にがてだけど気きになるゲームがあるという悩なやみに応こたえてくれる素敵すてきなソフトについて使用しよう手順てじゅんなどをメモします。次つぎの2つのソフトを触さわりました。どちらも無料むりょうで使用しようできます。制作せいさく者しゃ様さまに感謝かんしゃ。ヘビーユーズするようなら寄付きふなどしたいです。 ①Screen Translator たぶん定番ていばんなソフトだと思おもいます。海外かいがいの方ほうが開発かいはつしているので、「英語えいごが全まったくわからん」という場合ばあいは使つかいにくいですが、「アイキャンノットスピークイングリッシュ（ちょっとだけ分わかる）」という場合ばあいの補助ほじょとしては十分じゅうぶんな機能きのうだと感かんじました。 ②PCOT 2020年ねんごろに個人こじんで開発かいはつされたソフトみたいです。一時期いちじきは配布はいふが制限せいげんされていましたが、2021年ねん7月がつ現在げんざいは配布はいふが再開さいかいしています。各所かくしょで話題わだいになっている通とおり、使つかいやすいです。また、設定せってい画面がめんなどが全すべて日本語にほんごなのもありがたいです。おススメ。 ◆はじめに◇そもそも何なにのために使つかうものなの？「遊あそびたいゲー
- 勉強べんきょう