アフィリエイト広告を利用しています

バイブコーディングで複数枚の画像をテキストに保存できるMac用OCRアプリ「scr2txt」を作った

スクリーンショットや写真の文字を、テキストにしたいこと、ありませんか?

会議のスライド写真、手書きメモの画像、Webページのキャプチャ。フォルダにどんどんたまっていく画像たちの文字を、まとめてテキスト化できたら便利ですよね。

バイブコーディングでMac用のOCRアプリ「scr2txt」を作りました。

フォルダに入っている画像をまるっとテキスト化してくれるアプリです。

icon_eyecatch.jpg

こんなアプリができました

scr2txtは、macOSに搭載されているVisionフレームワーク(プレビュー.appのテキスト認識と同じエンジン)を使ったOCRアプリです。

できることを、ざっくりまとめると

  • フォルダ丸ごとOCR — 入力フォルダに画像を入れて、ポチッと実行するだけ
  • ドラッグ&ドロップ対応 — フォルダをウィンドウにドロップするだけでOK
  • 日本語・英語対応 — Apple純正エンジンなので、日本語の認識精度が高い
  • ファイルごとの処理状況表示 — どの画像が完了して、どれが処理中か、リアルタイムでわかる
  • 設定画面 — 認識言語を日本語・英語から選べる
  • DMGインストーラー付き — Applicationsにドラッグするだけでインストール完了

PNG、JPG、TIFF、HEIC と、対応フォーマットも幅広い感じです。

スクリーンショット 2026-02-15 9.42.11.jpg
スクリーンショット 2026-02-15 9.42.05.jpg

使い方は3ステップ

操作はシンプルです。

  1. 入力フォルダを選ぶ(ドラッグ&ドロップでもOK)
  2. 出力フォルダを選ぶ
  3. 「OCR処理を開始」ボタンをクリック

これだけ。

処理が始まると、ファイルごとにチェックマークが付いていって、全部終わるとサウンドで教えてくれます。ほっ。

完了後は「ファイルを開く」「Finderで表示」ボタンがパッと出てくるので、すぐに結果を確認できます。

キーボードショートカットも使えて、Cmd+Rで処理開始、Cmd+Iで入力フォルダ選択、Cmd+Oで出力フォルダ選択。キーボード派にもやさしい感じです。

バイブコーディングで作れた感動

このアプリ、バイブコーディングで作りました。

ドラッグ&ドロップのビジュアルフィードバック、ファイルごとのリアルタイム進捗表示、設定画面、キャンセル機能、前回のフォルダを記憶する機能。

こういった細かいUXの作り込みまで、ちゃんと動くアプリが出来上がりました。

あっ、これ、ほんまに動くやん。

実際にビルドして、テスト画像でOCRを走らせて、テキストファイルが出力されるところまで確認しています。macOS Sequoia(macOS 15)にも対応済みです。

ソースコードは1ファイル構成で、Xcodeプロジェクト不要。ターミナルで ./build.sh を実行するだけで、アプリ本体とDMGインストーラーが生成されます。

まとめ

バイブコーディングで、実用的なMacネイティブアプリが作れました。

  • スクリーンショットの文字をまとめてテキスト化
  • ドラッグ&ドロップで直感的に操作
  • 日本語・英語の高精度OCR
  • macOS Sequoia対応

この記事を書いた人

大東 信仁

カンパチが好きです。

プロフィールはこちら

10月14日開催 参加者募集中
(画像をタップ→詳細へ)

ミッションナビゲート モニター
(画像をタップ→詳細へ)

広告