iPhoneでも、OpenAl Whisperで文字起こしができるアプリを見つけた。
無料で使える。
ただし、大きなサイズの音声認識モデル、つまり、変換精度を上げるには、アプリ内課金が必要。(買取 1,100円 or サブスクモデル300円/月)
WhisperをiPhoneでも使いたい
Macで使っている文字起こしアプリ Whisper Transcription が便利。これをiPhoneやiPadでも使えたら嬉しい、と思い、探して見つけたのが、こちらのアプリ Hello Transcribeだ。
このアプリも、OpenAI社のWhisperを使っている。しかも、処理はデバイスで完結しており(音声データを外部に送信しない)安心して利用できる。もちろん、問題なく日本語で使える。
アプリの説明文を翻訳するとこんな感じ。
このアプリは、OpenAl Whisperを使用した音声テキスト変換ツールです。
- すべての処理はデバイス上で行われるため、100%プライバシーが守られます
- オフラインで動作します。
- 文字起こしの結果(テキスト)は、保存することを選択した場合のみ、iCloudに送信されます。
Hello Transcribe is a speech to text transcriber that uses OpenAl Whisper.
• All processing is done on-device for 100% privacy.
• It works offline.
• Results are only sent to iCloud if vou choose to save the results.
音声入力と違い、話す内容を考えて無言でも待ってくれるし、何より、文章を書いてる感覚でなく、友人に話しかけている感じで、テキストを書ける気楽さ。これが気に入っている(笑)
初期設定なく使える
初期設定なしに使える。
(初回起動時に、マイクへのアクセス許可をOKにする必要はある)
ただし、僕は言語設定をJapaneseに設定している。
起動した画面の右下の歯車アイコンをタップして、設定画面を呼び出して
- Audio languageのオプションを「Japanese」にする。
買取ライセンス 1,100円を即ポチり
音声認識モデルは、無料で使える一番小さなモデルでも、使えると感じている。
とはいえ、1,100円ポッキリの買取ライセンスだったので、早速購入し、大きな音声認識モデルもダウンロードして試している。
サブスクライセンスだと、1ヶ月 300円。ということは、4ヶ月以上使うと、買取ライセンスの方がお得になる。
どのくらい精度が違うのか?メリット・デメリットは、しばらく使った後に、記事にまとめる予定だ。
壁打ち相手に話しかけてアウトプット
アウトプットのハードルがグッと下がり、テキストを書く生産性が上がっている。この記事も、このアプリ(Hello Transcribe)に話しかけて、書き出したテキストをベースに、記事を書いた。
3分ほど音声を話して、音声認識モデルが小さい場合は、リアルタイムで認識完了。テキストをメモ帳に貼り付けて、30分で、この記事が完成した。
壁打ち相手に話しかける感じで使うのは、予想以上に便利なので、ぜひ使ってみてほしい。
参考
認識結果のテキストをそのまま貼り付ける。一見、無茶苦茶に見えるが、このテキストがあるのとないのでは、大違いで、文章を書く叩き台として素晴らしい。
マックで持状庫しができるウィスパートランスクリップションが便利で、これがアイホンアイパートでも使いたら、嬉しいと思って探したら見つかったのがこちらのアプリ、ハロートランスクリブです。このアプリもオープーAIシャガー。
開発したウィスパーの技術を使っており、アプリの説明を、1回に本役するとこんな感じです。さっそく使っていますが、その場で話したことが
日本に話かけていくとどんどんもう少子をしてくれてお制によること違って次何を話そうかと考えている間も待ってくれるのがありがたいです(笑)(笑)
初期設定なしに使い始めることができますが1回初現後設定は画面のハグルマを押してランゲージのランをジャパニーズ選択するともっとも、アイホントかな?
アップルのアイホントを言っても、カタカなのになってしまうので、アップルのアイホントを言っても、カタカなのになってしまうので、すげれば、ここは、アップル的に、下がきを作るという点では日本語で書いて
確認もらった方が全体の制度がいいと考えて日本語を選択しています。モデルは無料で使える一番小さなモデルでも、これぐらいの制度かなと思っていますが、モデルは無料で使えると考えています。(エンディング)
アップリ内閣品でサブスクではなくて 回取で100円の来選数で購入できたので早速購入して大きな現語モデルが使える 文章子親使う自尚データになる大きな現語モデルを使えるようにしてみましたせいどとについてはまだまだ使い方を使い出してまだ1日しかだった
ていないのでどのモデルがどれぐらいの制度なのかっていうのはまだ発揮に感覚として理解できてないとこもあるのですがブログキジの 戦いないなるブーショー何も性力されたらと 壁打ちで話しかけると手気総理になるというのは 要想状に便利なのでぜひ使ってみてください
特に IOSのアイホンで使っていって便利なのが話をあった後に文字を越したデータを目持ちこの後に大力とに保存することができるのが便利です
カウンセラー ノブの視点
文章を書くときに、相手に伝わるか?は大切な点だ。しかし、伝わるかどうかにとらわれすぎると、文章を書くこと自体が重たくなる。「文章を書くには、頭の中で整理しないといけない」と、学校教育で刷り込まれた思い込みがないだろうか?
上の認識結果は、意味不明な文字列のところもあるが、話した本人だと内容がわかる。一旦、頭の外に未整理のままで良いから出して、それを組み立て直す方法の提案として、この記事を書いた。
今までは、「整理していないままの文章をテキストにする」が、技術的にできなかった。が、技術の進歩で出来るようになった。
何より、やってみて、楽だーっと感じた。楽してアウトプットの効率もクオリティも上がるので、嬉しい。
タイトルはChat-GPTを活用
タイトルと、要約は、Chat-GPTを活用して組み立てている。
詳しくはこちらの記事を読んでほしい。
また、あわせて、こちらの記事も参考になるので、読んでほしい