音声認識アプリ【UDトーク】を使ってみましょう
読書ブログに突然【UDトーク】が出てきて「???」となっているかもしれませんが、今回は本のレビューではなくブログを書くときに私が使用している音声認識アプリの話をします。
音声認識アプリを使うと、読書中に気になった文章を音読して文字化しておいてブログに引用できるので便利です。また読書中に感じたことを声に出して呟いて文字化しておくとこれも便利。
私が使っている音声認識アプリ「UDトーク」は音声認識と翻訳機能を兼ね備えていますので、聴こえに困難を感じている方の情報保障として活用したり、会議の議事録作成、海外の方とのコミュニケーションに活用したりとマルチな力を発揮します。
UDトークは、次のような特徴があります。
- 「句読点をつける・つけない」を選択できる
- AmiVoiceという音声認識エンジンを使用しているため認識率が高い
- 辞書登録でさらに認識率をUPできる
- 認識させながらリアルタイム修正もできる
- 表出した文字に自動で「ふりがな」をつけることができる
- 多言語に対応している
- 複数の端末で連携できる
このようにとても便利なUDトークですが使い方は二通りあります。一つはZoomなどでリアルタイム字幕をつけたり、聴こえに困難を感じている方の情報保障として使う方法です。
もう一つは文字起こしをしてブログや議事録を作成するという使い方です。
今回は文字起こしを中心に書いていきます。使用するのは【UDトーク文字入力】というソフトですが、このソフトは単独では機能しません。話者の声を文字化するのはスマホのアプリです。パソコンの【UDトーク文字入力】というソフトとスマホの【UDトーク】を連動させて使います。まずはスマホのUDトークをダウンロードしましょう。
UDトークを使ってみましょう
●スマホに【UDトーク】をダウンロードしましょう→ダウンロード
・利用規約に同意
・初期設定(あとから変更できますので、そのまま進んで大丈夫です)
・タップしてUDトークを始める
・写真、動画などへのアクセス許可を求められますのですべて許可してください
オンラインマニュアルもあります→マニュアルネット上に存在するマニュアルや動画のほぼ100%がiPhoneで説明されていますが、Androidでも問題なく認識はできます。一部の設定やプロジェクターと接続する際の形式等iPhoneでしかできないものもありますが、お使いの携帯電話がAndroidだからといって諦めることはありません。
このブログではAndroidの画面で説明をしていきます。
開発者の青木さんのYouTube解説動画もあります→YouTube
※2024/08/04 上記資料に記載した「遠くの声」と「近くの声」の設定は一例です。「遠くの声」については、開発者青木さんのFacebook動画を参考にして、各自で試して設定を決めてください。
日本語の音声認識エンジンは編集用・高精度・Googleの3つがあります。通常は私は編集用を使用していますが、文字起こしや議事録作成には高精度を使用する人も多いようです。試しに両方使用してみて使い勝手の良いほうを選んでください。
②認識させてみましょう
③マイクについて
マイクは必ず必要というわけではありません。音声認識専用のマイクもありますが4万円弱していますので、割と高価なもと感じるでしょう。まずはスマホに近づいて話してみて、近くの声/遠くの声を切り替えて試してみてください。本来はスマホを話者に近づけて認識させるアプリです。さらに認識率を上げたいと感じたときにマイクを検討するという感じで十分だと思います。
- 大きな声で話さなくても大丈夫です。アナウンサーのように話さなくて大丈夫ですが文末まではっきり話してください。
④辞書登録について→ ①-2 タップして話す/辞書登録
固有名詞や専門用語など誤認識しやすい言葉の表記と読みを登録します。スマホのアプリ内で登録できますがパソコンでも登録可能です。読みは実際の読みと必ずしも一致しなくても大丈夫です。
UDトーク文字入力を使ってみましょう
ダウンロードページの下のほうにあります
①ダウンロードが完了したら、アイコンをクリック。下の図を参考にしてスマホと連動しましょう。
②句読点をつける?つけない?改行は?
UDトークは非常に優秀なアプリです。かなり適切に句読点を自動でつけることができますが、話者が本来句読点をつける場所ではなくても一呼吸置くことはよくあります。その場合は句読点がつきます。また本来は長い一文だったものがいくつかの短文に分かれて表出されることも考えられます。設定はスマホのUDトークアプリで行います。
句読点をつけるかつけないか→句読点を削除する改行を自動で入れるか入れないか→「。」で自動改行する
③文字を入力したい場所にカーソルを合わせてUDトークで喋ると音声認識で入力ができます。Word、Googleドキュメント、ブログなど様々な場所で活用できます。
④会議等の録音から議事録を作るときは、録音を聞きながらリスピークして認識させることもできます。その際はヘッドホンを着用してください。カナル型(耳穴式)のイヤホンだと自分の声が響いて聞こえるため、話しにくくなります。
- 密閉型アームレスヘッドホンは耳掛け式で疲れにくく音も自然で聞きやすいです。価格は1000円前後です。家電量販店で売っている安価なヘッドホンでも大丈夫です。
- まったく自分の声が聞こえなくても話しにくいものです。まずは手に入りやすい安価なものから試して自分で使いやすいものを探してみましょう。
●Mac & iPhone の使い方は開発者の青木さんのYouTube動画を参考にしてください。
●音声認識専用マイクは、いくつか種類がありますがそこそこ高額なものになります。
私はマイクなしでもかなり認識率は高いと感じているためマイクは使用していません。マイクを買うかどうか悩むなら喋り方を工夫しようという考え方もあります。まずはマイクなしで使ってみる、安価なBluetoothマイクを使ってみる、今持っているマイクで試してみる、それでももっと認識率を高くしたければ専用マイクを買うことを検討してください。
●情報保障としての字幕作成などは複数名での共同作業となることが多く設定も多少複雑な面が出てきます。これはまた別にUPしていくつもりでいます。
字幕作成の手順、全体図は下の図で確認できます。ネットワークの概念がもしかしたら難しく感じるかもしれませんが、一度複数名で体験するとすぐに理解できるような簡単なシステムです。音響設備になじみのない方は音源確保が難しく感じると思います。少しずつ慣れていくという感覚で大丈夫です。どうしても上手くいかなければ話者の近くに認識用のスマホを近づけるという単純な方法も試してみてください。まずはじめてみましょう。
![]() |
●少しずつ資料を作成しています。まだまだ完成には程遠いのですが、一部を公開しています。
これからもAndroidの資料にする予定です。普通に普通の会社で働いている人はWindows、スマホ、タブレットの組み合わせが多いのではないでしょうか。ちなみにAndroidタブレットもスマホと同じアプリを使用できます。個人で使用するのでしたらアプリは無料です。
●iPhone版も使ってみたいと思うことはありませんか? そんなときはSIMなしのiPhoneでもアプリは使えます。使っていない古いiPhoneを持っている家族や友人がいたら譲り受けて使ってみてください。私は娘が使わなくなったiPhoneSE(第一世代)で試してみましたが問題なく使えました。
いかがでしたでしょうか。少しでも興味を持っていただけたら嬉しいです。また既にUDトークを使っている方もいらっしゃることでしょう。ここは違うよ、ここはもっとこうしたらいいよ、などのツッコミやアドバイスをいただけると大変助かります。
今回はブログを音声認識で書くというブログを音声認識を使って書いてみました。
0 件のコメント:
コメントを投稿