音声入力で日記を書く

2025/05/28

一週間ほど前から「Aqua Voice」というMacアプリで音声入力を試している。音声認識はAIで進化した分野のひとつで、日本語でもほとんど間違えない精度で認識してくれる。音声入力はタイピングよりかなり楽だという話を聞くので最近人気のAqua Voiceを試してみている。

まずはサービス開発で使ってみた。最近のサービスは「with AI」が当たり前になっており、プログラミングといってもAIに指示する文章(プロンプトと呼ばれる)を書く時間が長い。AIは賢いが空気を読むことはできない。なんとなくやっておいて、と伝えても良い仕事はできず、指示文には変更の背景や参考になる箇所、気をつけてほしい点などを伝える必要がありなかなかのボリュームになる。そこで音声入力の出番だ。Aqua Voiceを起動し、タスクの詳細についてつらつらと話して文章を入力する。人と話すときのように構造化する必要はなく、思いついた順にダラダラ話していけばよい。解釈は受け手側(AI)が頑張ってくれる。精度としてはほぼ誤字はなく、あったとしてもAIはなんとなくで理解できるので問題ない。タイピングより3倍くらいのスピードで打てるのは便利。ただ静かな環境である必要があったり、AirPodsだとマイクの質が低いので優先イヤホンをつける必要があるなどちょっと気を遣う必要がある。でも集中して家で作業する場合などには良いかもしれない。

プログラミング以外の用途として、この日記の素案を音声で書くのもやってみた。少し前にAIライティングというのを試したが、これは箇条書きで日記のタネを書くとそこから自分の文章の特徴をおさえた上で日記にしてくれるというものだった。ここに渡す日記のタネを音声で書いてみる。その日のテーマについてわーっと喋り、それを日記にしてもらうとそこそこのものが出来上がった。しかし日記をこうして書くことに何の意味があるかは不明。商品のPRなど、マーケティングとしての文章であれば良いかもしれないが、この日記は書くことで理解を深めることを目的にしている。PV数やコンテンツの数などは重要ではない。音声だと一度話し始めたら最後まで突っ走らなければいけない。話し終えてからじゃないと全文が打ち込まれないため、前の文章に誘発されてアイデアが出てくることもない。発話と執筆はそもそもの構造が違うので、うまくハマるかはシーンによるものが大きそうだ。

音声入力自体にはとても魅了を感じている。例えば外出時、スマホに長文をタイピングするのは大変だが音声なら歩きながら喋れる。目を束縛もしないので移動しながらいろんな情報を取り入れることもできる。在宅時、机に向かって座らずとも寝転んだ状態で長文が打てる。自由度も増すし、体を壊して怪我した場合などは本当に助かる技術になる。ChatGPTの運営会社であるOpenAIは新しく音声デバイスを開発中らしい。GoogleもAndroid XRというメガネを開発している。新しい技術で生活がどのように変わるか、今から楽しみだ。