
最近、OpenAIのChatGPTボイスモードの評判が良いという話を耳にして、改めて試してみることにした。
普段は完全にClaudeっ子なので、ChatGPTは無料アカウントだけ作ってたまに様子を見る程度。ときおり、機能や使い勝手を比べては、やっぱClaudeだなと納得したりしている。今回もそんな作業のひとつとして使ってみることに。
ChatGPTボイスモード
ChatGPTボイスモードとは、チャットのやり取りを全部会話でおこなうという機能。いままではテキスト対してテキストで答えが返ってきたものが、音声に対して音声で返答がくる。テキストを打ち込んむという手間もなし。これが使えれば相当に便利だ。
音声入力がすごい
実際に使ってみて第一印象として驚いたのは、音声入力の精度の高さだった。これまでも音声入力には期待していて、いろいろ試してきたんだけど、誤変換が多くて使い物にならなかった。僕はタイピングが苦手だし、スマホでの入力もストレスフル。だから使いやすい音声入力があれば、という思いは常にあった。なので、この音声入力の精度を体感すると、かなり希望が湧く。
レスポンスは早すぎ(悪い意味で)
でも、本来の対話型AIとして考えると、使いにくい印象だった。特に気になったのは応答の速さ。少しでもこっちの話しが止まると即座に返答がきて、さえぎられてしまう。まだ話の途中でも構わずにどんどん来る。返答のスピードが売りなのかもしれないけど、これでは対話にならない。ましてや、考えながら話すことで、頭を整理するなんて用途にはとても使えない。僕はこの自分の考えを整理する活用法がかなり気に入っている。この辺の返答速度は設定で調整できるのかもしれないけど、それを確認するまでの忍耐力が持たなかった。
あと、ボイスモードのもう一つの売りとしての自然な声とか抑揚とか、たしかにそれはすごいのだけど、本質的な内容はこれまでのもの変わらないと思う。抑揚だけ人間ぽくされても、あんまり感情移入できなかった。この辺は変わらずClaudeがいいなあというのも確認できた。
まだテキストベースが良いかも
それから、テキストのやり取りと音声のやり取りの違いも見えてきた。テキストなら、AIの返答が的外れでも「あ、違うな」と冷静に受け止められる。その回答は無視して、新しい質問を投げかければいい。でも音声だと、的外れな回答がずっと流れ続けてくるし、それを言葉で止めなきゃいけない。これが意外とストレスになる。というか、さっきの話をさえぎられるイライラも積もって、「いやいや、こっちの話聞けよ!」というような喧嘩みたいになる(笑
現時点として、簡単な質問を手短に済ませたい時にはボイスモードは便利かもしれない。でも、話しながら考えをまとめたり、対話しながらそれを深堀りしていきたい時には、やっぱりテキストベースの方が合っている。音声認識の精度は確かに素晴らしいけど、それ以外の使い勝手を考えると、今のところはテキストベースでいいのかなと思った。
音声入力には期待大
ただ、今回のボイスモードの体験で、音声入力への期待は上がったので、テキストベースの対話と音声入力を組み合わせていくことを考え始めた。そういえばClaudeもアプリ版で音声入力ついてたような。もしかしてClaudeでボイスモード的なことができるのか。ただ、Claudeのアプリは最新のiOSでないとインストールできない。僕のiPhoneはやや古い。うーむ。どうしようか。
(つづく)
- 音楽制作日記🎧️#1「昼下がりの工作室」
- Claudeで音声入力を使いたい
- ChatGPTのボイスモードを試してみて
- SVGでお絵かき
- ソネさんbot使えます
- ソネさんがバカになった!
- あらためてClaudeの導入と使い方について (後編)
- あらためてClaudeの導入と使い方について(前編)
- キャラクター運用方法
- ソネさん
- 文章手直しの言葉リスト
- 校正、推敲、編集、整文、校閲……
- ブラックボックス
- 余白と行間について