最近、Apple系デバイスの音声入力で文章をゴリゴリ書く機会が増えたので、まとめてみました!
この記事がお役に立てそうな方
- ライティングや、ドキュメンテーションをスピードアップしたい方
- メディアやブログ記事をたくさん書きたい方
- アイデア発想を行いたい方
目次
音声入力のメリット:コツと慣れで、文章作成が超早くなります。
自分はもともと、そこまで長文を書くことが得意ではありませんでした。
仕事でも大量の文章を書かなければならない時が定期的にやってきます(うーむ)。
そんな時にOS標準の音声入力を試したところ……あれ、こんな高精度&高レスポンスになってたっけ!?
とびっくりするほど進化を遂げておりました。
というわけで、どう使えるようになったかを書いていきます!
今回は議事録の文字起こしや、リモート会議の字幕(アクセシビリティ)関連の話ではなく、
自分の考えを音声入力で言語化することにフォーカスします。
似ているけど、ちょっとジャンルが違うんだ。
今回は議事録の文字起こしや、リモート会議の字幕(アクセシビリティ)関連の話ではなく、
自分の考えを音声入力で行うにフォーカスします。
似ているけど、ちょっとジャンルが違うんだ。
日々の仕事や創作活動にも、役に立つよ!
お仕事に使えます!
まず仕事のドキュメンテーションや、レポート書いたりするのに使えます。
オフィスだとやりづらいですが、リモートワークならそこまで恥ずかしく無い!
今はテレワーク用の個室みたいな設備も駅とかオフィスにあったりしますしね。
創作活動にも使える。
文書で創作活動と聞くと、小説?と思いがちですが、意外とデザインとか絵にも使えます。
クリエイター・デザイナーさんは、世界観の構築に言語の力を使います。
「言語→ビジュアル」「ビジュアル→言語」を行ったり来たりすると。
最近読んだコンセプトアートの本と、人外デザインの本にもそのようなことが書いてありました。
クリエイティブ系の本読むと、Howto以外の情報…つまり考え方とかも知れるので良いですよね。
日記や、日々の記録にも役立つ。
そこまで気合を入れた長文出なくとも、数行程度の短文や、日記を書くことはあるはず。
ちょっとした気づきを言葉に残しておくと、後で振り返った時に、結構な成長実感に繋がります。
「音声入力」がしやすい環境が、揃ってきた。
少し前まで(といってもコロナ禍前くらい)、音声入力は「すごいけど、あまり実用的では無いなー」という印象だでした。
機能はすごいけど、認識精度が甘かったり、オフィスでは使いづらかったり。
でもリモートワークや、リモート会議が増えてまず独り言をしやすい環境が増えました。
そのためか認識精度が高くなった。
そして機材も選別(良いマイク)が進み、喋り方自体も滑舌良く喋るようになりました。
音声認識の技術が進んだこともありますが、
環境だったり、話し手(つまり自分!)がアップデートされたのかもしれません笑
そんなわけで、音声入力をよく使うようになり、使い所の理解も進んでいきました!
音声入力はできるだけOS標準搭載のものを!
実は音声入力はiPhone、iPad、MacBookなどApple製品だとOSに標準搭載されています。
そのおかげか高速に、精度高く入力する事ができます。
すぐに起動できるよう、ショートカットを覚えておきましょう。
現状はApple系が早くて精度がでる。
MacBookだと発話した側から認識・入力されていきますし、
iPadの入力は少し遅いけど、それでも十分な速さ。iPhoneも悪く無いです。
Apple系は「設定」、もしくはMacOS なら「システム環境設定」で素早く音声入力できるように&誤発動しないように設定を見ておきましょう。
※英語(スピーキング)に自信がある人以外は、日本語だけに絞っておいた方が良いです。
非Macユーザーはブラウザ版のGoogle docsで音声入力が使えます。
スピードはブラウザを経由するためか若干遅め。
2023/02/01時点ではブラウザ版のみの機能のようで、iPad版では使えなかったです。
Windowsにも音声入力ソフトはたくさんあったようです(結構いいお値段で手がなかった)。
ただ、開発終了になってしまったソフトが多く、googleと同じエンジンを使用!と記載があるもの。。。
それこそGoogle docs使ったほうが良いです!
Android系は未調査です……。でもないはずがない!
OSに最初から入ってるもののメリット
何と言っても自分がよく使うソフトに直接文章を入れられる点です。
Evernote、Dynalist(アウトライナーと呼ばれるテキストエディタ)、またはWord Pressに直打ちしたりが柔軟にできます。
Apple系の音声入力具合を比較してみる。
実は上の記事を書いたあとに手持ちのApple系デバイスで音声入力の使い心地・速度はどうなんだっけ?と調べてアニメーションGIFを貼り付けてみました。
台本を見ながら喋っている、というのもありますがどのデバイスでも精度はばっちりですし、しいて言えばMacBookの反映速度が早いくらいの差ですね。
ただ、MacBookは自動で改行されないのが若干残念。
MacBook
iPad
iPhone
Windows+Chrome+GoogleDocs
GoogeDocsの音声入力も貼ります!
これだけみると、あまりうまく入力できていないように見えますが、
GoogeDocsの場合は音声入力中にもキーボード操作を受け付けるので、
喋りながらキーボードで改行を入れたり、句点(。)をいれるということができます。
※Apple系は音声入力中にキーボード操作をすると、音声入力モードが解除されてしまう。
追記:たたき台レベルで最速だったのは、iPhoneだった!(2023/3)
お恥ずかしながら、「iOS 16」から音声入力オンの状態をたもったまま、タイピングもゴリゴリできることを知りました。
最近は「Type」という超シンプルなマークダウン記法対応アプリを使っていますが……
Typeを使って、音声入力しつつ、そのモードを維持したままタイピングでき、すぐにプレビューできる(+サブスクでApple系端末に同期できる)ので、むちゃくちゃ捗ってます。
他の端末もいずれできるようになるのでしょうが、当面はこちらでネタだししつつ、ブログを書いていきます!
マイクにはこだわろう!
音声入力ライフを快適に過ごすには、何と言ってもマイクが重要です!
口元にマイクが届くタイプだと、小さな声でも十分拾ってくれるます。
マイク無しでデバイスに話しかけてもいいのですが、微妙に精度が落ちたりするので、ぜひ色々試して欲しいです。
私はこのブームマイクをつかってます。
あと、最近のWindowsマシンなら問題ないかもしれませんが、少し古めのマシンだとイヤホンジャックはあるけど、
そこの音質&マイク認識が弱かったりするので、USB-DACをいれるとマイクの音をうまく取ってくれるようになります。
↓は安いし、音質も良いのでオススメですー!
そもそも音声入力で文章を書くとは。
2パターンが考えられます。
- 自分の中で書きたいこと(主張したいこと、理由、事例など)がある程度定まっている場合。
- 全然決まって無い。または、あえてフリーダムに行きたい場合。
それぞれ見ていきましょう!
書きたいことがある程度決まっている場合
先に文章構成(見出しレベルを大・中・小と決めていく)を作ってしまい、本文を音声入力で書いていくスタイル。
メリット:後で編集しなくてもある程度文章になる。
メリットは事前に「型」を作っているので、文章がテーマと大きくズレたり、後の修正が最小限ですむ点。
文章構成自体はスマホでもできるし、むしろガッツリ書かない程度にしたほうが全体の構成を掴みやすいです。
※あまり頑張って書いてると構成考える時点で疲れ果ててしまうのです。
シンプルな構成なら、スマホで30〜60分位で作れるようになります!
自分はスマホ版Evernoteで文章構成というか(ネタだし)をしています。
その後MacやノートパソコンでWordPressに流し込んでいます。
#を分頭に入れ、スペースキーを押せば一瞬で見出しが作られるのでオススメ!(マークダウン記法)
自分は以下のテンプレートにして使いまわしています!
記事タイトル:タイトル
この記事がお役に立てそうな方
※以下はPREP法と呼ばれる文章構成例です。
各見出しの下に本文が来ます。
###見出し大:結論など
####見出し:中
#####見出し:小
###見出し大:理由とか
####見出し:中
#####見出し:小
###見出し大:事例(体験談)など
####見出し:中
#####見出し:小
###見出し大:結論・まとめなど
####見出し:中
#####見出し:小
PREP法はよくブログの書き方で紹介されるけど、プレゼン資料のお作法としても紹介されてます。
デメリット 慣れるまで、書きづらい。
自分も最初、文章構成をしてから音声入力をしていたのだけど息苦しいというか…心理的に口から言葉が出づらいのが辛いところ。
ただ逆に有効活用すると、実生活で端的に話せるクセが付きます笑
「えーと」「そのー」といった、冗長な表現が可視化されるためです。
※GoogleDocsの音声入力だとうまくカットしてもらえるが、Apple系は無慈悲に記載されるのです。
書きたいこと自体がまだ決まってない場合
最初にタイトルだけでも考えておきましょう。
単語レベルでキーボードで打ったり、紙に書き出したりして、頭の中や、心の中にあるキーワードを、一度物理世界にアウトプットしてみる。
それらを、組み合わせて一行「2-30文字」のタイトルができたら、目に見える所に設置して……
あとは思った事を喋り続けるのみ!
メリット 自由気ままに、発散できる。
ガチガチに文章構成を決めるのではなく、自由に好きなことを音声入力する場合、とんでもない文量になる事が多いです。
事前に箇条書きスタイルにしておくことをお勧めします。
時おり改行(次の箇条書きを作る)しておくと、アウトライナー等コピペした際に段落を組み替えて、素早く文章を作れます!
また、アウトライナーはマインドマップに変換できる機能があったりします。
ビジュアルで捉える方が好きな方は試してみてください!
※例えば自分の未来とか、ふわふわしている事を言語化する時にこの方法は役立ちます。
ずーっと、喋ってると、どこかでループしていることに気がつくので、そこがやめ時になります。
デメリット:後の編集、修正作業が大変なことになる。
この方法のデメリットは、下手すると音声入力したのと同じくらい、編集に時間がかかることです。
構造化されていない文章は、自分が書いたはずのものなのに、超読みづらいです!
一般的に一文は60文字程度がちょうど良いと言われています。
以下のワードを定期的に発話して、文章をこまかく区切っていきましょう。
- 句点(。) ※くてん
- 読点(、) ※とうてん
- 改行 ※かいぎょう
まとめ
個人的には、はじめに文章の構造をスマホでサクッと打ち込み、
喋りまくってOKな環境で一気に音声入力で肉付けしていくスタイルをとります。
音声入力とデバイスは、うまい組み合わせを見つけると、どんどん書けるようになります。
音声入力をうまく使って、仕事と趣味、創作活動を楽しんでいきましょう!
ここまで読んでいただき、ありがとうございました!