カスタマイズでより使いやすく。AIの学習により、精度も大きく改善
導入にあたって配慮したのが操作性です。文字起こしソリューションを利用するには、Zoomとは別に専用ソフトウェアを起動する必要がありました。「Zoom自体も導入したばかりで、わざわざ2つ起動して両方を操作するのはハードルが高いと感じました。そこで、Zoomからボタンひとつで文字起こしソリューションでの録音・自動文字起こしまでできるようカスタマイズしてもらいました」Zoomに文字起こしソリューションを組み込んだ形です。
事前に単語などの学習をせずに、いきなり使い始めたこともあり、最初のころは精度が上がりませんでした。
「最初はあまり使いものにならない状態でしたが、認識されなかった単語を登録することで、目に見えて改善していきました(三厨氏)」
AIの文字起こしでは、たとえば「ミドリさん」という人の話でも、色の「緑」だと認識してしまうと、後続の文章が色の話だという前提で構成されてしまい、文章全体の意味が通じにくくなってしまいます。人名や地名、社内での略語などを登録するだけでも、かなりの改善が見込めると言います。
「特に社内用語は顕著で、自社名(ソフトバンク)を『S(エス)』と呼ぶことが多いのですが、これを登録するだけでも大きく改善しました(三厨氏)」
毎日実施する5~10分ほどの朝礼を文字起こしにかけ、単語入力を積み重ねることで、半年ほどで十分使えると感じるほどになったと言います。
文字起こしの精度に大きく影響する“集音”の問題
もうひとつ課題となったのが集音です。Web会議では、人によって話している環境が異なりますが、広い部屋での話し声や、マイクから遠い人の声はどうしても認識精度が下がります。
「なるべくイヤホンマイクを使ってほしいと依頼していたのですが、最初は浸透せず、文字起こしも精度が上がりませんでした。偶然ですが、途中で、高品質なイヤホンマイクが流行し、利用者が増えたところ、正確性も大きく向上し、集音の重要性を改めて感じました(三厨氏)」
セミナーのようなだれかひとりが話す会議だけでなく、ブレインストーミングのような複数人が話す会議でも、イヤホンマイクなどにより集音の精度を上げることで、言葉をきちんと拾えるようになりました。