“ぴったり字幕”ってどうやって出すの?

NHKでは、東京オリンピック・パラリンピックの放送で、さまざまなユニバーサル放送に取り組みました。

その一つが「ぴったり字幕」

通常、生放送の番組だと、話している音声と字幕にタイムラグがでてしまうのですが、音声と字幕を合わせてご覧いただけないかと試行錯誤で始まったのが「ぴったり字幕」。

東京大会期間中に放送した「あさナビ」で実施しました。

その仕組みとは…

東京大会「あさナビ」でぴったり字幕を体験した
鈴木奈穂子アナウンサー コメント

いつもの生放送は基本的に8時15分“00秒”から始まるので、30秒前倒しでスタート…最初は少し緊張感がありました。生放送とも収録ともちょっと違う。放送で博多大吉さんが「タイムトラベラー感覚」と言っていましたが、まさにそんな感じです。

反響も続々!「画像と字幕が合うことで番組の雰囲気がよくわかります」とか、「字幕放送にしておけば、朝子どもたちが騒ぐ声で音が聞こえなくても楽しめる!」などなど、さまざまなメッセージをいただきました。

障害がある人もない人も! ぴったり字幕、ぜひ活用してください。

この仕組みについて担当者に話を聞きに行ったところ、通常の字幕放送についてもいろいろ教えてもらいました。

気になるのは、今回30秒ずらして放送していますが、もし、放送中に緊急地震速報など、緊急ニュースが入った場合は?

緊急地震速報が出た場合は、ニュースセンターから速やかに緊急地震速報やニュースをお伝えします。

とのこと。地震を始め、さまざまな緊急ニュースに備えて、シミュレーションしているそうです。

それにしても、文字起こしは、AIなどでもっと簡単にできないものですか?

ニュースの生字幕や、通常の「あさイチ」などでは、音声認識システムを使用しています。今回は、ぴったり字幕を合わせる、ということで、いろいろ試しましたが、速さと正確さ、あとコスト的なことも考えて、現在の方法で行うことにしました。日本語の細かいニュアンスは、やはり人間が入らないと難しいです。

ちなみに、文字の入力は特殊なキーボードではなく、みなさんがお使いのパソコンなどと同じキーボードで行っているそうです。

ほかにも字幕放送全般についていろいろ聞いてみると…

▼ぴったり字幕は、30秒の時差で準備しているが、実際は15秒あればタイミングを合わせて出せるそう。しかし、今回は余裕をもって30秒で実施。

▼事前に収録・完成している番組は、ナレーションなどのタイミングにピッタリ合わせで出せるように、文字数などを調整して放送している。

▼字幕1枚は、15文字×2行までで、通常は1枚の文字数を読める時間として、2.8秒~3秒で次の字幕に変えている。(ぴったり字幕では、ディレクターがタイミングをとって、話者が話し終わるタイミングで次の字幕に切り替えています)

などなど。字幕の世界も奥深いですね。もしよろしければ、ぜひ、リモコンの字幕をONにして、見てみてください。

▼生放送の字幕はこうやってお伝えしています▼

その他の注目記事