テレビ会議で文字起こしや字幕を作りたい

  • 2021年9月24日
  • TIPS
  • 1626View
  • 0件

はじめに

テレビ会議などで議事録を取るために文字起こし(テープ起こし)をしたい場合がありますよね。

そこで今回はテレビ会議を録画して文字起こしを試してみます。今回試してみる方法はMicrosoft Streamを利用する方法です。この方法でしたら、TeamsでもZoomでもテレビ会議の動画さえあれば、文字起こしや字幕を作ることが可能です。

Microsoft Streamで文字起こしをする

Microsoft Streamとは

Microsoft Stream は、組織内のユーザーが動画を安全にアップロード、視聴、共有するのに使用できるエンタープライズ ビデオ サービスです。授業、会議、プレゼンテーション、トレーニング セッション等の録画や、チームのコラボレーションを促進するその他の動画を共有できます。
引用元:https://docs.microsoft.com/ja-jp/stream/overview

要は企業内Youtubeですね。

ちなみにMicrosoft Streamは、以下のライセンスで利用できます。(2021年8月時点)
・Microsoft 365 F3(月額870円)
・Office 365 E1(月額870円)
・Office 365 E3(月額2,170円)
・Office 365 E5(月額3,810円)
など

有料サービスですが、企業で契約している場合も多く、追加料金なしで利用できる場合もあります。(セキュリティ対策のため、会社側が意図的に無効にしている場合もあります)

どうやって文字起こしや字幕を作成する?

文字起こしや字幕を作成するのは凄く簡単です。

Microsoft Streamへ動画をアップロードする

これだけです。簡単ですね。それでは試してみましょう。

会議を録画する

まずは元ネタとなる会議を録画しましょう。Microsoft Streamで使用できる入力コンテナファイルは以下の形式です。

推奨は.mp4です。.mp4は、Teamsのレコーディング機能で作成される形式です。

ファイル形式 (ファイル拡張子)
FLV (H.264 および AAC コーデック付き) (.flv)
MXF (.mxf)
GXF (.gxf)
MPEG2-PS、MPEG2-TS、3GP (.ts、.ps、.3gp、.3gpp、.mpg)
Windows Media ビデオ (WMV)/ASF (.wmv、.asf)
AVI (非圧縮 8 ビット/10 ビット) (.avi)
MP4 (.mp4, .m4v)/ISMV (.ismv)
Microsoft デジタル ビデオレコーディング (DVR-MS) (.dvr-ms)
Matroska/WebM (.mkv)
QuickTime (.mov)
引用元:https://docs.microsoft.com/ja-jp/stream/input-audio-video-formats-codecs

なお、MP3などオーディオ形式のコンテナは使用できませんのでご注意ください。ただし、動画編集ソフトなどでMP4などの動画形式のコンテナに変換すればアップロードすることは可能です。

録画した動画をStreamへアップロードする

なお、以前はTeamsから直接Microsoft Streamへ保存できていましたが、2021年8月半ばごろから仕様が変わり、Teamsでレコーディングする動画ファイルはOneDriveやSharePointにしか保存できなくなったそうです。(公式情報)

PowerShellでアップロード先をStreamへ変更してみても、設定値は変わりますがStreamにはアップロードされません。そのため、一旦、OneDriveやSharePointに保存した動画をダウンロードしてからStreamへアップロードする必要があります。

どうやってStreamを利用して文字起こしや字幕を付けるかと言うと、このStreamのサービスに動画をアップロードすると、動画に含まれる会話の音声は自動的に解析され、テロップ(字幕)を付けてくれます。このテロップは別途ダウンロードすることもできますので、ダウンロードしたファイルに含まれる文字を議事録用に編集します。

Microsoft Streamへログインして[ビデオのアップロード]をクリックする。

ブラウザに動画をドラッグ&ドロップか、[参照]リンクをクリックする。

「ビデオの言語」は必ず[日本語]を選択してください。解析結果に影響が出ます。

「アクセス許可」の[社内の全員にこのビデオの閲覧を許可する]を無効にします
有効にしたままだと意図せず社内全員に公開されます

「オプション」の[キャプションの自動生成]が有効(デフォルト)になっていることを確認して、[公開]をクリックします。

アップロードが終わったら動画を確認します。[マイコンテンツ]>[ビデオ]をクリックします。

次に音声の解析が終わっているか確認するには、[…]>[ビデオの詳細を更新する]をクリックします。

音声の解析が終わると[ファイルのダウンロード]のリンクが表示されます。

リンクが表示されない場合は音声解析がまだ終わっていないので、しばらく時間をおいてから再度確認してください

ダウンロードしたキャプションのファイルは、メモ帳などのテキストエディタで参照できます

試しに読んだテキストは、厚生労働省のコロナ感染対策についての記事です。

ぼそぼそ喋ってた割にはかなりの精度のようです。(”ひとりおひとり”は単純に読み間違えました)

一般的な用語であれば上記の通りですが、実際には言い間違いで文字が崩れたり、専門用語が変に解析されたりと言うことはあるかもしれません。その場合は、動画で確認するとよいでしょう。動画の右ペインのテキストをクリックすると、その再生位置にジャンプできます。また、動画中にキャプションを表示するには、[CC]をクリックします。

最後に

会議内容を聞き直すととても時間がかかります。

そこで今回紹介した方法を利用すればグッと時短になると思います。

Microsoft Streamが利用できる方は試してみてはいかがでしょうか?