Agora Go Real

{{ page_meta.name }}|{{ group.public_title }}|{{ site_settings.logo_alt }}

作成者: 藤本 諭志|Mar 18, 2024 3:50:26 AM

デモ動画

実際のセミナー用に動画生成したAIアバターの一部を公開します。

AIアバターが自然にスピーチしている様子がチェックできます。

AIアバター動画生成の技術選定

生成AIアバターを利用した動画作成には以下の技術が必要です。

  • TTS(テキストtoスピーチ)
  • キャラクター作成
  • リップシンク(スピーチに合わせてキャラクターを動かす技術)
  • 資料との繋ぎこみ

それぞれの技術についてAPI経由やGUI経由でさまざまなソリューションが提供されています。
ブイキューブではこの生成AIアバターを利用した動画作成のサービスを視野に入れているため、極力自動化を目指しAPI経由で生成できる技術や、より自然なAIアバターの作成を調査し、プロトタイピングを行いながら動画作成を行いました。

動画制作プロセスで直面した課題と解決策

新しい取り組みなので、当然ながらいくつかの課題が発生しました。
例として挙げられるのは、リップシンクの生成時間です。数秒程度の音声データについては許容できる範囲の生成時間でした。ところが、長尺になるにつれ、生成時間が指数関数的に増加していきました。
結果として、短い動画を生成し、あとでマージするという解決策にたどりつきました。

視聴者の反応

視聴者からのフィードバック

セミナー実施後にアバターに対するアンケートを取りました。
バーチャル講師に対する一番の懸念点として視聴者がストレスを感じるかという点がありました。アンケート結果からは改善の余地があるものの概ねストレスを感じないという結果になりました。

バーチャル講師への今後の期待でも視聴者に受け入れられている様子が伺えます。

自社でのバーチャル講師活用についてはまだまだ未知数である様子が伺えます。

視聴者の反応によって浮き彫りになった点

自由記載のアンケートでは以下のようなコメントを頂きました。

 

肯定的なコメント
・新鮮で面白かった
・裏側の仕組みが気になった
・思っていたよりも違和感なく聞く事が出来た
・プレゼン下手な人間がやるよりはずっとよかった

最後の「人間よりずっとよかった」というコメントから、発信したいけどしゃべるのが苦手な人にとってAIアバターが有効なソリューションだと気付きました。

否定的なコメント
・イントネーションが日本人らしくない
・抑揚が弱くて聞きづらい箇所もあった

否定的なコメントからはビジュアルよりも音声の品質が気になる傾向のようでした。

ネガティブなフィードバックへの対応方法

テキストからの音声化については様々なモデルやサービスが存在する為、いくつか試して改善していく事になりそうです。

最後に

今回、従来のセミナーのライブ配信の課題を解決するために生成AIアバターを採用しました。
自然なAIアバターの動画生成技術を使用することで、物理的な制約を超え、高品質で一貫したコンテンツ制作が可能になり、効率的な配信と視聴者との新しい形のエンゲージメントが実現されることが期待されます。
視聴者からは、新鮮で面白いと感じるなど肯定的な反応が多く見られましたが、音声のイントネーションや抑揚に関する改善点も浮かび上がりました。
今後、これらのネガティブなフィードバックに対応し、さらに改善を進めることで、バーチャル講師の活用はより受け入れられるようになることが期待されます。