マルチモーダルLLM(大規模言語モデル)を活用し、ブログの文章の主題と脈絡を把握。内容を要約した後に音声や背景音楽、演出まで施しショート動画を作成する。
これまでにも入力したテキストを映像に変換するAIは存在したが、利用者が画像や音声の選択を行う必要があった。ネイバーによると、オートクリップAiのように、テキストの内容を把握して適切な効果を挿入する技術は初めてだという。
オートクリップAiは、AIで映像を理解するプラットフォーム「MUAi」と連動する。MUAiには、オートクリップAiが生成した映像におけるチャプターを決め、説明を提供する「オートチャプター」技術が適用される。雰囲気や活動、感情などの要素を分析し、メタデータを生成する技術で、年内に公開予定だ。
このほか同社は年内に、グーグルが独自開発した基本ソフト「アンドロイド」基盤のXR(クロスリアリティー技術)を使ったコンテンツプラットフォームも開発している。3D(3次元)によるアバター生成などを可能とすることで、コンテンツ制作環境を拡大する戦略だ。
Copyrights(C) Edaily wowkorea.jp 101