2022年秋に登場した、文字で指示すると画像を描いてくれる「Stable Diffusion(ステーブル・ディフュージョン)」や「DALL-E(ダリ)2」などにより注目された「生成(Generative)AI」は、11月の「ChatGPT」の登場で一気に世界中を席巻した。
昨年さらに進化した生成AIを、今年は仕事でも日常生活でもパソコンやインターネットを使うように普通に使い始める年になりそうだが、中でも「動画生成AI」の進化は驚きだ。
2月15日に発表されたOpenAIの「Sora(ソラ=空)」と1月23日に発表されたGoogleの「LUMIERE」は、これまでのものを遥かに上回る動画を文字による指示(プロンプト)だけで作ってくれ、誰でも簡単に動画が作れる時代が到来する。
■Sora
OpenAIが公開している「Sora」で作ったサンプル動画には、濡れた路面にネオンが映るアジアの都会をサングラスをかけたアジア人女性が歩いているものや、雪景色だが桜が満開の川沿いをカップルが手を繋いで歩いいているものなどがある。
「桜と雪」という組み合わせの動画は、「美しく雪に覆われた東京の街がにぎわっている。美しい雪模様を楽しんだり近くの露店で買い物したりしている数人の人々をカメラが追いながら、活気のある市街地の通りを移動する。華やかな桜の花びらが、雪片とともに風に舞っている」というプロンプト(文章による指示)で生成されたものだ。
「Sora」の凄さは指示された文言(プロンプト)だけでなく、それらのものが物理的な世界にどのように存在するかを理解する「物理シミュレーション」という機能や、生き生きとした感情表現もあるところだ。
■LUMIERE
Google Researchが、リアルで一貫性のある動画の生成を目指して開発した動画生成AIの「LUMIERE」は、1024×1024ピクセルの5秒間のリアルな動画を生成するが、文字による指示だけでなく動画、画像からも動画を生成でき、動画内の画像の一部分を動かしたり、動画の一部分を補完・修正するといった処理もできる。
デモには歩いている女性のドレスの色を変えたり、フェルメールの「真珠の耳飾りの少女(青いターバンの娘)」が笑ったりする動画も出ていた。
Googleは「初心者ユーザーでも創造的かつ柔軟な方法でビジュアルコンテンツを生成できるようにすることを目指している」としており、誰でも簡単にこのような動画が作れるようになりそうだ。
■ディープフェイク
2023年に最も売れたアーティストとされ、2月に日本でもコンサートを行ったテイラー・スウィフトも被害にあった、AIで作成したわいせつなニセ動画(ディープフェイク)は今後ますます問題になると思われる。
「Sora」や「LUMIERE」も悪用して偽動画や有害な動画を作成するリスクがあり、有名人の場合は本物の方に「公式マーク」などを入れることで対処できるが、一般人の場合はそれも難しい。そのため、OpenAIやGoogleなどは悪意のある利用を検出する機能を開発している。
======== DATA =========
●社長のメシの種 4.0・第121回 「ジェネレイティブAI」
https://plus.jmca.jp/takashima4/takashima4-121.html
●Sora(ソラ=空)
https://openai.com/sora
●LUMIERE
https://lumiere-video.github.io