Generative AI(生成AI)とは、新しいコンテンツを生み出すことができるAIの一種です。これは、複雑な機械学習モデルを使用して、前の単語のシーケンスに基づいて次の単語を予測したり、前の画像を説明する単語に基づいて次の画像を予測したりすることで、これを実現します。ジェネレーティブAIのモデルは非常に多様です。画像、長いテキスト形式、電子メール、ソーシャルメディアコンテンツ、音声記録、プログラムコード、構造化データなどのコンテンツを取り込むことができる。新しいコンテンツ、翻訳、質問への回答、感情分析、要約、そして動画まで出力することができます。
2022年はDALLE•2の発表から爆発的に画像生成AIの発展が広がっていきましたが、2023年以降のトレンドとして注目されるのが「動画生成AI」です。これはGenerative AIの一種で、画像やテキストの情報をもとに新しい動画を生成する技術です。
映画やアニメなどのエンターテインメント分野や、教育、企業においてのマーケティング動画生成など、さまざまな用途で動画を作成することができると期待されています。
Metaが発表した新しいAIシステム「Make-A-Video」は、テキストプロンプトを簡潔で高品質なビデオクリップに変換することができます。これは、Meta AIが近年進めているジェネレーティブテクノロジーの研究をベースにしており、クリエイターやアーティストの新たな活躍の場を広げる可能性を持っています。 このシステムは、テキストと画像のペアデータから学習し、関連するテキストがないビデオ映像からどのように動くかを学習します。同社はオープンサイエンスに取り組んでおり、デモ体験の公開を前提に、研究論文で詳細を共有しているとのことです。
We’re pleased to introduce Make-A-Video, our latest in #GenerativeAI research! With just a few words, this state-of-the-art AI system generates high-quality videos from text prompts.
Have an idea you want to see? Reply w/ your prompt using #MetaAI and we’ll share more results. pic.twitter.com/q8zjiwLBjb
— AI at Meta (@AIatMeta) September 29, 2022
Googleも、Metaの発表と同時期にテキスト入力からビデオクリップを生成するシステム「Imagen Video」を発表しました。このシステムは、1400万組のビデオとテキスト、6000万組の画像とテキストの組み合わせで学習されていると言います。 Googleの実験では、ゴッホの絵画や水彩画のような動画を作成することができ、奥行きや立体感を理解することが示されています。
Imagen Videoによって生成された動画サンプル
参照:https://imagen.research.google/video/
2022年9月にテキストを基にする動画生成AI「Phenaki」を匿名の研究者が公開し話題になりました。どれも簡単なプロンプトで生成されたとされておりますが、いずれのショート動画も一定のクオリティを維持しております。
さらに注目されたのが「Phenaki」で生成されたという2分間にわたる長編の動画が公開されている点です。前述の2つの生成AIと比較して、長編のストーリー性のある動画を生成できることが特徴です。この匿名の研究者は実はGoogle Researchの研究ということもわかっており、今後は前述の「Imagen Video」と「Phenaki」を組み合わせて、高精度でより長い動画の生成が行えるようになるということです。
Meet Imagen Video and Phenaki, two research approaches for text-to-video generation.
By combining diffusion & sequence learning techniques, we can generate videos that are super-res at the frame level and coherent in time. (4/5)https://t.co/O7gGzb9knWhttps://t.co/Uc0krTyTvk pic.twitter.com/Op4tonX2iw
— Google AI (@GoogleAI) November 2, 2022
動画生成AIを活用する上での課題はまだまだ散見しています。今後一般に広がっていくためには、より自然な動きのある動画を作る必要があります。また、リアルさや、見ていて面白い動画を作ることが難しいことも課題として挙げられます。一方で、すでに形になっている技術でもあるため、画像生成AIの広がりと同じようにさまざまな事業者での研究が進み、爆発的に加速していくことも考えられます。Googleの研究者によると、これから2年後くらいにはAI技術でテレビドラマ全編を制作できるとも主張されているため、今後の発展には期待が持てますね。
AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。
社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)
パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。
AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。
毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。
著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。
実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
※石角友愛の著書一覧
毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。