アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > AIアートの最新技術「DALL·E 2」の創造力の凄さ
AIアートの最新技術「DALL·E 2」の創造力の凄さ
2022/05/18 ブログ, The Insight人気記事, The Insight 
by kohei 

AIアートの最新技術「DALL·E 2」の創造力の凄さ

言葉での指示に従って多種多様な画像を自動生成する技術

今週のテーマ:技術開発

パロアルトインサイトの石角です。「AIに創造性はあるのか?」は、昔からある問いかけです。人のような知能を持つAIの実現を目指す組織「OpenAI」は「DALL·E 2」(ダリ2)を発表しました。このAIは、創造性を持っているとしか思えないような絵画や写真を次々に生み出します。今回はDALL·E 2について、詳しく解説します。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、人が言葉で指示するだけで、多種多様な画像を自動で作り出すAIです。

この記事から得られる3つのナレッジ
・DALL·E 2が優れているポイント
・DALL·E2の技術的な処理
・AIの画像生成における倫理や権利の問題

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:Hierarchical Text-Conditional Image Generation with CLIP Latents
著者:Aditya Ramesh, Prafulla Dhariwal, Alex Nichol, Casey Chu, Mark Chen
掲載サイト:arXiv
発行日:2022年4月13日
引用数:
URL:https://arxiv.org/abs/2204.06125

この論文を選んだポイント
言葉での指示に従って高品質な画像を生成できるうえに、研究成果がサービスとして展開される予定であることから、従来の画像生成AIにはないインパクトがあるため。
この記事に登場する技術キーワード
  • CLIP(Contrastive Language–Image Pre-training)
  • 弱教師あり学習
関連記事「弱教師あり学習によるデータ不足への対処法
  • GPT-3
関連記事「自然言語処理の世界に衝撃をもたらした「GPT-3」その根幹を成すトランスフォーマー(Transformer)と注意機構とは
  • Diffusion Models

目次

DALL·E 2とは?読み方や特徴

技術面:2段階の処理

AIの画像生成における倫理や権利の問題

AIビジネスデザイナーのワンポイントアドバイス


DALL·E 2とは?読み方や特徴

AIを研究するアメリカの非営利団体OpenAI が2022年4月にDALL·E 2を発表しました。DALL·E 2と書いて、「ダリ ツー」と発音します。画家のサルバドール・ダリと、CGアニメのキャラクターWALL-Eが名前の由来です。文章から画像を生成できるAIとして話題になりました。その後、文章から画像を生成できるAIとしてGoogle からも「Imagen」や「Parti」と続々と発表され、文章から画像を生成するAIの開発はトレンドのようになっています。今回は、DALL·E 2について、詳しく解説していきます。

特徴:指示に対応して創造できる

DALL·E 2は、画像を生成するAIです。言葉で「こんな画像を作って」と指示を与えると、写真のようにリアルな画像やアート風の絵などを、自由自在に作り出します。

どんな絵が描けるのかは、DALL·E 2の公式サイトで見られるので、ぜひアクセスして確認してみてください。

例えば、以下の指示をDALL·E 2に与えるとします。

  • テディベア
  • AI研究をしている
  • 1990年代の技術水準で水中で

すると生成されるのが、下図右側の画像です

(画像引用:https://openai.com/dall-e-2/

たった1つの指示から、バリエーションのある画像を生成できます。どれも与えた条件文に合っており、しかも本当にテディベアを水中に沈めて撮影したかのように自然な画像です。

また、すでにある画像に新たな要素を加えることも、簡単な指示で実現できます。例えば、美術館の画像の中で位置を指定して「コーギーを追加したい」と言葉で依頼すれば、下図のように実現してくれます。

(画像引用:https://openai.com/dall-e-2/

単に犬のコーギーの画像を合成しているわけではなく、影や光の反射も含めて、本当にその場にいるかのように再現できるのです。しかも、追加する場所として「絵の中」を指定すれば、展示された絵の中にコーギーを登場させることも可能です。

色々なパターンを見れば見るほど、AIとは思えない創造性の高さに驚かされるでしょう。

広く使われるサービスとして提供される予定

DALL·E 2は、OpenAIが昨年に発表して話題となった「DALL·E」の後継AIです。今回、わずか1年で大幅な進化を遂げたことで、世界中の研究者のみならず、一般の人々からも注目を集めています。

DALL·Eは研究成果の「見本」として公表されただけでしたが、DALL·E 2は正式なサービスとして、これから本格的に展開されていく予定です。

OpenAIは、2020年7月には文章を生成するAIサービスの「GPT-3」(The Insight の過去記事「自然言語処理の世界に衝撃をもたらした「GPT-3」その根幹を成すトランスフォーマー(Transformer)と注意機構とは」)を公表しました。GPT-3はすでに多くの企業や研究機関で利用され、文章の要約や質問への回答などに活用されています。DALL·E 2も同じように、多くの企業や個人に使われることを目指しているようです。

DALL·E 2のような高性能AIが業界内の「インフラ」として使えるようになれば、その影響は非常に大きいです。DALL·E 2を基盤として、画期的なサービスが次々に生まれる可能性があります。

すでに始まっている活用の具体例

 

DALL·E 2の活用はすでに開始されています。例えば最近、Greg Brockman氏がOpenAIのトップに就任した際のブログ記事では、DALL·E 2により生成された右の画像が使用されました。

記事の中では、この画像がDALL·E 2によって生成されたと記載はありませんが、どうやってDALL·E 2によって生成されたとわかるのでしょうか。判別する方法は後ほどお伝えします。

おすすめ/関連記事こちらの記事も合わせてどうぞ

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP