アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > Googleが画像生成AI「Parti」を一般公開しない理由
Googleが画像生成AI「Parti」を一般公開しない理由
2022/07/20 ブログ, The Insight 
by kohei 

Googleが画像生成AI「Parti」を一般公開しない理由

自然言語処理モデルに使用されるTransformer を利用した画像生成モデル

今週のテーマ:技術開発

パロアルトインサイトの長谷川です。先月にGoogleが新たな画像生成AI「Parti」を発表しました。Googleは2022年5月には「Imagen」を発表したばかりであり、The Insightでも取り上げたので、ご記憶の方も多いでしょう。PartiとはどんなAIなのか、Imagenとの違いも含めて解説します。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、Googleが発表した最新のデジタルアート生成技術です。

この記事から得られる3つのナレッジ
・Partiによる画像生成の特徴
・画像生成と学習の技術的な仕組み
・ImagenやDALL·E 2との違い

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

著者:Jiahui Yu et al.

掲載サイト:arXiv

発行日:2022年6月22日

引用数:

?この論文を選んだポイント
高品質な画像を生成するAIの開発において、有望な新手法を発表した論文であるため。
?この記事に登場する技術キーワード
  • C4(Colossal Clean Crawled Corpus)
  • ViT-VQGAN(Vision-Transformer- based Vector-Quantized Generative Adversarial Networks)
関連記事「敵対的生成ネットワーク(GAN)の真の可能性とは
  • 自己回帰モデル
  • Transformer
関連記事「自然言語処理の世界に衝撃をもたらした「GPT-3」
  • Diffusion Model
関連記事「AIアートの最新技術「DALL·E 2」の創造力の凄さ
関連記事「Googleの最新画像生成AI「Imagen」はDALL·E 2を超えるのか

目次

Partiが生成する画像

画像生成と学習における技術手法

ImagenやDALL·E 2との違い

Partiはあくまで研究用であり一般には非公開

AIビジネスデザイナーのワンポイントアドバイス


Partiが生成する画像

Google が開発した「Parti」とは「Pathways Autoregressive Text-to-Image」の略称です。文章で指示を与えると、その文脈に合った画像をPartiが自動生成します。

Partiはどんな画像を生み出すのか

Partiがどのような画像を生成できるかは、Google の特設サイトを見るとよく理解できます。下図はPartiによって生成された画像の例で、それぞれの元となった指示文の日本語訳は以下の通りです。

左:シルクハットをかぶり、杖を持った正装のアライグマ。ゴミ袋を持っている。ゴッホ風の油絵。

右:車掌の帽子をかぶり、陰陽太極図のマークが付いたスケードボードを持っているトラのポートレート。写真。

 

(画像引用:https://parti.research.google

こうした短い文章から、Partiは多種多様な画像を生み出します。特設サイトでは、指示文の一部をユーザーが自由に選択できます。上図左のアライグマの画像であれば、「ゴッホ風」の他に以下の選択肢が用意されています。

?画像の選択肢
  • レンブラント風
  • 葛飾北斎風
  • ドット絵
  • 抽象的なキュビズム
  • エジプト風の象形画

指示文を変えるごとに、まったく違う画像が生み出される様子を見ると、まるでAIが創造性を持っているかのように感じられるでしょう。

画像生成を翻訳のように扱う

Google の開発したPartiは、文章から画像を生成することをまるで言語を翻訳するかのように扱うのが特徴です。つまり、ある英語の文章が与えられた際に、それを別の言語に変換するかのように、画像に変換する処理を行うのです。

こうした変換処理を高い精度で実現するために、GoogleはC4(Colossal Clean Crawled Corpus)という大規模な文章のデータセットを用意しました。C4を使って学習することで、Partiは「その文章は何を意味しているのか」を示すパラメータを蓄積していったのです。

従来の画像生成モデルでは、学習用のデータとして「文章と画像の組み合わせ」が大量に必要でした。しかし、そのようなデータセットは用意すること自体が難しい、という課題がありました。

一方、Partiの画像生成の仕組みであれば、「文章のみ」のデータセットを増やすだけで、画像生成の質の向上に大きな効果があります。「文章のみ」のデータであれば、インターネットを通じて大量に入手することが容易であることから、Partiは学習を進めやすいのです。

パラメータ数によって性能が大きく変化

Googleが開発したPartiの研究における大きな成果のひとつは、「パラメータの数と生成される画像の質に密接な関係がある」と明確にしたことです。下図は、Partiが獲得したパラメータ数ごとに、どのような画像を生成するかを示したものです。

画像の元となった文章は共通で「リスが鳥にりんごを渡している」です。

(画像引用:https://parti.research.google

パラメータ数が「350M」と「750M」では、奇妙な画像ができてしまっていることがわかります。「3B」の図は悪くありませんが、鳥の頭部が不鮮明です。

ところが、パラメータ数が「20B(200億)」になると、まるで撮影した写真のような高品質な画像を生成することに成功しています。

このようにPartiでは、パラメータ数を増やせば画像の質が高まります。そして、パラメータ数を増やしたければ、「文章のみ」の大規模なデータセットを用意すれば良いのです。

高品質な画像生成モデルを開発するうえで、Partiは新たなアプローチ方法を示したといえます。

おすすめ/関連記事こちらの記事も合わせてどうぞ

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP