こんにちは。パロアルトインサイトCEO・AIビジネスデザイナーの石角友愛です。
今回は、世間で注目されているMidjourneyやDALLE2(DALL-E2、ダリツー)などの「画像生成AI」のビジネス応用と注意点についてまとめたいと思います。
まず初めに、画像生成AIの紹介をします。
これまでの「AI」は、人間の模倣はできてもクリエイティブな部分までは再現できないと言われてきました。しかし、近年ではアートやデザイン、映像、音楽、文章といったクリエイティブの領域にもAI活用が広がっています。その最たる例が、今回のテーマの「画像生成AI」なのです。
AIならではの特徴として、人間の持つ固定観念のようなものを越えて、これまでに見られなかった面白い作品が生み出される点が魅力となり、話題を呼んでいます。
実際、現在TwitterなどのSNSでも「#AIアート」などのハッシュタグで、多くのAIアート作品が公開されています。
多彩な作風の作品を生成できることも特徴です。
例えば、指定する言葉(指示文)を少し変えるだけで、カメラで撮影したようなリアルな画像から絵画タッチの作品に変わったり、かと思えばデジタルアート調のものを生成できたりと、さまざまな変更を瞬時に反映できる点も面白さや利便性を感じさせる要素となっています。
DALL-E2は、AI研究を進めるアメリカの組織OpenAIによって、2022年4月に発表された画像生成AIです。画家のサルバドール・ダリや、ピクサーの長編アニメ映画『ウォーリー』(WALL-E)のキャラクターが名前の由来となっています。
例えば、文章で「音楽を聴いているカエルの足のひよこ、デジタルアート」といった注文(英語でプロンプトと言います)を入力し、指示するだけでそのイメージに合ったAIアートが生成されます。
OpenAIは2020年7月に文章生成AIサービス「GPT-3」を公開したことでも有名で、現在その「GPT-3」は多くの企業・研究機関で利用されています。DALL-E2も同様に、将来的に多くの企業や個人が使用できることを目指していると言われています。
DALL-E2の特徴として、訓練データの画像に「何が写っているか」のラベル付けが不要で、「どんなカテゴリーに属する画像か」という情報だけがあれば十分に学習できる点が挙げられます。
CLIP(Contrastive Language-Image Pre-training)はOpenAIが開発した画像認識AIで、2021年1月に発表されました。CLIPの学習方法は「弱教師あり学習」と呼ばれます。この方法で、膨大なコストがかかるラベル付け工程(その画像にどんな要素が含まれているかを人間が入力する工程)が不要になり、より効率的に学習することができるのです。
実は、CLIPがリリースされたことがきっかけで、AIコミュニティで一気に画像生成AIの開発が広がったと言われています。
CLIPにより、テキスト入力でAIモデルから高品質の画像を作成する機能が人気となり、その後、他のAIモデルの助けを借りて画像を出力することができるようなアプローチが生まれました。その後、画像生成AIコミュニティは、さまざまなモデルや技術を使用して画像を作成するPythonコードを公開し、熱狂的な探求の時代に乗り出したのです。
画像生成AIはDALL-E2の発表を皮切りに、GoogleからはImagenやParti(研究目的であり一般公開はされていません)、Microsoftからは枠外への画像の拡張や動画生成を実行できるNUWA Infinity、そして、Midjourney社からはMidjourneyといった類似アプリケーションがどんどん発表されています。
特に、Midjourneyは、7月から8月にかけて、「神絵を描けるAI」などと呼ばれて日本でも話題を呼びました。
Midjourney社は、膨大なデータとAIが学習するために必要なインフラを持っている大企業とは違い、小規模な会社です。10人のフルタイムスタッフとアドバイザーで構成され、自己資金で運営されています。
創業者のデイビッド・ホルツ氏は、「投資家もいない。資金的な動機もない。ただ、自分たちが情熱を傾けられることに取り組み、楽しむためにここにいるようなものです」と述べています。ホルツ氏は、Midjourneyを設立するために自身が2008年に立ち上げたLeap MotionというIoTデバイス開発の会社を2021年に退社し、現在はMidjourneyの事業に注力しています。
インタビュー記事によれば、Midjourneyはすでに黒字化に成功していることが分かっています。大企業が激しく競争している画像生成AIの分野において、Midjourneyのような小規模なチームがいち早く商業化に成功したことは、ビジネスモデルの流動性の高さや、市場ニーズの多さを表しているとも言えます。
画像生成AIはこのように次々にアプリケーションが生まれています。2022年8月には、ロンドンとロスアルトスに拠点を置くスタートアップ企業Stability AIが、DALL-E 2 に似たシステム 「Stable Diffusion」を発表し話題になりました。
Stable DiffusionはDALL-E2と比べると、生成される画像に対しての規制が緩く、例えば公人が写っている画像を使うことに対して制限をあまりかけていないと言われています。しかし、初心者にとっての使いやすさなどから多くのユーザーに支持されており、「Stable DiffusionとMidjourneyで同じプロンプトで画像生成をしてみた」というブログ記事も出ています。プロンプトは同じでもAIが異なると生成される画像も大きく異なることが分かります。
現在のMidjourneyのユーザー層から、どのような目的で画像生成AIが使われているかが見えてきます。
AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。
社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)
パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。
AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。
毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。
著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。
実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
※石角友愛の著書一覧
毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。