画像生成AI「DALL·E 2」や「Imagen」との比較や画像生成プロセスを解説
パロアルトインサイトの長谷川です。これまで大手企業が開発する画像生成AIをいくつか紹介してきましたが、それらは研究者や開発者、または招待された人のみが使えるものでした。
ところが、2022年7月にオープンベータ版が公表された「Midjourney」では、一般の人でもAIに指示を与えて画像を生成できます。そして、作り出された画像がSNSで共有されて広まることで、大きな話題を集めているのです。この記事を読んでいる方がすぐに試せるように、Midjourneyの使い方も含めて解説します。
シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、新たな画像生成サービス「Midjourney」です。
この記事に登場する技術キーワード
Midjourneyはサービス名であり、会社名でもあります。どんなサービスと会社なのかを紹介します。
Midjourneyは「文章で指示した通りに、AIが画像を生成してくれるサービス」です。2022年7月にオープンベータ版が提供されると、すぐに大人気となりました。
MidjourneyはAIの研究者や開発者だけでなく、13歳以上なら一般の人が自由に利用できるのが特徴です。TwitterやInstagramなどのSNSには、Midjourneyが生成したAIアート作品が多数投稿され、多くの人々の関心を集めています。
しかもMidjourneyは、限られた回数であれば無料で使えます。なお、正確な回数は設定によって異なりますが、25回程度です。
もっとたくさんの画像を作りたい場合は、月額10ドルの「Basic」プランか月額30ドルの「Standard」プランに加入が必要です。また、企業向けに月額600ドルの「Corporate」プランも用意されています。
Midjourneyは小規模な会社です。11人のフルタイムスタッフとアドバイザーで構成され、自己資金で運営されています。(2022年8月時点)
創業者はデイヴィッド・ホルツ(David Holz)氏です。2008年にホルツ氏は、手の動きをセンサーで認識するデバイスを開発する「Leap Motion」 という会社を創業しました。2021年、Midjourneyを設立するためにLeap Motionを退社し、現在はMidjourneyの事業に注力しています。
「The Resister」によるホルツ氏へのインタビュー記事によれば、Midjourneyはすでに黒字化に成功しているようです。大企業が激しく競争している画像生成AIの分野において、Midjourneyのような小規模なチームがいち早く商業化に成功したことは、驚くべきことです。
Midjourneyの使い方を以下の3つの手順で解説します。ぜひご自身の手で、AIによる画像生成を試してみてください。
Midjourneyの操作は、チャットツールの「Discord」上で行います。アカウントを持っていない場合は、あらかじめ作成しておきましょう。
Midjourneyの公式サイトにアクセスし、トップページの「Join the beta」のボタンをクリックします。すると、Discord内にあるMidjourneyのサーバーに参加できます(下図)。
(MidjourneyのDiscordより画像引用)
Midjourneyのサーバーで、画面左側のメニューから「NEWCOMR ROOMS」を探しましょう。その中に「newbies-○○」という部屋がいくつか用意されているので、クリックしてどれかに入ります。
なお「NEWCOMR ROOMS」が表示されていない場合には、Discordのアプリを再起動すると表示されることが多いようです。
「newbies-○○」の部屋の中で、画面下部のチャット欄にコマンドを打つと、画像生成の指示を与えられます。
まずは「/imagine」と入力します。すると指示文が入力できる状態になるので、入力してエンターキーを押しましょう。なお日本語ではなく英語で指示したほうが、精度の高い結果を得やすいため、おすすめです。
指示をすると、すぐにMidjourneyが4つの画像を生成し始めます。はじめはボヤけていた画像が、だんだんとくっきりしてくる様子を見るのは、面白く感じられるでしょう。
例として「Teddy bears working on new AI research underwater with 1990s technology」(1990年代の技術水準で、水中でAI研究をしているテディベア)という指示文を打ち込んでみました。その画像生成の過程が下図です。
(進捗30%:MidjourneyのDiscordより画像引用)
(進捗47%:MidjourneyのDiscordより画像引用)
Midjourneyでは大勢の人が同時に画像生成を行っているため、自分の画像はすぐにDiscordのタイムライン上で流れていってしまいます。画面右上の受信ボックスから「ジャンプ」すると、自分の画像をすぐに見つけられるので、活用してみてください。
画像の生成が終わると、4つの画像の下にボタンが表示されます。
AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。
社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)
パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。
AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。
毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。
著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。
実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com
※石角友愛の著書一覧
毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。