アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > ソニーAI研究の凄さとは?エチケットを理解した深層強化学習
ソニーAI研究の凄さとは?エチケットを理解した深層強化学習
2022/02/23 ブログ, The Insight 
by kohei 

ソニーAIの研究は何がすごいのか?エチケットを理解した深層強化学習

レーシングゲームで人間のトッププレイヤーを超えたAI研究がもたらすもの

今週のテーマ:技術開発

 レイアウト・編集担当の嶋崎です。先日行われたThe Insight Book Club へ参加された皆様、ご参加いただきありがとうございました。

 記事で取り上げた技術を掘り下げた議論を交わしたり、みなさんからの質問やフィードバックなどをいただけてとても嬉しく思います。いただいたコメントは今後のThe Insight へも活用して参ります!また次回、お会いできること楽しみにしております。今回のThe Insight Book Club のレポートはこちらから。

 2022年2月、ソニーの関連会社「ソニーAI」を中心としたグループの研究が、世界的な科学誌「Nature」の表紙を飾ったことをご存知でしょうか。「真面目な研究でゲームを使っている」というおもしろさもあり、一般のニュースで取り上げられるなど注目を集めました。このホットな話題についてご紹介します。

論文を選んだポイント

AIの飛躍的進歩として「Nature誌」のトップを飾り、無限の選択肢が存在する複雑なレースゲームで人間に勝ったことはAIの進化において大きなインパクトを与えた論文であるため。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、最新のAI論文よりレーシングゲームでトッププレイヤーを超えるAIを生み出した研究について詳しく解説してきます。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、最新のAI論文よりレーシングゲームでトッププレイヤーを超えるAIを生み出した研究について詳しく解説してきます。

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:Outracing champion Gran Turismo drivers with deep reinforcement learning
著者:Peter R. Wurman et al.
掲載サイト:Nature
発行日:2022年2月9日
引用数:
URL:https://www.nature.com/articles/s41586-021-04357-7

?この記事から得られる3つのナレッジ
・ソニーAIによる研究の何がすごいのか?
・「深層強化学習」の仕組みと工夫
・AIが「エチケット」を理解することの意味
この記事に登場する技術キーワード
  • 深層強化学習
関連記事
AIが囲碁で人間に勝つ。その事実のどこが凄いのか
強化学習をビジネスに応用するには?
  • mixed-scenario training

目次

ソニーAIの研究概要

本研究が注目される3つのポイント

ソニーAIが示した研究インフラの可能性

今後のAI開発への期待

AIビジネスデザイナーのワンポイントアドバイス


ソニーAI の研究概要

ソニーAIが発表した論文タイトルを日本語に訳すと「深層強化学習でグランツーリスモのチャンピオンドライバーを超える」です。まずは「グランツーリスモ」と「深層強化学習」という2つキーワードから、この論文の概要をご紹介します。

グランツーリスモ

本研究で使われたのは、プレイステーション4のレーシングゲーム「グランツーリスモSPORT」です。生み出されたAIは「グランツーリスモ ソフィー(以下GTソフィーと略)」と名付けられました。

「グランツーリスモSPORT」は世界的なeスポーツタイトルです。車両の見た目だけではなく、以下のような物理現象もリアルに再現されています。

⚙️ リアルに再現される物理現象

  • 車体の重量バランス
  • 剛性
  • 空気抵抗
  • タイヤの摩擦

(画像引用:https://www.gran-turismo.com/us/gran-turismo-sophy/technology/

深層強化学習

 GTソフィーの開発には「深層強化学習」と呼ばれる技術が使われています。深層強化学習は2016年に世界トップレベルの棋士に勝利し、大きな話題となった囲碁の人工知能「AphaGo」(The Insight で前編後編に分けて紹介)でも使われました。

深層強化学習は「強化学習」と「ディープラーニング」を組み合わせた技術です。強化学習では人間が教師データを与えて教えるのではなく、AIに自由にゲームを操作させて、自ら学ぶように促します。その際にカギととなるのが「報酬とペナルティ」です。

(DeepMind社が提唱した「報酬を与えるだけで十分である」という仮説:Reward is enough については、The Insight で前編後編にわたり紹介)

レースで有利になる操作には「報酬」を与え、不利になる操作には「ペナルティ」を与えるように、あらかじめプログラムしておきます。あとはできるだけ報酬を最大化しつつ、ペナルティを最小化しようとAIが工夫するうちに、自然にドライビングテクニックを身につけていくのです。報酬とペナルティの例は、以下の通りです。

?️ AIへの報酬とペナルティ

  • ラップタイムを縮めたら報酬
  • コースアウトしたらペナルティ
  • タイヤと路面の摩擦力を失ったらペナルティ </aside>

さらにディープラーニングを強化学習に組み合わせることで、目の前の報酬だけでなくより長期的な視点を持つなど、より最適な判断を実現しました。

深層強化学習は非常に効果的でした。GTソフィーはわずか数時間でトラックを周回することを学習し、1〜2日で95%の人間のプレイヤーよりも速く走れるようになりました。そこからさらに9日以上のトレーニングを行うことで、人間のトッププレイヤー以上の実力を手に入れたのです。

人間は最初に「報酬とペナルティ」を設計するだけで、あとはAI自身の学習に任せている点がポイントです。

 

本研究が注目されるポイント

なぜ本研究は「Nature」の表紙を飾るほど注目されたのでしょうか?これまでの研究と何が違うのか、重要なポイントを3つご紹介します。

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP