アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > Metaのマルチモーダル型自己教師あり学習は何がすごいのか
Metaのマルチモーダル型自己教師あり学習は何がすごいのか
2022/04/27 ブログ, The Insight 
by kohei 

Metaのマルチモーダル型自己教師あり学習は何がすごいのか

データのラベル付けなしで画像、音声、自然言語を学べるAI

今週のテーマ:技術開発

パロアルトインサイトの長谷川です。いまAI業界で注目のトピックである「マルチモーダル」と「自己教師あり学習」について、「The Insight」でも何度も取り上げてきました。今回は、この両方を同時に扱おうとする興味深い研究を紹介します。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、マルチモーダルに対応した自己教師あり学習の仕組みを作ろうとする挑戦です。

この記事から得られる3つのナレッジ
・マルチモーダルの重要性
・データを「目隠し」する自己教師あり学習の手法
・マルチモーダルの2つのタイプ

 

論文データ:
今回のディスカッション対象の論文をご紹介します。

タイトル:data2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language
著者:Alexei Baevski, Wei-Ning Hsu, Qiantong Xu, Arun Babu, Jiatao Gu, Michael Auli
掲載サイト:arXiv
発行日:2022年2月7日
引用数:
URL:https://arxiv.org/pdf/2202.03555.pdf

 

この論文を選んだポイント

1つの仕組みで画像、音声、自然言語のすべての自己教師あり学習に対応しようとする、興味深い試みであるため。

 

この記事に登場する技術キーワード

 

目次

マルチモーダルが重要な理由

「目隠し」したデータから学ぶ自己教師あり学習

マルチモーダルの2つのタイプ

AIビジネスデザイナーのワンポイントアドバイス


マルチモーダルが重要な理由

まずは議論の基礎として、マルチモーダルについて解説していきます。

複数の感覚を組み合わせてAIを人に近づける

マルチモーダルとは「複数の入力情報を利用する」という意味で、ここ数年で特に注目されている分野です。

人は五感(視覚、聴覚、触覚、味覚、嗅覚)を同時に使って情報を集め、すべての情報を組み合わせて判断を行っています。これは特別なことではなく、子どもでも意識せずにやっていることです。

しかし、ここ数十年で急速に進化が進んだAIも、その多くは「画像」「音声」「文字」など、単一の入力情報しか処理できません。そのせいで、子どもでもできる判断を誤ることがよくあります。AIをより人に近づけるためには、マルチモーダルが欠かせないのです。

いま話題の「メタバース」の世界でも、マルチモーダルが重要です。触覚や嗅覚なども取り入れることでより現実の世界に近づけ、メタバースへの没入感を高めようと試みられています。

「The Insight」の過去記事の紹介

マルチモーダルについては、過去の「The Insight」でも取り上げています。

メタ学習とマルチモーダル:AIを人間に近づける挑戦」では、「AIを人間に近づけるための研究」のアプローチとしてマルチモーダルについて紹介しました。

また「三菱電機がAIを開発する理由:マルチモーダルセンシングと自然言語生成を併用した意思疎通できるAI」では、自動運転での応用を解説。カメラ、マイク、LiDARといった入力機器からの情報を組み合わせて、周囲の状況を把握しているモデルを紹介しました。

これらの記事もあわせてご覧いただくと、理解が深まるでしょう。

「目隠し」したデータから学ぶ自己教師あり学習

今回のディスカッション対象の論文について、解説していきましょう。

自己教師あり学習の意義

自己教師あり学習は、以前の記事「訓練データ量を劇的に減らす新たな機械学習」で詳しく取り上げました。今回の論文はMetaが発表した論文であり、Metaは自己教師あり学習(Self-Supervised Learning)に力を入れていることがうかがえます。

従来から行われてきた「教師あり学習」では、ラベル付けされた訓練データを大量に用意する必要があり、あらゆる現場で課題となっています。そこでラベル付けされていない訓練データから学べる「自己教師あり学習」が注目されているのです。

データを目隠しして学ぶ「data2vec」

本研究の手法は「data2vec」と名付けられています。この手法のポイントは、ラベル付けされたデータを用意する代わりに、データを「目隠し」することです。

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP