アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > YOLO – 物体検知AIの仕組みと発展の過程
YOLO – 物体検知AIの仕組みと発展の過程
2022/07/13 ブログ, The Insight 
by kohei 

YOLO – 物体検知AIの仕組みと発展の過程

最新バージョン「v6」の特徴とは

今週のテーマ:技術開発

パロアルトインサイトの石角です。2022年6月、画像中の物体を検知するAI「YOLO」の最新バージョンが発表され、話題となりました。物体検知は車の自動運転など応用範囲が広く、AI技術の中でも研究が進んでいる分野です。

物体検知の仕組みや発展の歴史を解説しつつ、YOLOの最新バージョン「v6」についても紹介します。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回取り上げるのは、物体検知AIの「YOLO」です。

?この記事から得られる3つのナレッジ
・物体検知の仕組み
・YOLOのバージョンアップの過程
・最新バージョン「v6」の特徴

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:You Only Look Once: Unified, Real-Time Object Detection
著者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
掲載サイト:arXiv
発行日:2015年6月8日
引用数:
URL:https://arxiv.org/abs/1506.02640

?この論文を選んだポイント
リアルタイムでの物体検知を可能にする、画期的な手法を発表した論文であるため。
?この記事に登場する技術キーワード
  • バウンディングボックス
  • 分類器
  • R-CNN(Region based Convolutional Neural Networks)
関連記事「画像認識における物体検出、その仕組みと応用例

目次

物体検知AIにおけるYOLOの位置づけ

YOLOのバージョンアップの過程

YOLOv6:最新バージョンの特徴

AIビジネスデザイナーのワンポイントアドバイス


物体検知AIにおけるYOLOの位置づけ

物体検知の基本的な仕組みと、他のAIと比較した際のYOLOの特徴を紹介します。

YOLOは「You Only Look Once」の略称で、物体検知を行うAIです。2015年に最初のバージョンがJoseph Redmon 氏より発表されて以来、物体検知の最先端で使われ続けています。

物体検知の仕組み

そもそも物体検知とは、画像中に何が写っているかを判別する技術のことです。画像を処理するAIを開発するうえで必須となる、基礎的な機能だといえます。

物体検知を行う際には、画像中に「バウンディングボックス」と呼ばれる長方形の領域を取り出し、そこに写っている物体が何なのかを特定します。

下図はYOLOを使用して作成したバウンディングボックスの例です。

AIが「この物体は何なのか」を判別する際には、「分類器」と呼ばれる仕組みを使います。

まず、あらかじめ「ネコ」「バナナ」「人」といったタグを付けられた大量の画像を読み込み、分類器に物体の特徴を保存しておきます。

そのうえで画像を分析する際には、バウンディングボックス内の物体と分類器内の情報を照合して、「人が写っている」などと特定するのです。

従来の物体検知の処理は2段階

2015年にYOLOが登場する以前より、R-CNN(Region based Convolutional Neural Networks)を代表例として、物体検知の手法は存在しました。The Insight の過去記事「画像認識における物体検出、その仕組みと応用例」でR-CNN を解説しているので、ぜひあわせてお読みください。

当時の手法は、以下の2段階の処理で物体検知を行うのが主流でした。

物体検知の2段階処理
  1. バウンディングボックスの候補を作る
  2. 候補に対して分類器を実行する

こうした処理方法が発展したことで、高い精度で「画像に何が写っているか」を特定できるようになったのです。ただし、2段階の処理は「時間がかかる」という弱点を抱えていました。

以前から物体検知の応用が期待されていたのが、車の自動運転です。車を安全に走行させるためには、周囲にある物体が何なのか、正確に見分ける必要があります。

車の走行中には周囲の状況が刻一刻と変わるため、物体検知は瞬時に終わらせることが欠かせません。しかし、従来の物体検知の手法では、リアルタイムでの対応はできなかったのです。

YOLOは1段階の処理なので速い

おすすめ/関連記事こちらの記事も合わせてどうぞ

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP