アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > 画像認識における物体検出、その仕組みと応用例
画像認識における物体検出、その仕組みと応用例
2022/01/12 ブログ, The Insight 
by kohei 

画像認識における物体検出、その仕組みと応用例

どんな画像も機械にとっては一つ一つが点であるピクセルの集合体です。ピクセルの集合体を機械はどのように物体を検知しているのでしょうか。「画像認識における物体検出」をご紹介

今週のテーマ:業務効率化

こんにちは、パロアルトインサイトの嶋崎です。

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回は「画像認識における物体検出」をご紹介します。画像認識は、自動運転など幅広い分野で応用されており、注目度の高い技術です。少し深く知っておくだけで、さまざまなAI技術が理解しやすくなるでしょう。

今まで目視で確認していた業務や、目視からデータ入力していた業務など、画像認識の技術を使用することで格段と早く業務を遂行することができるようになります。ただ物体を検知するだけでなく、ビジネス文書から特定の箇所を検出しデータ入力も可能です。

では、どのようにして画像認識がされているのか、画像から物体はどのようにして検出されているのか、そして、ビジネスへどのように活用されているか事例を用いてご紹介してまいります。

論文データ:

今回のディスカッション対象の論文をご紹介します。

タイトル:Selective Search for Object Recognition
著者:J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers & A. W. M. Smeulders
掲載サイト:International journal of computer vision 104,154-171 (2013)
発行日:2013年4月2日
引用数:3069
URL:https://ivi.fnwi.uva.nl/isis/publications/2013/UijlingsIJCV2013/UijlingsIJCV2013.pdf

この記事から得られる3つのナレッジ

・物体検出の手順
・物体検出の手法が進化してきた流れ
・画像認識を書類処理に応用した事例

 

目次

画像認識とは

物体検出の手順

  1. バウンディングボックスを作る

  2. 識別する

物体検出の手法の進化

  スライドウィンドウ形式

  バウンディングボックス生成後に識別する形式

  すべてを一貫して行う形式

ベストパーツ社の事例

AIビジネスデザイナーのワンポイントアドバイス

 

画像認識とは

 画像認識とは、画像に写っている物が何かを認識する技術のことです。たとえば、写真を見て「ネコ」「人」「車」などを区別することは、人間なら子どもでも簡単にできます。しかし、コンピュータにとって画像は「ピクセルの集合体」でしかないため、写っている物を認識するには、高度な技術が必要なのです。

 2012年ごろから、AI技術のひとつである「ディープラーニング」が取り入れられたことで、画像認識の技術は急速に発展しました。「AIがネコの画像を認識できるようになった!」と話題になったことを、ご記憶の方も多いかもしれません。

 当時は、たとえば「ネコだけが写った画像」をネコだと見分けられるかどうかが、問題とされていました。現在では、より複雑な「不特定多数の物が写った画像」をどれだけ早く正確に処理できるかが追求されています。

物体検出の手順

 画像内にある不特定多数の物を見分ける際に重要なのが、「物体検出(object detection)」の技術です。コンピュータはどのようにして、ピクセルの集合体から対象物を見分けるのでしょうか。

 イメージをつかんでいただくために、物体検出のひとつの手法であるR-CNN(Region based Convolutional Neural Networks)の処理手順をご紹介します。R-CNNは、以下の2つの手順で進められます。

1.バウンディングボックスを作る

 R-CNNでは、まずは物体があると推測される領域を特定します。この際にコンピュータが生成する長方形の領域は、「バウンディングボックス(bounding box)」と呼ばれます。

デジタルカメラで撮影する際に、人の顔の部分が四角で囲われているのを見たことがある方は多いでしょう。バウンディングボックスは、そういったイメージです。

 バウンディングボックスを生成する際には、類似するピクセルをグループ分けして、物体らしき領域を探し出す「selective serch」が使われます。以下の図を見ると「selective serch」の流れが理解しやすいでしょう。

image

引用:https://ivi.fnwi.uva.nl/isis/publications/2013/UijlingsIJCV2013/UijlingsIJCV2013.pdf

 こうして検出された「物体があると推測される領域」を「ROI(Region Of Interest)」、またROIを提案する仕組みを「region proposal」と呼びます。そして、ROIを囲う適切な大きさの長方形を作ることで、バウンディングボックスが完成するのです。

2.識別する

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。東急ホテルズ&リゾーツのDXアドバイザーとして中長期DX戦略への助言を行うなど、多くの日本企業に対して最新のDX戦略提案からAI開発まで一貫したAI・DX支援を提供する。2024年より一般社団法人人工知能学会理事に就任。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『AI時代を生き抜くということ ChatGPTとリスキリング』(日経BP)『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

実践型教育AIプログラム「AIと私」:https://www.aitowatashi.com/
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

 

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP