人工知能に対抗するチワワとマフィン

Written by

in

人工知能は、マフィンと犬の顔のような興味深いものを区別するのに問題があります。幸いなことに、ディープラーニング…

たとえば、目の端を見て、床に横たわっているその毛布が実は猫であることに突然気づいたことはありませんか。それは正常なことです。あなたは人間であり、視覚に問題があり、散らかった心を持つ、間違いを犯しやすい生き物です。スーパーコンピューターに聞いてみたらどうでしょうか？巨大な計算能力を持つマシンのほうが幸運かもしれません。あるいはそうではないかもしれません。彼らがすでに何度か示したように、人工知能は食べ物と動物を区別するのが困難です。このおかしな事実は、少し前にすでにインターネットの共感を呼んでいました。彼らはそれを解決しましたか？そして、この困難は人工知能の開発において何を意味するのでしょうか?

チワワ vs マフィン

少し前に、チワワの顔を真珠光沢のあるチョコレートマフィンと比較した画像が短期間ネットワークに溢れました。これらの画像の後には、シャーペイの子犬やクロワッサン、パグや食パン、さらにはラブラドゥードルやフライドチキンなど、同様に興味津々な画像が続きました。控えめに言っても、この比較は非常に興味深いものです。しかし、なぜ？メッセージはいつも同じでした。犬と食べ物の違いが分かりますか？あるいは物体、なぜならその物の強度が増し続けたからです。しかし重要なことは、それを区別できるかどうかではなく、明らかに区別できることです。機械でもできるのでしょうか？画像を認識して区別することは、エンジニアがこれまで直面した中で最も複雑なタスクの 1 つです。そして、あなたが自然に行っていることをアルゴリズムに変換するのは簡単ではありません。

抽象化してみましょう。脳が画像を見ると、パターン、寸法、色、テクスチャ、深さ、時間性、関連性など、信じられないほどの量の情報が生成されます。メッセージから不必要なものをすべて取り除きましょう。必要なのは比較するためのパターンだけですよね?つまり、犬は…犬とカナリアは小鳥に似ていますよね？目の間の距離、肌の質感、色、鼻やくちばしの有無などを測定してみましょう。画像が他の画像と異なるほど、正しい比較を行って適切に識別することが容易になります。しかし、チョコレートチップとチワハの黒目を区別することがどれほど難しいか、立ち止まって考えたことはありますか?実際、これはコンピュータにとって非常に深刻な問題です。どうやって特定するのですか？コツは学習にあります。

パターンからディープラーニングまで

1970 年代以来、画像識別の原始的なバージョンであるパターン認識はつまずきながら進化してきました。エンジニアたちは、静的パターンの下で特定の画像を区別するための厳格なアルゴリズムを設計して数年間を過ごした後、別の分野である機械学習の出現により空が開けたのを目にしました。これは、担当するタスクを改善するために、トレーニングされ、ルールを学習および作成するアルゴリズムの使用を考慮しています。このようにして、機械学習アルゴリズムは、多くのトレーニングを経て、特定の画像の典型的なパターンを区別することを学習できます。しかし、これだけでは十分ではありません。ここでディープラーニングが登場します。この一連のアルゴリズムは、いわば機械学習の進化版です。その目的は、高レベルの抽象化、つまりより複雑な画像やパターンに取り組むことです。これを行うために、複数の非線形変換で構成されるアーキテクチャを使用します。

Google ニューラルネットワークによって取得された反復画像。マイケル・ティカ/Google

これらのアルゴリズムは、多様な性質と表現のデータ表現を学習することに焦点を当てています。たとえば、チワハの目ではチョコレートパールの質感が異なります。または、それらの間に存在するコンテキスト (髪の毛の有無やオブジェクト間の距離など)。私たちの場合と同様に、このタイプの処理は学習され、指数関数的に増大する一連の計算を生成します。そのため、大きな処理能力を使用することが不可欠です。しかし、非常によく最適化されたアルゴリズムでもあります。この種の問題を解決するのに最も適切なアーキテクチャは、ニューラルネットワーク(ディープニューラルネットワークやディープ畳み込みニューラルネットワークなど) に基づいています。これらのアルゴリズムのおかげで、人工知能はついにチワワとマフィンを区別できるようになりました。

これは単なる逸話のように思えるかもしれません。しかし、そうではありません。人工知能とディープラーニングは、AI に人間に近い能力を獲得する機会を提供します。複雑なパターンを区別する方法を学ぶことは、単なる画像の問題ではありません。また、音、交通手段、買い物、態度、エネルギー効率などを指す場合もあります。これらのアルゴリズムから、より安全な自動運転車の作成などに役立つ、より効率的なリアルタイム分析を開発できます。あるいは、より効率的な方法でエコシステムを管理します。あるいは、もっと便利で活発なロボットを作成してみてはいかがでしょうか。ディープラーニングは登場したばかりで、現代のコンピューティングとロボット工学の最も有望な分野の 1 つであることがすでに示されています。結局のところ、人工知能の 2 つの恐るべき敵、チワワとマフィンを倒したものなのです。

参考資料一覧

http://www.computervisionblog.com/2015/03/deep-learning-vs-machine-learning-vs.html
https://github.com/yskmt/dog_recognition
http://imgur.com/a/K4RWn

人工知能に対抗するチワワとマフィン

チワワ vs マフィン

パターンからディープラーニングまで