産業の情報化は米国、中国の周回遅れになっている

 編集部:2018年の年初から、コンビニ連合では経産省の主導を得て、ICタグの利用実験を進めています。経産省ではコンビニ連合との間で、2025年までに1000億枚のICタグの使用することが合意されていますから、1枚のコストはどんどん下がって、最終的には1枚1円と試算されているようですね。

 こうなると、まさに、IoT(全商品情報のインターネット化)が進みます。

 吉田:実際には経産省が言う2025年の2、3年前、つまり、2022年ころに国際的には1個2円か1円になると思っています。

 理由は消費人口が日本の10倍もいる中国で電子マネーとICタグの利用、無人店舗の増加も進んでいるからです。米国ではアマゾンは無人店を700店作ると言っていましたが、その数を1500店に倍増しています。取り組みがうまく行ったからで、数年ではそれより多い3000店になるでしょう。

 日本は産業の情報化で米国と中国の周回遅れになっています。AIの利用では中国からは3周遅れと言われています。

 金融危機(1997年)の後、21世紀になって20年間もGDPが増えず、企業の国内売上げも増えていない間に、企業のイノベーション、技術革新への意欲が低くなってしまったのはSMも同じです。

 店舗の技術革新で先行している中国のGDPは2010年に、当時、世界で2位だった日本を超え、2018年には日本の2.3倍になっていることはご存じですね。

 編集部:米国では、2018年1月に無人店のアマゾンゴーが開発され、実験を経て、2021年には全米3000店にまで出店すると発表されています。アマゾンゴーの商品認識、どういう仕組みか、教えていただけますか。

 吉田:ディープラーニングというAIの方法を使った画像認識です。

 店舗では1980年代から約40年、商品の品目を認識するのにUPS(米国のJANコード)が使われてきました。レジのPOSでUPSのバーコードをスキャンすると、その商品マスターファイルを参照し、レジに品目と販売価格を表示する仕組みで、これをPLU(プライス・ルックアップ)と言っています。 

 アマゾンゴーでは商品を、AIにつながるカメラに読み込ませ、これは***という品目だと教え込みます。これを教師型学習と言います。

 ある一定量以上(数百枚以上)読み込ませると、AIは間違えずに品目を区分できるようになっていきますこれがAIによる画像認識(技術用語ではパターン認識)です。

 技術的に言うと、そのものをそのものたらしめている特徴量を数値化し、その変数を、最小二乗法を使う多変量解析の方程式として作っていくのです。

 コンピューターは内部では0と1の2進法での数値計算しかしていません。そのため、デジタル(国語では離散量)処理と言います。画像も音声も数値化して、計算しています。画像処理では処理速度の速いエヌビディアのGPU(画像処理のCPU)を並列につないで使っているのです

 多くの商品画像を読み込ませるほど、特徴量が正確になり、認識も正確になります。検索サイトのグーグルで2012年に犬の顔と猫の顔の識別に5000枚の画像を読み込ませたといいます。商品はいろいろな種類がいる犬や猫よりはるかに簡単なので、数百枚の画像を読み込ませるだけでよいでしょう。

 スマホでも2000年代初期のスーパーコンピューターを超えるくらい、データの処理速度が速くなったので、この画像認識ができるようになったのです。

 画像は針の先のように微細な点(ドット)にした情報の量が多いので、処理速度、つまり計算の速さが必要。これは2017年1月にトッププロより強くなった将棋や囲碁の棋譜の認識方法と同じです。

 アマゾンゴーの入り口で改札口のようなセンサーにスマホをあてて入ると、天井のカメラがその人の動きを追います。商品を手に取ると、それを買ったことになります棚に戻せば返品です。棚には重量センサーがあって、その顧客が商品を取ると、分かるようになっています。

 店を出るときは、出口でスマホをかざして、買った商品の表示された品目と価格に対してYESとすれば、買ったことになります。代金の支払いはあらかじめ紐づけておいたアマゾンに登録したクレジットカードで行います。品目と価格のレシート情報はアマゾンのコンピューターと、顧客のスマホが同じもの共有することになるのです。