人工智能一浪接一浪地席卷全球，AI的其中一個重要分支——計算機視覺，也如雨后春筍，不斷涌現(xiàn)出新的想法和應(yīng)用。人臉識別已經(jīng)逐漸滲透我們的日常生活，機器能夠認準人臉，想必大家都有所耳聞;而另一類計算機視覺的應(yīng)用，是進行商品識別。

當前新興的一些無人零售店，背后就需要機器對商品進行自動識別，拍圖購物、AR互動營銷等場景，也運用了商品識別技術(shù)。人工智能商業(yè)公司 ImageDT，則利用商品圖像識別技術(shù)提供2B商業(yè)服務(wù)，包括基于互聯(lián)網(wǎng)圖片大數(shù)據(jù)的商業(yè)分析，以及基于門店貨架識別的渠道數(shù)據(jù)洞察，幫助消費品企業(yè)提升業(yè)績。

今天，圖醬就跟大家科普應(yīng)用在無人店、新零售中的商品識別技術(shù)。

數(shù)據(jù)邏輯

讓小孩“記住”超市里的所有商品

我們教一個小孩識物的時候，比如“蘋果”，首先要讓他反復(fù)的看到 “蘋果”，他便能認識“蘋果”;他可能會認錯，把“梨”認成“蘋果”，這個時候應(yīng)該幫他指出來。小孩看到的“蘋果”越多，辨識的能力就越強。

基于深度神經(jīng)網(wǎng)絡(luò)的人工智能，讓機器具備理解的能力，基本過程就像教一個小孩認蘋果一樣。首先要有大量的數(shù)據(jù)，比如“蘋果”的圖片;同時，要增加大量機器會認錯的“負樣本”，比如“梨”的圖片;然后經(jīng)過一個深度神經(jīng)網(wǎng)絡(luò)，反復(fù)學習，最終獲得一個有效的識別模型。

對于快消商品的識別，我們不僅要認出一個瓶子包裝，還要認出是一瓶酸奶還是啤酒;不僅要認出酸奶，還要認出是哪個品牌的酸奶，甚至是哪個口味和規(guī)格。要讓機器能夠準確識別成千上萬的快消商品SKU，是一項極其龐大而復(fù)雜的AI工程。

數(shù)據(jù)采集

讓機器獲得學習的原始素材

首先，我們需要梳理出所有的目標商品清單，并設(shè)法獲得每一件商品的圖片數(shù)據(jù)。根據(jù)商品的特征辨識度，通常需要幾十到幾百張的有效圖片。

數(shù)據(jù)采集是一套組合拳。電商平臺上擁有結(jié)構(gòu)化的商品介紹圖片以及大量的買家曬圖，社交平臺上也能獲取到大量的消費者曬圖，是性價比最高的數(shù)據(jù)源。超市店內(nèi)的真實貨架數(shù)據(jù)，是最可靠的數(shù)據(jù)源，但獲取和后期處理的成本都比較高。

除此之外，ImageDT還通過自主研發(fā)智能燈箱和智能采集車，模擬各種不同的場景對商品進行360°拍攝從而建立龐大的訓練數(shù)據(jù)庫，以此來獲取最豐富的訓練數(shù)據(jù)。

數(shù)據(jù)標注

有多少人工，才有多少智能

采集到原始圖片數(shù)據(jù)，通常會混雜許多“臟數(shù)據(jù)”，需要進行清洗;大部分情況下，還需要對圖片中的物體進行標注和分類。只有可靠的數(shù)據(jù)才能產(chǎn)生高質(zhì)量的識別模型。

在每一個人工智能公司，都有一支特殊的軍隊——數(shù)據(jù)標注團隊。ImageDT也不例外，在背后支撐這個團隊的是一個充滿黑科技的標注系統(tǒng)。

比如，圖片在標注前通常會先經(jīng)過弱模型的處理，讓機器先解決 50%的問題;系統(tǒng)有支持批量標注的小圖模式，讓標注員可以一目十行，成倍提高標注的速度;產(chǎn)品經(jīng)理反復(fù)打磨每一個功能，做A/B測試，從每處細節(jié)提高標注的體驗和效率。

除此之外，標注團隊還為不同任務(wù)配置了不同等級的質(zhì)量保證機制，包括抽樣審核、全量審核、交叉校驗、埋點校驗等，確保讓機器學習最準確最可靠的訓練數(shù)據(jù)。

模型訓練

“活到老學到老”，機器也要不斷學習

準備好了數(shù)據(jù)，下一步就是讓機器進行學習，建立識別模型的過程。同樣的數(shù)據(jù)，選擇不同的神經(jīng)網(wǎng)絡(luò)算法、以及不同的參數(shù)設(shè)置，將會影響最終模型的效果。模型建立之后，還需要進行管理：模型之間存在層次關(guān)系，數(shù)據(jù)和模型會存在版本的迭代，這些問題，當遇到大量商品類別的時候，顯得非常艱難。

在ImageDT內(nèi)部，有一個自助式的深度學習平臺，支持拖拉拽的算法和參數(shù)測試，甚至一個非程序員都可以傻瓜式的完成一次建模任務(wù)，并獲得模型的效果評估報告。

每一位ImageDT的新員工，不管是工程師，還是前臺，都會接受一次半小時的建模培訓;而在培訓結(jié)束后，每個人都將能夠獨立的建立一個圖像識別模型，整個過程只需要半小時。

同時，深度學習平臺就像一個模型倉庫，兼顧著對象、數(shù)據(jù)和模型的管理。

整個建模的過程已經(jīng)標準化，最快只需要一天，就能完成從數(shù)據(jù)采集、標注、建模到上線的整個流程。

ImageDT的研發(fā)團隊分為四個組，產(chǎn)品組、建模組、數(shù)據(jù)組和研究組。前三個組，負責實現(xiàn)流水線的搭建和經(jīng)營，使得每天都能井井有條地建立大量新的商品識別模型，并快速上線，對每天數(shù)千萬的圖片數(shù)據(jù)進行識別和分析。研究組，則要克服各種疑難雜癥，比如容易產(chǎn)生褶皺的軟包裝、商品側(cè)面和背面的識別、遮擋和反光環(huán)境下的識別等等。

目前，在實際生產(chǎn)環(huán)境下，已經(jīng)達到95%以上的識別準確率。

人臉都有眼睛、鼻子、嘴巴等固定的特征，而超市中琳瑯滿目的商品，則千奇百態(tài)。與人臉識別相比，商品識別有更高的工程復(fù)雜度。 ImageDT正在做的，就是實現(xiàn)這個龐大的AI工程，讓機器能夠自動地、準確地識別每一件商品。

關(guān)于ImageDT

ImageDT(圖匠數(shù)據(jù))是一家人工智能商業(yè)應(yīng)用公司。團隊專注于為企業(yè)提供商業(yè)智能化技術(shù)與服務(wù)，具備領(lǐng)先的數(shù)據(jù)采集、圖像識別、語義分析、海量數(shù)據(jù)挖掘等技術(shù)，長期服務(wù)于日化、乳制品、食品、飲料等快速消費品生產(chǎn)和零售企業(yè)，主要產(chǎn)品包括：智能貨架圖像識別與洞察系統(tǒng)，互聯(lián)網(wǎng)圖片大數(shù)據(jù)應(yīng)用等，用智能科技助力企業(yè)業(yè)績增長。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

南通颐猩文化传播有限公司

當前位置：首頁 > 科技 > IT業(yè)界 > 正文

快消品圖像識別丨無人店的背后竟然是……

相關(guān)文章

視達無人店亮相德國EuroShop，暢想未來零售

亞馬遜將開迷你無人店：未來將引入商場和機場

聯(lián)想首家AI無人店正式開業(yè)：未來三年將部署5000個智能貨柜

雅量無人店給消費者超酷體驗，讓“無人店”變多人店

海信放言一年布局3000家無人店，為何有底氣？

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標簽