亚洲天堂资源网,自拍第1页,亚洲最大视频网

本站小編為你精心準備了人臉識別技術在安防行業中的運用參考范文，愿這些范文能點燃您思維的火花，激發您的寫作靈感。歡迎深入閱讀并收藏。

人臉識別技術在安防行業中的運用

一、引言

人臉識別不是一個新的技術，也不是最近幾年才在行業中得到應用。人臉識別是計算機視覺研究領域一個已經存在了很長時間的重要課題。隨著科技的快速發展，尤其是海量數據的出現，如圖1所示，互聯網、智能手機、視頻監控等行業的飛速發展，為計算機視覺學術研究新的算法提供的數據集容量與日俱增。同時用于允許算法的硬件平臺的計算性能的顯著提升，為計算機視覺新算法的誕生提供了新的土壤。其中計算機視覺一個重要的研究分支人臉檢測和人臉識別的算法性能相比傳統的人臉識別算法得到大幅度的提升，促進了人臉檢測和人臉識別算法在各種行業中的落地。

二、深度學習研究進展

深度學習是機器學習的一個分支。機器學習包含訓練/學習過程和推理過程（如圖3所示）。訓練過程是對一個深度人工神經網絡其中的連接權值進行不斷的前后向學習迭代，學習得到一個深度人工神經網絡模型，然后使用該深度人工神經網絡對測試數據進行推理。以深度卷積網絡為代表，深度（人工神經）網絡學習并不是個新穎的研究課題。上世紀的人工卷積由于硬件平臺的算力不足，無法訓練一個層數很多的網絡。進入二十一世紀后，尤其是2012年以后，研究者們發現基于GPU芯片能夠顯著地加快人工神經網絡訓練過程，能夠大大縮短訓練過程來不斷的實驗和改進網絡結構，以提高其效果。雖然從理論上來說，更深的神經網絡一定意味著更有效，但就目前的神經網絡訓練方法來看，對淺層神經網絡，研究者們還沒有找到一個更好的訓練使之收斂的方法。而對于層數較深的神經網絡，研究者們使用經典的反向傳播訓練方法，更容易訓練得到一個效果較好的網絡模型。所以也不難理解，現在在產品中落地的深度卷積神經網絡基本上都是百層以上的模型。針對什么架構的深度卷積神經網絡更有效，多少層的深度神經網絡更優秀，研究領域一直沒有定論，甚至都無法用理論證明。比如在2017年12月22日的NIPS2017大會上，深度神經網絡奠基人之一的YannLeCun仍然就神經網絡的可解釋性與其他研究存在不同意見，他認為，深度神經網絡的可解釋性并不像你所想象的那么有用（如圖5所示），深度神經網絡的可解釋性也并不像我們所認為像深度神經網般的那么難。

通過機器學習得到的深度神經網絡在某些應用方面已經超過人類，比如在斯坦福大學FeiFeiLi教授組織的ImageNet系列挑戰賽中，深度神經網絡算法在目標檢測和目標定位的能力已經超過人類5%的視覺錯誤率（如圖5所示）。雖然深度神經網絡如此有效，但是研究者們對在哪種具體應用場景中，具體的神經網絡模型結構，即多少卷積層，多少池化層，隱含層的特征映射面的大小，層與層之間的連接關系，仍然沒有定論。同時現在人們都已經意識到深度神經網絡將影響到人類社會的下一次經濟變革，很多企業紛紛開源自己的深度神經網絡研究平臺，以此吸引全球層面的研究者和廠家加入自己的深度神經網絡生態鏈。Theano是第一個被廣泛采用的深度學習框架。由深度學習的另一位開拓者YoshuaBengio領導的MILA創建和維護。由于最近幾年的深度網絡框架的飛速發展，今年9月份，MILA宣布，在Theano的最新版本之后，2018年將終止Theano的開發與維護。這可能是因為Theano的框架已經不再適應深度學習的飛速發展。目前從GitHub的star和fork數量，以及StackOverflow活躍度來看，谷歌的TensorFlow似乎是最常用的深度學習框架。有人預計伴隨著TensorFlow的推出以及谷歌的感召力，谷歌將會主導這個市場多年。但是其他框架確實也吸引了越來越多的充滿熱情的用戶群。PyTorch是在2017年1月由Facebook推出的，它是經典機器學習庫Torch框架的一個端口，Torch二進制文件包裝于GPU加速的Python。除了GPU加速和內存使用的高效外，PyTorch受歡迎的主要因素是動態計算圖的使用。微軟開發的名為CNTK的內部深度學習框架，在2017年正式推出2.0版本，并將其重新命名為微軟認知工具包（MicrosoftCognitiveToolkit）。

2017年，Facebook還推出了Caffe2，它將成為眾所周知的Caffe框架的繼承者。Caffe框架最初是伯克利視覺和學習中心開發的，現在仍然非常受歡迎，這是由于它的社區性質，它是計算機視覺的應用程序，以及它的ModelZoo系列預訓練的模型。不過，Caffe2似乎還沒有跟上Caffe的腳步。另一個流行的深度學習框架是MXNet，由微軟和亞馬遜共同支持。MXNet實際上支持許多語言，包括C++、Python、JavaScript、Go以及R。MXNet最為突出的是它的可擴展性和性能。除了這些框架之外，還有一些包裝在一個或多個框架中的接口（interface）。對于深度學習來說，最為人熟知和廣泛使用的接口無疑是Keras。Keras是一個高級深度學習API，用Python編寫，由谷歌開發。谷歌在2017年宣布，Keras已被選為TensorFlow的高級API。這意味著Keras將被包含在下一個TensorFlow版本中。除了TensorFlow，Keras也可以使用Theano或者CNTK作為后端。Keras的功能強大，因為它用非常直接的方式，即通過堆疊多個層來創建深度學習模型。使用Keras時，用戶不必進行層背后的數學運算。這似乎是快速原型設計的一種理想選擇。Keras也是Kaggle比賽的熱門工具。那么，一方面我們現在擁有了高級的KerasAPI，可以讓你輕松地構建簡單而高級的深度學習模型；另一方面我們還有低級的TensorFlow框架，能為構建模型提供更大的靈活性。這兩者都由谷歌支持。但是競爭并沒有停止，2017年10月，微軟和亞馬遜的AWS聯合宣布推出GluonAPI。Gluon是一個封裝了MXNet的高級Python深度學習接口，未來它還將支持微軟的CNTK。Gluon是Keras的直接競爭對手，盡管AWS聲稱他們強烈支持所有深度學習框架，但顯然，他們會打著AI民主化的口號押注于Gluon。如今TensorFlow的最大競爭對手似乎是PyTorch。社區對PyTorch的興趣越來越高漲，例如，Kaggle的最新競賽中，參賽者經常選擇使用PyTorch作為其解決方案的一部分，PyTorch也被用在最新的研究論文中。而TensorFlow終于引入動態圖機制是在2017年10月的EagerExecution，這是TensorFlow的“define-by-run”接口。谷歌希望通過這次，贏回那些喜歡上PyTorch以及它的動態圖的用戶。但對于廣受歡迎的深度學習課程fast.ai的開發者來說，這個改變來得太遲了。今年9月，fast.ai宣布從Keras＆TensorFlow轉換到PyTorch。fast.ai的創始研究員、Kaggle的前總裁兼首席科學家JeremyHoward認為PyTorch將能夠保持領先地位。只有時間能告訴我們答案了。開放神經網絡交換（ONNX）格式于2017年9月8日由微軟和Facebook聯合，并在12月了V1版本。ONNX是一個表示深度學習模型的開放格式，它使用戶可以更輕松地在不同框架之間轉移模型。ONNX由微軟、亞馬遜和Facebook等公司共同發起，宣布支持ONNX的公司還有AMD、ARM、華為、IBM、英特爾、Qualcomm等。谷歌不在這個陣營中并不令人驚訝，ONNX從一開始就支持Caffe2、MicrosoftCognitiveToolkit、MXNet和PyTorch，但與其他開源項目一樣，社區也已經為TensorFlow添加了一個轉換器。

深度學習框架在最近幾年之所以開源社區呈現爭奇斗艷的局面，究其原因還在于深度學習、深度神經網絡還處于快速發展的不成熟時期，同時深度神經網絡本身也存在很多令人不滿意的地方。比如圖7所示，對卷積神經網絡來說，右邊的圖像也被當做左邊的人臉被識別出來。因為CNN在訓練學習的時候，認為只要具備眼睛、嘴巴、鼻子、臉龐這些元素就認為是個人臉。所以在訓練的時候還需要對每個元素的空間關系進行學習。因此，最近兩年的生成對抗網絡研究異?；鸨，F在的深度卷積神經網絡雖然很有效，但并不是真正的仿生人類視覺神經元或者腦部的神經元。甚至卷積網絡的奠基者YannLeCun一度倡導大家把“深度卷積神經網絡”中的“神經”二字去掉，因為“神經”二字帶有誤導性。YannLeCun同時認為“在特定的領域，機器的確有超人的表現，但就通用智能而言，我們的人工智能甚至還不如老鼠聰明”。同時深度學習的另一個領導者GeoffreyHinton也認為，現在深度卷積神經網絡中的某些算法并不是很好，它們雖然有效，但是深度卷積神經網絡含有重大的缺陷。他一度坦言“卷積神經網絡中的池化（pooling）操作是一個巨大的錯誤，它運作良好將是一個災難”。雖然可以在卷積神經網絡中取消最大池化操作，但是仍然不能解決關鍵問題：“卷積神經網絡的內部數據表征不考慮簡單對象和復雜對象之間的重要的層次關系”，如圖7所示。因此需要尋找更好的神經網絡內部算法，打造更優秀的神經網絡結構和模型，才能夠在深度學習和人工智能領域進一步突破。對于深度神經網絡，除了算法、網絡架構、深度學習開源框架等方面的飛速發展，同時在提供算力的芯片平臺方面也同樣呈現百花齊放百花爭鳴的態勢。從前幾年英偉達的GPU一家獨大，到現在的TPU、FPGA方案，以及眾多傳統芯片巨頭以及眾多初創公司的新方案，芯片競爭也逐漸進入白熱化狀態。

三、安防領域的人臉識別應用

對安防領域的人臉識別應用來講，人臉深度特征提取的深度神經網絡算法或者說深度學習算法雖然是重點，但不是全部。如圖8所示為公安行業中一個單域的典型的人臉識別應用場景。在該類應用中，人臉從相機成像后并采集，需要在十萬級的動態比對庫中進行比對，實現布控告警。人臉還可能需要在千萬級的常住人口的人臉庫中進行檢索服務。還有可能對相機采集的每個過人人臉圖片在千萬級的常住人口的人臉庫中進行檢索。十萬級的動態數據庫，千萬級的人臉靜態數據庫，千萬級的過人數據庫，同時深度學習特征不同于一般的結構化信息，需要使用新型的比對和大數據存儲和處理技術。公安行業最近頒布的《公安視頻圖像信息應用系統》標準（GA/T1400-2017），其中包括了公安行業的人臉識別典型應用。如圖9所示，對于公安行業的人臉采集、人臉比對與識別、監控名單人臉庫動態布控，常住靜態人臉庫檢索服務，都必須符合《公安視頻圖像信息應用系統》標準的上下級的級聯以及公安專網和公安內網的級聯要求。通過以上分析可見，就僅僅針對公安行業的人臉比對和識別業務應用，是一個整體的解決方案，人臉檢測和人臉識別，尤其是人臉深度特征學習算法，雖然由于自身應用的技術正在經歷著突飛猛進的變革，但不是全部。對公安人員來講，最根本的是為他們提供高價值的整體服務。對傳統安防廠商，面臨著機遇和挑戰。對算法初創公司來講，也同樣面臨著挑戰和機遇。其最根本的問題是能夠為公安客戶創造有價值的服務，只是兩者出發的角度不同。尤其是對傳統的安防廠商而言，經歷了近20年的發展，其實已經經歷過一波波的IT技術革新，心態更穩。而對于頂級算法的初創公司來講，乘著技術浪潮之風，充滿激情的踏入安防行業。對于未來的格局如何，還在于給客戶何種有價值的服務。

四、宇視人臉產品

2017年6月，宇視科技了昆侖二代高性能專用計算平臺（如圖10所示），插CPU板卡可進行海量數據處理，能夠快速存儲和索引，多種數據進行時空碰撞；插GPU板卡則繼承全部昆侖一代的智能分析功能。昆侖二代=CPU通用計算+大數據內存計算+GPU智能計算，實現視頻調度、大數據、智能等全部安防算力的融合。除了昆侖二代，2017年10月深圳安博會期間，宇視科技深度智能攝像機『函谷』、人臉識別速通門『潼關』。深度智能攝像機函谷，凝聚了宇視對智能識別最強場景適應能力、最高抓拍率的承諾。函谷可實現最小40×40像素的人臉抓拍，并發最大抓拍人數可達40人。人臉速通門不僅保證快速穩定通行，還可防多重防尾隨、防反向、防夾等功能實現高安全防護；融合高速前置人臉識別，人臉識別準確率高達99.5%，現場體驗者好評如潮；宇視人臉速通門融合安防組網，實現統一存儲人臉圖片、統一管理人臉數據和統一展示人臉識別；具備高融合、高識別、高安全、高顏值四大特性，還可提供外形定制化服務。

作者：吳參毅　單位：浙江宇視科技有限公司

在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

人臉識別技術在安防行業中的運用范文

擴展閱讀