相信在人們的印象里,AI都是一個屬于“大多數”的技術門類。所謂大多數,第一意味著相關數據量大、便于累積,適用于AI對海量數據極度依賴的特性;第二意味著應用場景廣泛、便于變現回收成本,適用于AI研發的高門檻投入。
目前我們身邊常常出現的人臉識別、語音交互等等,其實都符合以上這些特征。不過這并不意味著,屬于“少數派”的AI是一片空白。現在,我們不如把目光投向于那些能夠消弭“少數與多數”區別的技術發展,例如服務于聽障人群的手語識別,就是一個典型的例子。
你我不懂的手語,為什么AI也很難讀懂?
手語是用手勢比量動作,根據手勢的變化模擬形象或者音節以構成的一定意思或詞語,是聽障人群獨有的一種溝通方式。但這種溝通方式雖然能讓聽障人士之間彼此溝通,或讓理解手語的普通人與之溝通,但仍然不能滿足聽障人士與普羅大眾之間的交流需求。
這便意味在一些社會公共空間之中,例如政務場景或服務業場景,聽障人士可能都會遇到一些不便。而AI,恰好成為了一種解決方案。
我們在一些軟件中,已經開始應用到了AI的手勢識別能力,像是拍照時“比心”來觸發一些AR特效。將這種對于手勢的捕捉,和手勢語義對應起來,不就能實現對于手語的翻譯和生成了嗎?
這一邏輯是正確的,可從邏輯正確到應用可行,卻還隔著一段不短的路程。

首先,手語的表達有一定的特殊性,想進行捕捉并不容易。我們知道在“比劃手勢”這種行為上,本來就不存在絕對的精準度,加之一些手語詞匯的表達非常接近,而且手語表達通常是以句子為單位,詞與詞之前不會有明顯的間隙。以往手勢識別中利用前置攝像頭捕捉的方式,基本是不可行的。
于是很多科技和團隊給出的解決方案是加以外設,例如中科大和微軟推出了基于Kinect的手語翻譯系統,加州大學曾經推出過的手語識別手套等等就是這樣。可這些外設要么便攜程度低,要么造價昂貴,推廣起來有很大的困難。
同時,手語表達同樣也有國別性和地域性,在模型通用性上存在著困難。手語中有“文法手語”和“自然手語”兩個概念,文法手語既是通用的普通話,至于自然手語則如同方言一般,在國別、地方甚至城市之間都有著不小的差異。這也造成了手語數據收集、標注會是一項成本高、工作量大的事情。
例如亞馬遜曾經提出過,對智能音箱Alex進行改造可以使其翻譯出一些簡單的信號。可是因為缺乏大規模的訓練數據集,目前這一功能只能識別出一些簡單的美國手語,停留在實驗室階段。
手語破題沒有秘法,AI產業本該平權
雖然探索艱難,但科技企業們和學界還是不斷在手語AI上取得成果。例如騰訊優圖實驗室推出的 “優圖AI手語翻譯機”、愛奇藝推出的AI手語主播等等,都在手語AI的應用上取得了不小的進展。
手語AI的突破可以分為兩條路線,一方面是手語AI本身技術的進展,另一方面是應用場景的突破。
在手語AI技術本身上,可以分為識別模型和數據集兩個解決路徑。在數據集上,可以像優圖一樣,通過和社會相關機構以及聽障人士的接觸自建手語識別數據集,并且針對手語表達的地方性差異,做出表達習慣和速度上的多樣性拓展。
至于識別模型上,業內也有全新的算法搭建概念,例如通過2D卷積神經網絡和3D卷積神經網絡分別提取手勢中靜態和動態的信息,經由綜合處理來提升視頻識別效果,徹底擺脫其他傳感器的桎梏。同時針對手語表達的整句化的現象,在視頻幀的最后加入了詞級信息挖掘,對特征提取器提出的信息進行核驗,進一步去確定手勢對詞語表達邊界,除了提升識別精準度以外,還能提升對自然手語中地域表達的總結能力。在此基礎上,還可以算法模型中引入了上下文理解能力,以便于面對更加復雜的手語識別翻譯需求。
不過技術雖然得以提升,應用場景端仍然會受到一些限制。例如手語識別可能會依賴較強大的算力,短時間內很難便攜化、消費化。但完全可以通過和政府的合作,讓手語識別進入一些公共服務場景。或者像愛奇藝一樣,從手語生成方面入手,同樣也能幫助到聽障人士。
其實我們不難發現,可如果將技術拆分來看就能發現,手語AI取得的進步,并不是因為在某項基礎科學上突然取得了什么驚人的突破,而是有越來越多的企業和學者在研發和數據累積上一貫長期的投入,才能解脫于以往手語語料庫匱乏的困境,在算法上不斷迭代。
換句話說,企業和學者們在“少數派”的AI技術中投入了幾乎與“大多數”AI技術相匹配的精力與財力。對于AI產業來說,這無疑是一種平權精神。
從以人為本到科技向善:我們為何要對技術洋流的引導更加主動?
騰訊優圖在手語AI方面的投入,其實也是AI產業中一種隱隱冒出勢頭的洋流方向。
幾天以前,在福州的數字中國峰會上,馬化騰首次提到了“科技向善”這一概念,提出“我們相信,科技能夠造福人類;人類應該善用科技,避免濫用,杜絕惡用;科技應該努力去解決自身發展帶來的社會問題。”
無獨有偶,李飛飛在回歸斯坦福后,就著手創辦了HAI研究所(以人為本斯坦福人工智能研究所),并在今年開始擔任所長。HAI的研究目標,就是推動AI技術向造福人類的方向發展,預測AI對人類生活的切實影響。
科技巨頭和學界旗幟都將目光投向了同一方向,是因為人們已經開始逐漸發現AI、5G、產業數字化等等技術力量的勢頭之強,已經到了不得不對其加以引導甚至約束的地步。
如同上文所說,科技企業在這一波技術發展的過程中,起到了很大的促進作用,而逐利自然是企業的本能和天性,因此企業會率先投身于那些滿足大多數人、應用場景廣泛、研發成本相對低的技術。
這種行為本身無可厚非,但AI等等新技術帶來的效率提升實在過于顯著,是否會會對那些暫時無法接入新技術的領域和群體進行擠壓甚至邊緣化,是很多人都在思考的一個問題。
例如隨著英漢日法俄等等主流語種的機器翻譯能力不斷增強,那些語料庫不充足、應用人數更少的小語種是否會因為得不到技術賦能,而被進一步的邊緣化?
同樣的,當公共事務辦理越來越多的被語音交互、圖像識別等等AI技術替代,聽障、視障群體在獲取服務時會不會遇到更多麻煩?
類似的情況其實已經發生:2018年年底,聯合國發布了對英國政府數字化成果的報告,結果是數據顯示在英格蘭,自2010年以來無家可歸者增加了60%,保障住房的等待名單上有120萬人,用來救濟窮人的食品銀行需求量增長了近四倍——因為很多貧困人群并不知道如何在互聯網上申請貧困補助,甚至家里都沒辦法連接互聯網,最終只能在貧困中越陷越深。
很多時候,即使是無惡意的技術,也可能會出現無法預測走向。我們對于科技向善的引導,或許應該更主動一些。
結束語
最后,我們不如來看看這樣一組數字:
據2017年北京聽力協會預估數據,我國聽障人群數量約達到7200萬。在全球范圍內,世界衛生組織發布的最新數據顯示,全世界有共計約4.66億人患有殘疾性聽力損失。
——你看,這世界上所謂“大多數”和“少數派”本來就是一個相對性的概念,并不存在黑白鮮明的區隔。尤其對于AI這種善于模仿人類能力的技術來說,它的存在本可以推倒阻礙各個群體溝通交流的空氣壁,而不是讓這種趨勢愈演愈烈。我們關于利用技術搭建美好世界的目標,既然可以不拋下任何一個人,就不該拋下任何一個人。
好在從服務于聽障人群的手語識別翻譯上,我們已經能看到這種趨勢走向——精于計算的大腦不是AI唯一的模擬對象,還有人類的熾熱心臟。我們相信,在學界和巨頭的引導之下,未來會有越來越多的企業關注到無障礙AI技術的發展,不斷的打破各種隔膜阻礙。
愛雖沉默,也有回響。
AI雖沉默,也有回響。
? ? ? 責任編輯:tzh
相關推薦
不懂編程沒關系,邀請您來學AI活動概述:本活動是現場講座,由臺灣知名AI教育專家、金門創新學院院長、臺灣Android技
發燒友學院發表于 2019-05-24 00:00
?
3656次閱讀

VR/AR行業在2016年經歷過一次“資本熱”,但是由于時機不成熟,隨后逐步降溫。VR/AR設備銷量....
發表于 2020-07-31 15:46?
3次閱讀

時至今日,隨著技術進步,騎自行車的人越來越多了。許多企業都在開發極具吸引力的自行車,使騎行更加安全、....
發表于 2020-07-31 15:06?
48次閱讀

工信部召開數字基礎設施建設工作推進專家研討會,工信部副部長陳肇雄指出,加快5G建設進度,力爭早日建成....
發表于 2020-07-31 14:57?
90次閱讀

其中,“征程1.0”主要應用于智能駕駛,能夠對路況進行實時監測與識別,實現車道偏離、車輛及行人碰....
發表于 2020-07-31 14:50?
85次閱讀

能夠在邊緣設備上運行大規模DNN模型。幾種框架和技術都支持模型壓縮,包括Google的TensorF....
發表于 2020-07-31 14:44?
35次閱讀

把圖片替換成聲音,深度學習就由圖片識別變為聲音識別。如果標注的是聲音對應的正文,就可以做語音識別,如....
發表于 2020-07-31 14:42?
78次閱讀

近些年,中國飲料市場群雄并起,各大飲料企業針鋒相對,各種飲料花樣層出不窮,競爭異常激烈。飲料企業要想....
發表于 2020-07-31 14:40?
32次閱讀

表面看起來保險行業一片繁榮,實則虛火不小,盡管還沒有斷崖式下滑的風險,但局部結構性危機已經顯現。
發表于 2020-07-31 14:37?
77次閱讀

IT部門以前做數據跟蹤報表,每次業務提需求基本是上午提下午要,給IT部門很大壓力,而IT部門引入數據....
發表于 2020-07-31 14:36?
64次閱讀

以“數字新基建,可信新生態”為主題的2020年可信云大會在北京如期召開。本屆大會由中國信息通信研究院....
發表于 2020-07-31 14:26?
23次閱讀

智能邊緣一體機將計算、存儲、網絡、虛擬化和環境動力等 產品有機集成到一個機柜中,在出廠時完成預安....
發表于 2020-07-31 14:23?
89次閱讀

移遠通信攜5G、LTE Cat 1、車載前裝、NB-IoT、安卓智能、GNSS以及Wi-Fi等多個領....
發表于 2020-07-31 14:20?
46次閱讀

報告指出,5G智能手機正在蓬勃發展,2020年第二季度在中國的出貨量為3900萬部,比第一季度增長了....
發表于 2020-07-31 14:10?
29次閱讀

愛陸通5G工業路由器三口AR7088H是一種物聯網無線通信路由器,利用公用 3G/4G/5G 網絡為....
發表于 2020-07-31 13:49?
12次閱讀

其中在國家新一代人工智能開放創新平臺展區,將集結15家開放創新平臺共同亮相全球智博會,彰顯作為國家人....
發表于 2020-07-31 11:57?
46次閱讀

周杰倫對中國風(《青花瓷》、《蘭亭序》)和拉丁曲風(《迷迭香》、《mojito》)的拿捏和把握,是建....
發表于 2020-07-31 11:54?
57次閱讀

“構筑萬物互聯的智能世界,共筑科技先享的出行體驗。”余承東所提出的正是華為作為5G汽車核心通信零部件....
發表于 2020-07-31 11:51?
121次閱讀

作為 “臉行貴陽” 項目的整體端到端解決方案提供商,國內領先的人工智能企業依圖科技也受邀出席了本次發....
發表于 2020-07-31 11:51?
53次閱讀

世界名校杜克大學的研究人員提出了一種AI算法,稱之為PULSE(PhotoUpsamplingvia....
發表于 2020-07-31 11:44?
55次閱讀

據了解,數據和語音呼叫是諾基亞在5G SA網絡上的第一次,其完成時間比計劃的提前,部分原因是諾基亞采....
發表于 2020-07-31 11:42?
42次閱讀

隨著時代的發展,“智能”這個詞匯已經成為科研、生活中的熱門詞匯,人工智能對于社會發展的重要程度已經被....
發表于 2020-07-31 11:32?
99次閱讀

作為全國領先的智能計算中心,“灃東新城智能計算中心”于6月正式發布了AI開放創新平臺——灃云平臺,平....
發表于 2020-07-31 11:30?
73次閱讀

面向年輕化的市場,那么游戲性能一定要有不俗的表現。Redmi 10X液冷散熱系統可以均勻、快速地給手....
發表于 2020-07-31 11:29?
136次閱讀

目前,國際標準化組織3GPP已經定義了5G的三大應用場景,其中eMBB是指3D超高清視頻等大流量移動....
發表于 2020-07-31 11:28?
43次閱讀

在數據和分析中的應用,區塊鏈可以會有較為亮眼的表現。實際上,區塊鏈技術提供了資產和交易的完整沿襲,為....
發表于 2020-07-31 11:28?
21次閱讀

受益于加速計算技術的不斷突破,機器學習、深度學習模型訓練和推理速度持續提升,加快推動了AI應用產業化....
發表于 2020-07-31 11:24?
85次閱讀

電力作為第二次工業革命以來最偉大的應用之一,對推動產業變革和社會發展發揮著無可替代的作用。 5G作為....
發表于 2020-07-31 11:21?
62次閱讀

本輪融資由中國國有企業結構調整基金(簡稱“國調基金”)、交銀國際、宏兆基金共同投資。在這幾家資方中,....
發表于 2020-07-31 11:21?
89次閱讀

目前國內三大運營商已經出臺了5G轉售相關政策,對于迪信通等虛商來講,搶占5G市場制高點尤其重要。5G....
發表于 2020-07-31 11:20?
50次閱讀

從各方面都可以看出,在企業越發重視推進自動駕駛道路測試的同時,政府也在為自動駕駛測試提供幫助。開放更....
發表于 2020-07-31 11:18?
88次閱讀

智能學習”豐富講解方式,知識掌握曲線學情可視化
發表于 2020-07-31 11:14?
130次閱讀

團隊一邊與浙江大學、中國殘聯合作,共同研究商品圖片無法被視力殘疾人閱讀的問題,一邊邀請盲人測試者參與....
發表于 2020-07-31 11:08?
126次閱讀

在人們對5G展示最大熱情的時候,Wi-Fi6也悄然出世。
本文首先簡要回顧Wi-Fi和蜂窩網絡的發....
發表于 2020-07-31 11:08?
84次閱讀

中國對于創新藥的研發有著非常強烈的需求,但對創新藥研發歷史較短,經驗不足,而且研發投入的巨額資金和長....
發表于 2020-07-31 11:03?
143次閱讀

今年以來,國家大力推動新基建部署,5G作為新基建七大領域之首,定位網絡信息基礎設施,肩負推動經濟社會....
發表于 2020-07-31 11:01?
111次閱讀

*ST北訊公告,公司、廣訊全通及全通控股簽署《投資合作框架協議》
發表于 2020-07-31 11:00?
63次閱讀

近日,2020共贏未來全球線上峰會隆重舉行。在本次峰會上,華為云核心網產品線總裁劉康發表了主題演講,....
發表于 2020-07-31 10:57?
39次閱讀

“隨著新基建的大力建設,我們相信未來兩三年之內,萬物互聯將逐漸走向全場景智能感知的時代。” 付強介紹....
發表于 2020-07-31 10:56?
57次閱讀

2020年7月30日,中興通訊憑借面向5G的分布式云解決方案,在2020可信云大會上榮獲“可信云技術....
發表于 2020-07-31 10:53?
13次閱讀

5G發展的重要性不言而喻,作為新一代科技革命的代表技術,5G已經給未來全球經濟發展注入了新的動力。
發表于 2020-07-31 10:52?
89次閱讀

就制造業而言,對廣大一線工作者的使用場景進行降本增效已經是普遍需求。面對“降本增效”的問題,通過“混....
發表于 2020-07-31 10:52?
68次閱讀

專家表示,盡管5G技術相對于上一代無線技術有了巨大的改進,但推動5G進入新頻段的許多動力來自老式的物....
發表于 2020-07-31 10:48?
16次閱讀

中國移動北京公司(北京移動)近日宣布,中國移動首個基于SPN網絡的5G業務自動部署系統已在北京完成全....
發表于 2020-07-31 10:48?
51次閱讀

近日,北京聯通率先完成5G SA網絡端到端切片的業務測試,快速構建網絡切片能力,推出了5G SA網絡....
發表于 2020-07-31 10:47?
28次閱讀

另外,5G基站的建設成本和維護費用也遠超同等規模的4G基站。這也成為限制運營商大規模推進5G網絡建設....
發表于 2020-07-31 10:42?
29次閱讀

時代潮頭,“新基建”被看作是中國經濟發展的新動能,推動著萬物互聯與協作通訊的實現與發展。如何在此浪潮....
發表于 2020-07-31 10:41?
96次閱讀

隨著國內5G的正式商用,到今天已經有一年多的時間了,期間伴隨著互聯網、移動化等產業趨勢的不斷深入發展....
發表于 2020-07-31 10:35?
84次閱讀

在運行性能方面,該開源應用套件在底層算法邏輯中維護"人臉底庫",可以充分提升人臉識別速度,以RK32....
發表于 2020-07-31 10:33?
97次閱讀

計算機視覺:深度攝像頭可以將更精確的視頻信息捕捉下來,然后通過人臉識別技術將所捕獲的人面部的骨骼輪廓....
發表于 2020-07-31 10:30?
129次閱讀

搜狗AI錄音筆S1顏值出眾,能專業拾音,快速錄音,實現錄音轉文字,連翻譯功能更是較之前的型號產品升級....
發表于 2020-07-31 10:25?
49次閱讀

5G 愿景的真正實現,還需要更多創新。網絡基站和用戶設備(例如:手機)變得越來越纖薄和小巧,能耗也變....
發表于 2020-07-31 10:23?
48次閱讀

據悉,Google旗下的DeepMind已經成為AI領域的明星,最初成果主要應用于模擬、電子商務、游....
發表于 2020-07-31 10:21?
119次閱讀

由 RFMD 和 TriQuint 于 2015 年合并成立的新公司 Qorvo 是射頻市場當之無愧....
發表于 2020-07-31 10:13?
37次閱讀

目前,客戶已經采用這些參考架構來構建自身的DGX POD和DGX SuperPOD。其中包括美國最快....
發表于 2020-07-31 10:08?
176次閱讀

5G 時代的到來為智能手機帶來了新的增長機會,據 Strategy Analytics 近日發布的最....
發表于 2020-07-31 09:58?
45次閱讀

今日,在2020共贏未來全球線上峰會(Better World Summit 2020)云與計算分論....
發表于 2020-07-31 09:33?
37次閱讀

2026年,LTE產品組合將繼續是主要的移動技術,占全球移動用戶的50%以上,而5G用戶基數將增長到....
發表于 2020-07-31 09:26?
53次閱讀

發表于 2020-07-22 10:20?
102次閱讀

基于Android平臺實現人臉識別
發表于 2020-06-02 17:38?
204次閱讀

使用君正x1830人臉識別開發板做條碼識別,如何選擇sdk?還有音頻播放怎么使用?
...
發表于 2020-06-01 09:41?
160次閱讀

我在用USBcloner燒寫uboot,win 10環境,開發板USB口接電腦,識別出是Android設備,在USBCloner中選擇配置...
發表于 2020-06-01 09:25?
123次閱讀

請問x1830人臉識別開發板,開機偶爾會停留在開機頁面,顯示logo不進入系統,而且使用半小時后越用越卡是什么原因?
...
發表于 2020-05-29 17:24?
297次閱讀

請問君正X1830人臉識別開發板上的雙攝像頭是什么型號?
...
發表于 2020-05-29 16:11?
173次閱讀

1、支持5M@30fps camera;(最好25fps以上)2、支持USB HID slave協議(作鍵盤輸出);3、支持OS05A10 se...
發表于 2020-05-28 13:48?
293次閱讀

隨著我國經濟的發展和人口的增長,大城市交通狀況日趨惡化,各大城市將城市軌道交通作為城市基礎設施建設領域的投資重...
發表于 2020-05-12 08:28?
161次閱讀

方案特點:本人臉識別解決方案基于君正X1830芯片,硬件上提供了turnkey級的硬件參考設計,具有低成本高性能的優勢,...
發表于 2020-05-09 13:50?
1040次閱讀

一個簡單的人臉檢測Demo
發表于 2020-04-08 17:49?
152次閱讀

評論