AI出手 避免6000件未成年者性交易悲劇

圖片來源:Shutterstock

作者:陳良榕

「一個15歲女孩,離家去見一個自稱17歲的網友。此人真實身分卻是個36歲、剛出獄的逼良為娼前科犯。48小時之內,她被迫上網刊登援交廣告,自稱18歲。」

11月28日,美國西岸時間早上7點,賭城拉斯維加斯。

亞馬遜網路服務(AWS)開發者大會第一個主題演講正要開始。多數與會人士仍睡眼惺忪,「全世界大概只有亞馬遜會排這種時間,」一旁的台灣媒體嘀咕著。

但當應邀出席的著名兒童援救機構棘刺(Thorn)執行長柯度娃(Julie Cordua)開始演講,她丟擲過來的冷硬事實,讓所有人瞬間清醒。

「在這個國家,每個小時都有數百個小孩,被迫在網路上性交易。」

她在螢幕上秀出一張剪報。「這是一個15歲女孩,離家去見一個自稱17歲的網友。此人真實身分卻是個36歲、剛出獄的逼良為娼前科犯。48小時之內,她被迫上網刊登援交廣告,自稱18歲。」

然後悲劇戛然而止。「棘刺及時通知當地警察,48小時之內,女孩被救出。」

棘刺與亞馬遜合作開發的AI系統,能從網路上的數千則色情廣告中,篩出有「被逼迫、未成年」氣息的幾則。因此,在過去兩年半時間,讓6000個未成年受害者逃出虎口。柯度娃一說完,滿堂觀眾頓時大力鼓掌。

11月初,英特爾執行長科再奇在里斯本Web Summit的主題演講,也介紹英特爾與美國聯邦政府合作的拯救失蹤兒童計劃(Intel Inside, Safer Children Outside)。他說,這是「用人工智慧行善」(AI for Good)的首例,同樣贏得滿堂彩。

透過AI人臉辨識的功能,從舊照片分析臉部特徵,得以由不同角度、光線、表情的照片,識別出失蹤兒童。圖片來源/英特爾官網

中國微軟則與吉林省的民間尋人組織「寶貝回家」合作,比對失蹤兒童與全中國各地收容所的1.3萬張兒童照片,順利找到一個失蹤4年的廣州唐氏症男孩,並在2016年登上一個尋人電視節目。

爸爸抱著已經17歲的兒子,在全中國千萬觀眾面前痛哭失聲。

這些科技企業樂意暢談他們如何用最先進的AI技術協尋失蹤兒童,理由容易理解。第一,感人。第二,不會有人因為工作被取代而憤怒。

最重要的是,效果實在好到令人難以置信。與棘刺合作的部份警政單位,破案效率大幅提升65%。

與英特爾合作的半官方機構——美國國家失蹤與受虐兒童援助中心(NCMEC),找到失蹤小孩的平均時間,從33天大幅縮短到驚人的一天。

圖像辨識 揪出人眼看不到的小細節

這些小孩與他們的家人,堪稱這一波「深度學習」革命,最早也最特別的一批受惠者。

AlphaGo轟轟烈烈的兩場棋王大戰,讓全世界都記住「深度學習」,也知道它是這一波AI革命的核心技術。(延伸閱讀:AlphaGo贏中國棋王,戰力1年提升多少?

但其實,在圍棋之外的若干專業領域,深度學習激起的變革,甚至更早、衝擊更大。例如,電腦視覺領域的AlphaGo時刻,便出現在2012年。

該年,史丹佛大學AI實驗室主辦的ImageNet圖像辨識比賽,出現驚人大突破,多倫多大學深度學習大師辛頓(Geoffrey Hinton)麾下兩位博士生所組團隊,辨識成功率竟一舉達到第二名的接近2倍。(延伸閱讀:世界公認的「深度學習之父」,為什麼也跑來加拿大?

該團隊首度採取的深度學習方法,快速被Google、臉書等全世界最傑出的研究團隊跟進,整個領域進步神速。到了2015年,位在北京的微軟亞洲研究院團隊發表論文,首度讓電腦視覺達到超越人眼辨識的水準。在ImageNet的五萬張測試圖片,辨識錯誤率降低到4.94%,超越人類的5.1%。

微軟將這個位居全球最頂尖之林的演算法,用在人臉辨識,可以分析27個不同臉部特徵,從不同角度、光線、表情的照片,識別出同一人;甚至連長大幾歲、容貌已改變不少的失蹤兒童,都可以認出。

經過海量訓練數據,「我們的系統自動學習到,哪些人臉區域和相貌特徵不會隨著年齡改變,」負責人臉識別核心算法的微軟亞洲研究院資深研究員陳博表示。

英特爾大變身:進軍電影、汽車,還會救小孩

英特爾的拯救失蹤兒童計劃成員、資料中心事業群首席資料科學家羅傑斯(Bob Rogers)讓《天下》記者嘗試從一張失蹤男孩(真實案例,已找到)的大頭照,去人工比對資料庫隨機挑出的幾十張和他一樣是褐髮、黑眼特徵小男孩的照片。

「裡頭有一張是他被找到時的模樣,」羅傑斯說。

哪一張?記者花了大半天挑了幾張,都被打槍。實在太難了,髮型、攝影角度、體型,有太多變數干擾。

羅傑斯接著執行英特爾的辨識程式,不到一秒時間,馬上找出正確答案。

這個程式,現在忙著處理臉書等網站業者每天主動傳送給NCMEC、平均2萬多筆的可疑線報。

這些線報裡頭,相當大部份是網站刊登的色情與援交廣告或訊息。英特爾的深度學習軟體,會將裡頭的圖片臉孔,與NCMEC資料庫裡頭數十萬筆失蹤小孩的照片比對。

如此複雜的工作,過去光靠該組織25個分析師整天靠肉眼比對,根本無法負荷。

金髮、高大的英特爾資料中心事業部副總裁兼IT變革事業部總經理戴維斯(Lisa M. Davis)親自負責這個專案。她曾在美國聯邦法警局擔任資訊長,兩年前,她的前上司、前聯邦法警局局長克拉克(John F. Clark),轉到NCMEC擔任總裁,問她:「英特爾可以幫忙嗎?」

這個詢問來得正是時候。英特爾為了迎接AI時代,整個營運方式開始轉型,開始走出去,為客戶提供諮詢服務,如同微軟、IBM20年前在網路時代降臨時做的轉型。

老字號的英特爾開發者大會(IDF)今年甚至停辦。取而代之的,是分散世界各地的中型研討會,例如《天下》參加11月在紐約召開的首屆Shift大會,到場的是數百個金融業、媒體與醫療業的客戶,個個西裝楚楚,與過去多是穿著牛仔褲的工程師大不相同。

於紐約舉行的英特爾Shift大會,讓數據工程師與來自金融、醫療等產業的客戶齊聚一堂,擴展各自人脈。圖片來源/英特爾官網

「英特爾過去說的常是:CPU要多快?」羅傑斯說,「現在則是:幫助顧客搞清楚,這東西對我的意義是什麼?我的角色是什麼?把顧客的需求連結到我的產品線。」

「我們現在也是一家解決方案公司(Solution Company),」戴維斯對《天下》記者說。

例如,英特爾用來尋找失蹤兒童的人臉辨識技術,也可用來幫老電影公司活化舊資產。華納兄弟便使用這個技術,去辨識該公司瀚海般的老電影庫存,讓電腦精確找出每個演員的所有演出片段,方便剪出各式各樣的懷舊電影片段集錦。

英特爾近年來致力跟上AI浪潮。一連串併購,包括高價收購自駕車晶片先驅Mobileye,以及低功耗晶片公司Movidius,都是電腦視覺相關公司,只是分別專注在自駕車、無人機與VR裝置等不同的應用場景。

這家矽谷元老的諸多轉型努力,華爾街看在眼裡。11月開始,接連發布的外資報告力挺英特爾。大和證券認為英特爾在AI領域的能力「被市場低估」。

《霸榮週刊》在11月初,喊出英特爾股價未來一年可漲25%。

英特爾的市值在7月到11月這一波足足漲了45%,又重新超過台積電,奪回全球半導體市值龍頭的寶座。

電腦視覺感知 掀起新風暴

深度學習加持下的電腦視覺,因為應用廣泛,已在醫療、安控、無人機以及工業應用等領域,掀起變革波瀾。(延伸閱讀:中國新創Airdoc 用AI讓智慧醫療無所不在、逆境中大膽加碼 台灣安控大廠看到什麼機會?

斯迪富融資公司分析師卡西迪(Kevin Cassidy)認為,整個電腦視覺晶片市場,包括用在無人機、安控攝影機、機器人、汽車市場,會在2021年達到30億美元規模,年均複合成長率超過30%。

更關鍵的一點,被看好將在幾年後大爆發的無人車浪潮,最核心的技術之一,也是電腦視覺。2018年將在世界各地上市的大改款奧迪旗艦車A8,便採用英特爾旗下Mobileye視覺技術。

這是世界第一款擁有歐規第三級自駕能力的量產汽車。遇到塞車、停停走走時,駕駛可以將雙手放開方向盤,看手機或報紙,電腦會自動剎車、加速,甚至急轉變換車道。

好像回到1995:這次,衝擊將大過網路

《天下》採訪團隊於3個月期間,走訪紐約、西雅圖、北京、拉斯維加斯,直擊亞馬遜、微軟、英特爾三大科技巨頭,最新的AI佈局。

在這些現場,許多人臉上帶著情不自禁的喜悅,辦公室的空氣都洋溢著興奮的氣息,

這個氣氛很眼熟,不少資深業界人士都回想到,網路科技剛出現的時期。

「很像1995年的時候,」曾任微軟人工智慧部門亞太研發總監、回台灣創立AI實驗室的杜奕瑾說。

為何是1995年?原來該年史上第一個純網路股網景上市,一天之內大漲208%,引爆之後浩浩蕩蕩的「.com」熱潮。

杜奕瑾是台灣網路先驅,學生時代架設著名的批踢踢實業坊(PTT),更參與創立當時台灣最大的蕃薯藤網站。日後到美國,又因緣際會投入AI,屬於微軟語音助理Cortana研發團隊的核心成員。

有「創世神」、「PTT之父」之稱的杜奕瑾,曾任微軟人工智慧部門亞太研發總監,今年3月辭掉微軟工作、返台創立AI實驗室。圖片來源/王建棟攝

他說,AI的應用層面極廣,「我看到的是一片藍海無限可能,看到所有產業,包括醫療、金融都可以做,那不就跟當年的.com一樣?」

另一個也在最近離開大企業創業的AI重量級人物、前百度首席科學家吳恩達,在《時代雜誌》採訪時說,他認為深度學習的衝擊,甚至將大過網際網路,「就像100年前,電力改變了每一個產業,AI也會一樣。」

深度學習加持 繞過「波蘭尼悖論」

因為,深度學習解決了AI領域的一個百年難題。

人類有很多複雜的能力,都是「憑感覺」執行,自己無法清楚描述、歸納,因此也無法寫成程式,用電腦複製這個能力。

麻省理工史隆管理學院主任研究科學家麥卡菲(Andrew McAfee)與該校管理學教授合作的新書《機械、平台、群眾》解釋了這一點:

「人類的許多能力中存在這樣的不自知,從在車流中駕駛汽車,到辨識一張面孔。對於這一個特別現象,匈牙利出生的哲學家、科學家波蘭尼(Michael Polanyi)有精彩的概括,他說,『我們知道的,比我們講得出來的還多。』這種現象後來就被稱為『波蘭尼悖論』(Polanyi's Paradox)。」

深度學習另闢蹊徑,繞過這個理論限制。只要灌入海量的註記過資料,電腦就可從這些資料當中,自行找出這些細微的模式,「學會」人類最精巧的技藝。

這麼厲害的科技,為什麼直到最近,才開始為世人所用呢?

「大家都說,是因為網路累積的大數據,」前Google北京研究院副院長、宏達電資深副總張智威,在台灣人工智慧年會演講時自問,「但是大數據已經講了10年了,為什麼到最近2、3年,深度運算才受到矚目?」

原因是,學界後來發現,原來「量變會帶來質變」。當輸入電腦模型的資料集從原先的數十萬份,增加到百萬甚至於千萬份時,電腦模型預測的精確度,會跳躍性地提高10%、20%,大幅增加預測的可信度。

「產業發現AI再也不是可有可無,而成為企業生死存亡的關鍵時,」張智威說,「整個產業就井噴了。」

各大科技企業紛紛擁抱AI。Google執行長皮蔡在1年前宣示,企業目標從「行動優先」,轉向「人工智慧優先」(AI First)。

納德拉(Satya Nadella)3年前接任微軟執行長以來,多次提及公司目標是「行動與雲端優先」。但最近出爐的2017年微軟年報,AI也取代行動業務,成為優先之一,且年報中六度提到AI,反觀去年則隻字未提。

連過去力挺物聯網的台積電董事長張忠謀,都在最近改口:「台積電在未來10年,會大力投入AI。」(延伸閱讀:Google兩大祕密武器 以AI雲挑戰亞馬遜、台灣AI大神 如何推42歲微軟成功轉型?

自然語音 引爆電腦介面革命

2016年,微軟語音辨識團隊,首度達到與人一樣水平的辨識精度。

於是,繼電腦視覺之後,自然語音成為第二個百家爭鳴的新商機。

「語音,將是機械學習造就的下一個顛覆!」

洪厚聲音傳自美國拉斯維加斯最大的室內場地,美高梅大花園體育館擠滿將近2萬名來自世界各地的工程師、記者,專注聆聽亞馬遜技術長威格爾(Werner Vogels)一年一度的主題演講。這是AWS開發者大會的重頭戲。

高壯、理著大光頭、穿著西雅圖著名搖滾樂團「幽浮一族」黑色T恤上台的威格爾,繼續他的下一個預言:「自然語音,將是21世紀新一代電腦系統的主要介面。」

亞馬遜夠資格這樣說。因為靠著大熱賣的智慧喇叭Echo,全美已經有超過1千萬家庭,回家後可以邊解開領帶邊說,「Alexa!播放五月天的最新專輯。」便能即時享受音樂舒壓。甚至可以靠語音開燈、開冷氣,因為開利的空調、飛利浦的智慧燈具,也都內建語音助理Alexa。

亞馬遜已在短短2年內,打造出全球最大的語音生態系,成功攻佔美國家庭的客廳。逼得蘋果、Google甚至微軟,也都跟著推自己的智慧喇叭。

亞馬遜的下一步是什麼?當然是攻佔辦公室了。

威格爾隨即發表「Alexa企業版」,只要放一台Echo喇叭在會議室中間,就能輕鬆命令電腦「關燈、播放投影片」,發現會議室被佔了,也可直接問Alexa,「哪裡還有空的會議室?」

他一再強調,語音是溝通最自然的方式。

事實上,美國已經有不少金融機構與亞馬遜合作,推出語音銀行的服務。例如,前身是通用汽車金融部門的純網路銀行Ally Bank。(延伸閱讀:最貼心的語音助理 陪你聊天、幫你理財,還會寫歌給你聽!


【小辭典】
1. 人工智慧(AI)
任何一種可以讓電腦模仿人類智能的技術。
2. 機器學習
人工智慧的一支,用統計技術讓電腦可藉由累積經驗改善能力。