淡江學術圈 2021/03/01

【淡江學術圈】張志勇以自然語言處理 提供企業AI解決方案

資訊工程學系特聘教授張志勇

學歷:中央大學資訊工程所博士

專長:物聯網、人工智慧、嵌入式系統、無線網路、機器人與雲計算、智慧居家照護、物聯網/雲/大數據整合

現任:淡江大學資工系專任特聘教授、淡江大學工學院物聯網與大數據中心主任、北京交通大學兼任客座教授、安徽滁州學院兼任特聘教授、Chair of Taiwan ACM SIGMOBILE Chapter

經歷:教育部教學實踐研究計畫複審委員、科技部資訊工程學門複審委員、國立聯合大學資工系系務發展諮詢委員、財金資訊股份有限公司顧問、弘富寬頻科技股份有限公司顧問、電腦技能基金會物聯網智慧應用與技術證照講者、教育部無線感測網路協定與應用教材優等獎、教育部嵌入式無線感測課程模組教材特優獎、教育部物聯網概論教材優等獎等

文/張容慈

研究緣起

本校資工系教授張志勇日前組隊「AIGOing」、「AI悍將」、「AI 因由夫來」,以及「廸普學習」參加經濟工業局主辦「109年度AI智慧應用新世代人才培育計畫-人才解題構想」中,在自然語言場次之12案入圍得獎奪下5案外,為酷訊搜索、內政部統計處、巨鷗科技等企業的完成客服機器人的服務需求。其中「AI 因由夫來」、「AI悍將」,以及「AIGOing」在「AI出題實證」項次中獲得佳績,「AI 因由夫來」獲得特優獎、「AI悍將」和「AIGOing」各得到佳作。

自然語言處理(Natural language processing)是種透過複雜的數學模型及演算法讓機器去認知、理解並運用人類語言的一樣科技技術,隨著AI趨勢的發展,自然語言處理(NLP)逐漸運用於各產業的應用領域。張志勇說明,產業數位轉型及邁入AI化實屬不易,政府為推動產業轉型及解決產業面臨轉型遇到的痛點而舉辦此競賽,提供平臺讓產業提出轉型遇到的問題,由經濟部工業局先行審核問題是否可以AI解決後再將問題公告,邀集全臺學術與產業界各方人馬參與比賽為企業提供解決方案,「也透過這樣的賽事讓研究生可以實務學習了很多AI技術,並增加對議題的挑戰,從競賽中實作產學案,與產業界建立連結關係,來降低學用落差。」

研究歷程

AI炙手可熱,產業界也不想落後積極投入,隨著AI技術的推陳出新,能提供的解決方案越來越多元,張志勇以自然語言處理(NLP)為產業界解決客服機器人、下標題、選擇關鍵字及簡介短文等問題,他分享,透過NLP技術為酷訊搜索股份有限公司設計「人工智能廣告關鍵字文案推薦」系統,可建立吸人眼球的廣告標題及自動生成廣告短文,讓該公司可以減少人工作業,以利將訊息推播於網路世界中。

機器可以辨識人類語言,並可以組合和回應人類的提問,張志勇解釋,過去的NLP 技術主要基於統計的概念去訓練模型,讓演算法閱讀大量類似字典的文章段落,再讓演算法計算單字、句子出現的機率,所以組合出來的文字和段落會很生硬,但隨著深度學習與演算法模型的突破,就能提出符合企業需求的更好的訓練方式,他舉例,將文章斷詞斷句後分析語意時,遇到「好棒」就必須當作「好評」處理,若遇到「好棒棒」其實不一定是好評,這時,就須將每個字詞轉為語意向量,再將這語意向量輸入提供給電腦辨識,將資料貼上不同的標籤類別,反覆訓練機器尋找特徵,讓機器從眾多資料中學習,並再組合成符合人類語言的段落字句,「我們使用的是深度學習技術及python語言,設計深度學習模型後,使用Google雲端系統及GPU圖形處理器(Graphics Processing Unit),處理深度學習問題,深度學習即是機器學習的其中一種方法,這如同將一堆的樂高積木分門別類,再將各式各樣的樂高分成不同層面,如顏色、形狀等,透過演算法找特徵分類,再組合成語句。」

聽起來似乎很簡單,但在架構系統時卻沒有想像中輕鬆,要將全部的文章變成電腦可辨讀的方式,需要做好充分準備,張志勇指出,以「人工智能廣告關鍵字文案推薦」系統為例,在架構前須將歷年文章透過深度學習的方式,分類人、事、時、地、物,切割文章並利用斷詞軟體標示標籤,再將文章中的句子挖空,將人、事、時、地、物等重要關鍵字挖空,留下句型公式,套用需要使用的關鍵字;短文生成的部分則會抓該篇文章重點的關鍵字前後50字,將這50字相互拼湊,觀察閱讀起來較為順暢的方式,先組合成約500字的文章段落後,再從中擷取重點組成為25字的短文說明,最後,再將成果文案與專家討論,持續修正語句間的邏輯與順暢度,以利於企業使用。

張志勇表示,AI技術和數據是冰冷的,只有能將系統運用到人類的需求才有溫度,因此會教導研究生在執行案子時必須謙卑地向廠商需求訪談、了解數據對廠商的意義為何,確實了解廠商的需求後,再來提出解決方案,「因為若只以技術為本位,卻沒有思考人家要什麼,這樣無法確實解決問題,所以在產學合作過程中,鼓勵學生要換位思考,並在研究過程要不斷修正,才能產生雙方滿意的成果。」

提及研究過程遇到的瓶頸,張志勇認為,目前仍無法做到百分之百讓人滿意的標題,文案也無法做到與專家相等的程度,「其實這也是AI目前的瓶頸,至今人工智慧無法像人類一樣。人類是可全面性地學習並累積經驗,AI無法全面地透過資料來掌握經驗,現在在發展『可解釋的AI』,目前無法評估AI學習過程是否正確,但這對於醫療類需要精密正確度的領域來說相當重要。」

本校於109學年度起正式成立「AI創智學院」,並在工學大樓三樓設置實境場域,其中「Q/A互動」就是由張志勇所設計「淡江選課QA機器人」系統,讓全校師生可以語音方式查詢本校課程,並設置「自動應答方案」和「同音字辨識系統」,即使麥克風進行語音轉文字時,將老師名字或是課程名稱轉譯錯誤,只要是同音字,系統都能正確回答。張志勇分享,自然語言領域之中,同音異字及發音的問題是最需要克服的難關,目前已解決同音異字的瓶頸,還有縮讀等等問題皆已克服,然而發音尚且努力中。

研究特色和研究展望

整體來說,人工智能廣告關鍵字文案推薦系統透過AI技術,能夠幫助廠商大幅減少人工作業時間,這套系統尚未有實體成果,但是已可透過模擬及評估的方式了解運作狀況,相信未來的成果能夠幫助媒體界在下標題、選取關鍵字及簡述短文方面節省不少時間。張志勇說明,整體系統跳脫傳統模式,雖是機器運作產生的產物,卻富有人情味,「團隊成員除了有本校師生外,還有他校教授加入此陣容,產業界相當實務,成員們仔細考量產業的需求,透過專業技術與持續修正,最終得以在競賽中脫穎而出,也期許透過這類的產學合作,降低學用落差,同時幫助學生學以致用,增加實務經驗。」另外期許透過參與競賽及展出成果,各方觀摩,幫助使用者的生活變得更加便利,同時展示淡江的實力堅強。

研究聚焦

。近期學術演講

1.2020/9/17, 紡織工會:當傳統產業遇見人工智慧

2.2020/9/9, 臺北大學:深度學習與產業案例分享

3.2020/8/21, 遠傳電信:物聯網概念與產業應用

4.2020/8/7, 經濟部專業人員培訓中心自然語言處理演講

。近期獲獎榮譽

1.2019/11/06, 經濟部工業局AIGO優等

2.2019/11/27, 經濟部工業局AIGO傑出

3.2019/11/27, 經濟部工業局AIGO佳作

。近期研究獎勵

1.2019/08/01, Cooperative Data Collection Mechanism Using Multiple Mobile Sinks in Wireless Sensor Networks, Sensors 18(8 ), 2627

2. 2019/08/01, 物聯網智慧應用與實務, 五南

3. 2019/08/01, QoS guaranteed surveillance algorithms for directional wireless sensor networks, Ad Hoc Networks 81, p.71-85

4.2019/08/01, SPA: Smart Parking Algorithm based on Driver Behavior and Parking Traffic Predictions, IEEE ACCESS 7, p.34275-34288

5.2019/08/01, Towards Human Activity Recognition: A Hierarchical Feature Selection Framework, Sensors 18(11), 3629

。近期發表論文

1. 2019/10/25, 「Towards Human Activity Recognition: A Hierarchical Feature Selection Framework」, Sensors 18(11), 3629

2.2019/06/12, 「Maximizing Surveillance Quality of Boundary Curve in Solar-Powered Wireless Sensor Networks」, IEEE ACCESS 7, p.77771-77785

3.2019/08/10, 「Cooperative Data Collection Mechanism Using Multiple Mobile Sinks in Wireless Sensor」, Sensors 18(8), 2627

。近期參與研究計畫

1.2020/08/01, 可充電式無線感測網路中最大化網路連通性與監控品質之行動充電車充電策略

2.2020/06/01, 109【產學合作計畫-基於人工智慧之專案支援系統設計與實作】

更多學術研究內容,請見本校教師歷程系統(http://teacher.tku.edu.tw/) 以「張志勇」查詢。

NO.1119 A | 更新時間: 2021/03/01 | 點閱: 145 | 下載:

  • 版權所有:淡江時報社
  • 電話:02-26250584
  • 傳真:02-26214169
  • 建議使用 Chrome 瀏覽器
  • 個資相關問題請洽受理窗口,分機2040
  • 管理者:潘劭愷 / 建置單位:淡江大學資訊處
  • 更新日期:2021/4/9 上午 10:30:03
  • 線上人數:5