[對話式AI-5] 基於知識庫的問答系統實作方法

# 問句分析 (Question Analysis)
問句 = input("請輸入你的問題: ") 
代表問句的一組資訊詞 = 問句分析(問句)
使用者意圖 = 意圖識別(代表問句的一組資訊詞, 知識圖譜)

# 片語映射 (Phrase Mapping)
if (使用者意圖 == Null)
  問句 = input("我不懂你的意思,請換個方式告訴我: ")  
else if (使用者意圖 == 特定服務)
  服務所需的一組資訊詞 = 所缺的資訊詞填入預設值(代表問句的一組資訊詞)
  問句資訊詞的本體 = 自然語言映射到本體(服務所需的一組資訊詞, 知識圖譜)

# 查詢建構 (Query Construction)
  答案的關鍵內容 = 查詢(問句資訊詞的本體, 各種API服務)
  答案的本體 = 服務映射到本體(答案的關鍵內容, 知識圖譜)
  一組候選答案 = 產生答案(答案的本體, 知識圖譜)

# 消歧 (Disambiguation)
    一組候選答案 = 消歧(一組候選答案, 服務所需的一組資訊詞)

# 答案生成 (Answer Generation)
  一個答案 = 排序(一組候選答案)
  回答 = 轉換成自然語言(一個答案, 回答模板)
print(回答)

[對話式AI-1] Chatbot的類型與對比(問答、對話與閒聊系統)

由於常常跟客戶和外部工程師雞同鴨講,最後發現大家對聊天機器人的定義都不一樣;你知道Chatbot可以分成三類嗎?對話式AI專欄的第一篇,就來介紹一下「各類Chatbot的用途」,並針對「開發方法」、「特點」、「關鍵評價指標」及「應用場景」等進行深入對比,讓你一次搞懂Chatbot,不再一知半解。

類別問答系統任務導向對話系統閒聊系統
英文Question Answering systemTask-Oriented Dialogue systemChit-Chat Dialogue system
功能回答使用者問題代替使用者完成任務陪伴使用者閒聊
領域特定領域特定領域 開放領域
方法基於Web檢索、基於知識庫、基於社群模組化(基於規則、資料驅動)、端對端(資料驅動)基於檢索、基於生成
特點單輪對話,著重問句分析(識別資訊詞)多輪對話,著重對話管理多輪對話,著重個性化及情感分析
關鍵指標召回率(Recall)、精確率(Precision)、F-Measure任務完成率、對話耗時、對話輪數、機器模擬使用者評分詞重疊率、詞向量距離、機器模擬使用者評分
應用場景FAQ、教育助理、訂票閒聊、陪伴
知名案例IBM WatsonSiri、Google Assistant微軟小冰、SimSimi
實作方法基於知識庫的問答系統模組化的任務導向對話系統應用搜尋引擎檢索,或訓練Seq2seq模型生成

[對話式AI-8] 研發部門與開發流程介紹

本文以筆者所任職的公司為例;在不涉及公司機密的前提下,介紹人工智慧產品研發的「相關部門、開發流程及工作內容」,為大家揭開AI產業的神秘面紗。

公司主要業務是為電信、金融、政府及電商等領域,導入AI技術、自然語言處理(Natural Language Processing, NLP)技術、系統整合及平台建置,最常幫一些大型機構建置Chatbot及呼叫中心等系統,協助提升客戶服務,並降低人力需求。

AI公司的組織架構

一般AI公司研發中心可以分為下列部門(舉例),橫向為各部門名稱,縱向為組織架構:

  • 研究院 / 知識研究部(算法研究)
  • 自然語言理解NLU研發部 / 語音引擎研發部(算法研究及應用)
  • 基礎產品研發部 / 雲端平台研發部(引擎應用)
  • 產品測試部
  • 解決方案部(產品包裝)
  • 專案實施部(產品應用及二次開發)

AI產品的開發流程

  1. 研究院負責與大學院校合作,閱讀論文並研究前瞻技術後,將研究成果提供給NLU / 語音研發部。同時通報專利申請單位,將有價值的技術註冊成專利。
  2. NLU / 語音研發部將研究成果,實作成底層引擎,並將其轉交給基礎產品研發部。同時通報專利申請單位,將有價值的技術註冊成專利。
  3. 基礎產品研發部負責市場調查、設計產品,並撰寫前後端邏輯,將引擎包裝成Chatbot / 推薦系統(Recommender system)等產品。同時通報專利申請單位,將有價值的技術註冊成專利。
  4. Chatbot / Recommender等產品的基本內容及行業知識,由知識研究部負責建置,如標註資料、建置知識、知識圖譜、預置行業包等。
  5. 解決方案部負責將Chatbot / Recommender產品的各項能力,打包成各個行業的解決方案,提供給業務單位兜售。
  6. 如果客戶有興趣,專案實施部會使用該Chatbot / Recommender等產品 / 解決方案,為客戶無償做POC(Proof of Concept);如果客戶滿意其成果,就會為後續開發簽約付錢。
  7. 專案實施部再根據合約內容完成Chatbot / Recommender等系統建置及介接API等二次開發工作,並提供售後維護服務。公司每年再收取License、維護及再開發費用。

AI產業的工作內容

若你有志投入AI相關產業,可以往以下幾種部門走,但著重的技術都不同:

研究院

一般使用Python語言及TensorFlow、PyTorch及SKlearn等框架研究算法(Algorithm),如語音辨識(Automatic Speech Recognition)、分詞(Word Segmentation),詞性標註(Part of Speech)、句法分析(Syntactic Analysis)、語意分析(Semantic Analysis)、對話管理(Dialogue Management)、自然語言生成(Natural Language Generation)及語音合成(Text to Speech)等。

NLU / 語音研發部

由於Python不適合用於大規模平行計算(Parallel Processing),這裡常使用Java語言,Mahout、Deeplearning4j等框架在Hadoop及Spark上實現算法、引擎、訓練及部署模型。

基礎產品研發部

這裡就比較沒有局限了,什麼語言和框架都可以用,譬如使用Go語言及Gin框架,撰寫後端邏輯,將底層引擎包裝成產品;以及使用Javascript語言、React或Vue等框架開發前端。

專案實施部

根據客戶需求選擇語言及框架,透過Chatbot / Recommender等產品 / 解決方案為客戶二次開發,並提供售後維護服務。

RSC修錶及驗錶過程分享

母親大人的OP26是香港購入的,因不慎從口袋掉出摔破鏡面送修;Batman是歷史高點在玩錶舍購入的,全新有膜沙烏地阿拉伯18年11月保卡,雖然說現在賠了一些,但畢竟停產了相信跌幅有限,購入至今也戴了半年多。

送驗及送修過程:

由於平常會用清水軟刷洗錶,本次趁著幫母親大人送修摔破鏡面的OP26,想檢測Batman的防水性能,但RSC要收2000元檢測費,因此改為利用免費的送驗服務,檢測一下錶況,若防水圈有問題,應該也會藉此發現。

OP26因為殘留的玻璃碎削,RSC小姐要求強制洗油;基本檢測後,師傅發現龍頭有磨損,怕影響防水性能,所以可自費更換。費用分別是藍寶石鏡面NT$2800+龍頭2000+洗油保養11800,總計16600。

最後得到兩張綠色的工作單據,送修的手錶寫明20天後取件,領錶時再付費;送驗的則是待通知。

取回過程:

等待約20天後,接到RSC通知,已可取回手錶;送驗的Batman僅簡單告知沒有問題,但使用數日後發現變準了,本來誤差是+4秒/日,現在接近0秒/日,不知道是調校過,還是消磁所帶來的效果;修好的OP26則是發現錶盤有被玻璃碎屑輕微刮傷,如果在意的應該可以要求換面盤,經過測量得到誤差+2.38秒/日。付費方式可以使用現金或刷卡,本次選擇刷卡。

最後得到了刷卡單據、統一發票、印有Logo的收納紙套、送驗的Batman付塑膠錶套,送修洗油的OP26贈原廠皮套。

基於深度學習的推薦算法調研

年底因為工作任務,調研了幾篇推薦系統 ( Recommender System ,以下簡稱RS) 的論文;我寫碩論時還不流行深度學習(Deep Learning,以下簡稱DL),轉眼間DL已經成為顯學,近年發表的推薦算法也都是基於DL的研究,我也已經應用在業界的專案中,並獲得了一些進展,但對DL應用在RS的普遍成效,我也是相當好奇。

趁著還記得調研的內容,在此以ACM RecSys 2019最佳論文「Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches」為基礎,跟大家分享一些心得:

讀後總結:

  • DL應用在電腦視覺CV和自然語言處理NLP領域相當成功,但在其他方面不如預期。
  • 2015到2018年RecSys, WWW, KDD, SIGIR頂級會議共有18篇DL論文與top-n推薦有關,可重現的實驗有7篇,比例約39%;也就是61%的實驗無法重現。
  • 通常做為baseline的方法有非個性化TopPopular、協同過濾CF的ItemKNN、UserKNN、P3alpha、RP3beta,混合的ItemKNN CF + CB,以及機器學習ML的SLIM。
  • 論文作者重現這7個實驗,驗證其進展是否真實,發現DL方法,效果並沒有上述經典的啟發式方法好,在7篇論文中只有1篇優於上述baseline方法,但只是在部分情況下超越。
  • 論文作者認為導致此結果的原因,是這7篇論文挑選了較差的baseline方法和參數、所選擇的測試資料epoch次數不同,甚至有實驗程序不同導致評估錯誤。

個人心得:

  • 為了驗證這幾年的進展,論文作者使用公開資料集作為可重現條件之一,從18篇論文中挑選了7篇重現實驗,但目前的公開資料集有資料量不夠大,矩陣比較不稀疏,以及特徵少等特色;此種資料集並非DL的強項。
  • 公開資料集大多出於學術界,其大小與特徵豐富程度遠低於業界的系統;所以論文作者的結論,以及DL在商用資料集的表現,還有待進一步的驗證。

參考資料:
https://dl.acm.org/authorize?N684126
https://arxiv.org/pdf/1907.06902.pdf

現有命名方法彙整及比較

命名規則是為了增加識別和可讀性,沒有強制的規定,但一旦選擇其中一種,會建議編寫時統一格式;而化學、天文、生物也有其慣用的命名方法;大部分的程式語言也有對此進行建議,以統一風格。

在程式設計的命名上,當變數、函式及類別等名稱由兩個以上的單字組合,就可以使用現有的命名方法,增加識別和可讀性。目前已經出現的命名方法,可以分為Underscore(底線式)、Camel-case(駝峰式)及Hungarian notation(匈牙利命名法)三大類。此文進行彙整,並以個人經驗,探討其優缺點。


一、Underscore(底線式):

單字之間使用底線分隔,GNU/Linux環境中最常見,例如:string_name。

優點:

使用底線取代空格,閱讀上比較直覺易懂。

缺點:

比起Camel-case使用字首大寫取代空格,底線比較少在日常輸入,因此需要適應。


二、Camel-case(駝峰式):

單字之間使用大寫分隔,又可以分為Lower Camel-case(小駝峰式),或Upper
Camel-case(大駝峰式),而後者又稱為Pascal-case(帕斯卡式)。

Lower Camel-case(小駝峰式):
第一個字母用小寫,此變化常用在變數名稱上,例如stringName。

Upper Camel-case(大駝峰式):
第一個字母用大寫,此變化常用在函數、類別、屬性及命名空間上,例如StringName。

優點:

  • 可以利用名稱前綴的大小寫,區分變數,以及函數、類別等其他型別。
  • 單字之間使用大寫取代底線,能夠減少名稱的長度,減少程式碼超出視窗被遮擋的情況。

缺點:

  • 比起Underscore使用底線取代空格,閱讀上較不直覺易懂。

三、Hungarian notation(匈牙利命名法)

在Camel-case(駝峰式)的基礎上,在名稱前綴添加預先約定好的縮寫,例如約定如下:

b       boolean
c       character
str     C++ String
si      short integer
i       integer
li      long integer
f       floating point
d       double-precision floating point
ld      long double-precision floating point
sz      Old-Style Null Terminated String
if      Input File Stream
is      Input Stream
of      Output File Stream
os      Output Stream
S       declaring a struct
C       declaring a class

Source: http://web.mst.edu/~cpp/common/hungarian.html

根據縮寫用途的不同,又可分為Systems Hungarian,以及Apps Hungarian。

Systems Hungarian
名稱前前綴代表的是實際的資料型別,例如:strName。

Apps Hungarian
名稱前綴代表的是目的或其他提示,例如:usName,其中us代表unsafe,為了避免Code injection或XSS,之後必須進行過濾處理。

優點:

  • 不需要IDE支援,就能夠從名稱能看出型別。
  • 制定好的編碼規則,能夠在搜尋時更加統一易找。
  • 制定好的編碼規則,能夠在命名及輸入上更快。

缺點:

  • 需要另外學習編碼規則。
  • 現代IDE已經可以輕易的區分型別,在資料型別上,此方法稍嫌多餘。
  • 變數型別修改時,名稱也必須修正維護。
  • 採用縮寫來命名,對新手較不友善,例如szName,不如stringZeroName。
  • 也更容易造成歧義,例如szName,更容易被誤讀成其他意思,也難以透過猜測關鍵字搜尋。

Rolex百事圈與藍黑圈搜尋趨勢分析

最近一直在百事可樂與蝙蝠俠間猶豫不決,因此產生了一個疑問,鋼版百事圈和藍黑圈倒底誰比較紅?以及雜誌上的說法到底有沒有根據?


從Chrono24上可以發現新版藍黑圈平均售價63.4萬,比百事圈60.1萬還要來得高;但又觀察到台灣市場,百事圈售價略高藍黑圈約1萬,因此發揮科男的精神,特別做了一下調查。


從Google Trends可以發現,2018年3月鋼板百事圈發布以後,馬上爆款,之後逐步與舊版三板帶藍黑圈打平;而2019年3月新版藍黑圈發布以後,一併拉抬了舊版的聲勢,甚至高過新版。而在近兩個月內,全球新版藍黑圈詢問度52%略高於百事圈48%,但若加上舊版藍黑圈,則藍黑圈整體詢問度70%遠高於百事圈30%。


不看舊版藍黑圈的話,近兩個月在美國,藍黑圈詢問度52%百事圈48%;在日本,藍黑圈
47%百事圈53%。台灣數據過少無法判斷。


結論:
近期數據顯示,若只看新款,兩者持平;其中美國偏愛蝙蝠俠,歐洲持平,亞洲偏愛百事可樂。若納入舊款,蝙蝠俠整體熱門程度高於百事可樂,且舊款詢問度更高。

流言終結者:
Q: 百事圈更紅?
A: 2018年百事圈的聲勢,其實與2013年舊版藍黑圈相當;2019年新版藍黑圈走勢則有待觀察。
Q: 百事圈帶動藍黑圈銷量?
A: 舊版藍黑圈2013至2018年的搜尋量相當穩定,2018年3月百事圈的發布,並未明顯拉抬舊版藍黑圈的詢問度。
Q: 新版藍黑圈帶動舊版的銷量?
A: 2019年3月新版藍黑圈的出現,明顯拉抬了舊版的聲勢,但詢問度仍是舊版比較高,可能是因為五珠鍊接受度不如三板帶。

未來趨勢:
GMT Master II百事圈與藍黑圈等雙色陶瓷圈,在銷售上一直有相乘效應,在今年新版藍黑圈的宣傳推動下,估計已停產的舊版藍黑圈,還會在二手市場熱個幾年。

參考:
2012至2019年的搜尋概況 – Rolex GMT MasterII 鋼版 雙色陶瓷圈 相關型號

Oculus Quest使用心得與對比

我在對VR產生興趣後,依序體驗過下列裝置:

  • Acer AH101 + GTX970 (自行購入)
  • HTC Vive (展場試玩)
  • PS VR (展場試玩)
  • Samsung Odyssey + GTX1080Ti (自行購入)
  • Oculus Go (自行購入)

根據上述經驗,以及對技術的好奇心,入手Oculus Quest三日後,得到了一些使用心得,在此跟大家分享。日後有買新遊戲,也會新增一些感想。

硬體:

  • 定位已足夠精準,又可以追蹤環境,可見四鏡頭inside-out tracking會變主流;但使用Tilt Brush等應用,手把太靠近頭部時,會無法定位,故outside-in在特定場景無法取代。
  • 每眼1440*1600 AMOLED 72Hz,解析度比HTC Vive及PS VR好很多,顯示器與Go差異不大,受益於處理晶片提升,遊戲畫質比Go更好,而且紗窗效應比同樣是AMOLED的三星Odyssey輕微。
  • 採用Fresnel lens黑底白字時,眩光比較嚴重。
  • 由於Oculus未公布FOV,個人目測跟其他設備差不多,約為110度;但有來自Reddit網友CodeF53的分享,顯示其約90度,如下圖。
    Comparison of the Horizontal FOV of different headsets
  • IPD可調範圍為58-72mm
  • Headset和手把,外觀都很精緻,重量很輕。
  • 手把握感舒適,但震動很弱,回饋感差。
  • Quest控制器比WMR省電很多;都是依賴光源追蹤,但前者採用紅外線LED,後者採用一般白光LED。
  • 揚聲器音質比Go好,音量更大;但是另外接中高階耳機,可以給你更好的臨場感。
  • 不知道為什麼左右各有一個耳機孔,有點多餘。
  • 越界時可直接看到黑白的外界影像,除了防止碰撞外,移動也不用取下headset。
  • 不用高端PC顯卡和接一堆線,真的很方便。
  • 附帶的超長usb type-c很實用,但有磁吸會更好。
  • 有機會跟game console競爭,畫質接近switch。
  • Go訂製的近視鏡片,因模具不符,無法用在Quest。
  • 2019年底預覽的手勢追蹤(Hand Tracking),玩遊戲不用手持控制器,其使用深度學習技術進行手勢追蹤與辨識。本人透過刷韌體提前體驗了,發現其已達到可用的程度;缺陷是四鏡頭inside-out tracking時,手掌擋到手指時就無法使用了,且目前幾乎找不到遊戲支援,待官方正式發表。

軟體:

  • 由於控制器不同,Go和Rift買的內容不能在Quest用;此做法方便官方管理,但對使用者來說不太合理。
  • 遊玩不超過2小時的應用或遊戲,可在14天內退款,每月限退5單。
  • 新手教學First StepsFirst Contact超美,體驗超棒,女生會很喜歡。4顆星
  • Rec Room體驗與PC相同,是個免費下載的小遊戲社交平台,但提供遊戲內付費內容,目前最強的社交遊戲,新手入門首選。5顆星
  • 名作Beat Saber體驗與PC相同,是款音樂節奏遊戲,特點是使用光劍跟隨節奏劈砍磚塊。4.5顆星
  • 名作Superhot體驗與PC相同,是款慢動作的射擊遊戲,有許多精心設計的關卡,值得一玩。5顆星
  • Sports Scramble擁有網球、保齡球與棒球三種遊戲,是我目前玩過最好玩的VR sport。5顆星
  • Drop Dead是款使用手槍打僵屍的遊戲,最早是在Go接觸的,當時控制器僅有三軸感測,體驗已經相當不錯,Quest版本因受益於顯示晶片、頭部與手部追蹤技術的提升,使其畫質及體驗有大幅提升。4顆星
  • Vader Immortal畫質比想像中好,體驗很棒,但玩法與內容有限,只推薦給電影粉絲 。4顆星
  • 名作Robo Recall受限於硬體性能,畫質不如PC,但玩法依舊,有大作的風範,是槍戰遊戲的一時之選。4.5顆星
  • Dance Central是一款跳舞遊戲,我最初是在Xbox Kinect接觸到,改成VR版以後,畫質差,玩法差,體驗差;像是廉價外包的遊戲,千萬別買。2顆星
  • National Geographic Explore VR是一款探險遊戲,有南極和祕魯馬丘比丘兩個場景,畫面夢幻,體驗好。4顆星。
  • Journey of the Gods是一款動作RPG遊戲,畫面夢幻,有點像是VR版的薩爾達傳說。4顆星
  • Gadgeteer是款排骨牌的益智遊戲,適合喜歡慢步調的玩家;可惜玩法稍嫌單調。3.5顆星
  • Drunkn Bar Fight是一款酒吧大亂鬥遊戲,可以撿各種武器打人,蠻紓壓的,但玩法過於簡單,而且只有三個關卡,內容過於匱乏。3.5顆星
  • Pistol Whip是一款節奏槍戰遊戲,風格宛如Superhot,但非慢動作的玩法,使其節奏更加緊湊,是我目前玩過最好玩的VR槍戰。 5顆星

包裝:

  • 包裝盒厚實堅固且精美,可重複用於日常收納。
  • 另外加購的Travel case很輕巧,獨特設計專為收納及攜帶Quest。

產業:

  • Facebook Oculus這次從成本、整合及生態上,把VR進入門檻大幅拉低;本來VR PC及headset一組至少要1000美金,現在standalone只需要400美金,而且不用經過繁瑣的設置,有助於吸引更多人入手。
  • Windows MR standalone入手成本也很低,但硬體、整合和內容上還不如Oculus。
  • HTC硬體走高端,但成本、整合和生態全輸,快看不到Oculus的車尾燈了。
實際遊玩照片(可不接任何纜線)

獅子評分

⭐⭐⭐⭐

主流通訊協定介紹(RPC、SOAP、REST)

Remote Procedure Call (RPC)

起源於1976年,允許Client遠端呼叫Server的子程式,然後將執行結果返回給Client;當時的傳輸資料常使用二進制格式,為了統一資料傳輸格式,隨後出現了XML-RPC, XML作為資料交換語言的RPC機制。

Simple Object Access Protocol (SOAP)

起源於1998年,由於RPC經常被Firewall及Proxy Server阻擋,為解決兼容及安全性問題,採用HTTP(起源於1989)是更好的方法,SOAP還提供了一套標準方法讓程式間可以互相通信。可以簡單把SOAP當作RPC+XML+HTTP(POST only)+有狀態的通信方法。

Representational State Transfer (REST/RESTful)

起源於2000年,由於SOAP過於複雜且依賴狀態,REST提倡使用標準的HTTP中的四種動作GET、PUT、POST及DELETE,以及Uniform Resource Identifier (URI)來指定資源,降低開發的複雜性。可以簡單把REST當作PRC+XML+HTTP(GET,PUT,POST,DELETE)+URI+無狀態的通信方法。

發展趨勢

REST風格相比XML-RPC及SOAP更加簡潔易用,而JSON資料交換語言相較XML更加輕量,目前大多數的Web Service都採用REST+JSON作為傳輸方法。

2019上半年中國AI產業研究筆記

●2018年中國AI領域融資1311億,增長超過100%
●2020年中國AI產業規模將超1500億元
●2013至2018年全球AI論文共30.5萬篇,美國發表5.2萬篇,中國發表7.4萬篇
●2030年中國無人駕駛汽車銷量預計將達190萬輛,出行AI備受關注
●中國自動駕駛技術正朝”L4級高度自動化”努力,世界尚未有人能夠達到”L5全部自動化”
●中國CV市場中68%都用於安防
●當前AI的商業化主要是基於CV,語音,NLP等技術
●中國AI產業目前處於各自為營的狀態,但有產業鏈分工的發展趨勢
●易於使用的自動化ML工具逐漸成為主流,例如AutoML
●隨著5G即將商用,無線通訊效率提升,有助於AI應用升級


Source: https://report.iimedia.cn/report.jsp?reportId=38874