累積資料庫 疾管家變得更會聊天
「疾管家」在疫情期間能及時地迅速發揮功用,鍾逸帆解釋,主要歸功於自然語言處理(Natural Language Processing)以及自動水平擴充(Horizontal Autoscaling)兩大技術。
「當疾管家的功能越來越多,我們發現有民眾開始把他當作真人聊天。」鍾逸帆笑說,開始有人問疾管家一些無關傳染病的問題,甚至是趁亂告白,但為什麼疾管家可以分辨民眾的提問,原理在於以DeepQ獨家AI引擎T-Bert所建置的自然語言處理技術,能夠辨識1,800種意圖,1,200個疾病與284種症狀,而且團隊花費三年時間,建立可能被詢問的意圖句型,並收集大量匿名化的問句,打造出可以回答80多種傳染病問題的疾管家。
自動水平擴充技術 百萬人上線都不怕
至於自動水平擴充技術,也就是透過虛擬機器自動運算,幫助工程師們解決伺服器的負擔問題。在COVID-19專區設立後,使用人數從10萬飆升至200萬,2021年推出簡訊實聯制後,使用人數再次飆增至900萬。尖峰時刻每秒需處理近1,000個民眾的詢問,每天實聯制掃碼40萬次,也對伺服器產生非常大的負擔。
鍾逸帆解釋,在採用了自動化的水平容量擴充之後,當有預警到民眾流量可能會暴增時,例如防疫記者會推播訊息,這時遍佈全臺的虛擬機器(virtual machine),內容傳遞網路(content delivery network),以及負載管理(load balancer)都會提前自動部署,大幅增加可以承受的流量,讓工程師不用每天都要跟伺服器流量搏鬥。