根據(jù)估計(jì),流感每年導(dǎo)致超過3140萬次門診訪問,超過20萬人次前往急診室和醫(yī)院。?毋庸置疑,有足夠的動(dòng)力來預(yù)測(cè)流感爆發(fā)的范圍和嚴(yán)重程度,研究AI增強(qiáng)預(yù)測(cè)的研究人員正在取得進(jìn)展。?在Arxiv.org上發(fā)表的一篇論文《使用谷歌趨勢(shì)預(yù)測(cè)流感》中,來自東京大學(xué)的科學(xué)家們描述了一個(gè)系統(tǒng),該系統(tǒng)可以利用谷歌趨勢(shì)的數(shù)據(jù),這一工具分析了流感流行趨勢(shì),并且利用Google搜索中的熱門搜索查詢,以提高精確度。
該團(tuán)隊(duì)利用一種稱為序列到序列的人工智能模型,它可以根據(jù)內(nèi)部信號(hào)選擇性地處理輸入數(shù)據(jù)。像大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)一樣,序列到序列模型由數(shù)學(xué)函數(shù)層(神經(jīng)元)組成,攝取數(shù)據(jù)并將其傳遞給后續(xù)層,在此過程中調(diào)整神經(jīng)元之間連接的強(qiáng)度(權(quán)重)。編碼器組件輸出對(duì)應(yīng)于輸入的編碼矢量,而解碼器編碼輸入矢量并預(yù)測(cè)下一個(gè)時(shí)間步輸出。
至于上述谷歌趨勢(shì)數(shù)據(jù),研究人員用它來衡量人們?cè)谌魏翁囟〞r(shí)間點(diǎn)對(duì)流感的興趣。具體來說,他們?cè)凇傲鞲小边@個(gè)詞的檢索頻率上進(jìn)行了磨練,作為該模型的補(bǔ)充信息,這有助于補(bǔ)償從流感樣疾病原始數(shù)據(jù)當(dāng)中獲得的信息。總而言之,研究小組使用了六個(gè)州(紐約、俄勒岡州、加利福尼亞、伊利諾伊、德克薩斯和喬治亞州)未加權(quán)的流感樣疾病感染者比例,這些州因其氣候多樣性而被選中。研究人員將這些數(shù)據(jù)與2010年10月10日至2018年12月30日(430周)的谷歌趨勢(shì)數(shù)據(jù)相結(jié)合。大約67%的數(shù)據(jù)用于訓(xùn)練人工智能模型,37%用于測(cè)試。
研究人員警告說,峰值隨著預(yù)測(cè)時(shí)間的增加而向下移動(dòng),因?yàn)闊o法從學(xué)習(xí)數(shù)據(jù)中準(zhǔn)確預(yù)測(cè)峰值時(shí)間。然而,他們認(rèn)為,添加一個(gè)領(lǐng)先指標(biāo)(這些指標(biāo)留給將來的工作)可以進(jìn)一步提高預(yù)測(cè)準(zhǔn)確性。
【來源:cnBeta.COM】