最近新一波疫情侵襲澳門,今波疫情相對前面幾波較為嚴峻。
澳門衛生局除了近期進行多輪全民核酸檢測外,更要求全民每天/按需使用使用新冠病毒抗原檢測包進行自我檢測,完成後將結果拍照、手動勾選檢測結果、簽名並寫上當天日期上載匯報至當局頁面。
全澳人口大約接近70萬人,也就意味每天有關方面會收到最多約70萬張的檢測結果照片,如下圖所示。
如何更科學地對這麼大量的圖片數據進一步發掘、分析,提取有助防疫的資訊,輔助決策,這亦可能是一個課題。
- 如何得知各個抗原檢測套裝品牌每天的結果誤報率?
- 有多少市民所上載的檢測結果與選擇的結果不符合?
- 最多市民使用的抗原檢測套裝的品牌是?
- 下一階段應該採購哪種檢測包?
等等...
從以上新聞消息截圖得知:「局方需要市民將快測結果連同檢測盒包裝一併上傳,政府將系統及科學分析檢測效果及質量,作為未來採購檢測包的依據。」
至於當中「系統及科學分析檢測」方法實際是什麼?我們這些外人就無從得知。
不過換個角度,如果自己面對這麼大量的數據,該用什麼方法才能發掘數據中的更多價值?
第一時間想到的思路就是:透過機器學習 Machine Learning 訓練出 A.I. 模型,對大量抗原檢測結果(圖片)進行識別、分類。
實際進行流程如下:
- 獲得數據集(收集若干數量新冠病毒抗原檢測試劑盒結果圖片)
- 標註數據集(對所有圖片進行手工標註 紅線結果顯示區域)
- 對圖片的檔案名進行統一規範(以便後期處理)
- 劃分數據集(大部份用於訓練模型,另一部份用於驗證模型)
- 增強數據
- 定義數據集
- 訓練模型
- 使用模型進行預測
上圖為預測效果,不同品牌的試劑,包括有包裝盒及只有試劑盒,效果尚算不錯,但仍有誤判(右圖一),可能是參數問題,又或者是樣本量較少的關係。
上面就是初步透過機器學習 Machine Learning 對 1,000 多張試劑盒圖片進行訓練模型,進而識別結果屬於 陰性/陽性。
這只是一個很初步,對於思法的試驗,若能得到更多數據重新再進行訓練,相信判斷精度能再加強。
除了可以識別結果 陰性/陽性外,若數據集訓練數據充足,識別不同試劑盒的品牌也不是一件難事,綜合上面所得出的資訊,應該能夠得到一些更有助於防疫的資訊,從而協助決策。
希望澳門疫情早日消退!
你是如何收集图像的?有可用的数据集吗?还是您手动拍摄每张照片?惊人的工作。
@noobdev 很多都是透過爬蟲在網上搜集的,畢竟自己的圖片並不多,而且很多圖片也包含了個人信息。