十年前,我到芝加哥參加一場活動,無意間走進了市中心的芝加哥鐵路交易大廈。在一樓中庭,擺放了一套320平方英呎大的3D芝加哥城市模型,呈現了超過1千棟建築物,橫跨芝加哥400個街區,但讓我驚訝的不只是這座精巧的模型,而是後方的超大螢幕。
螢幕中是張超大芝加哥地圖,用顏色區分出城市每一棟建築物的建造年份,搭配城市儀表板,即時顯示各項城市數據,從不同地點的用電量、空氣品質、每小時天氣,火車到站時間、各處施工資訊等,市民 311通報數據。這是當年芝加哥,花了兩年,在全市每一個路燈裝設IoT,即時搜集各種城市大數據的其中一項成果。
芝加哥是十年前少數善用大數據來解決城市問題的智慧城市先驅之一,後來,臺灣也掀起了一波智慧城市潮,不少城市仿效芝加哥的做法,也在大量路燈上,設置了各種感測器,更擴大到不同的城市設施,公車站牌、紅路燈、監視器都兼具了搜集不同城市數據的能力。
十年前的大數據城市,已經是現在都市的基礎建設,但是,十年來,城市人口越來越多,各項設施,複雜交通網路和民生管線,功能越來越複雜,再加上氣候變遷帶來的劇烈天氣變化。只有這些數據,還不敷城市治理所需,像擁有272萬人口,面積超過2,900平方公里的高雄市,不只是靠IoT來追蹤城市動態,更是高度依賴1999通報的案件,由市民親眼所見的各種城市問題。
去年,高雄市政府收到了超過12萬通的事件通報,包括了各種交通事故,道路品質,淹水、環境衛生等,光是路面坑洞問題就超過1萬件。
但是,城市資源有限,得優先處理嚴重程度較高的問題,以路面坑洞為例,市民通報內容往往缺乏細節,甚至用簡單的「路上有個大洞」來描述道路縫隙,工務局得派人勘察這上萬件通報,才能決定要優先派工處理哪些坑洞,一來一往,相當費時。
能不能不要等市民通報,就能更主動、即時的發現事故、災情,第一時間出動,這正是高雄市政府想要用AI技術來實現的目標。
這期封面故事,我們介紹高雄市最新的燈塔計畫,要打造一套高雄市的主權AI系統,在自家機房中部署一套城市級VLM(Vision-Language Model,視覺語言模型)推論平臺。高雄市想要善用VLM的影像理解能力,第一時間來判讀城市影像中的事件。
高雄市資訊處先與四個單位合作,主管交通運輸的交通局,負責城市公共工程建設的工務局,管理水資源業務的水利局 ,以及環境保護的環保局,整合跨局處、跨領域的影像資料,避開人臉、車牌等敏感資訊,使用商用VLM模型,來辨識108種不同事故的情境,涵蓋609組判斷指標,從日常交通、淹水偵測、災害應變、交通異常事件、活動疏運、道路設施、廠區管理、港區物流紓解等。這108種情境不一定都是大災情,就連公共場館的垃圾髒亂、人孔蓋冒水、人行道地磚毀損到電線桿歪斜,都能判讀。
透過VLM判讀所得到資訊豐富度,遠高於當年芝加哥大數據城市搜集到的IoT資訊。以淹水事件為例, IoT頂多可以偵測到有淹水,但VLM可以知道水深多少,有沒有影響到交通或是造成道路封閉,附近有多少車輛經過而受影響等,VLM可以將更多現場脈絡的情報,立即通報給相關的單位來處理,不用像過去,得等到市民通報,派人勘查後才能得知,市政府因應的速度,比過去快了不只是一倍。或是城市某處發生了車禍,VLM不只可以判別這起車禍對附近車流的影響,還能判斷現場有警消、救護車,來調整需要及時通報的對口單位。透過VLM通報的預警, 高雄市希望可以實現即時應變的治理能力。
燈塔計畫的企圖心不只是即時發現曾經發生過的事故,高雄市希望VLM也可以有能力判讀,過去從未發生過的災情,例如輕軌列車出軌。高雄市運用了數位孿生和物理AI技術,合成了足夠多的出軌模擬影像,來訓練VLM判別這類特殊事件的能力。
過去的大數據城市,IoT搜集了大量資料,提供給真人判讀,但仍不足以涵蓋日益複雜的城市樣貌,高雄市想用VLM這類最新AI技術實現的,不只是大數據城市,更要成為具有大智慧輔助真人決策的新型態城市治理。

