新年伊始,DeepSeek系列模型的火爆“出圈”吸引了AI領域甚至全社會的廣泛關注,其發布的推理模型R1以及千億參數模型V3憑借超低訓練成本、媲美國外主流模型的性能以及開源生態模式震驚全球,在國內外刮起一陣人工智能“創新風”。作為在城市治理領域深耕二十多年的智慧城市核心應用和運營服務提供商,數字政通持續在一網統管、法治政府以及城市管理信息采集等業務場景積極探索大模型智能化落地應用。公司將接入DeepSeek模型作為基礎模型賦能城市治理行業大模型產品,助力城市治理“深度思考”,提升城市治理智能化應用水平。“人和”行業大模型是數字政通從“網格化”到“一網統管”發展過程中,專注于城市治理行業應用,立足于全國5000多個項目沉淀的業務和數據基礎,全面擁抱生成式人工智能技術趨勢而發布的AI大模型產品。該模型基于通用大模型底座,結合城市治理行業經驗和專業知識進行微調,打造更符合行業需求的應用創新范式。
人和大模型業務架構
“人和”行業大模型專注于城市治理垂直場景應用落地,其靈活解耦的大模型基礎底座支持通用大模型集成與接入、行業大模型發布與應用,數字政通積極擁抱DeepSeek,目前已經完成DeepSeek-R1模型的接入并推進業務場景應用測試。通過接入DeepSeek-R1模型,在民生訴求業務場景中風險事件識別、工單小結、標簽提取3個特定任務進行驗證測試。具體示例如下:
風險事件識別
工單小結
標簽提取
未經工單數據標注和模型微調訓練,DeepSeek-R1在3個特定任務中的表現均達到預期,可以滿足實際業務場景需求。
通過接入DeepSeek-R1模型,基于 DeepSeek訓練方案優化公司行業大模型產品,將加快“人和”大模型產品的技術突破,可從數據依賴程度、模型推理效果、模型訓練成本等方面極大提升城市治理領域中行業大模型落地應用價值。具體包括:
(1)降低數據依賴:傳統大模型訓練依賴大量標注數據做有監督微調,而 DeepSeek 的強化學習更注重數據 “信息密度”,通過實時反饋動態進行模型優化。在民生訴求熱線業務中,可減少對大規模熱線工單數據標注的依賴,能根據實時的用戶反饋進行快速調整和優化,提高模型的靈活性和適應性。
(2)提升模型推理效果:通過強化學習,在僅有很少標注數據的情況下極大提升了模型的推理能力,這可以使熱線智能客服業務中處理客戶咨詢等問題時,更準確地理解問題意圖,提供更精準的回答和解決方案。比如在處理復雜的技術咨詢或業務流程問題時,能快速推理出正確答案。
(3)解決算力不足難題:城市治理領域需要處理海量數據(如視頻監控、熱線工單、地理空間數據、案件文書等),傳統本地服務器算力有限,難以支撐實時分析或復雜模型訓練。DeepSeek采用混合專家(MoE)機制和模型壓縮(如知識蒸餾、量化技術)等算法優化提升訓練效率,降低行業大模型應用的算力門檻。
對于城市治理領域,動輒上萬路視頻監控、幾十萬案件文書、上百萬圖片、上千萬熱線工單的數據處理需求,大模型落地應用的成本問題不可回避。與業內普遍使用的監督微調(SFT)訓練范式不同,DeepSeek采用了直接強化學習方法,有效降低了訓練成本。傳統的強化學習從人類反饋中進行強化學習(RLHF)需要大量人力進行評分反饋,成本高、時間長。DeepSeek 采用自動化強化學習,降低了人力成本,這使城市治理行業垂直大模型能夠更快地迭代和更新,及時適應業務的發展和變化。
2024年,公司與華為昇騰、新華三開展了算力層面的合作,分別完成在華為AI框架昇思MindSpore昇騰兼容性技術認證和H3C·R5300 G6服務器(天數智芯GPU)適配認證,在國產化算力適配方面取得進展。公司將繼續提升“人和”大模型在國產化算力方面的適應性,以滿足城市治理行業信創要求。
2025年公司研發架構重點支持AI部門的投入,并積極推動各個應用部門場景的全面AI化工作,力爭所有應用部門均有具體場景的落地。另外,公司核心產品“麒艦”已經全面接入人和大模型能力,這次DeepSeek對人和大模型的能力加持即將在核心產品上得到體現。數字政通“人和”大模型將在一網統管、法治政府、城市信息智能采集等業務場景中利用DeepSeek大模型的“深度思考”能力,繼續探索城市治理領域Agent智能體應用,構建行業大模型應用方案,并在深圳、福建、青島、天津等地的熱線和執法項目以及全國100個智能采集項目落地。其中:(1)一網統管:打造民生訴求熱線全流程智能化應用及智能標簽體系,提升工單響應與問題解決效率,精準定位分類訴求,優化工單流轉,增強數據分析,為政府決策提供依據,推動民生服務升級。(2)法治政府:構建智能評查模式與文書要素體系,實現案件全量自動化評查與輔助辦案,提升執法效率和評查精準度,挖掘分析數據優化執法,助力法治政府建設。(3)城市信息智能采集:探索移動智能采集視覺多模態大模型應用落地,降低人工標注投入,實現城市場景自動識別與問題發現,實時監測與預警風險,為城市管理決策供依據。我們將從城市治理行業需求出發,以解耦的架構集成如DeepSeek-R1等領先的基座模型,結合豐富的行業經驗,提升城市治理行業大模型能力。在數據融合處理、模型優化、智能決策分析方面進行深化研發,打造行業數據分析、數字人智能客服、行業智能體等應用,提升城市治理行業大模型智能化應用水平。