导语
蛇年春节前后,一场史无前例的“AI风暴”被DeepSeek点燃。由中国AI初创企业深度求索(DeepSeek)发布的开源模型DeepSeek-R1爆火全球,其出色的语境理解、推理能力和开源特性,引发国内外广泛关注,吸引了各行业领域争相接入和拓展应用。据悉,目前国内各地方政府、互联网巨头、电信运营商、独角兽、云厂家、芯片厂、手机厂、车企、银行等企业和品牌纷纷接入DeepSeek,积极探索其在不同业务场景下的应用可能。
安防行业是人工智能最早成功落地的行业之一,在深度学习的热潮中,安防是AI应用落地的先行者;这两年大模型时代开启,安防行业再次站在了技术应用的前沿。当下面对AI技术的新突破,智能安防企业也迅速做出反应,及时跟进研究与探索应用。目前,行业内部分企业已成功接入 DeepSeek。其中,一些企业更是在近期重磅推出了基于开源大模型 DeepSeek 的AI一体机等创新产品。可以预见,未来将会有更多安防企业接入 DeepSeek,以此为基础进行产品创新和拓展应用。那么,DeepSeek 的接入究竟会给安防产品带来怎样的应用价值?它又将给智能安防行业的发展带来哪些深刻的影响和改变?智能安防企业又该如何借助 AI 技术的新突破实现创新发展?未来安防行业大模型技术发展走势又将何去何从?等等。围绕这些备受关注的问题,本期我们特别邀请了业内资深专家、学者进行深入探讨,以飨读者。
DeepSeek大模型赋能智能安防技术升级
高飞
浙江工业大学计算机学院党委委员、图形图像研究所所长
从达特茅斯到DeepSeek,
人工智能的发展与突破
在1956年的达特茅斯会议上,麦卡锡、明斯基等学者正式提出人工智能(Artificial Intelligence)术语,这标志着人工智能正式成为独立的学科。随后,人工智能经历了符号主义、连接主义、专家系统等阶段的发展,因为软硬件技术瓶颈及过高预期,在20世纪70年进入研究寒冬。进入20世纪80年代,随着机器学习与神经网络的兴起与发展,人工智能研究开始逐步复兴。2012年,Hinton团队提出AlexNet并在ImageNet大规模视觉识别挑战赛(ILSVRC-2012)中以显著优势夺得冠军,预示着深度学习的崛起。此后,深度学习逐渐成为人工智能的最主流技术之一。
人工智能主要包括自然语言处理、计算机视觉、数据挖掘等三大方向,各种深度学习模型与架构经过近10年的发展,在三大方向上互有交叉、借鉴与融合。随着2017年Transformer架构的提出与发展,人工智能在自然语言处理方向上率先获得突破,2022年OpenAI公司推出大语言模型ChatGPT成为这一突破的标志性事件,自此人工智能开始从学术界向产业界漫延,人们都惊讶于它强大的生成能力,写诗、作画、编程等似乎无所不能,国外推出了GPT系列、BERT、T5、LLaMA、Claude等模型,而国内也陆续推出通义千问、豆包、智谱、混元、文心一言、盘古、星火、Kimi等大语言模型。这一时期的大语言模型几乎遵循着如下特点:以Transformer架构为核心、参数规模驱动性能提升(动辄上千亿参数)、训练成本高(高算力依赖,动辄万张GPU卡,成本达上亿美元)、商业化闭源策略(限制深度定制与优化,通过API提供服务)、部署成本高(依赖于高性能GPU集群)等,这极大地限制了大语言模型的推广应用。
随着2024年12月DeepSeek-V3及2025年1月DeepSeek-R1的推出,自2022年以来的大语言模型生态受强烈冲击。可以说,DeepSeek作为2025年全球人工智能领域的现象级企业,其技术创新和产业影响引发了广泛关注,正在引领人工智能新浪潮。在技术方面,DeepSeek进行了液态神经网络(LNN)等新架构引入(非Transformer架构探索)、动态稀疏路由与MoE架构(打破传统Transformer架构对算力依赖)、FP8混合精度训练(显著降低训练成本)、强化学习革新(采用无需价值模型的GRPO技术,提升数学推理能力并减少显存占用)、数据增强与模型蒸馏等一系列模型架构与训练优化技术的尝试与创新。在商业方面,DeepSeek采取了开源模式,完全颠覆了前述闭源策略,各种DeepSeek一体机、低成本本地化部署方案快速涌现,各行各业的应用应运而生。DeepSeek的出现,打破了算力依赖,降低了应用门槛,促进了制造业、医疗健康、金融科技、电子政务、法律等各行各业向智能化转型,将推动算力需求结构性改变(加快人工智能算力向国产自主可控转移),将对我国人工智能产业带来深刻影响,各种基于人工智能的新经济形态将涌现,也将重塑全球人工智能格局,并为全球推进人工智能发展提供中国方案。
智能安防在DeepSeek
影响下的变革与发展趋势
结合DeepSeek的技术与商业特点,DeepSeek或将在以下几个方面对智能安防(机器视觉)的发展带来影响与革新:
一是视频图像理解与感知能力大幅提升。例如,在复杂交通时空场景中的人-车-物-路的全景分割及交互关系理解,各类目标行为意图识别(从吵架向斗殴演化、嫌疑人驻足徘徊等),等等。二是视觉-语言-决策协同模型。例如,根据目标图像,自动关联相关系统、文献,生成目标文本画像,通过以图搜文、以文搜图等自然交互生成精准商品描述与推荐报告,以及任务理解、场景感知及自主决策融为一体的机器人等等。三是视觉模型部署将更灵活简便。现有智能安防模型多以端侧及云计算、端云协同等方式部署,前者存在算力限制大、模型难迭代等不足,而后者对带宽要求较高,若采用GPTQ、AWQ、FP8等量化技术,将视觉大模型压缩至十亿级参数规模,适配低端GPU或嵌入式设备,实现更加灵活、易于迭代的部署。四是鼓励开源模式的发展。通过开源为智能安防行业提供深度定制的可能。五是促进安防系统的交互方式变革。可通过自然语言(语音)模式实现智能安防灵活调度、跨镜联动等。
未来,随着以DeepSeek为标志的模型创新与技术变革涌现,人工智能深度技术将加速演进,而其应用将在宽度上进一步拓展,可能存在如下发展应用趋势:
第一,相关技术向视觉大模型延伸与发展,有望在视觉大模型方面获得突破,进而形成视觉-语言-决策的强智能体。
第二,学术界与产业界将会有更多人关注各种模型优化、压缩技术,模型对于数据和算力依赖的现状将得到改观,零样本或少样本模型与技术将受到更多重视,模型小型化、低算力化将是人工智能普适化的重要方向之一。
第三,人工智能技术越来越成熟,将与5G/6G、物联网等技术深度融合,推动产业经济形态、生产生活方式的颠覆式改变,各种垂直应用将越来越普及。例如:人形机器人生活服务中的应用,具身工业智能体在无人工厂中的应用,医疗智能体在医疗健康中的应用,安防智能体从城市级向社区、门户延伸,等等。在安防领域,应该积极推动语言-视觉技术融合,同时主动学习大语言模型的相关技术,将其消化吸收至视觉模型领域,在视觉大模型方面形成能力与性能突破,实现智能安防领域的“看得清、看得快、看得准”的预警式应用。
栏目主持:本刊记者/李红莲
文章来源于《中国安防》杂志2025年五月刊(总第227期)配资网股票配资门户
智航配资提示:文章来自网络,不代表本站观点。