安防行业作为应用AI和多模态大模型的先锋领域,展示出其在发展新质生产力方面的强大产业基础和能力:
从业人员众多、生态完整:安防产业链条长,从硬件制造、软件开发到系统集成、服务运营,形成了一个完整的产业生态。这种完整的生态系统促进了技术知识和行业经验的累积与传承,加速了新技术的研发和推广。
加速AI落地应用,安防是核心应用场景
安防行业是人工智能、物联网、大数据等先进技术最早得到应用和验证的领域之一。这些技术的融合应用不仅极大地提升了安防产品和服务的性能,也推动了行业自身的升级和变革。
应用场景众多:眼见为实,安防因为其数据的丰富性,在计算机视觉(CV)技术的驱动下,智能安防已经跳出传统技防的范畴,从安全防控走向安全生产,走向基于数据和算力驱动的智慧运营,跃升至为城市管理、商业决策等提供智能数据服务的新阶段。
聚焦“AI+安防”融合创新,依图科技推出天问大模型
而依图科技多年来一直专注于人工智能技术在安防领域的实践和应用,早在2019年便开始研究以Transformer为基础的大模型发展和应用,并将图像感知、视频感知与大模型结合,在2023年底发布了可对话、会思考、能进化的“天问”多模态大模型,在公共安全、智慧城市、智慧交通、内容审核、智慧园区等多个领域实践,推动关键技术转化为真正的生产力。
由依图科技创新打造的“天问”多模态大模型,已在全国几十个项目中实战部署,在视频语义搜索、万物识别、AI智能体编排以及算法零样本冷启动等方面展现出巨大潜力。具体场景中,公共安全、智慧城市建设、智慧交通、内容审核和智慧园区等方向的应用进展显著,这些领域对视频分析、行为识别和实时反应的需求不断增长。
天问大模型3大特性,破解传统安防技术应用难题
安防从高清走向智能,这是AI安防1.0,人脸识别、人体ReID、视频结构化、车辆/非机动车结构化就是这个时期的作品。但是一旦安防的应用进入安全生产就会面临长尾算法的需求。而传统深度学习模型基于是监督学习方法训练出来的,在面临到这个复杂场景的时候就会有很多约束和限制,这就导致过去这七八年AI安防虽然有些进展、但是落地的并不好。大模型时代下进入AI 2.0,基于Transformer架构,依图天问多模态大模型彻底颠覆了传统安防行业的碎片化特点,会呈现3个特性:
1、会思考
多模态大模型不再像过去一样只是某种算法、某种工具,而是呈现出助手、智能体的特征,让机器看一遍视频,它能够准确识别视频中的内容,将机器看视频的能力转化为直观的算法,为安防行业带来了革命性的变革。
2、可对话
人使用多模态大模型的过程更像与另外一个人交流。用户可以通过语义搜索和语音指令调取视频,例如,仅需简单地说出“请调取有积水的点位视频”,系统便能迅速响应,展现所有相关的视频片段。这一功能极大地提升了指挥调度的效率,节省了宝贵的决策和调度时间。
3、能进化
能进化是依图天问大模型的另一大亮点。不能根据用户和环境而进化的智能系统是工具,不是真智能。依图天问大模型支持现场算法训练,能够根据实际应用需求快速迭代和优化。一个新的算法需求可以在1分钟内实现0样本冷启动,1小时内完成在线标注训练,并在1天内快速上线,展现了前所未有的智能化和灵活性。
算法准确率90%+,天问大模型实战效果优异
2023年下半年西部某省份曾经出现过烈性犬伤人事件,如何快速生成烈性犬检测算法、快速布控到城市公共区域,成为城运中心工作人员的难题。如果采用常规深度学习的算法训练方法,要求数据搜集、标注、训练,一个新算法的产生至少要半个月后,管理的时效性就没有了。
而基于多模态大模型的算法训练就简单的多,预训练的大模型基座带来近70%的准确性,工作人员在预警处置的过程中简单点击预警的对错,不到5天的时间就可以完成超过90%的算法准确率。现场生产新算法方面展现了惊人的速度和灵活性,有效保障了公共安全。这种以用户需求为核心,以技术创新为驱动的策略,是推动AI 2.0发展的关键动力。预计未来智能安防的大模型将在更多细分市场和复杂场景中发挥关键作用,特别是在需要高度个性化和动态适应性的场景中,大模型的应用将更具潜力。
依图科技多模态大模型的推出,使视觉和语言的模型归一,统一了物理世界和认知世界的底层框架,让多模态的信息之间可以无差别表示和无缝转换,为大模型的人机交互模式、产品迭代模式、服务运营模式都提供了更多的可能性。AI 2.0走向安全生产,走向基于数据和算力驱动的智慧运营,这无疑是未来安防行业发展的方向。