联合智谱AI共同研发千亿级大语言模型“360GLM”后,360集团大模型阵营中的另一角色——360智慧生活视觉大模型,也正式登场了。
近日,360集团宣布推出360智脑·视觉大模型,同时发布多款已“嵌入”该视觉大模型的智脑硬件新品,宣布360智慧生活正式进军SMB市场,从家庭场景进一步跨入企业商用领域。
在与新浪财经沟通中,360视觉云业务线总经理孙浩指出,“上一波物联网浪潮更多是解决数据问题,但更多的数据价值并没有被充分挖掘,多模态大模型与物联网的结合,能将物联网感知的数据进一步融合、学习,产生更大的一个价值,这将会是下一个风口。”
从360智脑到视觉大模型,360的大模型的多模态技术能力正不断得以延伸,而将大模型“嵌入”到智能硬件之上,360布的是怎样一盘棋局?
“让智能硬件具备灵魂”
近年来,随着人工智能技术的发展,传统深度学习算法在安防等物联网场景中的局限性愈发凸显。算法通用、场景不通用,无法以较低的边际成本解决场景碎片化问题。与此同时,边端算法受限、内存受限等问题,也限制了AI的进一步普及与落地。
相比之下,大模型有着更好地泛化能力,有望进一步突破传统算法的精度与数据局限,解决传统深度学习算法的数据依赖,这不仅能够降低训练研发成本,还可加快AI在垂直场景中的落地,很好地弥补传统深度学习算法的局限。
因此,宣布推出360智脑·视觉大模型,也成为了360完善自身大模型“多模态”技术能力,同时基于安防等对于图像视频需求更多的垂直行业,打造行业大模型的重要一环。
据孙浩介绍,360智脑·视觉大模型现阶段主要聚焦开放目标检测(OVD)、图像标题生成、视觉问答(VQA)三项能力。这三项能力可以在长尾目标检测、巡店、看护、设备巡检等场景中实现广泛应用,对传统深度学习算法形成很好的补充。
在360智脑·视觉大模型发布会现场,360集团创始人周鸿祎发言指出,“大语言模型攻克了认知层面的难题,大模型的出现标志着通用人工智能时代的到来。”而这也意味着,基于大模型的新一轮人工智能技术,已经具备了能够“读懂”图片、视频等文本以外的内容能力,让人工智能技术从最初的视觉感知,进化到视觉认知层面。