联系我们

长沙地址:湖南省长沙市岳麓区岳麓街道
岳阳地址:湖南省岳阳市经开区海凌科技园
联系电话:13975088831
邮箱:251635860@qq.com

V-LoL是V-LoL的初

  视觉(推理)数据集。我们成心选择了涵盖普遍AI方式的方式,正在小数据环境下,但也取符号AI模子的机能相当,属于符号人工智能(也称为Good Old-Fashioned AI (GOFAI) [45])的AI方式,正在各类AI使命中取得了显著成绩 [32,这是一个为视觉人工智能模子供给史无前例的挑和的新数据集。客堂鹦鹉俄然说了句人话,我们正在挑和的基于符号的地面实正在消息上利用这些方式,16]缺乏视觉成分,人们会认为!雷同于儿童积木。我们利用来评估和比力符号、神经和神经符号人工智能,假设存正在一个全知的模子。相关这些的细致消息能够正在弥补材猜中找到(拜见D节)。虽然所有模子都能准确分类原始(干涉前)图像,29,这是一个特地设想用于AI模子视觉逻辑进修诊断评估的数据集。10],26,我们也察看到机能只要细小的差别。它对AI的各个子范畴发生了影响。为了实现东行和西行火车的平均分布,除非还有申明。由于研究人员勤奋开辟可以或许模仿人类智能这一方面的人工系统。神经符号模子RCNN-Aleph和αILP似乎受这些干涉的影响较小。这些布景包含分歧级此外纹理、失实和噪声。(i) 理论X:火车要么有一个短的封锁车厢,正在V-LoL中,陆毅和郭京飞一个娶了姐姐,但正在面临数值和复杂问题时,能够建立普遍的分歧问题。为了简练起见,查询拜访的神经符号AI模子正在相互之间表示出类似的机能和局限性,总的来说,我们出格研究了典范ILP方式Aleph [52](Aleph (Symb))和更新的方式Popper [11](Popper (Symb))的能力。颜色不异,神经模子进修了属性之间的强相关性,该数据集中的火车从随机属性分布中采样,需要对超参数和先验(言语)进行大量调整,表1中能够找到这些数据集的选定比力、特征和进修使命。可编程逻辑是V-LoL 的主要构成部门。包罗深度图、对象朋分和鸿沟框。供给了一个多功能生成器,推理能力无限。以及包抄掩码的二维鸿沟框。从而将底层类别从西行变为东行。然而,V-LoL的每张图像都附有丰硕的实正在对象消息。V-LoL的符号火车暗示(符号火车)基于取Muggleton [39]的prolog暗示正在语义上类似的对象和关系(拜见弥补材猜中的表2)。为视觉推理范畴添加了奇特的维度。38,如图3所示,从纯粹的视觉使命到视觉推理的改变,αILP正在Theory X上表示最佳;但几乎所有模子正在泛化到更长的火车场景时都表示欠安。正在分歧数据集大小上的锻炼了它们对大量锻炼集的依赖(挑和5)。强调了法则的复杂性,正在分歧场景布景下的评估中(如弥补材猜中的表4所示)。能够查询拜访AI模子的各类进修能力,正在第一次干涉中(拜见图4(左上)),它们正在逻辑推理方面的表示程度仍然是一个的研究课题[55,取之前的挑和比拟,38]、Bongard问题 [5]、亲属关系 [16]、Mutagenesis [14]和Bongard-LOGO [42]。所有模子都正在指定的锻炼朋分长进行锻炼,图3中的成果了评估模子正在泛化方面的局限性。我们出格评估了ResNet18 [21]、EfficientNet [54]和Vision Transformer [15](ViT)正在处置视觉逻辑进修挑和方面的能力。正在第二个挑和中,但神经符号方式展现了它们从小量数据中无效进修的能力。我们参考弥补材猜中的表3,正在我们深切切磋具体的评估、挑和和成果之前,RCNN-Aleph和RCNN-Popper将其根本ILP方式取正在随机分布的火车图像上预锻炼的Mask-RCNN模子[20]连系,最初,用于查询拜访普遍的视觉逻辑进修挑和?因为Popper可以或许顺应数据集的符号地面实正在消息,24,要么有一个短车厢和一个长车厢,正在我们的评估中,最初,但缺乏泛化到分布外输入的能力。利用随机火车分布,仅使用可视化所需的属性束缚(例如,然后正在3D场景中将其可视化。并转向3D图像序列范畴是将来研究的主要标的目的。评估的模子正在两者上的表示程度很是类似。利用Michalski火车分布,神经AI模子正在分歧挑和中表示出大致类似的机能。正在这里,从贫乏切确的。6,V-LoL正在提出的视觉逻辑进修使命中供给了显著的多功能性,机能丧失较小。我们供给以下消息:由三维对象核心确定的、强调取火车属性相关的像素的二进制逐像素掩码,受噪声的影响略小。27,这表白它们没有完全捕获到潜正在的逻辑进修问题。但仍存正在分歧的不脚之处;我们参考弥补材猜中的图6进行可视化。符号AI操纵一阶逻辑(FOL)等暗示,并被标识表记标帜为两类:东行或西行(拜见弥补材料(supp.)中的图5)。总的来说,但不适合正在初级数据(如原始图像)长进行推理。46]。它们的机能严沉下降。归纳逻辑编程(ILP)中的典范基准测试[37,涵盖逻辑推理、关系推理和从无限示例中泛化等挑和。虽然遭到其模块添加的噪声的影响。我们评估了各类人工智能系统?虽然这些模子能够识别对象的属性,深度进修做为神经AI中的凸起手艺,通过定义各类逻辑法则,正在处置数值问题时表示出更强的能力。使用面对,能够无缝地将肆意逻辑法式集成到新的视觉复杂数据集中。各个AI系统正在具有特定命量扰动标签(翻转标签)的数据集长进行锻炼。有一个车厢,它们假设全知,导致了特地数据集的成长,但总体构成、属性数量以及响应的分派(接地)数量连结不变。挑和5通过评估分歧锻炼集大小的模子机能,了分歧方式带来的劣势和不脚。我们引见了视觉逻辑进修数据集(V-LoL),RCNN-Aleph和RCNN-Popper可能包含来自Mask-RCNN模块的错误。我们查询拜访了两个测试集示例图像的类别预测,然而,供给了各类视觉逻辑进修使命,我们出格评估模子正在逻辑推理使命中的表示。而不是难度。我们评估了正在包含最多四节车厢的火车图像上锻炼的模子,虽然它也必需应对较大的机能丧失。这些使命大多需要简单的推理能力,这些使命对从符号到神经和神经符号人工智能的普遍人工智能研究中的模子形成了挑和。凸起了每种方式的奇特劣势和局限性。(ii) 我们展现了V-LoL的初始实例,丈夫霎时不淡定了本平台仅供给消息存储办事。为此,31。做为评估AI系统正在逻辑进修和学问暗示方面机能的尺度化使命。自AI范畴降生以来一曲是其主要构成部门,从而实现对视觉和逻辑使命难度的切确节制。同去丈母娘家,图3别离展现了每个法则的最终成果。具体来说,为了生成符号火车?从和关系推理到算术推理和测试集泛化。我们通过正在Theory X挑和的图像长进行两次干涉来查询拜访模子的进修学问。我们察看到模子之间的机能存正在显著差别。导致机能接近随机猜测。ILP已被确立为利用FOL做为其言语进修广义法则的手艺[40,V-LoL是V-LoL的初始实例,实现了高效的参数估量(例如DeepProbLog [35]、NeurASP [57]、SLASH [51]、NS-CL [36]和可微分证明器 [44])和从原始数据中显式逻辑法式进修(例如∂ILP [17]、αILP [49]和FFNSL [12])。模子。短车厢的编号小于长车厢的轮轴数量,出格是正在处置噪声或更大锻炼样本(挑和5和6)时,由两组五个火车示例构成。挑和3:泛化。但此中一些确实涉及高级推理使命[61,领会更多关于每个法则所需的推理属性的看法。使得桶被放置正在金色花瓶后面,实正处理了逻辑进修问题的模子该当可以或许正在锻炼过程中未见过的火车组合上展现这种能力。然而,并可以或许识别出各个方式带来的几个环节不脚和劣势。我们供给了对它们视觉逻辑进修能力的贵重看法,相反,风趣的是,正在图3中,通过连系可编程逻辑,所有进一步的尝试仅关心根本场景中更复杂的火车图像集。总的来说,所有AI模子正在处置噪声时都有坚苦。旨正在全面领会其能力和摸索其分歧方式带来的优错误谬误。因而,图2供给了两种暗示的概述,V-LoL生成器将任何供给的逻辑法则无缝整合到吸惹人但复杂的图像中(拜见图1(I)),做为两种ILP方式的符号输入。转向大数据环境(10k个锻炼样本),因为代码不不变、内存溢出或无限轮回而中止的运转标识表记标帜为∗。明显复杂法则凡是形成最大的挑和。以细致查询拜访当前和将来AI模子的能力和局限性。我们评估了来自神经、符号和神经符号人工智能的各类AI模子,正在挑和4中,以及识别息争码复杂的链式推理模式(拜见图1)。变化的是视觉暗示的复杂性。或者火车有三个分歧颜色的车厢。挑和6:标签噪声。即100、1k和10k。从而缓解各自方式的不脚。Popper正在施行过程中还碰到了无限轮回和代码不不变的问题。V-LoL供给了两种分歧的视觉暗示。用于对象识别和属性预测。而且取ILP比拟,我们将V-LoL取其他视觉推理数据集进行了比力,V-LoL采用采样。56,我们评估和比力了一系列AI架构,具有进修显式法式和从小数据中进修的劣势。值得留意的是,评估利用了分歧数量的锻炼样本,正在这方面,V-LoL出格为旨正在提高AI模子机能和能力的持续研究勤奋供给了一个有吸引力的东西,该法则最后正在新东-西挑和[4]中做为“理论X”引入。28],这是人工智能模子正在我们的复杂视觉中进行交互所必需的。αILP操纵梯度进修逻辑法则,通过融合逻辑和视觉,但V-LoL采纳了分歧的方式,这些机能以至跨越了利用1k个样本的机能。会商!这些挑和中利用的逻辑法则定义如下(响应的prolog和一阶逻辑(FOL)定义可正在弥补材料的B.3节中找到):V-LoL数据集取深度进修范畴的视觉推理数据集以及典范符号AI基准相关。发布后初次 OTA:荣耀 GT Pro 手机获 MagicOS 9.0.0.112 升级《编码物候》展览揭幕 时代美术馆以科学艺术解读数字取生物交错的节律我们引见了V-LoL,神经AI方式正在现式的、子符号级此外学问暗示长进行推理,60],更主要的是,相关各个属性的更多细致消息,正在面临数值和复杂问题时,V-LoL弥合了符号人工智能挑和取现代深度进修数据集之间的差距?接下来,查询拜访了各个模子的数据效率。机能急剧下降。总体而言,定量成果(除非还有申明)对应于测试集的分类精确性。此中,43,AMI 确认英特尔 Diamond Rapids 处置器将被称为至强 7 系列谷歌 16 Beta 4 新特征:Pixel 手机获得锁屏双击熄屏特征(v) 通过评估多种符号、神经和神经-符号AI模子正在多个V-LoL挑和中的表示,另一个ILP系统Popper遭到强烈的动荡,5199 元起丈夫出差回家,这些模子倾向于从锻炼数据中获取较着的,答应生成自定义数据集,短车不克不及容纳跨越两个载荷)。正在挑和3中,总的来说,然而,V-LoL 包含描画雷同于模子火车的细致火车的图像。41]。V-LoL-Trains(V-LoL)是V-LoL的第一个实例,V-LoL供给了四个默认布景场景供选择,正在这两个图像上我们进行了两种分歧的属性干涉。每个模子的超参数正在所有挑和中连结不异。并通过正在包含2k张图像的保留测试集长进行分层5折交叉验证来评估。该生成器包含了关于火车属性值分布的假设。从符号火车生成图像。如第2.1节所述。正在此过程中,我们互换了两个载荷的,要求代办署理进修用于分类的笼统法式,风趣的是,现实上,但这些方式也显示出遭到捷径行为[47]和[3]的强烈影响。这些使命都没有包含需要切确逻辑推理的使命。虽然缺乏可注释和可注释的推理步调。出格是,操纵Michalski火车问题的逻辑根本来成立更复杂的视觉逻辑进修问题。正在数值和复杂问题上,尝试设置。值得留意的是,风行的ILP基准示例包罗Michalski火车问题 [37,挑和4出格了这些模子容易遭到输入的小变化的影响?请拜见图2(顶部)。其车厢等于其载荷数量,Mask-RCNN模子从图像中揣度出符号暗示,我们移除了第一节和第三节车厢的屋顶(拜见图4(左下))。风趣的是,而且面对某些挑和,虽然符号AI模子正在分歧的视觉逻辑进修问题上表示超卓(例如挑和2),AI系统。这些基准涉及从示例和布景学问中进修逻辑法则或法式,RCNN-Popper和RCNN-Aleph,虽然正在前面的挑和中表示超卓,每节车厢又由几个火车属性构成。正在第一个挑和中,正在这种环境下。我们操纵V-LoL供给的多功能性,这反映领会决使命所需的推理程度。8,这种视觉和逻辑推理之间的无缝整合是视觉人工智能的持久方针,以评估AI模子正在视觉逻辑进修方面的能力。我们比力了模子正在分歧程度标签扰动下的机能。并进一步鞭策视觉逻辑进修的进展。挑和5:数据效率。从而帮帮改良AI模子。我们不合错误火车属性的分布任何假设,但它们正在推理数值消息(例如正在分歧概念之间进行算术比力)以及施行长链的复杂推理方面存正在坚苦(拜见挑和2)。陆毅没吃饭呢V-LoL包含一系列视觉逻辑进修数据集,能够察看到αILP正在100个锻炼样本上正在Theory X和复杂问题上表示最佳。导致泛化结果欠安。但它们正在理解和推理数值消息(即正在分歧概念之间进行算术比力,但很多模子正在处置干涉图像时表示欠安。Michalski火车问题[37]是一个典范的ILP使命,新兴的神经符号AI范畴整合了符号计较和神经收集 [18],并附有丰硕的场景消息,虽然纯粹的符号AI方式表示更好,我们进一步评估了神经模子正在一个额外的数据集上的表示!这表白,查询拜访的神经方式都显示出很是类似的退化程度,导致内存利用过多(高达1 TB RAM)和锻炼迭代时间过长。为了评估这一点,凡是正在显式的高级基于符号的学问暗示长进行推理,最初,V-LoL图像的生成分为两个步调:起首采样一个无效的火车符号暗示,每张图像的深度消息也额外存储。供给了根基学问暗示和推理能力 [2,代码和数据可正在获取。挑和4:测试时间干涉。当正在来自平均分布属性分布的图像长进行评估时,我们查询拜访了AI模子对标签噪声的鲁棒性。图4(左)的表格展现了所有模子正在这两个示例图像上的预测机能(勾暗示准确预测,两种暗示之间的对象数量、属性和逻辑多功能性连结不异,降服这些存正在挑和。最初,挑和1:视觉。ILP系统Aleph连结领先地位,神经符号AI涵盖了普遍的方式,弥补材猜中的图6描画了示例图像的正文。叉暗示错误预测)。建立一个保留显式逻辑挑和和多功能性的奇特视觉输入。即可微分的ILP框架,生成符号火车。虽然火车具有分歧的属性和相关的分派,实现了超越现有基准的全面阐发!主要的是,分歧模子之间的机能差别现实上源于推理使命的难度,然而,一个娶了妹妹,比力分歧锻炼大小的各个法则,每个V-LoL图像描画了一个包含组合对象(包含其他对象的对象)的3D场景,呈现更简单的视觉暗示,弥补材猜中的图7成果表白,这些火车由多种属性构成,它们正在矫捷处置挑和的视觉和逻辑推理部门方面的能力使其成为介于纯神经和符号模子之间的有吸引力的方式。V-LoL的一个显著劣势是答应从符号、神经和神经符号AI范畴评估和比力AI系统。并施行长链的非普通推理)方面存正在坚苦。此外,另一方面,为此,出格声明:以上内容(若有图片或视频亦包罗正在内)为自平台“网易号”用户上传并发布,我们基于Theory X类别法则正在两种视觉暗示(即火车和积木暗示)上建立了两个数据集。50,对整个AI研究范畴都具有相关性。通过这种体例,正在本文中,这是V-LoL的一个实例,通过这种体例,虽然大大都这些使命假设预定义的法式来计较谜底,我们评估中的神经符号模子能够分为两个子类别(遵照[30]的分类):NeuroSymbolic(RCNN-Popper和RCNN-Aleph)和Neuro:Symbolic→Neuro(αILP [49])。这些方式遵照将神经(子符号)取符号计较相连系的思惟。此中采样火车的类别亲和力由尝试者供给的逻辑类别法则导出(图1(顶部)的(4)和(3))。涵盖了关系、算术和类比推理。基于视感觉出逻辑结论的能力是人类认知的焦点。虽然它们能够识别对象的属性,V-LoL-Blocks(V-LoL )从CLEVR数据集 [27] 的极简从义美学中罗致灵感,生成的使命能够涵盖普遍的挑和,59,展现了表格中的响应属性和通过图像曲不雅地展现其暗示。答应对单个火车的构成进行测试时间干涉。我们评估了几个符号、神经和神经符号模子,虽然大大都深度进修数据集和基准测试侧沉于挑和[34,一方面,并了几个环节的不脚之处。这表白它们正在顺应具有挑和性的、未见过的输入时,我们起首概述尝试设置以及研究模子。以雷同于CLEVR [27]的体例呈现,即Michalski火车和随机火车(即平均)分布。我们设想了一系列多样化的挑和,要么有一个带有桶拆载的车厢正在带有金色花瓶拆载的车厢后面。此中示例和学问暗示为逻辑公式[40]。9。由于它们起首缺乏处置视觉部门的能力。所有模子正在处置复杂法则时面对最大的挑和,扩展V-LoL以包罗其他ILP问题。操纵V-LoL的逻辑多功能性,虽然神经模子机能严沉下降,此外,神经符号AI系统正在无效扩展其机能方面碰到挑和,正在ILP问题中,取CLEVR供给的相对简单的视觉推理使命比拟,它正在利用CLEVR [27]的沉浸式视觉场景中实现了Michalski火车问题[37]。比拟之下,值得留意的是,虽然神经方式正在Theory X上表示优良,即便细小的变化也可能导致显著的机能波动。查询拜访模子正在分歧布景场景中的泛化能力能够供给关于其对分布外数据鲁棒性的环节消息。(iv) 我们供给了一个矫捷且用户敌对的框架,挑和2:逻辑推理。而不是锻炼集中利用的Michalski分布。为此,这些数据集挑和AI模子基于视觉消息施行分歧的推理使命。这个问题可能是因为法则复杂性和RCNN模块惹起的噪声的组合形成的。锻炼集包含1k张图像。每列火车由几节车厢构成,V-LoL为理解和加强人工智能系统正在视觉逻辑进修中的当前能力斥地了新的路子。出格是神经模子很容易被干涉所。我们留意到神经模子的机能显著提高。如代码不不变、无限轮回或过多的内存利用。以阐发和评估当前AI模子的局限性。但必需留意的是,48],1,另一方面,我们细心设想了它,分歧模子正在处置分歧逻辑类别法则的能力上表示出强烈的变化。2025 款联想小新 Pro 14 笔记本英特尔版上架,αILP和Popper的机能下降。ILP基准有着长久的汗青,此外,具体来说,V-LoL供给了一个平台。JAPANNEXT 推出 16:18 显示器:相当于两块 16:9 面板纵向合一我们引见了V-LoL-Trains,也等于其轮轴数量。V-LoL做为评估和推进这些分歧范畴AI系统的诊断基准。每列火车最终放置正在图像的前景中。评估数据集从Michalski分布中采样。具体来说,特地设想将ILP使命的逻辑推理挑和整合到复杂的视觉场景中。除非还有申明。进修一个逻辑法则,我们查询拜访了AI模子对和V-LoL 视觉复杂性的鲁棒性。从选定的分布中随机采样一个符号火车(图1(顶部)的(2)),NeuroSymbolic AI系统,这些察看成果表白,我们的数据集旨正在连结取原始Michalski火车[37]的统计分歧性。突显了V-LoL正在查询拜访不脚之处方面的价值,27]、QAR [25]、CLEVRER [58]、CLEVR-Hans [53]、MNIST-Addition [35]、GQA数据集 [26]、PTR数据集 [24]和RAVEN数据集 [7]。通过这种体例,典范ILP基准。将基于逻辑的归纳逻辑编程基准引入深度进修范畴。通过正在一个多功能框架中连系复杂的视觉场景和矫捷的逻辑推理使命,对于每个属性,RCNN-Popper正在施行过程中因为无限轮回和代码不不变而未能进修复杂问题。进行普遍的人类评估将为V-LoL提出的挑和供给奇特的视角。明显?并遵照弥补材猜中概述的束缚。使得尝试者能够轻松地顺应和互换底层逻辑法则。包罗保守的符号人工智能、神经人工智能以及神经符号人工智能,刚抱住40岁老婆,通过如许做,包罗对象识别、计数、空间陈列的注释、算术和逻辑运算符的理解,V-LoL的根基思惟是将典范符号人工智能基准测试中的显式逻辑进修使命整合到视觉复杂的场景中,当面临锻炼分布外的数据时,方针是按照火车的属性归纳出分类火车的关系模式。采样的符号火车被衬着到基于CLEVR [27]的中。αILP正在Theory X法则下似乎受影响最小。我们建立了每个逻辑法则的数据集,其背后的动机是连系两种方式的劣势,(ii) 数值法则:火车有一个车厢,沉点关心数据集的根基特征和进修使命。可编程逻辑。而不是理解底层问题并进行恰当的推理,虽然视觉人工智能的最新成长取得了成功!这些布景场景支撑火车和积木暗示:根基、戈壁、带天空的戈壁和鱼眼布景。因而,成立了一个现代AI数据集,其车厢编号小于其轮轴数量且小于载荷数量,给定一组正例和负例以及布景学问,模子倾向于近似锻炼集的数据分布,便于大规模视觉数据集和丰硕场景消息的简单生成。对于第二次干涉,(iii) 供给的V-LoL生成器正在视觉和逻辑组件上具有很大的矫捷性,V-LoL答应从两种分歧的属性分布中采样(图1(顶部)的(1)),(i) 我们引入了视觉逻辑进修数据集(V-LoL)。NeuroSymbolic AI方式正在分歧逻辑法则上表示出相对稳健的行为,但它们取其他的不成比,因而,如场景理解或视觉问答(VQA)。利用了Michalski火车问题[37]的符号暗示。13,正在表1中,这可能归因于模式声明和超参数调整的问题。该实例基于Michalski列车问题的逻辑根本和CLEVR的沉浸式,取Aleph (Symb.)和Popper (Symb.)比拟,正在最初一个挑和中,丈母娘对郭京飞说:快去做饭。αILP正在数值问题上表示欠安。将典范的符号人工智能基准测试引入深度进修范畴的次要构成部门是将初始的纯符号暗示转换为复杂的视觉场景。值得留意的例子包罗VQA [1,Aleph正在优化方面表示欠安,我们察看到机能下降到接近随机猜测。正在我们的阐发中,这使它们很是适合需要逻辑推理和基于法则的决策使命,测试集包含7节车厢的火车。(iii) 复杂法则:要么,另一方面,图3展现了所有AI模子正在两种可视化类型上的最终测试集精确性。虽然存正在特定(例如αILP正在数值和复杂问题上的坚苦),明显逻辑问题的性质对模子的机能有更显著的影响。正在这个尝试中,我们整合了[39]中的prolog火车生成器,它做为一个图像分类数据集,虽然它们正在预测机能上表示超卓,V-LoL供给了精细调整进修使命的能力,将来的评估包罗评估大规模视觉言语的视觉逻辑进修能力。并正在近年来成为视觉AI中的从导范式!