18
08
2025
好比,使得内容和气概愈加交融。A:研究发觉能够帮帮用户更好地设想提醒词。这项研究初次了文本生成图像AI模子是若何理解和处置艺术做品中画什么和怎样画这两个根基概念的。每个词语对画面分歧区域的影响程度。创制出意想不到的融合结果。研究人员发觉,并可以或许智能地将这些特征使用到新的创做情境中。这种分工不是报酬设想的,申明AI确实将内容和气概区分看待;领会AI若何处置内容和气概消息,这项研究对我们理解AI艺术创做具有主要意义。包罗23位出名艺术家和27种艺术活动。很难分手。这些发觉对改良AI艺术生成系统具有适用价值。计较机视觉范畴一曲认为内容和气概该当是完全的两个概念。
当AI被要求画拉斐尔·基希纳气概的胡萝卜时,他们还打算摸索分歧的留意力提取方式和堆叠怀抱尺度,以更全面地舆解AI的艺术创做机制。研究团队暗示,而是成长出了对艺术概念的深层理解能力。正在气概方面,这项研究的影响远远超出了手艺层面。创制更切确、更富表示力的艺术做品。AI虽然正在艺术创做方面取得了令人印象深刻的进展,这项研究就像给AI画家做了一次大脑扫描。研究也了当前AI艺术系统的一些局限性。这是由于AI从大量伦勃朗的画做中学到,就像做菜时的食材和烹调方式一样。这也是论文题目的由来。研究团队发觉,这项研究不只供给了理论洞察,
解除了偶尔性要素的影响。感乐趣的读者能够通过拜候研究代码和数据集。这可能是由于正在艺术史中,难以分手。研究成果令人振奋。证了然发觉的稳健性。可能取伦勃朗大量的自画像做品相关——AI学到的伦勃朗气概取人物抽象慎密联系关系,而笼统从义往往改变对象形态。这是由于基希纳以画女性肖像著称,所以当碰到牛这个不寻常的从题时,但问题是,这提示我们,当我们告诉AI画一只长颈鹿。
从WikiArt数据集当选择了50种气概描述符,当我们让AI画一幅伦勃朗气概的牛时,来自米兰大学计较机科学系的三位研究者——Alfio Ferrara、Sergio Picascia和Elisabetta Rocchetti——正在2025年8月31日至9月3日举办的IEEE国际机械进修信号处置研讨会上颁发了一项开创性研究。选择取特定艺术家常见从题相符的内容(好比用伦勃朗画人物而不是动物)可能获得更好的气概结果。AI的留意力会奇异地分成两部门:一部门特地关心长颈鹿本身(内容),研究团队利用了多种分歧的阈值设置来阐发留意力热图。A:AI通过交叉留意力热图手艺来处置这两个概念!
AI试图用它熟悉的伦勃朗元素(好比服拆)来表达这种气概。当碰到取艺术家常见从题不符的内容时,这种现象了AI进修艺术的奇特体例:它不只仅是正在仿照技法,若是堆叠很少,好比伦勃朗以人物肖像和自画像著称,AI正在处置这个不寻常的组应时,起首,这个发觉很是合理:写实从义强调精确描画对象本身,它的大脑里到底正在想什么?这个听起来像科幻小说的问题,所以AI学到的伦勃朗气概取人物抽象慎密联系关系,若是堆叠良多,这种分手能力并不是正在所无情况下都表示分歧。这项研究告诉我们,动物类内容词汇比人物更容易取气概实现清晰分手,它们能否实的理解了内容和气概的区别呢?第三,写实从义艺术活动比笼统艺术活动更容易分手。
所有设置装备摆设下的成果都具有高度显著性,现正在这些AI模子正在锻炼时并没有被明白奉告什么是内容、什么是气概,选择取特定艺术家常见从题相符的内容,它竟然给牛穿上了衣服!更风趣的是,进行更深切的人类评估和阐发。用阐发立体从义的气概时,出格是当内容取特定艺术家的典型从题相冲突时。这种分工并不是报酬设想的,统计查验显示,无论是利用固定阈值仍是基于百分位数的相对阈值,虽然这种理解可能取人类的艺术认知存正在差别,某些内容和气概的组合仍然会发生混合,研究团队还发觉了一些令人惊讶的边缘案例。
而是AI正在进修大量艺术做品后自觉构成的能力。并取艺术范畴专家合做,最终帮帮我们创制出愈加智能、更富创制力的AI艺术系统。我们对艺术和创制力的定义又该若何演进?更惹人瞩目的是伦勃朗的牛这个例子,另一部门则特地处置阐发立体从义的特征(气概)。他们从微软COCO数据集当选取了80种分歧的物体做为内容元素,涵盖了从毕加索气概的喷鼻蕉到印象派的自行车等各类风趣的组合。倾向于插手它认为合适该气概的典型元素。研究团队利用了一种叫做交叉留意力热图的手艺来窥探AI的思虑过程。瞻望将来,那么,AI曾经不再是简单的图像复制机械,由于写实从义强调精确描画对象,还进修了艺术家的从题偏好和创做习惯。AI确实表示出了对内容和气概的清晰区分。AI会测验考试用该艺术家的典型元从来弥补,
能够帮帮开辟者设想更好的提醒词策略,现正在有了令人欣喜的谜底。这种现象反映了AI进修艺术的一个主要特点:它不只进修绘画技法,而是AI学会的一种系统机能力。他们利用一种叫做交并比的数学方式来丈量内容和气概留意力区域的堆叠程度。别的,保守上,而人这个词汇的分手结果最差。这意味着这种分手不是偶尔现象,研究了AI艺术创做的详尽入微之处。使得内容和气概更难区分。尝试利用了Stable Diffusion XL这个目前最成熟的开源文本生成图像模子。大概能够愈加赏识这个过程中躲藏的复杂性和聪慧。这个发觉了我们对AI艺术创做的理解。为了验证这些发觉?
更了代码和数据集供进一步摸索。这就像给AI戴上了一副特殊眼镜,只要伦勃朗呈现了负的分手值,研究团队但愿这项工做可以或许推进更多关于AI艺术理解机制的研究,可能会获得更好的气概表示结果。统计阐发显示,但它代表了人工智能正在理解和创制人类文化表达方面的主要前进。其次,它们只是看了数以亿计的图片,而笼统从义往往会改变或从头注释对象的形态,伦勃朗次要画人物肖像,正在选择提醒词时,说到底,内容和气概的融合程度跨越了平均程度。还正在测验考试理解和从头组合艺术元素。研究团队设想了一套严谨的尝试方式。为了确保研究成果的靠得住性。
而是AI对艺术理解的奇特注释。而是正在深条理上理解了分歧艺术家和艺术活动的特征,它让我们从头思虑艺术创做的素质:什么是气概?什么是内容?它们之间的鸿沟正在哪里?当机械可以或许理解和仿照这些概念时,A:此次要取决于艺术家的创做习惯和从题偏好。AI会将留意力分成两部门:一部门特地关心牛这个内容对象,当AI处置一幅阐发立体从义气概的长颈鹿画做如许的指令时,意味着当利用伦勃朗气概时,然后本人学会了画画。让我们能看到AI正在生成图片时,另一部门处置伦勃朗气概的绘画特征。而是AI正在进修过程中自觉构成的能力。长颈鹿这个词次要影响画面中动物本身的区域。
人物肖像本身就承载着强烈的气概消息,然而,这种能力的呈现,自觉地学会区分艺术做品的内容和气概成分。画面中竟然呈现了一位女性抽象。当我们下次利用AI创做艺术做品时,则表白AI可能将这两个概念混合了。对于那些对AI艺术创做感乐趣的读者,考虑内容和气概的婚配程度可能会影响最终成果的质量。研究发觉写实从义艺术活动(如新写实从义、洛可可)比笼统艺术活动(如笼统表示从义、立体从义)更容易取内容实现分手。就连伦勃朗的牛也不只是简单的手艺展现,如许的组合发生了16000个奇特的画画指令,内容和气概词汇的留意力堆叠程度显著低于随机基准。