您当前所在的位置: 网站首页 -> 学术成果 -> 学术论文 -> 正文

高峰|AIGC 赋能计算艺术的实践路径研究——以中国传统文化的当代表达为例

发布日期:2025-09-17   点击量:

【本文原载于中国艺术杂志公众号2025年9月5日推文】

摘要:人工智能生成内容(AIGC)正推动计算艺术从早期以规则驱动为特征的范式转向更具创造力的自动生成机制。当前,AIGC 在文本、图像、音频等多模态领域已展现出接近人类的内容生成能力,其在内容理解、风格迁移与语义联想等方面的优异表现,使其在创意实践中的应用成为可能。在此基础上,本文构建了一个以概率建模为核心的 AIGC 理论框架,将数据、模型与生成机制三大关键要素整合为协同交互的系统。进一步地,本文以中国传统文化的当代表达为实践范式,探索包括多模态文化数据集构建、多模态模型训练与文化风格建构、人机交互式创作平台开发在内的系统路径,旨在探讨 AIGC 赋能下计算艺术的技术逻辑、文化转译机制与美学重构的可能性。

关键词:AIGC、计算艺术、理论框架、中国传统文化

Abstract: Artificial Intelligence Generated Content (AIGC) is driving a paradigm shift in computational art, transitioning from early rule-driven models to more creative, autonomous generative mechanisms. Currently, AIGC demonstrates human-like generative capabilities across multimodal domains such as text, image, and audio. Its outstanding performance in content understanding, style transfer, and semantic association has enabled its application in creative practices. This paper proposes a theoretical framework of AIGC centered on probabilistic modeling, integrating data semantics, generative models, and control mechanisms into a collaborative interactive system. Furthermore, taking the contemporary representation of Chinese traditional culture as a practical paradigm, this paper explores a systematic approach that includes the construction of multimodal cultural datasets, the training of multimodal models for cultural style formation, and the development of human-computer interactive creative platforms. The aim is to investigate the technical logic, cultural translation mechanisms, and aesthetic reconstruction possibilities of computational art empowered by AIGC.
Keywords: AIGC, Computational Art, Theoretical Framework, Chinese Traditional Culture


一、计算艺术从程序逻辑到 AIGC 的演进

计算艺术是指以计算机及其算法系统为核心手段的艺术创作形式,起源可追溯至 20 世纪 60 年代。当时,伴随计算机图形处理技术的兴起,一批先锋艺术家开始尝试将程序语言转化为图像与声音,由此开启了基于代码与算法的艺术实践。随着数字技术的持续演进,尤其是人工智能的快速发展,计算艺术经历了多阶段演化。本文以人工智能生成内容(Artificial Intelligence Generated Content,简称“AIGC”)的广泛应用为历史分水岭,将计算艺术的发展划分为两个阶段:1.0 阶段以规则驱动和算法设定为核心,强调程序生成与控制;2.0 阶段则以 AIGC 为代表,基于深度学习模型实现更高程度的自动生成,表现出更强的内容自主性与风格复杂性。值得注意的是,计算艺术应区别于数字艺术与电子艺术,后者主要强调媒介的数字性或电子性,而计算艺术的核心在于“计算”过程本身——算法与程序在艺术生成中所起的主导作用。

(一)计算艺术 1.0 阶段

计算艺术 1.0 阶段的核心特征是基于预设规则与算法逻辑的图像生成。在此阶段,计算机主要作为执行指令的工具,尚不具备语义理解或自主创作能力。艺术家通过编程语言构建创作系统,借助程序控制图形输出,探索形式美学与计算逻辑的结合。

该阶段的早期实践可追溯至 20 世纪 50 年代。美国艺术家本杰明·弗朗西斯·拉波斯基(Benjamin Francis Laposky)利用示波器控制电子信号生成“电子图像”,其《波形图》(Oscillons)系列通过调控正弦波与频率形成动态几何图形,开创了“电子美学”的视觉实验路径。随后,计算艺术进入以算法绘图为核心的系统化阶段。德国艺术家弗里德·纳克(Frieder Nake)于 1965年创作《向保罗·克利致敬》(Hommage à Paul Klee,图 1),运用数学函数模拟克利绘画中的节奏与空间结构;德国艺术家格奥尔格·尼斯(Georg Nees)于 1968 年完成《碎石》(Schotter,图 2),通过逐行引入随机旋转与位移,实现“秩序—混乱”的程序化过渡,成为“生成性”思维的早期范例。

图 1   [德] 纳克,《向保罗·克利致敬》,数字绘图作品,1965 年,英国维多利亚与艾尔伯特博物馆藏

图 2   [德] 尼斯,《碎石》,计算机生成艺术作品,1968 年,英国维多利亚与艾尔伯特博物馆藏


英国艺术家哈罗德·科恩(Harold Cohen)是该阶段的重要代表。他自 20 世纪 70 年代起开发图像生成系统 AARON,使计算机具备自动绘图能力(图 3)。AARON 系统的创作从早期的黑白线条发展至后期的彩色具象构图,展现出程序在模拟人类绘画行为方面的潜力,其作品曾多次在旧金山现代艺术博物馆等机构展出,是最早进入主流艺术体系的人工智能艺术项目之一。

图 3   [英] 科恩,《无题》,计算机辅助绘制艺术作品,1982 年,美国惠特尼博物馆藏


在创作工具方面,美国艺术家卡西·瑞斯(Casey Reas)与程序员本·弗莱(Ben Fry)于2001 年联合开发的开源语言 Processing,为创意编码与视觉编程提供了入门平台。美国艺术家贾里德·塔贝尔(Jared Tarbell)通过 Processing 平台创作出“混沌和控制二元性”代表性作品《气泡室》(Bubble Chamber,图 4)。此外,德国艺术家曼弗雷德·莫尔(Manfred Mohr)是几何算法艺术的重要实践者,自 20 世纪 70 年代起便基于高维超立方体的变换进行图像生成,其作品强调形式纯粹性与计算精度,代表了计算艺术中“数理美学”的典型风格。

图 4  [美] 塔贝尔,《气泡室》,计算机生成艺术作品,2003 年,图片来源:里德·塔贝尔个人主页


在技术特征方面,计算艺术 1.0 阶段呈现出以下几个显著特征:第一,规则驱动性显著,艺术家需预先设定全部算法流程与参数值,创作逻辑固定且呈线性展开;第二,形式导向性突出,作品多表现为抽象图形、几何构造与参数变异,普遍缺乏语义层次的表达能力;第三,创作高度依赖人类主导,艺术家全面掌控创作过程,计算机仅作为规则的执行者,尚不具备自适应学习能力;第四,创作门槛较高,需依赖编程知识与数学建模能力,创作者群体相对封闭。

总体而言,计算艺术 1.0 阶段构成了人机共创范式的雏形。尽管当时的创作受限于硬件性能与算法复杂度,但为后续人工智能艺术的发展奠定了“程序思维”与“自动生成”这两大核心美学基石。

(二)计算艺术 2.0 阶段

深度学习技术的迅猛发展为艺术创作带来了革命性变革,特别是 2014 年伊恩·古德费洛(Ian Goodfellow)提出的生成对抗网络(GenerativeAdversarial Networks, 简 称“GAN”),为计算机生成高质量视觉图像提供了有效机制。随后,以 OpenAI 为代表的一系列研究机构陆续推出了 GPT、DALL·E、CLIP 等先进生成模型,正式开启了 AIGC 时代。AIGC 技术的突破也构成了计算艺术的分水岭,标志着其正式迈入2.0时代。

在计算艺术 2.0 阶段,创作模式由传统的程序控制范式转向人机共创的交互机制,艺术家通过提示词(Prompt)与人工智能进行动态互动,从中激发灵感并引导生成过程。同时,AIGC 工具的广泛普及显著降低了创作门槛,使非专业用户亦能够生产出高质量的艺术作品,推动了艺术实践的大众化与去专业化趋势。

在 AIGC 技术的驱动下,艺术表达形式呈现出前所未有的多样化态势。文本生成图像已成为主流创作实践之一,用户可通过自然语言提示生成具象或抽象的图像。代表性平台包括:DALL·E 系列,凭借出色的图文对齐能力与细节控制广受欢迎;Midjourney,强调风格美学与构图创新,在艺术社区中形成了广泛用户群体;Stable Diffusion,作为开源模型推动了人工智能艺术在本地化与个性化方向的发展。

在图像生成图像与风格迁移方面,DeepArt基于神经网络的风格迁移模型,可将用户照片转化为模仿凡·高、毕加索等艺术家风格的作品;Runway ML 则提供模块化图像编辑功能,支持图像局部修改、语义控制与多重生成。视频生成领域亦发展迅速。Sora 是目前最受瞩目的文本生成视频系统,能够生成具有镜头语言、空间深度与角色动作的视频片段;Pika Labs支持通过短文本或参考图像实现视频自动生成,强调动画表现与风格一致性;Runway Gen-2 则支持文本、图像与视频帧等多模态输入,生成高质量动态影像,广泛应用于实验电影、数字叙事与虚拟摄影。

在音频与音乐生成方面,AIGC 工具已可依据文本描述、情绪标签或旋律线索自动生成音乐与音效。MusicLM 与 AudioCraft(MusicGen)能够基于自然语言生成高保真音乐片段;Voicemod与 ElevenLabs 等平台则支持高质量语音克隆与合成,广泛应用于虚拟角色构建、叙事动画配音及声音装置艺术等场景。

与此同时,人工智能驱动的虚拟形象与表演也成为新兴艺术形式之一。Character.AI、Synthesia 与 Soul Machines 等平台可生成具人格特征的可交互虚拟角色,用于影视制作、舞台投影与实时互动剧场。人工智能编舞工具如 Move.AI与 DeepMotion 则可自动生成舞蹈动作,或在 3D环境中驱动数字身体实时表演,显著拓展了身体美学的表现维度与技术边界。

在作品层面,人工智能艺术已逐步进入主流艺术体系,并引发关于“作者身份”与“原创性”的广泛讨论。2018 年,法国艺术团体 Obvious 利用 GAN 创作的肖像画《埃德蒙·贝拉米》,在英国佳士得拍卖行以 43.2 万美元成交,标志着AIGC 艺术首次进入全球主流艺术市场,成为公众关注的焦点。

德 国 艺 术 家 马 里 奥· 克 林 格 曼(Mario Klingemann)自称“人工智能美学探索者”,是 AIGC 艺术的重要代表人物之一。他长期以GAN 与风格迁移技术为媒介,围绕人类面孔、视觉认知与机器偏差等主题展开创作。其 2018年推出的《路人记忆Ⅰ》(Memories of Passersby I,图5)是一件基于GAN实时生成“永不重复肖像”的装置艺术作品,观众所见图像不断变换,挑战了传统静态艺术的观念,赋予 AIGC 艺术“动态生命”的特征。该作品曾于英国苏富比拍卖行展出,引发业界广泛讨论。

图 5  [德] 克林格曼,《路人记忆Ⅰ》,计算机生成装置艺术作品,图片来源:英国苏富比拍卖行官网


美国计算机科学家艾哈迈德·埃尔加马尔(Ahmed Elgammal)则致力于连接人工智能创作与艺术史研究。他领导的“艺术与人工智能实验室”开发了创意对抗网络(Creative Adversarial  Network,简称“CAN”)模型,通过引入“风格偏离”机制,试图使 AI 生成不属于任何既有艺术流派的全新图像,突破简单模仿的限制。埃尔加马尔亦与多家博物馆展开合作,探索 AI 在艺术风格识别、历史重建等方面的应用潜力。土耳其裔媒体艺术家雷菲克·阿纳多尔(Refik Anadol) 在《机器幻觉》(Machine Hallucination)、《量子记忆概率》(Quantum  Memories Probability)等系列作品中,将 GAN 技术与大规模数据集融合,构建出沉浸式视觉体验,呈现人工智能如何在“梦境”中重构城市记忆与量子景观。这类作品强调机器感知与人类意识的交汇,扩展了人工智能作为视觉叙事媒介的表现力。

2022 年, 美 国 艺 术 家 杰 森· 艾 伦(Jason  Allen)借助 Midjourney 平台创作的《太空歌剧院》(Théâtre D’opéra Spatial,图 6)在科罗拉多州艺术博览会上从数百件人类创作中脱颖而出,荣获“数字艺术 / 数字操控摄影”类别金奖。该作品融合宏大的剧院构图与奇幻宇宙景观,引发了关于“艺术家定义”与“人工智能创作地位”的激烈讨论。这一事件被广泛视为 AIGC 艺术正式进入传统艺术评奖体系的里程碑,亦标志着公众认知态度的显著转折。

图 6  [美] 艾伦,《太空歌剧院》,计算机生成艺术作品,2022 年,图片来源:杰森·艾伦个人主页


AIGC 的兴起促使计算艺术从“规则驱动”的演绎范式转向“数据驱动”的生成逻辑,推动其实现了从确定性编码到概率性学习的深层范式转变。艺术创作亦由以往机械执行的程序逻辑,演进为基于语义理解的人机协同机制,凸显出人工智能在意义建构过程中的技术中介作用。笔者长期从事计算艺术相关研究,关注科技与艺术的跨界融合,涵盖人工智能绘画、交互装置、数字人、VR 游戏等多个方向。在创作实践中,笔者亦尝试与 AIGC 系统协同工作,探索生成模型在视觉叙事与文化表达中的潜力。本文立足于笔者在计算艺术领域的理论研究与实践经验,提出一个以概率建模为核心,以数据、模型与生成机制为关键要素的 AIGC 理论框架,并以中国传统文化的当代表达为研究视域,系统探讨 AIGC 赋能计算艺术的路径机制,涵盖文化数据集构建、文化风格建构与人机交互式创作等关键环节。


二、从艺术创作视角构建以概率建模为核心的AIGC 理论框架

AIGC 的飞速发展正在深刻重塑当代艺术的创作逻辑、媒介结构与审美范式。从文本生成到图像合成,从音乐编排到虚拟世界构建,AIGC正逐步构建起一种新的“技术—美学”综合体。尽管已有研究从计算机科学、数字艺术、心理学等多个维度探讨了 AIGC 的技术原理与文化影响,但如何从艺术创作本体出发,系统建构一个内在整合 AIGC 生成机制的理论框架,仍是当前学术界面临的重要前沿问题。特别是在当下数据驱动、模型构建与机制生成三者嵌套交织、非线性交互的复杂创作结构中,急需一种具备统一解释力的理论视角,以全面解析其生成逻辑与机制本质。本文以概率建模为核心,提出一个面向AIGC艺术创作的理论框架,该框架以“数据—模型—生成机制”为基础范式,将 AIGC 创作过程理解为对潜在美学分布进行建模,并通过采样操作实现具象表达。此理论不仅有助于揭示AIGC 艺术的内在逻辑,也为后续跨学科研究提供了清晰的认知结构与方法论支撑。

(一)概率建模视角下的艺术生成逻辑

概率建模是当前深度学习框架中构建生成模型的基础方法论。从早期的变分自编码器与GAN,到近年来广泛应用的扩散模型,其核心逻辑均可视为对图像、文本、音乐等高维数据背后潜在概率分布的建模与重构,从而在新的输入或控制条件下实现具有“拟真性”或“创意性”的内容生成。本质上,AIGC 并非直接“生成”内容本体,而是在“观测—建模—采样”的循环机制中,从潜在分布中抽取表达实例,实现对意义与形式的再创造。

将这一概率建模视角引入艺术创作理论,有助于揭示 AIGC 所体现的“潜能表达”范式。在传统艺术观中,创作通常被视为主体情感与经验的独特外化,其价值建立于不可复制性与个体表达;而在 AIGC 语境下,创作被重新定义为从建模出的“可能性空间”中抽取具有审美价值的样本。艺术家的角色由“内容生成者”转变为“潜能结构的引导者”或“生成流程的设计者”。在这一理论框架中,数据构成概率空间的观测投影,模型是该空间的结构表达,而生成机制则承担路径选择与样本调控的功能。以上三者共同构成一个闭环的生成系统,在概率建模这一核心思想下实现有机整合,构成理解 AIGC 艺术逻辑的基础范式。

(二)数据:潜在分布的观测投影与文化编码

数据不仅是模型训练的原始输入,更是潜在概率结构的表征媒介。从概率建模的视角来看,每一个图像、文本或音频样本,实质上都是从某一潜在分布中采样所得的观测点。换言之,所谓“训练数据集”,本质上是艺术风格、文化表达与语义惯习的样本化投影。因此,对数据的理解不应仅限于其统计属性,更应深入其审美结构、符号逻辑与文化语境。

首先,数据在AIGC艺术创作中构成一种“风格场”——不同类型的数据集往往对应着特定形态的潜在分布。例如,以凡·高画作为训练基础的图像模型,其潜空间将集中于粗犷笔触、浓烈色彩与旋涡构图等区域;而以宋代山水画构建的分布,则可能体现出高远、留白与笔墨结构所形成的稀疏美学密度。此类分布差异构成了 AIGC生成结果中的“风格偏置”,也使训练数据的选择本身成为一种隐性但关键的美学决策。

其次,AIGC 中的数据呈现出嵌套式语义结构,在多模态生成系统中尤为显著。图文生成模型通过构建图像与文本在共享语义空间中的对齐机制,使自然语言提示成为图像生成的语义控制变量。其生成效果很大程度上取决于训练数据中图文配对的语义密度、标签粒度与风格多样性。因此,AIGC 创作中的数据不再是被动的“原材料”,而是构成潜在美学语法系统的核心单元。

最后,从艺术伦理与文化政治的维度看,数据还具有文化编码性。不同文化背景、性别立场与社会群体所贡献的数据,所承载的价值观、感知模式与美学立场可能在模型中被继承、放大甚至扭曲。这意味着,AIGC 艺术中的数据采集、筛选与再设计,不仅是技术层面的操作,更是关涉创作伦理、文化权属与表达正义的核心议题。

(三)模型:潜在分布的构建装置与风格推理装置

模型是 AIGC 系统中对数据分布进行建模与生成的核心机制。在概率建模框架下,其基本任务是通过特定数学结构(如深度神经网络)对潜在分布进行近似重构,或在条件生成任务中学习条件概率的映射函数。在艺术创作的语境中,模型既可被理解为风格推理装置,亦可视为结构化感性的技术表征——它将感性表达的非确定性编码为可操作的生成路径。

从结构维度来看,尽管当前主流的生成模型在技术实现上各有路径(如变分自编码器、GAN、扩散概率模型等),它们普遍依赖“潜变量空间”作为中介,将高维非结构化数据压缩至低维潜能表示,从而构建出可调控的生成框架。特别是在扩散模型中,噪声注入与去噪重建过程模拟了一种“从混沌走向秩序”的生成轨迹——在某种程度上对应了艺术创作中“灵感—酝酿—建构”的演进逻辑。这种机制赋予 AIGC 系统以高度的结构可塑性,使得艺术家可通过干预潜变量(如提示词、风格编码、随机种子等)实现风格的细粒度调控与语义内容的精准引导。

从生成逻辑来看,模型的艺术功能可视为一种“算法性直觉”,它不仅能基于训练数据进行风格归纳,还具备在复杂潜空间中生成超越经验分布的表达样式的能力。这种“创造潜能”使得AIGC 不再只是再现机制,更成为生成实验性美学的技术载体。通过风格融合、语义重构或跨模态迁移,模型能够突破既有艺术语言的边界,生成具有开放性与未来感的图像样式。

然而,模型的创造潜能并非无限延展,其边界受到多个要素的共同制约,包括训练数据的分布范围、模型架构的设计策略、目标函数的优化逻辑等。因此,AIGC 系统的生成表现力本质上是“可设计的潜能结构”。艺术家可通过模型设计、语料筛选与优化目标设定等手段构建带有特定风格导向的生成系统。这一过程本身构成一种“元创作”实践,即将算法系统本体纳入艺术创作的范畴,使艺术家的主体性在技术系统中获得延展与再定义。

(四)生成机制:从采样到控制的艺术操作系统

生成机制指的是在模型构建完成后,从其潜在分布中进行样本采样、输出与调控的全过程。它既包括算法层面的采样策略,又涵盖交互层面的提示词构造(提示词工程)、参数设定与后处理操作,构成模型潜能向具体艺术作品转化的关键接口与操作环节。

在艺术创作语境中,生成机制可视为“创作技艺的再编码”。如果说传统艺术依赖笔触、修辞、构图等手工技法来完成创作表达,那么AIGC 系统中的提示词构造、控制参数与生成节奏则构成了一种新的数字化创作技法。以图像生成任务为例,“水墨山水,淡彩设色,高远构图,留白意境,仿宋人笔法”这类提示词,既明确了语义意图,又编码了美学特征与视觉风貌,其语言组织本身即是一种美学实践。这种“语义—风格—图像”之间的转换关系,体现出语言在 AIGC 生成中由描述工具向生成工具的角色转变。

更重要的是,生成机制具有循环性与交互性。AIGC 创作往往并非一次性完成,而是要经历多轮“生成—筛选—反馈—调整”的循环过程。艺术家在这一过程中持续参与,引导模型生成结果朝向特定的审美预期演化,从而形成一个“交互—审美”的动态生成闭环。相比传统艺术的线性输出结构,AIGC 创作体现出更强的非线性路径性:生成是一个“潜能探索—扰动试验—审美筛选”的动态演化过程,接近自然系统中“变异—选择—稳定”的生成逻辑。

随着 AIGC 系统向多模态融合不断推进,生成机制的复杂性亦显著提升。创作主体面临的已不再是单一模态(图像或文本)的控制问题,而是跨越语义、视觉、听觉甚至空间维度的协同生成挑战。例如,艺术家可通过文本提示词生成图像,再基于图像特征反向驱动音乐生成,最终形成一个“语义—视觉—听觉”联动的“跨模态叙事结构”。在这一背景下,生成机制不仅承担起媒介整合的功能,更成为构建多感官艺术语言与沉浸式审美体验的关键技术平台。

(五)生成系统的协同演化:从建模到美学生成的闭环机制

在以概率建模为核心的理论框架中,数据、模型与生成机制并非孤立并置的技术环节,而是构成一个内在耦合、动态演化的协同生成系统。该系统呈现出从数据经验中抽象潜在模型结构,再经由生成机制将潜能“具现化”为艺术作品,并通过循环反馈持续优化生成路径的闭环机制。由此,AIGC 的艺术生成过程可被理解为一个具有认知驱动、操作路径与演化能力的生成性系统,其整体运行逻辑可从以下三个层面予以解析。

首先,在认知层面,AIGC 生成体现为由“样本经验”向“潜在规则”的结构跃迁。训练数据不仅承载了历史经验与文化语义,更构成潜在美学结构的观测投影;模型的任务即是从中抽象出具备泛化能力的潜空间,实现对风格规律、文化符码与语义关系的建模。艺术家若能掌握该潜在结构,便可跳脱单一风格的再现逻辑,转而探索“风格的生成逻辑”乃至“结构的抽象范式”,从而展现出更高阶的艺术主体性。

其次,在操作层面,该系统构成一套可调控的生成路径结构:数据决定潜空间的拓扑分布,模型确定其可遍历的结构边界,而生成机制则调节采样策略与表达方式,决定“采何”“采何时”“采何处”。艺术家通过提示词构造、参数调控与样本筛选,在高维潜空间中实施节奏化的生成干预,逐步形成一种具有内在一致性与风格特异性的“生成性语法体系”。

最后,在演化层面,生成系统具备反馈驱动的自我调整能力。每一次生成行为不仅产出具象结果,也构成对系统表现力的隐性评估。当输出偏离预期时,艺术家可通过重构数据集、调整模型参数或优化生成机制,引发系统性的适应性重构。这一准进化逻辑使 AIGC 系统具备“自反性迭代”特征:生成不仅是结果导向的操作,更是系统演化的触发器。美学潜能在这一不断扰动与修正的循环中得以扩展与深化。

从系统论视角看,该三元协同结构具备一定程度的自组织性与非中心化属性。在高维潜空间中,模型并不直接生成意义,而是生成一组形式潜势;意义的实现依赖于艺术家对生成样本的选择性解读及其在特定文化语境中的再编码。这种机制打破了传统创作中“作者中心论”的逻辑,转向一种多主体协同、开放式解读的“共构型创作模型”。

基于此,AIGC 可被视为一种新型的生成性美学系统:其根本任务不在于模拟人类创作本体,而在于构建一个具备形式生成能力、反馈进化能力与人机协同接口的开放型系统。它不仅能在算法机制下自洽地输出高维风格结构,更为艺术家提供引导、干预与再阐释的空间接口,从而开启人机协同创作的新范式。这一机制预示着艺术创作正由静态表达系统向动态演化网络转型,呈现出艺术主体性、算法结构与文化语义之间协同演化的未来图景。


三、AIGC 赋能中国传统文化当代表达的计算艺术实践路径

在 AIGC 技术的推动下,计算艺术正经历一场深刻的范式转型,尤其是在以概率建模为核心的生成体系中,艺术创作日益演化为一个由“数据—模型—生成机制”协同驱动的复杂过程。这一生成性机制不仅重构了艺术的媒介结构与操作逻辑,也为中国传统文化的当代表达开辟了前所未有的技术路径与创作可能。在此语境下,本文旨在探讨如何将中国传统文化蕴含的哲学思想、审美范式与视觉语言,借助 AIGC 系统进行有效编码、生成与重构,从而实现技术逻辑与文化内涵的深度耦合与协同演化。

中国传统文化作为一个高度系统化的文化谱系,内蕴丰富的视觉资源(如书法构形、山水笔意、青铜纹样)、叙事机制(如象征表达、虚实相生、留白技法)与美学理念(如天人合一、中和之美、意境营构),在本体论与方法论层面均与西方艺术体系存在显著差异。这种差异性既构成 AIGC 系统在语义建模与风格生成方面的技术挑战,又蕴含着文化再创造的独特潜能:一方面,当前主流 AIGC 系统多建立在西方视觉经验与语言语料之上,其潜在分布结构难以原生性地支持中华美学的风格表征与语义生成;另一方面,AIGC 所具备的风格迁移、语义控制与跨模态建模能力,也为中国传统文化的数字转译、多模态重构与当代表达提供了关键性突破口。

在前文所建立的“生成性美学系统”理论框架基础上,下文将从实践层面进一步探讨 AIGC如何赋能中国传统文化的当代表达。分析将围绕以下三个关键维度展开。

一是数据集构建:探讨如何从中国传统艺术与文化遗产中提取、整理与结构化语义标签,构建具备文化深度与风格辨识力的高质量训练语料,奠定模型生成的语义基础,确立审美坐标。

二是模型训练与风格优化:研究如何在现有AIGC 架构下引入契合中华文化表达逻辑的建模机制,提升模型在风格分布、结构生成与文化嵌入等方面的表现能力,实现对传统视觉语言的深度学习与创造性再生。

三是人机交互与创作平台开发:分析如何构建支持语义引导、风格可控与多轮反馈的创作平台,使艺术创作者能够以灵活、开放的方式介入生成过程,推动人机协同的艺术实践与文化共创。

通过上述三个环节的系统分析,本文尝试为中国传统文化在 AIGC 语境下的当代表达提供一套具有可操作性的生成路径,也为人机共构、文化重释与艺术创新之间的协同机制探索理论与实践的双重支撑。

(一)多模态文化数据集构建

在以 AIGC 赋能中国传统文化的实践路径中,多模态数据集的构建构成文化语义转译机制成立的基础性支点。依据常规的生成模型开发流程,数据构建通常包括三个基本步骤:其一,数据采集与抓取,主要通过互联网开放资源、图像爬虫与文本语料抓取等手段,集中获取图像、文本、音频等单模态媒体数据;其二,数据清洗与预处理,聚焦于格式统一、重复剔除、噪声过滤与分辨率增强等环节,以提升数据整体质量;其三,多模态对齐与语义标注,借助人工标注、规则系统或机器学习模型,构建不同模态之间的语义对应关系,并建立系统化的标签体系以支持下游建模任务。尽管该路径在通用生成模型构建中已趋于成熟,但面对中国传统文化所承载的复杂语义结构、跨模态关联逻辑与深层美学特征,常规数据构建方式在文化适配性与表达深度上仍显不足。因此,有必要从文化语义的结构出发,结合传统文化的分层系统与表达逻辑,重构更具文化敏感性与生成导向的数据采集与标注机制。

当前,我国已在国家层面推动多项中华优秀传统文化数字化工程,例如《中国历代绘画大系》《中华古籍资源库》与《中国传统音乐录音档案》等。尽管这些项目的初衷并非面向 AIGC 系统设计,但其在多模态文化资源的采集与整理方面均提供了坚实的底层支撑。相关数据涵盖传统书画图像、古籍文献、戏曲舞台影像、古曲录音、礼仪视频及技艺类非遗资料等,呈现出极大的模态跨度与文化密度,具备构建深层文化语义生成模型的潜在能力。

在此背景下,笔者提出一种“三段式”的多模态文化资源采集结构,可概括为“平台接入—语义组织—格式处理”的三阶段策略。首先,在资源平台接入环节,优先采集国家图书馆、故宫博物院、中央音乐学院等权威机构发布的高质量数字文化资源。此类资源不仅数据质量高、版权归属清晰,而且多已进行初步分类与元数据整理,便于结构化解析。其次,在语义分层组织方面,可借助《中国大百科全书》《中国传统艺术门类体系》等既有学术分类标准,将原始数据按语义维度解构为基础模态单元,并进一步划分“诗”“画”“曲”“舞”“器”“礼”等子类,以支持跨模态对齐建模与风格迁移训练。最后,在格式处理层面,应开发具备结构解析能力的定制化爬取工具,针对图像扫描件、XML 结构化文本、MIDI 乐谱、MP4 视频等多样数据格式,完成自动化解析与内容结构提取,确保各模态数据在时间轴、主题语义与风格结构上的映射逻辑保持一致。通过上述“三段式”策略,可在文化结构基础上构建出具备高语义分辨率与多模态协同性的数据集,奠定 AIGC 系统理解与生成中国传统文化表达的关键语料基础。

以图像、文本、音频及行为模态为例,可基于现有数字化资源展开高质量语料的采集、结构化处理与语义标注。对于传统绘画图像,可接入《中国历代绘画大系》数据库,提取高分辨率图像,并关联题跋内容、创作者信息、流派风格及历史朝代等元数据,构建具备艺术语境与文化指向的视觉语料库。在古典诗词文本方面,可依托《全唐诗》《宋词三百首》《四部丛刊》等权威文献资料,对文本进行统一编码,并将诗人背景、题材主题、语言风格等语义属性嵌入结构化字段中,为后续语义建模与跨模态匹配提供基础。在音频资源处理中,可利用《中国传统音乐录音档案》所收录的地方戏曲、民族器乐演奏等音源,结合频谱分析与结构标注技术,提取节奏型、调式结构与演奏技法等关键参数,为音乐模态生成任务提供风格支撑与结构参照。

相较于通用 AI 中常用的实体识别、情感分析或风格分类等标注方式,面向中国传统文化的多模态标注应回溯至传统文化体系内部对图像、文本、音频、行为等媒介形式(模态)的本体论定义与分类逻辑,构建与其历史语义结构相契合的标注框架。此类框架不仅是模态对齐的桥梁,更是实现文化生成逻辑的重要机制,其核心在于保留并转译传统文化中高度符号化、隐喻化的美学特征。

在图像模态建模中,传统绘画理论为风格标签体系的构建提供了坚实基础。如谢赫《古画品录》提出的“六法论”可作为一级标签维度基础,包括:“气韵生动”(画面的情感张力与生命意趣)、“骨法用笔”(笔触的力度与结构性)、“应物象形”(造型的象征性与写实性)、“随类赋彩”(色彩使用与文化寓意)、“经营位置”(构图的空间逻辑与动态平衡)与“传移模写”(风格传承与技法源流)。上述维度可进一步细化二级标签。例如,“气韵生动”可分为“沉静”“飘逸”“雄健”等表现型情绪特征;在色彩维度可结合“五行色”(青、赤、黄、白、黑)展开传统语义标注,从而提升模型对色彩背后文化逻辑的理解能力。

在文本模态建模中,古代诗学理论为语义标签体系提供了充分支撑。如《文心雕龙》《姜斋诗话》《原诗》等文献可指导对诗词的意境结构、表达技巧、主题内涵等语义维度进行系统建模。具体而言,可依据“赋”“比”“兴”三类传统诗法对诗句结构进行标注;以“风”“雅”“颂”或“山水”“咏史”“闺怨”等题材类标签反映文化意象;在情感表达上,则可引入“哀而不伤”“含蓄深婉”等古典评价术语作为情绪标签,捕捉古汉语语义的审美特质。该类标签系统不仅可增强文本理解模型对古典诗词的语义解析能力,也可为“图生诗”“诗释画”等跨模态生成任务提供语义映射基础。

在音频模态中,传统音乐理论为调式与情感建模提供了语义支撑。如《吕氏春秋》《乐记》《律吕正义》等文献可用于构建基于“五音六律”或“十二律”体系的调式标签;在节奏结构方面,可划分为“平拍”“弱起式”“三连音”等基本节拍;在情绪维度上,则可借助“清”“悲”“烈”“逸”等传统音乐情绪类型构建标签集。针对曲艺音频(如昆曲、京剧),还可引入“行当”“唱腔”“锣鼓点”等多层级结构特征,形成嵌套式标签体系,以刻画其复杂的演绎风格与时序结构。

在行为模态(如礼仪、舞蹈与技艺动作)建模方面,可依据《仪礼》《礼记》《周礼》等典籍建立礼乐行为的结构化标注体系。祭礼类视频可标注“揖让”“俯伏”“引拜”等规范动作;传统舞蹈可结合“六艺”中“舞”的分类标准,如“容”“止”“进”“退”“周”“旋”,构建基于动作时间序列的语义标签系统。同时,借助现代动作捕捉技术与三维姿态识别技术,可将符号语义与物理特征共同嵌入模型训练过程,实现行为模态的“语义—几何”双重建模。

综上所述,通过回溯古典艺术理论与美学范式,构建以“古典语义主导”为核心的多模态标注体系,不仅有助于保障文化表达在不同模态间的一致性,也能够显著提升生成模型在训练与推理过程中的语义可解释性与风格可控性。当此类深层语义标签与现代技术方法(如弱监督学习、知识图谱辅助标注、多模态对齐算法)相结合,将显著增强 AIGC 系统在处理具有文化复杂性与审美深度任务时的表现能力,为中国传统文化的当代表达提供坚实的数据基础与认知支撑。

(二)多模态模型训练与文化风格建构

在 AIGC 赋能艺术创作的整体技术路径中,多模态生成模型的训练环节构成了原始数据到生成机制之间的核心桥梁。该阶段不仅决定了模型的表达能力与泛化性能,更直接影响生成内容的语义准确性、审美多样性与文化适应性。

目前,主流的多模态生成模型训练流程大致遵循以下三步:第一步是构建模态之间表示空间的映射关系,通常通过对比学习、跨模态对齐机制或特征融合策略,在图像、文本、音频等模态间建立统一的语义基础,确保各模态特征在共享语义空间中的一致性与可交互性;第二步是构建联合嵌入空间,通过引入 Transformer 架构、变分自编码器、扩散模型等深度神经网络,对多模态数据进行联合建模与语义整合,使系统能够在高维空间中进行多模态共表达与互生成;第三步是在训练过程中引入风格控制机制,包括情感变量、语境编码、文化标签等调控因子,以实现生成内容的风格迁移、语义保持、情绪调控等目标,从而增强模型的表达弹性与文化适配能力。上述训练流程已在图文生成、文本生成音乐、视听联合建模等多个 AIGC 应用场景中取得显著成效,在语义一致性、表达丰富性及人机交互友好性方面展现出较高技术成熟度。

然而,该多模态生成技术在应用于中国传统文化语境时,则面临一系列具有文化特殊性的建模挑战。首先,中国传统文化中的多模态内容并非静态离散的语料片段,而是一个历经时间沉淀、涵盖“物—象—意”三重层次的动态审美体系。其表达逻辑强调由具象“物象”引发联想,最终指向抽象“意境”,体现出高度的语义跃迁性与情感流动性。该语义结构超出静态嵌入的表征能力,对模型提出了深层次的结构建模要求。其次,在传统文化表达中,模态之间的联结往往通过隐喻性转换而非语义同构实现,如“以诗喻画”“以舞达意”“以声传情”等。此类跨模态映射强调风格迁移与意象联想,而非字面语义的一一对应。因此,生成模型在跨模态转换过程中,需具备对文化意涵与象征逻辑的理解与建构能力,从而实现符合审美意境的转换机制。最后,在风格建模方面,中国传统文化的审美风格常常嵌套于特定的哲学语境与礼乐秩序之中。该“风格”不仅是形式上的美学类型,更承载着价值观念、伦理规范与宇宙哲学。例如,“中和之美”“天人合一”“礼乐相成”等范式不仅指导着艺术的审美标准,也规定着其情感表达与价值取向。模型若欲实现有效的风格控制,不仅需支持细粒度的风格标签调用,还需具备文化一致性与语境协同表达的能力。为应对中国传统文化语境下的多模态生成挑战,本文提出一条融合“文化风格嵌套建模”与“语义图谱辅助对齐”的多模态模型训练路径。该路径由模态联合建模、文化风格编码与跨模态意象对齐三大关键环节构成,旨在增强模型对传统文化内容的理解深度与生成一致性。

1. 模态联合建模

在实现多模态信息联合建模时,需构建一个能同时容纳图像、文本、音频等模态的共享潜在语义空间。在目前的生成模型中,CLIP 采用双编码器结构,对图文进行对比学习优化;MusicLM 通过 Text2Audio 将文本嵌入映射至音频域。这类结构为多模态建模提供了通用基础,但面对中国传统文化的高语义密度与深层象征结构时,通用框架难以有效刻画其内涵。为解决此问题,可以引入“文化意象空间”作为中介语义层,将“山水”“兰竹”“高士”“琴瑟”等文化符号性意象编码为可学习的概念向量,构成跨模态建模的语义锚点。在“诗词—绘画”等任务中,训练过程不再局限于图文直接对齐,而是将两种模态分别映射至共享的意象中心(如“春山夜月”“隐逸高士”),再以意象为聚合点开展对比学习。这一机制可显著提升模态间语义对齐的稳定性与文化一致性,减少直连式映射中可能出现的表征歧义与语义偏离,从而为后续风格控制与情感迁移提供更具语义支撑的结构基础。

2. 文化风格编码

风格控制是决定生成内容是否贴合特定审美语境的关键机制。当前业内采用的方法主要有两类:其一是从训练数据中自动提取隐式风格编码,作为生成过程的引导信号;其二是引入显式风格标签(如“复古”“田园”),通过条件控制生成特定风格内容。然而面对中国传统文化,西方通用风格标签(如“写实 / 抽象”“浓烈 /淡雅”)往往难以刻画前者所蕴含的哲学意境与审美气质。因此,本文主张以传统美学理论为基础,建立一套具有文化辨识度与语义深度的风格向量体系,并参考《艺概》《容斋随笔》《画禅室随笔》等古典美学著作中高频出现的范畴(如“空灵”“沉着”“野逸”“清远”“幽微”),构建可用于机器学习的风格语义本体。

在技术实现层面,此类风格因子可通过多模态注释系统进行构建与训练:一方面,可依托文本与图像的双模态标签,结合专家人工标注与文论语料中高频审美词汇构建风格样本;另一方面,也可借助风格迁移、对比学习等方法,从大规模传统文化数据中抽取潜在风格特征并映射为模型可学习的嵌入表示。此外,为满足风格迁移与风格重构的需求,还需引入“风格—模态”映射机制,即将抽象的审美范畴具体化为图像、文本与音频等模态中的可识别结构特征。以“清远”风格为例,可提取其图像模态中的关键视觉特征(如笔触留白、山水远景、朦胧层次)、文本模态中的语言表达特征(如多用平声字、虚词、空灵意象)、音频模态中的韵律特征(如低音缓起、节奏舒展、音区留白)等,并构建其作为多模态控制变量的子空间。借助这一结构化的风格控制体系,当用户输入“清远”风格作为生成目标时,模型无论是生成图像、诗句还是旋律,均能调取其所关联的模态特征集合,从而输出与该美学范畴相一致的内容。

3. 跨模态意象对齐

中国传统文化中的“联觉”机制与“意象转换”原则强调模态间的意境传递与情感迁移,诸如“言外之意”“意在笔先”“声中有情”等表述均体现了非线性、非对称的模态转换模式。这决定了传统文化的多模态建模需超越表层映射,转向一种以“意象为核心节点”的嵌套式语义生成结构。为此,本文提出“意象—场景—模态”三层嵌套结构作为生成任务的基础架构:第一层为意象层,对应高度凝练的文化母题(如“梅雪孤山”“高士饮泉”“寒江独钓”);第二层为场景层,对应意象的具象场景建构(如“雪夜寒林”“春水轻舟”“孤亭对影”);第三层为模态层,对应图像(笔墨构图)、文本(语言结构)、音频(节奏旋律)等多模态表现形式。举例而言,“孤山寒梅”意象可在图像中表现为留白结构与斜枝构图,在诗词中体现为“疏影横斜水清浅”,在音乐中则体现为断续节奏与清寒旋律。通过意象图谱将三层结构组织为多对多的语义网络,可在训练过程中实现模态联动与意境统一,构建“同境异象”的生成范式。

在模型架构设计层面,为实现模态间的动态路径规划与语义协同,可引入多头注意力机制与跨模态图神经网络,将意象图谱编码为图结构,引导模型在生成过程中动态检索相关模态特征。例如,在“以诗生图”任务中,模型首先抽取诗句主意象(如“江雪孤舟”),检索其场景与图像表现特征(如“远山”“冷色调”),并生成匹配的视觉构图;在“以图生曲”任务中,模型提取图像中的象征元素(如“雪松”“飞鹤”),再映射至音乐中的节奏、调式与音区,从而实现模态间的情感迁移与风格延续。

综上所述,面向中国传统文化语境的多模态模型训练,必须突破通用 AIGC 系统中基于模态对齐与标签控制的范式局限,在三个关键层面实现结构创新:第一,在语义驱动层,以“意象”为中介节点,重构模态联结机制;第二,在风格控制层,构建中华传统美学向量体系,替代通用标签逻辑;第三,在意境建模层,实现语义嵌套、情感一致、风格自洽的生成结构。该路径不仅可以提升 AIGC 模型在非西方语境中的文化表达能力与认知适配度,也为多模态人工智能在人文艺术领域的深层应用提供了理论依据与技术架构参考。

(三)人机交互式创作平台开发

在多模态 AIGC 系统的发展路径中,人机交互平台不仅是生成模型的部署终端,更是连接人工智能与人类创意、推动协同创作的关键枢纽。其核心设计目标在于打通“模型能力”与“人类意图”之间的表达通道,使生成机制摆脱封闭黑箱式的运行方式,演变出开放、可控、可反馈的创作环境。这一交互范式的重构,意味着创作者不再只是被动的指令输入者,而是成为与模型共同参与艺术建构的主动主体。

当前,主流 AIGC 交互平台主要通过提示词接口、参数控制面板或对话式引导等提供基于自然语言的模型操控路径。这些交互范式在图像生成(如 Midjourney)、文本写作(如 ChatGPT、DeepSeek)、视频生成(如 Sora、即梦 AI)等领域已验证了其基本可用性。然而,这一平台逻辑在迁移至以中国传统文化为核心语义结构的AIGC 系统中时,势必面临一系列关键性技术挑战,涉及审美结构建模、语言解析机制以及跨模态协同控制等多个维度。

首先,传统文化创作本质上是一种审美与规范并存的活动,不仅强调个体灵感的自由输出,更重视对“法度”“体制”与“风格”的承继与变奏,现有平台往往缺乏对这类“审美结构”的可控支持。其次,中国传统文化的创作语言具有高度的多义性与象征性。无论是“空山”“松风”等意象词,还是“幽微”“清远”等风格描述语,都依赖深厚的文化经验进行语境化解读,使得传统提示词接口在面对复杂文化意图表达时显得力不从心。最后,在多模态输出方面,传统艺术作品通常体现为视觉、听觉、语言与动作等多种表达模态的融合,例如书画中的题跋,古乐中的节奏与情感共鸣,戏曲中的“唱、念、做、打”等。而传统交互系统多聚焦于单模态控制,难以支撑跨模态生成与审美一致性的实现。

针对上述中国传统文化 AIGC 系统在人机交互方面所面临的多重挑战,本文提出一种融合“嵌套式语义控制”“模块化审美调节”与“联觉式生成反馈”的交互平台构建思路,旨在为中国传统文化的数字化当代表达提供一个具有高语义表达力、高风格控制力与高交互响应力的 AIGC 创作系统。在整体架构上,该系统划分为语义引导层、风格调控层与生成反馈层三大功能模块,分别对应用户意图输入、文化风格建构以及多模态生成响应三个关键环节。

1. 语义引导层

语义引导层是创作者与系统之间的初始沟通通道,其核心功能在于将自然语言输入转化为机器可识别的意图向量。在面对中文传统语境中语义密集、象征性强且情感复杂的挑战时,平台可采用嵌套式提示词结构,将提示词划分为多个层级,包括意象描述、语境设定、风格倾向与表达意图等,由用户根据需求进行输入或选择。每一级提示词将调用内嵌的“传统文化语义图谱”进行解析、扩展与联想匹配,从而生成高语义密度的控制向量。

例如,当用户输入“梅花寒香,清远孤高”作为意象描述时,系统将自动关联《花间集》《随园诗话》等文献中的相应文化意象,识别其所指代的文化内涵(如“隐逸”“高洁”“耐寒”)、主情感基调(如“孤寂”“坚韧”)以及可能的场景结构(如“雪中寒林”“古寺残窗”)等,并在此基础上生成一组“风格建议项”供用户选择。此机制不仅增强了提示词输入的表达力,也保证了文化逻辑的一致性,为创作者提供更为精确的创作引导。

2. 风格调控层

风格调控层在 AIGC 系统中承担着引导生成方向和确立审美目标的核心功能。传统 AIGC 平台多通过数值调节、风格标签或实例参考等方式控制输出风格,但面对中国传统文化深厚的风格体系时,“复古”“文艺”等模糊标签显然难以实现精细化风格控制。为解决这一问题,平台可引入模块化审美调节子系统,将中国传统艺术中的核心风格因子转化为可控变量,并以分层结构呈现给用户。

该子系统包括三个主要模块:其一,美学结构模块,涵盖古典审美范畴(如“空灵”“沉静”“悲慨”“疏朗”),通过风格编码器提供预设向量,并结合生成任务语境进行自动调整;其二,表达方式模块,涉及不同媒介与技法(如绘画的“工笔 / 写意”、文学的“骈体 / 散体”、音乐的“宫调 / 徵调”),并与底层生成算法参数绑定;其三,文化规范模块,可参考《书谱》《画诀》《诗品》《乐书》等经典文献中的技法法则与体制结构,对生成结果进行合规约束(如对仗、押韵、构图)。用户可通过滑块、选项框或关键词输入等方式,自定义或调用预设风格模板,以构建出细致、可调的生成条件。在系统后端,这些风格变量将被转化为模型的条件向量与生成器参数权重,从而引导生成内容在结构、情感和形态等维度上的风格表现。

3. 生成反馈层

生成反馈层旨在优化多模态艺术内容的生成质量与人机协同效果。该层通过构建一个“联觉式输出空间”,使系统能够在多模态创作中提供实时反馈,并保持与用户输入的高度一致性。在提示词与风格设定完成后,系统将同步生成包括主模态内容(如图像、音乐、诗句)、附属模态联动(如配诗、配乐)、语义意象提示(如关键词可视化)以及风格评估报告(基于判别网络的美学评分)在内的多模态输出结果。这些内容将统一呈现在交互界面上,供用户进一步调整与优化。

通过引入“循环式人机共创机制”,用户可对任意输出结果进行微调、重新输入、修改意象或重设风格,系统则可基于历史语义状态与生成路径进行增量式更新,而非整体重绘,从而有效提升创作效率与风格一致性。尤其在多轮创作过程中,系统将自动保留语义状态与风格变量的历史轨迹,用户可回溯生成路径,重构任一历史节点的风格演化过程,最终构建起一种“风格时间轴”式的创作档案系统。

综上所述,该系统通过语义引导、风格调控与生成反馈三层架构,构建了一个高度语义化、高风格可控性的 AIGC 创作环境,尤其适用于中国传统文化这类具有复杂语义与审美逻辑的创作任务。对传统文化语义图谱、美学范畴与技法规范的整合,不仅显著提升了生成模型的表现力,也为 AIGC 在人文艺术领域的应用探索提供了全新的方法论与技术框架。


四、结语

科技与艺术的结合正在重塑艺术创作的未来。AIGC 的出现为计算艺术注入了前所未有的创造力和灵活性。本文从计算艺术的角度出发,围绕 AIGC 在生成机制、建模逻辑与文化表达层面的理论建构与实践路径展开系统性探讨。通过构建以概率建模为核心的三元理论框架,明确了数据、模型与生成机制之间的互动关系,并进一步以中国传统文化的当代表达为范式,提出了涵盖多模态文化数据集构建、多模态模型训练与文化风格建构、人机交互式创作平台开发的完整技术流程。

在 AIGC 技术逐步具备类人创造力的背景下,计算艺术正迈向更为开放、多元,更具备文化主体性的生成形态。未来,AIGC 驱动下的艺术创作不仅有望实现文化符号的深层转译与动态生成,也为非西方知识体系在数字艺术领域中的再阐释提供了可能路径。本研究的意义,正是在于为人工智能与人文传统之间的融合提供方法论支持,并为 AIGC 赋能下的新型艺术生成生态奠定理论基础。

本文为2021年度国家自然科学基金面上项目“基于人工智能的绘画艺术关键技术研究”(项目编号:62176006)、科大讯飞股份有限公司校企合作项目“计算艺术应用研究”的阶段性成果。

(原文见《中国艺术》2025年第4期,总第147期,注释从略)