Energy
Energy
JJuprisingGenAI and Energy
流动和运输管理[^1]
交通数据增强
数据增强是指通过添加对现有数据进行稍加修改的副本或从现有数据中添加新创建的合成数据来增加数据量的技术(Lemley 等人, 2017 年)。
GAN 和 VAE 因其能够生成高质量的合成数据而成为智慧城市数据增强应用中的普遍选择。然而,以去噪和数据增强优势而闻名的生成扩散模型主要用于医学研究而不是城市科学。这表明这些模型在城市应用中有一个潜在的未开发领域,它们独特的能力可以为复杂的城市挑战提供新颖的解决方案。许多先前的研究已经应用 GenAI 模型来增强交通数据。
- 周等人(2021)引入了轨迹生成对抗网络(TGAN)来解决识别和链接人类移动模式的挑战,特别是在基于位置的社交网络(LBSN)中。这种方法有效地克服了轨迹数据中数据稀疏性和标签分布不平衡的问题,与现有方法相比,TUL 的准确性更高。在这种背景下,使用 GAN 进行数据增强标志着人类移动分析的重大进步,为城市规划和个性化服务等各种应用提供了有希望的意义。
- Jilani 等人(2022)提出了一种使用 GAN 进行数据增强的交通拥堵分析的创新方法。该研究引入了一个五层卷积神经网络模型,该模型利用 GAN 增强的数据集来提高交通拥堵分类的准确性。
- Dabboussi ( 2023) 探索了一种使用 GAN 进行交通管理数据增强的创新方法。该方法通过添加真实的 GAN 生成数据,显著提高了交通预测模型的性能,从而显著改善了交通预测模型。
- Islam 和 Abdel-Aty ( 2021 ) 提出了一种使用 VAE 的新型数据增强技术,用于在训练数据有限的情况下改进交通模式分类。VAE 的解码器擅长生成与真实智能手机传感器数据非常相似的合成数据,从而有效地扩大了机器学习模型的数据集。
- Islam ( 2021 ) 介绍了城市交通系统中的新型深度学习应用。它展示了在数据集有限的场景中使用 VAE 和 GAN 来增强数据。该研究强调了这些深度学习模型生成与现实世界数据非常相似的合成数据的能力,从而增强了交通应用中的模型训练和预测性能,例如碰撞数据分析和交通模式预测。
- Islam 等人 ( 2021 ) 介绍了一种基于 VAE 的数据增强技术,以平衡交通系统中的碰撞和非碰撞事件数据集。由于这些数据集的极度不平衡,传统的机器学习模型往往表现不佳。VAE 将事件编码到潜在空间中,从而能够生成在统计上反映真实数据的合成碰撞数据。该方法优于传统的过采样技术(如 SMOTE 和 ADASYN),提高了碰撞预测模型的特异性和灵敏度。它还解决了过度拟合问题,展示了 VAE 为交通安全中的有效机器学习应用生成精确、平衡的数据集的能力。
缺失数据填补
使用 GenAI 进行缺失数据填补涉及利用高级生成模型(例如 VAE 或 GAN)来预测和填充数据集中的缺失值 (Shahbazian & Greco, 2023 )。这些模型学习完整数据的底层分布并为缺失条目生成合理的值,从而提高数据的整体质量和完整性 (Shammasi, 2024 )。
- 许多类似的 GenAI 驱动的应用程序使用 GAN 的变体来归纳交通数据(Yuan 等人, 2022 年;Kazemi & Meidani,2021 年;Yang 等人)。 2021;Huang 等人 2023a;Chen 等人 2023)。一些数据已将 GenAI 模型应用于城市交通系统中的缺失数据填补,例如自行车共享数据(Xiao 等人 2021)和公共交通数据(Kim 等人 2022)。
合成移动性数据的生成
在人类流动性研究中,生成模型被广泛用于生成合成轨迹,这些轨迹可以真实地再现流动性模式并预测未来的流动性趋势。
- Luca 等人(2021 年)介绍了一种与双向 GAN(BiGAN)相结合的无限高斯混合模型(IGMM),这种方法可以生成逼真的合成人类移动数据并有效检测多模态异常。
- (Kosaraju 等人, 2019 年)提出了一种行人轨迹预测的新方法。它将基于图的 GAN 与图注意力网络(GAT)和 Bicycle-GAN 相结合,以生成逼真的多模态轨迹预测作为未来场景。该方法有效地模拟了行人的社交互动,并解释了人类运动的多模态性。这项研究展示了轨迹预测方面的重大进步,为自动驾驶汽车导航和城市规划等应用做出了贡献。
- (Huang et al. 2019 ) 利用顺序变分自编码器 (SVAE) 重建人类移动轨迹。这种方法的新颖之处在于将变分自编码器 (VAE) 与序列到序列模型相结合,能够有效捕获人类移动数据中的显著特征。SVAE 模型展示了 VAE 在近似复杂、高维分布(如城市移动模式)方面的能力。这项创新对于增强城市规划和智能交通系统中的轨迹重建至关重要,解决了数据稀疏性和隐私问题。
- Bao et al. ( 2020 ) 介绍了一种创新方法,使用条件 GAN 来估计 COVID-19 大流行期间的人类流动性。这项研究通过解决在有限的训练数据下估计快速变化的社会环境中的人类流动性这一挑战做出了重大贡献。该研究在 GAN 的生成器中采用了领域约束校正层,增强了学习过程并提高了生成的流动性预测的质量。该方法展示了 GAN 在不确定和动态变化的条件下生成可靠时空流动性数据的潜力,这是公共卫生危机期间预测建模的关键进步。
- Wang 等人(2020a )) 介绍了 SeqST-GAN,这是一种利用序列到序列 (Seq2Seq) 生成对抗网络来预测城市人流的模型。它通过将人流数据视为类似于视频中的帧的序列,独特地解决了城市环境中复杂的时空相关性问题。Seq2Seq 和 GAN 的结合使模型能够生成准确的多步预测,克服了深度学习模型中经常出现的模糊预测的挑战。这种对 GAN 的创新使用展示了它们生成顺序高维数据的能力,标志着城市规划和交通管理的重大进步。
交通模拟场景生成
GenAI 组件,特别是 GAN,在从历史交通数据中学习以生成新的、真实的交通流场景方面发挥着至关重要的作用。这些合成场景可以帮助交通基础设施设计、道路规划和智能驾驶系统的虚拟训练环境。
- Wu et al. 2020)探索了一种使用 GenAI 生成真实交通流场景的新方法。该研究利用了一种结合长短期记忆 (LSTM) 网络和 GAN 的混合模型,称为 LSTM-GAN。该模型捕获交通数据的时间动态和空间依赖性,从而能够为多个视野和位置创建时空交通场景。
- Demetriou 等人(2023 年)利用 GAN 创建用于自动驾驶汽车测试的逼真驾驶场景。这项研究展示了 GAN 在生成复杂多样驾驶条件方面的创新用途,有助于自动驾驶系统的开发和验证。
随着 LLM 的最新进展,一些新兴研究探索了使用 GPT 生成场景。
- Güzay 等人(2023 年)探索了创新使用 GPT-4 等大型语言模型 (LLM) 来生成交通场景以用于模拟目的。该研究重点介绍了如何调整通常用于自然语言处理的 LLM 来为 SUMO(城市交通模拟)等工具创建基于 XML 的模拟文件。通过利用 LLM 的生成功能,研究人员旨在简化场景创建过程,使其比传统方法更加流畅和灵活。该方法允许用户用语言描述交通场景,然后由模型处理以生成准确的模拟文件。GenAI 的这种应用不仅简化了安全测试、自动驾驶汽车培训和法规遵从性的交通场景的开发,而且还解决了与现有模拟设置方法的复杂性和僵化相关的挑战。
除了四种主要的 GenAI 模型外,我们的文献搜索还发现了其他类型的 GenAI 模型的应用。
- Tan 等人(2021 年)提出了一种使用 GenAI 生成真实交通场景的新方法。该研究引入了 SceneGen,这是一种神经自回归模型,它通过根据自车的状态和高清地图将车辆、行人和自行车等参与者依次插入给定环境来生成交通场景。这种方法避免了对手工制定规则和启发式方法的需求,从而允许更复杂和多样化的交通场景,更好地模拟现实世界的情况。
城市能源系统[^1]
能源数据增强
两种常用的 GenAI 技术是数据增强和缺失数据填补。
基于GAN的数据增强
- Wu 等人(2021 年)提出了一种使用 GAN 增强集成模型预测能源消耗的新方法。该方法将 GAN 与集成学习相结合,显示出预测准确性的显著提高。该研究探索了使用 GAN 进行数据增强的方法,该方法有效地用高质量、多样化的样本丰富了训练数据集。这种方法增强了模型的鲁棒性和泛化能力,展示了 GAN 在改进能源管理系统中的预测模型方面的实用性。
- Boicea 等人(2022 年)探索了使用 GAN 增强电力负荷预测中的数据。它展示了 GAN 扩展数据集的能力,从而提高了用于负荷预测的卷积神经网络模型的预测准确性。该方法解决了电力负荷预测中样本量有限的挑战,展示了 GAN 在数据增强方面的有效性及其在提高能源管理系统预测准确性方面的潜力。
- Fan 等人 ( 2022b ) 利用深度学习,特别是深度生成模型,对建筑能源预测进行数据增强。这种方法显著提高了建筑物短期能源预测的准确性。该研究利用深度学习的能力来生成合成但逼真的能源数据,解决了高质量训练数据有限的挑战。这项创新展示了深度学习在增强智能建筑运营管理数据驱动模型方面的潜力,尤其是在数据稀缺的情况下。
缺失值填补
一些研究利用 GenAI 模型来促进缺失数据的填补。
- Hwang 和 Suh ( 2024 ) 提出了一种解决电力消耗数据集中缺失数据的新方法,这对于智能电网环境中的有效能源管理至关重要。该研究引入了 CC-GAIN 模型,该模型集成了聚类、分类和 GAN 来填补缺失数据。该模型利用电力消耗数据的时间序列和模式特征来提高填补准确性。CC-GAIN 模型通过有效处理各种类型和速率的缺失数据,显著优于现有的填补技术,使其成为维护智能电网运营所必需的高质量数据的强大解决方案。该研究通过广泛的评估和消融研究强调了该模型的卓越性能,展示了其提高数据可靠性和支持可持续能源管理的潜力。
- Ryu 等人 ( 2020 ) 探索了一种解决智能电表数据集中缺失数据的深度学习方法。该研究引入了一个使用去噪自动编码器 (DAE) 来填补缺失电力消耗值的框架。这项 GenAI 技术与传统的插值方法(如线性插值和历史平均)以及其他生成模型(如 VAE 和 Wasserstein 自动编码器 (WAE))进行了比较。基于 DAE 的方法明显优于这些方法,逐点误差降低了 28.9%,每日累计误差降低了 56%。本文强调了 DAE 模型在重建不完整每日负载曲线方面的稳健性和准确性,从而提高了智能电网数据分析的可靠性。
数据合成和场景生成
合成数据通过提供逼真、多样化的数据集来建模和模拟各种能源场景,从而支持城市能源系统的规划、管理和运营(Li et al. 2020 ; Roth et al. 2020)。这些数据集可以促进能源分布的优化、需求预测和资源的有效配置,减少城市的碳排放并提高电网系统的效率。
- 作为详细示例,Wang 和 Hong ( 2020 ) 介绍了一种生成逼真的建筑物电气负荷曲线的创新方法。该研究利用 GAN 解决了生成准确反映真实建筑物动态和随机行为的负荷曲线的挑战。该研究展示了 GAN 匿名化智能电表数据的能力,在确保隐私的同时保留重要的统计信息。这一进步为智能电表数据分析、增强建筑物与电网的整合以及促进可持续能源管理提供了重要意义。
- Dong 等人 ( 2022 ) 讨论了一种使用可控 GAN 生成可再生能源生产场景的新型数据驱动方法。它专注于解决由于风能和太阳能的不确定性而导致的电力系统规划和运行中的挑战。所提出的 GAN 模型学习可再生资源的随机和动态特性,从而能够创建可控、可解释的场景。该方法增强了可再生能源建模,为可再生能源渗透率高的电力系统的效率和可靠性做出了重大贡献。
- Pan 等人(2019a)介绍了深度学习在电动汽车(EV)负载曲线生成领域的创新应用。它采用深度学习模型变分自编码器(VAE)来创建电动汽车充电负载曲线。这种方法意义重大,因为它摆脱了严重依赖概率模型和手动数据采样的传统方法。VAE 模型通过学习电动汽车负载数据的固有特性,生成多样化的负载曲线,准确反映实际负载的时间相关性和概率分布。这种方法标志着在电动汽车使用量不断增加的背景下,使用深度学习进行更高效、更准确的能源管理取得了显著的飞跃。
- Jiang 等人(2018)提出了一种使用 GAN 生成风电场景的新方法。这项研究因其对 GAN 的改进而脱颖而出,特别是在通过梯度惩罚和一致性项强制 Lipschitz 连续性方面。这些增强功能解决了过度拟合和训练不稳定等常见问题,从而实现了更高效、更稳定的模型训练。该研究证明了该方法在生成风力发电高质量场景方面的有效性,为可再生能源建模和不确定情况下的决策提供了巨大潜力。
- 陈等人(2018) 介绍了一种使用 GAN 生成可再生能源场景的创新方法。这项研究强调了 GAN 创建逼真的数据驱动场景的能力,捕捉可再生能源发电厂的空间和时间相关性。该方法的效率和可扩展性尤为突出,为可再生能源建模提供了重大进步,尤其是对于风能和太阳能发电。这项工作展示了 GAN 在有效处理可再生能源数据的复杂性和多变性方面的潜力。
- 建筑能源优化(Fan 等人 2022b)
[^1]:Leveraging generative AI for urban digital twins: a scoping review on the autonomous generation of urban data, scenarios, designs, and 3D city models for smart city advancement