ICML 2025 | 如何在合成文本数据时避免模型崩溃? 随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。 生活百科# ICML2025# Token-LevelEditing# 合成数据 21小时前010