如果把AI送去大学,他们能顺利拿到毕业证书吗?
提出了StuLife的评测数据集,模拟上课、日常和考试三大核心场景,AI自主选课,根据选课结果走到教室上课,参与考试......实验发现,现有的大模型是一群没有任何人生经验的“天才”,那怕是GPT-5模型,也只能拿到17.9/100的GPA。
总之,目前大模型还缺少根据经验自进化的能力。
标题: Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark
论文地址:https://arxiv.org/pdf/2508.19005
新框架地址:https://github.com/ECNU-ICALK/ELL-StuLife