大模型目前还缺少根据经验自进化的能力
如果把AI送去大学,他们能顺利拿到毕业证书吗?提出了StuLife的评测数据集,模拟上课、日常和考试三大核心场景,AI自主选课,根据选课结果走到教室上课,参与考试......实验发现,现有的大模型是一群没有任何人生经验的“天才”,那怕是GPT-5模型,也只能拿到17.9/100的GPA。
总之,目前大模型还缺少根据经验自进化的能力。
标题: Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark
论文地址:https://arxiv.org/pdf/2508.19005
新框架地址:https://github.com/ECNU-ICALK/ELL-StuLife
https://s3.bmp.ovh/imgs/2025/09/17/552f57cd5e37cf6f.jpg
https://s3.bmp.ovh/imgs/2025/09/17/4a6e112308509c44.jpg
昨天用百度那个Ai搜北纬20°,西经100°是哪里?它拼命的推给我西双版纳,笑死我了。。。。。。
页:
[1]