交易股票平台 顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务
2025-02-02表现最好的智能体只能应对真实世界中24%的任务,在过程分上取得34.4%的得分 【导读】智能体究竟能否应对现实世界的复杂性?The Agent Company近日提出了一项评估基准交易股票平台,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。 如今,基于大模型的智能体,已经能完成许多在几年前还无法想象的任务,进步的速度是如此之快,以至于有些人甚至声称,在接下来的几年内,大多数人类劳动可能都可以实现自动化。 然而近日CMU、杜克大学等机构发表的一