百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

研究人员打造统一型参考框架,阐述构建大模型智能体的基本模块

ccwgpt 2024-11-18 09:28 23 浏览 0 评论

以 ChatGPT 为代表的大语言模型,展现出“类人”的文本理解能力和文本推理能力,已被视作是实现通用人工智能的关键技术。


尽管大语言模型能够进行类似于人类的认知处理,但是现有的基于大语言模型的智能代理与人类智能存在着明显区别。


具体来说:当前的大语言模型智能体依赖于通过解码和泛化来从预训练数据中获得已有知识,而人类智能则能通过在现实世界中的实践和体验来发现和学习新知识。


受到人类婴儿智力发展过程的启发,学界提出了“具身认知”这一假说。代理智能,是通过观察环境和与其互动而产生的,即智能的产生来源于整合了物理、社会和语言的现实世界。


数字游戏因其复杂性、多样性、可控性、安全性和可重复性,被认为是培养智能代理的理想环境。


从经典的国际象棋和扑克游戏到现代电子游戏,比如 Atari 游戏、星际争霸 II、Minecraft 和 DOTA II,游戏一直在推动着 AI 研究的发展。


传统的基于强化学习的代理模式,是通过行为层面的策略学习,来实现预期奖励的最大化。


而构建基于大语言模型的游戏代理,能够利用认知能力来深入理解游戏玩法,并能与游戏环境进行交互,在形式上更接近于人类智能。


此前该领域的综述论文,主要集中于介绍现有大语言模型、以及介绍大语言模型智能体的一般性技术和应用,对于游戏领域的关注相对较少。


为了弥补这一空缺,美国佐治亚理工学院胡思昊和所在团队,尝试针对基于大语言模型的游戏智能体的最新发展进行全面系统的综述。


日前,相关论文以《基于大语言模型的游戏代理的研究》(A Survey on Large Language Model-Based Game Agents)为题发在 arXiv[1]。




论文中:


首先,他们提供了一个统一的参考框架,描述了构建大语言模型的游戏智能体的基本模块,涵盖了六个核心功能组件:感知、记忆、思考、角色扮演、行动和学习。


其次,他们介绍了一种分类体系,将现有文献分为六种游戏类别,包括冒险、竞争、合作、模拟、制作与探索等类别的游戏。


对于每种类别的游戏,他们分别描述了技术挑战、支持的游戏环境、以及常用的优化策略。


最后,他们展望了大语言模型的游戏智能体在未来的潜在研究方向。




目前,这一研究方向的相关技术,主要用来探索语言模型在游戏环境中的交互式理解和学习,旨在探索更接近于通用人工智能的智能代理形式。


当然,相关技术在游戏中也有着非常广泛的应用,比如创建更拟人的非玩家角色,从而作为游戏助手或拟人化的游戏角色。


在模拟功能上,基于大语言模型的游戏智能体可以模拟人类的日常生活和社交,为人类玩家提供更沉浸、更真实的游戏体验。


此外,凭借良好的可解释性,基于大语言模型的游戏智能体,能够为人类新手玩家提供游戏决策和原因说明,从而达到游戏教育的目的。


另据悉,在已有大语言模型的智能代理技术之中,人们目前主要集中于将现有的开源模型用于游戏之中。


研究人员指出,未来该领域应该更多地关注如何让智能代理自治地与游戏环境交互。


并在交互中学习环境中的知识、理解游戏的玩法,从而获得原本不属于大语言模型的经验,而非单纯地压缩与解码人类已经积累的文本知识。


参考资料:

1.https://arxiv.org/pdf/2404.02039

https://github.com/git-disl/awesome-LLM-game-agent-papers

相关推荐

腾讯开源框架TarsCpp-rpc设计分析-server(二)

2Tars协议2.1是什么借用官方说法:TARS编码协议是一种数据编解码规则,它将整形、枚举值、字符串、序列、字典、自定义结构体等数据类型按照一定的规则编码到二进制数据流中。对端接收到二进制数据流...

微服务调用为什么用RPC框架,http不更简单吗?

简单点,HTTP是协议,RPC是概念!实现RPC可以基于HTTP协议(Feign),TCP协议(Netty),RMI协议(Soap),WebService(XML—RPC)框架。传输过程中,也因为序列...

go-zero:开箱即用的微服务框架(gin框架微服务)

go-zero是一个集成了各种工程实践的Web和rpc框架,它的弹性设计保障了大并发服务端的稳定性,并且已经经过了充分的实战检验。go-zero在设计时遵循了“工具大于约定和文档”的理...

SOFARPC :高性能、高扩展性、生产级的 Java RPC 框架

#暑期创作大赛#SOFARPC是一个高性能、高扩展性、生产级的JavaRPC框架。在蚂蚁金服,SOFARPC已经使用了十多年,已经发展了五代。SOFARPC致力于简化应用程序之间的RPC...

自研分布式高性能RPC框架及服务注册中心ApiRegistry实践笔记

痛点1.bsf底层依赖springcloud,影响bsf更新springboot新版本和整体最新技术版本升级。2.eureka已经闭源,且框架设计较重,同时引入eureka会自行引入较多sprin...

Rust语言从入门到精通系列 - Tonic RPC框架入门实战

Rust语言是一种系统级语言,被誉为“没有丧失性能的安全语言”。Rust语言的优势在于其内存安全机制,在编译时就能保证程序的内存安全。Tonic模块是Rust语言的一个RPC(RemoteProce...

腾讯开源框架TarsCpp-rpc设计分析-client(一)

前言Tars是腾讯开源的微服务平台,包含了一个高性能的rpc框架和服务治理平台,TarsCpp是其C++版本。对于以C++为主要开发语言,同时还想深入了解rpc和微服务框架具体实现的同学来说,Tars...

设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架

为啥要开发RPC框架事情是这样的,在开发这个RPC框架之前,我花费了不少时间算是对Dubbo框架彻底研究透彻了。冰河在撸透了Dubbo2.x和Dubbo3.x的源码之后,本来想给大家写一个Dubbo源...

rpc框架使用教程,超级稳定好用,大厂都在使用

rpc是什么远程调用协议如何使用导入依赖<dependency><groupId>org.apache.dubbo</groupId><art...

Layui 框架实战:动态加载 Select 与二级联动全解析

在现代Web开发中,下拉选择框(Select)是用户输入数据时不可或缺的组件。很多时候,我们需要的选项并非静态写死在HTML中,而是需要根据业务逻辑从后端动态获取。更有甚者,我们可能需要实现“...

15个能为你节省数百小时的前端设计神器,从UI库到文档生成

无论你是刚开始开发之旅的新手,还是疲于应付生产期限的资深程序员,有一个真理始终不变:正确的工具能彻底改变你的工作流程。多年来,我测试了数百个开发工具——有些实用,大多数平庸。但有一批免费网站经受住了时...

Layui与WinForm通用权限管理系统全解析

嘿,小伙伴们,今天咱们来聊聊Layui和WinForm这两个框架在通用权限管理系统中的应用。别担心,我会尽量用简单易懂的语言来讲解,保证让大家都能跟上节奏!首先说说Layui。Layui是一个前端UI...

纯Python构建精美UI!MonsterUI让前端开发效率飙升

“无需CSS知识,告别类名记忆,11行代码实现专业级卡片组件”在传统Web开发中,构建美观界面需要同时掌握HTML、CSS、JavaScript三剑客,开发者不得不在多种语言间频繁切换。即使使用Boo...

WebTUI:将终端用户界面(TUI)之美带到浏览器的CSS库

在当今Web技术飞速发展的时代,界面设计愈发复杂多样。然而,随着现代化工具的广泛使用,一些开发者开始回归极简风格,追求一种简洁而富有韵味的设计。WebTUI正是这样一款CSS库,它将经典的终...

人教版二年级下册生字描红汇总(拼音+笔顺+描红),可打印!

可定制内容,评论区留言。本次整理的为人教版二年级下册所有生字,共计300个;写字是小学阶段一项重要的基本功训练,把汉字写得正确、工整、美观,可以提高运用汉字这一交际工具的准确性和效率。对小学生进行写字...

取消回复欢迎 发表评论: