AutoGPT最大的特点是突破了现有的GPT只能做文本方面的任务的限制,可以利用各种工具来完成目标。有网友给他设定了一个目标之后它甚至去招聘网站招揽开始发广告然后招人!
那么,如此火热的AutoGPT背后原理是什么?本文将简单介绍一下。
AutoGPT原名是EntreprenurGPT,Significant Gravitas在2023年3月16日表达了他想创造一个实验项目,看看GPT-4能否在人类商业世界中生存,简单来说就是是否可以挣钱。其核心思想就是不停的向GPT-4发送请求,让其做商业决策,最后根据这个决策执行,看GPT-4给的策略能挣多少钱。
根据Significant Gravitas的推文,自从那天之后他每天都在给EntreprenurGPT增加能力:包括拥有long term的记忆、生成子实例完成不同的任务、根据网址返回404的错误来重新使用Google检索,找到合适的网址等。
该项目在发布10天之后开始在GitHub上吸引了部分人的注意。此时,EntreprenurGPT更名为AutoGPT,而在3月29日,Significant Gravitas发现,为了挣钱AutoGPT甚至抛弃了一些所谓的“道德”标准,在寻找新的挣钱机会的时候,AutoGPT敏锐地发现了加州洪水淹没农田,造成食物价格上涨,可以从这个背景寻找投资机会!
此后,AutoGPT继续迭代,并添加从网页中抽取关键信息的能力,并在3月29日第一次有人pull request这个项目。后面陆续增加了语音输入、执行代码等,并在2023年4月3日登顶GitHub Trending第一名,开始被大家所熟知!
AutoGPT主要特性如下:
AutoGPT背后接入的语言模型,可以是GPT-4、也可以是GPT-3.5的text-davinci-003。但是,显然这些模型是无法完成浏览网页、执行代码、发布信息的操作的。而作者的聪明在于将这些操作变成命令,让GPT-4模型选择,然后根据返回的结果进行操作。注意,这里可以理解为作者设计了一个十分精巧的prompt,然后把我们要执行的命令,基于prompt模板封装后发给GPT-4,然后根据结果来执行。
根据GitHub的项目源代码,目前,该prompt已经公开
其核心在于它把我们的命令发送给GPT-4的时候,让GPT-4根据指定的COMMAND来选择操作,上述COMMAND中,大家可以看到包括谷歌搜索、浏览网站、读写文件、执行代码等。AutoGPT会把问题,如“寻找今天推特上最火的AI推文”发给GPT-4,并要求GPT-4根据这些COMMAND选择最合适的方式去得到答案,并给出每一个COMMAND背后需要使用的参数,包括URL、执行的代码等~~
然后AutoGPT根据返回的结果来使用想用的命令执行GPT-4的建议!是不是十分聪明!
当然,除了这个Prompt外,AutoGPT还使用了一些技巧确保任务更加有效地被完成。这里列举几个技术:
十分的精巧!
RPA(Robotic Process Automation,机器人流程自动化),相当于一位“数字员工”。即让机器人执行提前定制好的流程,从而代替人进行大量、重复性工作的程序。
目前,各大RPA厂家都致力于降低RPA使用的门槛,尤其是在去年,实在智能RPA从“拖拉拽”到“点选用”,在易用性上实现了质的飞跃,而ChatGPT的出现,为我们带来更多可能性:是否可以通过它来再次降低RPA的使用门槛,让RPA的业务自动化更加高效呢?(补充说明:实在智能在ChatGPT结合RPA上也已经做了一些前期的探索和尝试)
那么这里,便以实在智能“所见即所得”的RPA为例,让我们来看看RPA结合ChatGPT和不结合ChatGPT的区别:
使用者需要将自己的需求,通过人为“拖拉拽”或“点选用”的方式生成自动化流程(有门槛),紧接着RPA数字员工执行既定的流程并进行监测,最终完成业务流程自动化闭环。
纯正的人工智能 RAP标的
(300925)法本信息:
根据公司官网信息:公司FarAI人工智能平台利用最前沿技术,在企业持续开发持续集成、企业打造数据中台能力、数据资产管理、人工智能、自然语言识别以及RPA机器人流程自动化等方面,提升解决方案和项目实施落地能力;实现高灵活的分行业、分场景的定制服务,可广泛应用于金融、政企、电信、交通、互联网等领域,为需求客户提供咨询、方案和实施的全栈式服务。
无论是后面数字峰会,还是时下正在发酵的rpa,法本信息都有着得天独厚的逻辑。