RPA简析

RPA(机器人流程自动化,Robotic Process Automation)在2019年和2020年受到了投资圈的关注,本文将从宏观视角看,RPA在智能革命道路上所处的位置,以及推演RPA技术的演进方向和未来的落地场景。

一、RPA的本质

RPA本质上讲就是机器人自动化在软件领域的应用,完全能力的RPA应该是TrueAI的,我们可以将所有软件产品的自动化软件都称为RPA,对应的产品也可以称为软件机器人,其接口界面是不确定的,可以多种形式进行交互,沟通目标和教学,以使其可以自动地完成各类软件操作的任务。

二、RPA的技术形态

当前的RPA技术主要是借助界面元素的内探技术,用户的录制过程中,RPA工具会记录下每个操作的界面元素的DOM ID,重放时就可以精准定位这些元素,相应信息也是从对应的界面元素中获取,AI技术融合后,一些组件的内容识别开始采用视觉技术,比如验证码识别,文本识别,图像理解。但RPA在架构上仍然遵从元素-操纵-流程的主框架思路,最终落实到可执行脚本上的都是算法流程,仅仅是表现形式不同而已,有些使用的图形化编辑器,有些使用的脚本语言。死板的流程往往不需要流程编辑,但大多数RPA脚本都是需要人工编辑的,录制本身不能自动理解其中的变量。

三、RPA的终局刻画

首先我们需要明确一个概念就是从类脑智能的角度看,一切可控制的流程本身是大脑图灵机制的表现形式,因而人类可执行的行为本质上讲都是可以以高级指令的算法化流程化来刻画的,也就是说达到True AI能力的RPA软件可以最终落实到流程上来。难点在于图灵机制与潜意识网络之间的鸿沟,还在于图灵机制与其他机制的融合,如目标驱动机制、异常监测机制、完形机制。

最终的RPA软件可以至少可以以类人的沟通方式明确自身的任务目标,并能够尽量自主推导执行过程,这是经典的目标驱动过程。因而终局的RPA将和其他垂直领域的智能技术走向融合,既要有语言沟通理解能力,也要有视觉理解能力,更要有运动控制能力和异常监测、目标驱动能力。

实现自动化所涉及的几种方法:

一、目标告知。通过简要描述告知任务目标,通过沟通或演示确认对目标的理解,自行对目标进行分解执行。

二、教学。通过演示,或者教授执行步骤,令智能体理解执行的全部细节,并通过对变量的理解进行沟通和交互,最终自动生成执行流程。

三、编码。完全通过编程的方式实现全部流程,流程中的子操作仍然面临智能问题,该子操作如果是True AI级别的,面临可实现和不可实现两种状态。

编码形式是目前主要采用的方式,主要通过模板和开放平台来实现复用。流程本身是层次化的,识别和执行函数的分解后可能面临智能屏障(即因为是高级的智能问题导致目前无法实现)。这些问题基本就是自动化编程所面临的问题。

四、RPA与信息化的关系

信息革命是从计算机诞生之后就一直持续存在的活动,对于各类实体实施信息化的主要目的在于将传统介质上的信息和数据变换到计算机上,从而可以依靠计算机的处理能力,进行电子化处理、模拟、存档、查询、自动化。信息化带来的好处之一就是自动化,这点似乎跟RPA本身的自动化是矛盾的。其实,很多RPA需求,我们也可以看到是因为在多个隔离系统之间进行数据迁移,而这个工作本身是可以被接口对接所取代的,但接口对接的成本其实很多情况下是很高的。而且现实中,很多通过UI操作的事情,的确都是可以通过计算机脚本来实现的,这些大量的可以脚本化的需求就催生了各类计算机应用软件和程序的出现,从而满足各类自动化需求,然而这类需求的长尾性和编程专业人才供给不足的不平衡导致很多长尾的需求并不能得到完全的编程资源的支撑。因而RPA与信息化貌似是此消彼长的机会,但从编程自动化的角度看,两者就统一了,只是自动化的不同表现形式,可以形式化定义的就完全使用编程来解决,之所以存在RPA是很多地方没有编程资源的介入,而无编程脚本,尤其是视觉界面的操作缺乏编程资源的支持,使得一些机构转向了RPA工具的使用。

本质上,RPA就是信息自动化的一种特例,在自动化编程技术进步后将逐步被吸纳和消亡的一个独特存在。

四、RPA的演进与未来

一、智能屏障的不断减少。比如一些机器视觉技术的进步,可以提供更加灵活的读取能力。以前通过DOM获取的方式会逐步转变为图像获取,视觉技术还可以提供更多的对界面结构的理解,可以容忍更多的变量存在。

二、向编程自动化方向演进。无论是面向需求编程,还是自然语言式编程,RPA的执行脚本将和其他领域的自动化脚本一样,走向更加智能的编程形式,无论是语言还是交互,无论是目标指引还是教学导向,似乎都指向通过一门全新的自动化编程语言来解决。

三、向更加广阔的领域扩展。进入到编程自动化领域,意味着更加广泛的软件自动化领域大门的打开,无论是自动化测试、简单重复的UI界面间操作,甚至一些复杂的业务逻辑处理的中高级工作,都可能被取代。

四、RPA的消失。因为编程自动化的迅猛发展,RPA的概念作为技术形态消失,可能龟缩到特定行业特定重复性劳动批量任务业务领域的代名词,而这些行业也慢慢因信息化建设和编程自动化的进步而逐渐消失。

五、小结

从整个智能革命历程上来看,RPA是“编程+智能”路径上的插曲,终将随着编程智能化自动化的完成而消亡。而编程自动化本身又是自动化大业的终极形态,本质上是完成了True AI的工作。现阶段,可以从编程自动化的视角去切入,推动RPA业务领域应用的简化,也可以直接探索自动化测试、to C的遗留系统自动化任务、长尾重复性劳动取代工作。