相信大家在生活办公的时候,多多少少会碰到一些需要重复操作的场景,这些操作很傻,可能是反复的 Ctrl C、Ctrl V,可能是在网站上反复的点点点,亦或两个工具之间反复横跳。
傻是因为过程枯燥乏味,但换言之有规律可循,既然如此,我们完全可以利用自动化工具来搞定这些操作。
比如像之前说那个在 ChatGPT 里自动回复「继续」的油猴脚本,评论里呼声最高的「按键精灵」。
这玩意我可不陌生,去年 Midjourney 和 Stable Diffusion 还没那么火的时候,国内一些 AI 绘画网站就已经上线冒头了。
可我发现这些网站上同样的 Prompt 生成的图片随机性非常大,耍一俩小时也就出个 1、2 两张满意的图。
所以当时我就用按键精灵录了个自动跑图的脚本,靠着白嫖来的免费额度生成了上百张图。。。
但按键精灵这样的工具,满足简单的键鼠操作没啥问题,一旦需求复杂起来,比如我需要从 Excel 里循环获取数据,比如我需要搞定报错,或加一些逻辑判断之类的,就要给工具升升级了。
或许,我们是时候了解一下小众圈子里的 RPA 工具了。
RPA 工具
所谓 RPA 指的不是一个具体的软件,而是指一门自动化技术,通过模拟人工操作,来搞定前面提到的那些枯燥、乏味的重复性任务。
简单说就是把背后执行的代码封装了起来,让我们可以像搭积木一样,去完成一个完整的、可复用的自动化机器人。
国内常见的 RPA 工具有两款,一个是「按键精灵」的师弟,同一家公司出品的流程创建者(UiBot Creator)。
官网:https://www.uibot.com.cn/
另一个就是基于 Python 实现的影刀。
官网:https://www.winrobot360.com/
从功能实现上讲,两者大差不差,至于价格,你要说免费吧,也不完全免费,毕竟 RPA 工具面向的更多是企业和工作室,官网提供的安装包也都是社区版。
但免费版没有想象中的太大阉割,只要不商用,个人体验都没问题,我在用影刀时候发现还有个邀请机制,这里放个我的邀请码,无所谓的小伙伴可以用这个注册。
https://www.winrobot360.com/share/activity/?inviteUserUuid=82625202159230977
当然,如果你有这方面的需求,也可以把邀请码放到评论区,我会放出来,大家互助一下。
不过无论是流程创建者,还是影刀,B 站上有两个工具的完整使用教程。
流程创建者:https://space.bilibili.com/387648216
影刀:https://space.bilibili.com/393215006
既然免费版好用,还配套有完整教程,那为啥介绍的人不多呢?无他,自动化工具必须要奔着场景来介绍,单纯说它好用,那不耍流氓嘛。
至于我们有没有这样的场景?有的,上周说利用 RPA 工具自动在 Midjourney 跑图的教程这不就来了嘛。
下面以影刀举例。
Midjourney + 影刀
事情起因就是之前说的那样,Midjourney 的共享账号买是买来了,但天天忙这忙那没时间跑图,四舍五入就浪费了。。。
所以这才有了,提前准备好 Prompt 的表格,自动去 Midjourney 上跑,睡一觉第二天直接收图的想法。
喏,就像下面这样,我还把每次生成的图扔到了表格里,方便查看。
最初我是在 Midjourney 网页端跑的,甚至是像「按键精灵」那样,用了影刀「智能录制」功能:
事实上,「智能录制」是 RPA 工具里最简单的玩法,每个刚接触 RPA 工具的小伙伴都可以试试看。
但这次我主动升级了难度,在 Discord 客户端完成的跑图,毕竟做教程嘛,还要考虑泛用性,万一你想做个基于其他软件而非浏览器实现的机器人,也能从这一篇 get 到思路,所以具体怎么实现?请往下看。
第一步:完成单张跑图
是的,万事开头难,要搭建一个机器人,不妨在自动化前,先跑通用影刀自动跑一张图的功能。
怎么做呢?想想我们是怎么在 Midjourney 上跑图的——
1、点一下输入框
2、输入「/imagine」的指令
3、按回车或者空格
4、在 Prompt 后的新输入框内输入提示词
5、再按回车完成对话
在影刀上,也是这么完成的,不过要更具体一些,建议大家先去 B 站看看影刀官方教程,比如影刀上的所有操作,都是左边找指令,然后双击或拖拽到右侧流程栏里实现的。
我这里更多的是为大家提供思路,3 步搞定——
1、获取 Discord 客户端,也就是找到你要完成后续操作的对象,这里的指令是「获取窗口对象」,虽然影刀提供了多种方式,但我们用最简单的通过名字找到 Discord 客户端即可。
需要注意的是,像这种获取 XXX 的操作,最后会有一个保存的输出指令,像后续我们要在 Discord 上完成的操作,都需要这次的输出,所以记得起一个一眼就能认出来的名字。
2、在 Discord 输入框输入内容,这里的指令是「填写输入框」,窗口对象是上一步得到的「Discord」,操作目标是 Discord 里的输入框。
怎么获取输入框?在「去元素库选择」里都有个「捕获新元素」的功能。
在 Discord 客户端,你会发现跟随鼠标走的有一个红框,这是影刀把当前界面的所有元素都提取了出来,我们只要按住「Ctrl」左键单击输入框那里,就能自动捕获。
输入内容是「/imagine+空格+提示词」的格式,千万注意,要在 /imagine 后加个空格,只有加了空格,才能自动唤出 Prompt 的输入框。
至于为什么不用输入「prompt」这个词?因为当有空格的时候,它已经自动跳转到新输入框内了,所以我们只用保留具体的提示词即可,比如「/imagine dog –niji 5」。
整体流程是这样的:
3、发送消息,两种方式,一种是点击发送按钮,一种是键盘输入回车。
前者用的是「点击元素」的指令,操作目标同样需要我们「去元素库选择-捕获新元素」找到。
后者是「键盘输入」指令,鼠标点「插入键盘符号」,再点虚拟键盘里的回车按钮即可。
两种方式都能搞定,选哪个都好。
仅此三步,影刀使用 Discord 跑图的功能就实现了,不单单 Discord,理论上说,你可以通过这样的方式让影刀去控制任意一款工具,完成所谓的自动化。
第二步:完成批量跑图
不知道大家发现没有,上面三步完成跑图的时候,获取窗口和发送消息都是固定操作,只有 2 里面,在输入框输入的内容在变,即「/imagine+空格+提示词」中的提示词需要每次都更换。
也就是说,只要我们准备一份提示词的表格,每次把表格里的内容,替换成上面的格式,然后输入,就可以完成批量跑图。
影刀能不能处理表格呢?当然可以,这是 RPA 工具最大的应用场景了,4 步搞定。
1、之前要找 Discord 客户端,现在处理表格了,也要找 Excel 才行,选择「启动 Excel」指令。
启动方式选「打开已有的 Excel」,文件路径选提前准备好的提示词 Excel 文件,保存 Excel 对象也和之前一样,它代表的就是后续操作中这个 Excelc 文件。
2、现在相当于影刀已经找到了 Excel 文件,下一步就是让它挨个访问 Excel 单元格的内容,指令是「循环 Excel 内容」。
Excel 对象选上一步我们起的名字,循环方式选「循环已使用区域」,还要再命名循环项和当前行号。
循环方式指的循环范围,比如我们提前准备好的表格,A1、A2、A3 这三个格子内就是已使用的区域。
3、看到这,想到没,之前让起名的「循环项」里,就包含了每次要变的提示词,只要接着实现上一节完成的单张出图,就能搞定自动出图啦。
但先别急着高兴,还有一步,我们需要改一下循环项的数据类型,通过「设置变量」的指令。
变量类型选:字符串,变量值是在点亮 Python 的小图标后输入:循环项的名字[0],变量名可以和之前循环项同名。
4、最后,只要把上一节单张出图的三步指令扔到循环里,就可以完成按表格批量出图的效果啦。
不过这次填写输入框那里,变成了「/imagine+空格+循环项」。
添加循环项的方法是通过点击右侧「fx」的按钮,选择之前的命名的那个字符串。
至此,这个按表格跑的机器人就已经跑通了。
我还加了一个「等待」的指令,每次输入后等个 2、3 分钟,主要是怕批量跑起来 MJ 封号,不过 MJ 是可以输入后,逐个完成的,这里或许是我的多此一举。
至于怎么把图片加入到表格,大概思路是找到最后一次生成的图片,然后右键唤出菜单,左键选择「复制链接」,再通过 HTTP 下载把四宫格图下到本地,最后添加到 Excel 表格。
大致流程是这样的:
结语
说实话,RPA 工具是一个软件圈的房间里的大象,提及者甚少,不仅是因为需要找具体的场景,更是在实际使用过程中确实有门槛。
这个门槛,就像学一门新手艺,不过 B 站刷一刷教程,自己试一试,上手很容易。
那你说 RPA 工具好不好用?它能控制任意软件,完成诸多操作,只要有场景,就能帮上忙,当然是好用的。
今天这一篇是小小的入门,如果大家对这个感兴趣,找机会我们可以再多聊一聊 RPA 工具的应用。
不过大伙都看到这了,肯定真爱粉无疑,教程不易,大家快来点赞啦。
QQ 群:729224889 网站:wldxh.com