如果微软员工没瞎说,就在这周,刚刚放开 ChatGPT 也就是 GPT-3.5 接口没多久的 OpenAI,要发布升级版的 GPT-4 了。
GPT-3 已经达到惊人的 1750 亿参数了,难不成 GPT-4 要直接干上百万亿,实现维度跨越?
可惜的是,这个百万亿参数已被官方定义成了谣言,这次预告中的 GPT-4,升级的亮点不是模型有多大,而是剑指「多模态」。
多模态这个专业术语,说人话就是,GPT-4 不再是文本对话了,图片,乃至视频都被纳入到了模型可理解的范畴。
好家伙,这 3.5 咱还没玩明白,更高级的 4 就要来了,虽然微软是 OpenAI 背后的金主,但为啥新模型的发布消息是金主来宣布呢?
顺着各路报道查了查,这个消息的出现,发生在德国一场关于 AI 的线下活动上,其中参与演讲的微软员工,在介绍语言模型时走漏了发布时间。
也就是说,GPT-4 在这周来了,皆大欢喜;GPT-4 这周来不了,员工不谨慎的传统艺能。如果说这是微软的营销,真的比前两年的 Win11 都要吊胃口。
不过在那场演讲中,有一句话说的特别到位:像 GPT 这样的大型语言模型是游戏规则改变者。
改变了什么?且看在 ChatGPT 持续走红的这段时间,网上又出现了什么新鲜玩意。
ChatPDF
地址:https://www.chatpdf.com/
ChatGPT 生产力升级,改变游戏规则的第一个走红的工具,是德国一个小哥开发的 ChatPDF。
不到一周的时间,这个网站就被上传了 6.5 万份 PDF 文档,有什么神奇之处?
很简单,你上传一份文档,它能够立刻把文档中的内容进行解读,并列出重点。
是的,相当于给 PDF 内置了一份搜索引擎,不仅可以依靠文档解释你的问题,还能够总结出重点,标注内容所在的页数。
这种文章内提到的小细节也不会放过。
正文内是这么说的,没毛病。
一份纯文字的教程文档,哪怕只有 5 页,也得看上个 10 分钟吧,但在 ChatPDF 的帮助下,你可以用提问对话的方式,1 分钟快速 get 到重点。
网上已经有无数的测试了,ChatPDF 所改变的,是我们获取信息的方式,无论是教程,还是合同,它都 OK。
甚至异常难读的论文都没问题:
图源量子位
而且,打起生产力变革第一枪的文档应用不只 ChatPDF 这一家,专门读开发文档的 DocsGPT,可以帮你快速复习文档内容:
地址:https://docsgpt.arc53.com/
为论文而生的 SciSpace by Typeset,可以复制传给 GPT,让其秒变研究助理。
地址:https://typeset.io/
注意,上面的这些文档助手,尚且不能识别图片,因为 GPT-3.5 并非多模态的,加上输入有限,但从现在 GPT-4 曝出亮点来看,未来只会更加方便。
文档阅读只是冰山一角,其他的呢?国内爆火的 ChatExcel 了解一下。
ChatExcel
地址:https://chatexcel.com/
Excel 这种能被称为老古董的工具,并不是人人都能玩转,每次做表格,现查现用是基操,我收藏夹里不知道有多少教程了。。。
而相比于搜索引擎查,然后自己去试,失败了再查,如果像前面 ChatPDF 那样,通过对话的方式,就能完成 Excel 复杂操作,你愿不愿意用呢?
北大的一个硕博三人团队,因为其中一位成员的女朋友有和我们一样的烦恼,诞生了 ChatExcel 这个项目。
是的,我们可以不知道如何利用 Excel 如何完成复杂操作,只要知道自己想得到什么结果就好了。
你只管当甲方,告诉 AI 需求,不用管中间过程,它会自动反馈给你一个结果,比如这份中国 GDP 的表格,我们需要一列两年的增长百分比。
运行过后真的就多了这么一列:
ChatExcel 不单单是帮你省去了查百度的功夫,还能帮你快速理解表格里的内容,比如这一份全球人口的表格。
但我只想知道 2001 年人口大于千万的最后三个地区,2021 年的人口数据,别管怎么做,把需求问它就好了。
执行过后,保留的就是我们想要的结果。
你说这些操作复杂吗?不复杂,每一步都能从搜索引擎找到答案,但你说以对话的方式,让懂你的 AI 快速得出结果,方便肯定是方便的。
文档可以、表格可以,翻译这种基操肯定不在话下,事实上有很多这类的工具,不过大多需要自己的 API,这里就不介绍了。
1、批量翻译,甚至生成双语版文件:
https://github.com/Raychanan/ChatGPT-for-Translation
2、滑词翻译,还能改写润色:
https://github.com/yetone/openai-translator
3、快速建立自己的生词库:
https://github.com/piglei/ai-vocabulary-builder
单文本操作就能给我们无限的想象空间了,让 ChatGPT 帮我们总结视频内容行不行呢?未来成本更低的多模态模型或许可以,现在嘛,曲线救国也不是不行。
BibiGPT
地址:https://b.jimmylv.cn
这是 B 站一位 UP 主@吕立青_JimmyLv 的项目,虽然现阶段 ChatGPT 只能读取文本,对视频没辙,但视频是有字幕的。
这位 UP 主做的事情,就是扒取了视频字幕,然后把字幕喂给 ChatGPT,让它总结整个视频的内容。
举个栗子,这是今天我在热榜上看到的视频,关于 ChatGPT 的搞钱方案,视频总结了国外利用 ChatGPT 盈利的资讯,但 16 分钟的时长,我两倍速看着也很折磨。
复制这个视频的链接,粘贴到 BibiGPT 里,视频重点真的就被总结好了,整个过程相当丝滑。
除此之外,还有一种玩法,只要把当前视频链接里的「com」改成「jimmylv.cn」。
它能自动跳转,总结当前视频,当初数千字的文案,就被总结成了百字左右,提炼出来的中心也没毛病。
BibiGPT 还支持了油管,匹配的有快捷指令,感兴趣的小伙伴可以去试试,不过有一个前提哈,得有字幕。
结语
新产品如雨后春笋般冒头,但这还只是 GPT-3.5 的功劳,而 GPT-4 正在路上,游戏规则真的被改变了。
可以用更贴近生活对话的形式,去更直接的表达需求;也可以让 AI 直接给出答案。
当然,现阶段的 AI 还有问题要解决,比如它也不能从甲方的需求里提取到五彩斑斓的黑,比如它的回答也不是 100% 正确,还需要人去预处理输入,去细分需求,稳定回答。
但看看前几天谷歌放出的 5620 亿超大模型,再看看同样这周将要发布的百度文心一言,大厂之间 AI 的军备竞赛已然打响。
不过,有件事不难达成共识——
前面是挖矿,后面是 AI,老黄又要赢麻了。
QQ 群:729224889 网站:wldxh.com