• 1******* 加入了本站
  • C****y 下载了资源 TikTok UGC案例与节日营销趋势指南-9页
  • 1******* 加入了本站
  • L******* 下载了资源 0基础跨境新手必读:做跨境电商有哪些必须了解的事-15页
  • L******* 下载了资源 0基础跨境新手必读:做跨境电商有哪些必须了解的事-15页
  • L******* 下载了资源 0基础跨境新手必读:做跨境电商有哪些必须了解的事-15页
  • L******* 下载了资源 0基础跨境新手必读:做跨境电商有哪些必须了解的事-15页
  • L******* 下载了资源 12招美国本土大卖图例选品思路详解-28页
  • L******* 下载了资源 12招美国本土大卖图例选品思路详解-28页
  • L******* 下载了资源 12招美国本土大卖图例选品思路详解-28页

AI+RPA实现自动抓取和分析行业新闻

AI+RPA实现自动抓取和分析行业新闻

豆包生成的封面图

最近网站新增了一个栏目叫“跨境新闻”,这个栏目我的介绍是:本栏目是我个人的 RPA+AI 的实践项目,由RPA全程自动采集处理和发布,AI负责结构化新闻速读和分析总结。

之所以落地这个项目有以下出发点:

1. 行业信息太多了,我需要集中获取信息并快速阅读信息。

行业信息我们得关注,但是目前信息泛滥,我们如果为新闻分级分主次可以减少我们筛选和阅读的时间成本。我首先想到的是亚马逊的官网新闻,当然我也想过汇总行业的其它渠道信息,比如跨境大V公众号,官方公众号等,但是为了方便和主次,我先采集亚马逊官网信息吧,后续再看情况聚合其它行业信息渠道。

2. 最近学习了AI编程和影刀RPA,我得练练手的同时解决目前的问题和需求。

3. 做一个现在能用将来也能用的工具。

如果需要实现自动发布,这中间需要涉及到多个处理模块:主要是3大模块——图片处理模块wordpress服务器端API模块(我是用API的形式处理的)、wordpress客户端发布模块

图片处理模块主要是筛选图片二维码图片剔除下载图片压缩图片缩放图片格式转换以及纯图片文章用OCR提取文本等。

wordpress服务器端API模块主要是从服务器端来配合构建客户端的功能API接口,来实现wordpress客户端模块的文章查重删除发布更新格式化内容等这几大功能。

这3大模块我现在做出来以后后续也能用上,能一直用,日后我还想实现本地文件自动分类,处理,提取信息,文案编写,文件上传,加密,定价等功能,做一个全自动的资源下载站~

图片处理模块,主要是一套筛选出最优封面图和处理封面图的逻辑

图片处理模块,主要是一套筛选出最优封面图和处理封面图的逻辑

文章发布模块

文章发布模块

影刀流程日志

影刀流程日志

其它的我就不细述了,重点说说怎么让AI能输出总体固定+部分灵活的结构,同时又能适配不同信息类型的文章。

都说用好AI需要有好的指令,目前来看确实是这样,特别是让AI能固定输出的时候,虽说官方API有创意性参数值来控制输出结果的固定性,但是经过测试这会让AI失去灵性,会变得很死板,它就无法满足我的部分灵活的需求了。所以还是得回归到指令上来限制而不是通过创意性参数值来控制。

为了得到合适得AI指令,我把大概需求先和Deepseek沟通了一遍,然后让他给我输出AI指令,当然它给的AI指令实际上是不能完全满足需求的,所以我又丢给了cursor来帮我优化AI指令结构,经过优化之后,指令的执行逻辑性非常强了,最后我自己结合我的需求做了最终优化,现在这个指令deepseek能非常好的理解指令要求和逻辑了,所以执行的非常好。同时我测试了一下其它AI大模型,适配性也还行,说明这个AI指令的执行逻辑和思维链是AI能理解的了。

这个AI指令大家可以作为参考样本,它的思维链和结构能通用在很多的复杂场景里。这个指令至少价值100元,就是因为它已经做了结构化,所以很好修改来做复杂需求的适配。

最终的指令如下:

注:后续我可能会不定期更新我的生产指令但是不一定会同步更新到上面,仅供大家借鉴和参考。

总的来说,AI指令需要有逻辑结构,并且AI不是万能的,对于输出内容,我们需要给AI提供思考链路,也就是我们自己本身要会思考——我们可以偷懒,但是不能真懒,我们得思考,而我这个项目最难的也是思考本身~

原文链接:https://www.amazon888.com/blog/9440.html,转载请注明出处和链接。

1

评论0

请先

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录