源码介绍
1.前端纯HTML+JS+JSON(链接统计除外),后端python生成标准JSON
2.自带30几个常用网站采集规则
3.多线程抓取,30+网站5秒内采集完毕
4.相同网站放在一个框架内,可局部刷新和滚动
5.更新时间显示(按采集页的自带更新时间或按时间排序的第一条时间采集,没有的为采集完成时间)
6.内容链接防盗链,链接通过base64+字符逆序+大小写反转+base64实现加密(更换大小写转换顺序或增加数字替换可实现不同密码加密)
7.内容链接点击统计
8.部分内容鼠标悬停提示(如appstore排行有更新内容、时间、版本号) 部署教程 python3 caiji.py采集(保持后台运行请用screen或nohup)
打开首页访问 caiji.py为后端采集程序,其余为前端需在同一目录 相应设置修改请查看源码中的注释 admin.php为第三方数据库管理程序,用于内容链接统计查看(默认密码admin,请在文件中修改) 点击统计数据库log.db会在首次访问内容链接时生成,如未建立请保证主目录可写 为了安全,后端程序caiji.py和数据库查看程序admin.php请改为复杂文件名,或移动到非web目录(需同时修改文件内的生成json保存目录为网站根目录,默认为当前目录) 默认使用多线程抓取,如有问题请改用单线程 今日头条的采集请更换为自己的cookie,头条短时间采集内容相同的太多(目前1分钟采一次合并10次数据),相同cookie分段采集后几乎不会有重复的,但采集一段时间后推荐的都是杂七杂八无关的垃圾内容(请定期更换cookie或自行加入随机的头条cookie生成规则) 采集站的logo大部分已修改为透明图层png,在非白色背景下可能会很难看
src感谢您的来访,获取更多精彩文章请收藏本站。
© 版权声明
1. 资源都是经过站长或作者收集测试修改后发布分享。转载请在文内以超链形式注明出处,谢谢合作!
2. 本站除原创内容,其余所有内容均收集自互联网,仅限用于学习和研究目的,本站不对其内容的合法性承担任何责任。如有版权内容,请通知我们或作者删除,其版权均归原作者所有,本站虽力求保存原有版权信息,但因众多资源经多次转载,已无法确定其真实来源,或已将原有信息丢失,所以敬请原作者谅解!
3. 本站用户所发布的一切资源内容不代表本站立场,并不代表本站赞同其观点和对其真实性负责,若您对本站所载资源作品版权归属存有异议,请留言附说明联系邮箱,我们将在第一时间予以处理 ,同时向您表示歉意!为尊重作者版权,请购买原版作品,支持您喜欢的作者,谢谢!
4. 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客如有发现请立即向站长举报;本站资源文件大多存储在云盘,如发现链接或图片失效,请联系作者或站长及时更新。
THE END
暂无评论内容