百度翻译反向js——破解反爬虫

@ 需要的工具:能上网的电脑 vscode,python, code runner, 谷歌浏览器

因为没有编程基础,所以在做爬虫的时候很多地方都会卡住,先说 纯新手 会卡住的点(我是卡住了,死活过不去):

  1. 找百度的请求网址:常用方法——elements 里 全部收搜 form,这个方法行不通,但是可以用来找 token 值(token值貌似每个人不一样,所有博文的),所以要自己找自己的不要企图复制别人的。 特殊方法——抓包,获取(后面讲抓包) 2.sign 值全文的boss,放后面慢慢说

3.划重点: 从网上扣来代码,不能直接用,要调整(要删掉一些东西和调整格式),最快的办法就是找大佬的代码一条一条对着找。(注意:移动版和电脑版不一样) 从网上扣来的代码,无处运行,最后,py文件中不知道如何调用,各个大佬有各大佬的办法(硬刚js,selenium,node.js) 尝试了无数软件后,遇到了曙光(感谢博文大佬):vscode 中加载 code runner(),就和加载Python的方法一样(百度下,就懂了); 代码扣好准确无误后,如何调用?(拜读了各大佬的博文,基本都是写成两个文件(.py ,.js)再调用,这个办法老实说,我不会。)于是我找到了笨方法。

import execjs
sign =   execjs.compile("""
				  扣来的,调整好的所有代码		
""").call("e",query)

代码解读:query,就是要输入的翻译内容,“e”,是要调用的对query操作的函数 sign 就出来了,往后就是正常操作了。

—— 抓包

百度→百度翻译→体验下翻译功能,翻译词组→F12→ 多翻译几个词语就会发现,只有字符长度值和sign值会变,其他不变,搞定sign,就大功告成了。

——sign boss

不是知道是最仅f反反爬虫文比较多,还是我被拉黑了,大佬们的方法找不到 js 文件了,先看下原来找文件的方法: 原来 2. 地方是有文件的,现在没有了

这个方法一定要在已经知道要找什么文件的基础上用我也是用了大佬的方法找到的代码,

【只看这篇文章,就只能得到一个爬虫,而不是代码运作的方法,对于积累知识就没太大意义了】 点鼠标右键→查看网页源代码→ctrl+f →.js →点进去(这是个连接)→F12→如图操作(这个方法没有调试功能) →扣需要用的代码function a( r )~function e( r ) 最后调整。 【破解反爬虫最有趣的地方就是调试代码哪里,可惜文件被隐藏了,不能演示了】

下面是看了大佬们的代码整理粗来的:

经验分享 程序员 微信小程序 职场和发展