网站静态页面克隆 | 学习笔记

克隆过程

软件准备以及系统环境

  1. IDEA (tomcat)
  2. windows 10
  3. 火狐浏览器 (我发现这是必要的,报错404内容比较完整,会带上完整链接,谷歌和Edge都不会)

整体流程

  1. 新建一个web 项目
  2. 找到喜欢的网站,copy源代码 (右键-查看源代码) 到index.html
  3. 配置服务器,在火狐浏览器打开;
  4. 找到它的检查报错,复制下来(视频里有讲),缺少的内容,大部分是图片,还有css文件,总之,它说缺什么,就下载下来,在idea里补上; a. 我下载的那个网页 还有一些ttf ,woff,woff2的文件,我也一并下载,复制进去了; b. up主用的vim整理需要下载的链接和批量下载404里的内容。我使用的excel格式化链接,和bat命令批量下载文件(win10自带),写在后面; c. 下载完成后补上。(视频里有讲)方法一是,一个一个右键新建package。方法二是在文件夹里批量新建文件夹,(win10也可以做到,写在后面);

win10批量下载文件&批量创建文件夹

  1. 怎么用excel 把404里复制下来的无效内容剔除应该就不用说了吧, a. crtl+f - 替换 :[*] 全部替换为 空 ; b. 再使用crtl +f替换为官方网址;
  2. 关于批量下载文件:将格式化后的链接保存到一个txt文件中,命名为imgs.txt;
  3. 再新建一个txt, 在里面输入
@echo off setlocal enabledelayedexpansion for /f %%i in (imgs.txt) do ( curl %%i -O ) pause
  1. 保存退出,重命名为dow.bat;
  2. 双击运行这个bat文件,imgs里的链接内容就会被下载到这两个txt所在目录下了。
  3. 关于批量创建文件夹,我是手动的,因为我copy的网站没几个package; 但是使用win10 的bat同样可以批量创建文件夹;
详情,请参考: (亲测可用) 如下代码:(创建了aa/aa1/aa2 三级文件夹目录) md aa md aa/aa1 md aa/aa1/aa2

出现的问题

  1. 默认打开的是index.jsp; 解决: 发现我放在了web-inf受保护的目录下,把index.html移到web目录下,同时删除index.jsp;
  2. 导入图片后打开不显示图片 解决:仍然是WEB-INF目录的问题,我拷贝的网站里的img地址链接都包含WEB-INF目录。最终我使用快捷键 ctrl+r批量替换img里的src链接中的 【WEB-INF/ -> / 】; 再把WEB-INF里的目录移动到web下,删除WEB-INF。
  3. 发现有一张图片显示不出来 解决:在火狐浏览器里右键检查-查看器定位到图片的代码处,在idea里看代码发现,代码里的图片名叫【20210529041606928.jpg】,但我下载下来后被重命名为【thumb_300_300_20210529041606928.jpg】,我修改了目录里的图片名,成功。
  4. 发现还有一张显示不出来 解决:定位 - 看代码 -图片在class里 -打开对应class文件 -发现里面的s3.png底下有红色波浪线- 从当初下载的地址里重新下载,粘贴进去。

5.我修改了href跳转的链接,可是实际浏览器上跳转的url一直不变 解决 : 浏览器右键检查发现改错位置了,上面跳转的链接没有改,只改了下面…

  1. 打开跳转页面后,报错如下:
来自“http://localhost:63342/qd/js/v.js”的资源已被阻止,因为 MIME 类型(“text/html”)不匹配(X-Content-Type-Options:nosniff)。

解决:百度得到把script标签的 type=text/html改为type=javascript,原本网页是在WEB-INF目录下,但是我拷贝后是放在WEB目录下

  1. 修改后仍然是之前的错误和页面 解决:删除ou缓存t文件,restart

总结

拷贝的是静态页面,本质就是看报错,打补丁 不是一个完整的项目,但是用于学习别人的前端代码是非常不错的 。 感谢up主

经验分享 程序员 微信小程序 职场和发展