M09Ic
|
f35a07050e
|
support http/socks5 proxy
|
2024-02-07 01:29:05 +08:00 |
|
M09Ic
|
ea5218b7f3
|
修复fasthttp client中, timeout不生效的bug
|
2024-02-07 00:46:11 +08:00 |
|
M09Ic
|
4cbb7b05ba
|
bump dependency
|
2023-12-28 14:34:19 +08:00 |
|
M09Ic
|
a36e06e96b
|
修复--timeout实际没生效的bug
|
2023-06-30 17:29:49 +08:00 |
|
M09Ic
|
73f724b92a
|
feat. 新增--index --random 支持自定义index与random目录
|
2023-06-03 22:24:52 +08:00 |
|
M09Ic
|
1a656b26a1
|
新增--retry插件
|
2023-05-04 12:04:59 +08:00 |
|
M09Ic
|
4b78503d64
|
添加url错误是的报错信息
|
2023-04-25 17:33:07 +08:00 |
|
M09Ic
|
3698d01903
|
添加--scope与--no-scope参数, 用来指定爬虫的作用范围
修复recursive中的多个bug
|
2023-04-14 20:05:21 +08:00 |
|
M09Ic
|
1bcf2f297d
|
修复url解析错误的bug
修复redirect的wg计算错误的bug
|
2023-04-06 21:20:24 +08:00 |
|
M09Ic
|
77b92b44ea
|
关闭check-only的kepp-alive.
新增checkonly的--match指定过滤器
|
2023-04-04 01:21:31 +08:00 |
|
M09Ic
|
8ec00abe10
|
修复多个可能导致报错的bug.
checkonly支持upgrade与redirect
|
2023-04-04 00:47:33 +08:00 |
|
M09Ic
|
30506b1f5b
|
修复部分情况下过滤不生效的bug
|
2023-03-24 15:39:40 +08:00 |
|
M09Ic
|
4a12286beb
|
实装random useragent
|
2023-03-24 14:20:31 +08:00 |
|
M09Ic
|
bdc793c75b
|
修复-m host 场景下字典与redirect生成错误的bug
|
2023-03-24 13:41:00 +08:00 |
|
M09Ic
|
296bea96a0
|
修复check-only失效的bug
|
2023-02-19 16:14:51 +08:00 |
|
M09Ic
|
b3589db853
|
新增一种特殊的过滤模式--unique 或指定状态码的--unique-status 200
|
2023-02-08 12:58:56 +08:00 |
|
M09Ic
|
6287a8e468
|
--fuzzy-status添加特殊情况 "all", 所有类型的状态码都会启用对应的模糊匹配
|
2023-02-07 18:42:20 +08:00 |
|
M09Ic
|
c263c11926
|
优化无效重定向页面的过滤
|
2023-02-07 18:37:47 +08:00 |
|
M09Ic
|
fea6ac7c39
|
去重策略不再作用于word, 防止内存中维护一个过大的map
|
2023-02-06 23:29:11 +08:00 |
|
M09Ic
|
c3993fc8c2
|
多处性能与代码优化, 能更好的支持不同的fuzz了
|
2023-02-04 19:44:37 +08:00 |
|
M09Ic
|
02f601051c
|
spray输出相关的代码整合到spray中
|
2023-02-01 18:31:50 +08:00 |
|
M09Ic
|
940c5b9e99
|
修复在优化stat时一个线程安全问题导致程序阻塞的bug
|
2023-01-29 18:23:55 +08:00 |
|
M09Ic
|
3943943405
|
完成对extract相关功能的重构
|
2023-01-28 13:15:49 +08:00 |
|
M09Ic
|
8756b7503e
|
使用了不太优雅的办法解决并发调度与可能的goroutine泄露问题
|
2023-01-16 17:30:54 +08:00 |
|
M09Ic
|
3ff46e5e1f
|
优化了输出中的number字段, 现在能正确判断了, 并且addition中的number会是当前的wordoffset, 可以用来判断错误发生的位置.
|
2023-01-12 19:21:35 +08:00 |
|
M09Ic
|
e30bab194a
|
优化统计模块, 现在check失败的任务也会在stat中保留了
|
2023-01-12 18:17:53 +08:00 |
|
M09Ic
|
758a274684
|
新增--rate-limit, 用来限制单个pool请求速率
|
2023-01-12 17:41:44 +08:00 |
|
M09Ic
|
02195a8005
|
添加了多处错误与日志描述
|
2023-01-12 16:35:34 +08:00 |
|
M09Ic
|
427f64f57a
|
回调redirect逻辑, 只有check不会被重定向
|
2023-01-11 12:07:07 +08:00 |
|
M09Ic
|
68bef7bc3c
|
优化redirect, init不需要重定向
|
2023-01-11 12:03:40 +08:00 |
|
M09Ic
|
a4d912ed4d
|
调整全局的去重列表以及日志输出
|
2023-01-11 11:26:03 +08:00 |
|
M09Ic
|
4a774718c9
|
调整url去重的逻辑, 现在将统一进行去重判断
|
2023-01-11 11:12:00 +08:00 |
|
M09Ic
|
75236c7708
|
优化index的init
|
2023-01-10 23:55:03 +08:00 |
|
M09Ic
|
b120d703b8
|
重写了目录拼接的所有逻辑, 发现做到安全的目录拼接有些困难, 只能做到尽可能安全
|
2023-01-10 23:44:03 +08:00 |
|
M09Ic
|
0b8fed7e80
|
优化body读取的逻辑, 0byte的body将会自动跳过读取
|
2023-01-10 11:59:43 +08:00 |
|
M09Ic
|
f197d18621
|
重写协议升级的逻辑
|
2023-01-10 02:04:12 +08:00 |
|
M09Ic
|
f87acdf657
|
实装--crawl-depth
|
2023-01-10 01:09:00 +08:00 |
|
M09Ic
|
599118284c
|
进一步优化crawl的正则与特殊情况处理
|
2023-01-10 00:58:16 +08:00 |
|
M09Ic
|
171786c51e
|
进一步优化crawl的正则与特殊情况
|
2023-01-09 22:41:05 +08:00 |
|
M09Ic
|
2081e25f93
|
bl中的exceed显示适配read-all
|
2023-01-09 22:23:34 +08:00 |
|
M09Ic
|
b019324383
|
新增--read-all参数, 用来取消body max read限制
|
2023-01-09 21:47:06 +08:00 |
|
M09Ic
|
f24c7b3bc6
|
对爬虫进行大量优化, 包括优化性能, 去重, 优化目录拼接, 适配"./"相对目录
fuzzy会在开启debug时自动启用.
|
2023-01-09 21:33:05 +08:00 |
|
M09Ic
|
a94f9e3dc7
|
优化相似度判断, 并添加了distance/sim字段用来获取.
优化fuzzybaseline的逻辑, 移动到处理线程中.
优化expr的性能
修复--fuzzy没启用也会生效的bug
|
2023-01-09 14:47:58 +08:00 |
|
M09Ic
|
797ac74af3
|
适配了favicon的指纹识别
添加了基于contenttype的一些优化
index现在发送的是空数据, 而非添加了"/"之后的
|
2023-01-09 13:43:00 +08:00 |
|
M09Ic
|
c84440a662
|
修复程序并发调度失败的bug
|
2023-01-09 11:55:27 +08:00 |
|
M09Ic
|
e3fc74e78d
|
优化baseline的性能与信息获取
|
2023-01-06 15:06:40 +08:00 |
|
M09Ic
|
4a1cb28bdd
|
新增--common, 探测web常见的通用文件.
优化--bak, bak现在还会带上常见的备份文件名了
|
2023-01-06 13:07:59 +08:00 |
|
M09Ic
|
6c2f5919d2
|
优化pool的init, 使用互斥锁提高并发速度
|
2023-01-06 11:30:17 +08:00 |
|
M09Ic
|
a3082d3f1a
|
通过fasthttp复用buf导致的数据引用错误的bug
优化代码结构
|
2023-01-06 04:18:21 +08:00 |
|
M09Ic
|
806f6355d0
|
misc update
|
2023-01-06 03:31:28 +08:00 |
|