蜘蛛是如何发现网络上的网站/域名的？ - V2EX

蜘蛛是如何发现网络上的网站/域名的？ - V2EX

Home Sign Up Sign In

推荐书目

高性能网站建设进阶指南

High Performance Web Sites

Google Hacks: Tips & Tools for Finding and Using the World's Information

关于 Google SEO 最好的一本书

This topic created in 2231 days ago, the information mentioned may be changed or developed.

比如解析了一个二级 /域名，蜘蛛是如何知道存在这个二级 /域名的？
域名后缀那么多，挨个扫？不现实吧？

12 replies 2020-04-07 08:48:19 +08:00

1

opengps

Apr 6, 2020

蜘蛛不会知道的。
如果没有外链，没有主动推送提交，没有 sitemap 引路，那么你这个二级域名的站点几乎等同于沉入了“暗网”

2

chinvo

Apr 6, 2020 via iPhone

Google 同时还会用 chrome 去获取新链接

3

OneMan

Apr 6, 2020

你要自己去提交。
做个出名蜘蛛很爽吧，这边主动喂料，那边主动交钱。

4

xyjincan

Apr 6, 2020 via Android

跑字典，或者直接在 dns 哪里批量获取？

5

Ultraman

Apr 6, 2020 via Android

这里是 cloudflare 的解释。
https://www.cloudflare.com/learning/bots/what-is-a-web-crawler/
web crawler bots start from a seed, or a list of known URLs. They crawl the webpages at those URLs first. As they crawl those webpages, they will find hyperlinks to other URLs, and they add those to the list of pages to crawl next.

6

yitd

OP

Apr 6, 2020

@opengps 有许多网站都没有建设好，比如搜索 Welcome to nginx! 后面几页开始就会有很多默认页面，这没有任何推送引路同样被收录

7

Ultraman

Apr 6, 2020 via Android

不如自行挂一个网页随便放点什么东西，再绑一个从来没用过的（二级）域名，你自己也不要访问避免如上老哥讲浏览器上传 URL 这种情况，然后等几天回来观察访问记录看 bot 能不能发现。

8

LukeChien

Apr 7, 2020 via Android

通过 dns，公共 dns 谷歌、百度、阿里都有。权威 dns 最早 dnspod 是和各家搜索引擎合作的。

9

binfeng

Apr 7, 2020 via iPhone

dns

10

chihiro2014

Apr 7, 2020

一般是自己提交，然后爬虫会去爬

11

Showfom

PRO

Apr 7, 2020

一般你用 Chrome 联网访问过就会被 Google 知道了

12

dream7758522

Apr 7, 2020 via Android

据说 36x 的蜘蛛，只要是同款浏览器再隐蔽的链接也能被抓

About Help Advertise Blog API FAQ Solana 3235 Online Highest 6679

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 111ms UTC 14:42 PVG 22:42 LAX 07:42 JFK 10:42
Do have faith in what you're doing.

ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86