<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python 一個超快的公共情報搜集爬蟲

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-11-03 15:16 ? 次閱讀

Photon是一個由s0md3v開源的情報搜集爬蟲,其主要功能有:

1.爬取鏈接(內鏈、外鏈)。
2.爬取帶參數的鏈接,如(pythondict.com/test?id=2)。
3.文件(pdf, png, xml)。
4.密鑰(在前端代碼中不小心被釋放出來的)。
5.js文件和Endpoint(spring中比較重要的監視器)
6.匹配自定義正則表達式的字符串。
7.子域名和DNS相關數據。

你可以用它來干很多事,比如爬圖片、找漏洞、找子域名、爬數據等等。而且提取出來的數據格式非常整潔:

圖片

不僅如此,它甚至支持json格式 ,僅需要在輸入命令的時候加上json參數:

python photon.py -u "http://example.com" --export=json

為什么能用來做情報搜集呢?耐心往后看哦。

1.下載安裝

你可以上photon的github下載完整項目:
https://github.com/s0md3v/Photon

或者關注下方Python實用寶典公眾號在后臺回復photon獲得國內網盤下載地址。下載后解壓到你想要使用的地方。如果你還沒有安裝Python,建議閱讀這篇文章:超詳細Python安裝指南,進行Python的安裝。

安裝完Python后,打開CMD(windows)/Terminal(macOS),下面簡稱為終端,進入你剛解壓的文件夾,然后輸入以下命令安裝Photon的依賴:

pip install -r requirements.txt

如圖所示:

圖片

2.簡單使用

注意,使用的時候要在Photon文件夾下。比如我們隨便提取一個網站的URL試一下,在終端輸入以下命令:

python photon.py -u https://bk.tencent.com/

結果如下:

圖片

它會在當前目錄下產生一個你測試的域名的文件夾,比如在我這里是 bk.tencent.com:

圖片

嘻嘻,讓我們看看里面有什么東西,有沒有程序員留下的小彩蛋,打開external.txt,這是該網站的外鏈的存放位置??梢钥吹?,這里不僅僅是只有網站頁面,連CDN文件地址都會放在這里,所以external可能是個藏寶庫哦。

圖片

還能一下找出該網站上鏈接的全部開源項目:

圖片

3.擴展

這個項目的價值,不僅在于能夠快速拉取你想要得到的數據,還在于能夠構建一個牛逼轟轟的 情報系統 (如果你技術夠強的話)。因為它是能不斷延伸下去的,比如從外鏈出發,你能找到很多和這個網站相關的訊息:

圖片

相比于搜索引擎搜索的結果,實際上這些信息更符合情報的要求。而且 不是所有的信息都能在搜索引擎搜索得到 ,而通過這個Photon,你可以順藤摸瓜找到那些隱藏在互聯網世界的它們。

試想一下,如果你搜集了很多這樣的網站...然后用正則表達式搭建一個屬于你自己的搜索引擎,這樣的感覺是不是很棒?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 監視器
    +關注

    關注

    0

    文章

    763

    瀏覽量

    32845
  • 參數
    +關注

    關注

    11

    文章

    1398

    瀏覽量

    31482
  • 代碼
    +關注

    關注

    30

    文章

    4557

    瀏覽量

    66855
  • python
    +關注

    關注

    51

    文章

    4678

    瀏覽量

    83485
  • 爬蟲
    +關注

    關注

    0

    文章

    77

    瀏覽量

    6528
收藏 人收藏

    評論

    相關推薦

    Python數據爬蟲學習內容

    ,利用爬蟲,我們可以解決部分數據問題,那么,如何學習Python數據爬蟲能?1.學習Python基礎知識并實現基本的爬蟲過程
    發表于 05-09 17:25

    Python爬蟲與Web開發庫盤點

    ,高層次的web抓取網頁,并從web站點的頁面中提取結構化的數據Scrapy用途廣泛,可以用于數據挖掘、監測和自動化測試。最爽的就是它是框架,任何人都可以根據需求方便的修改,里面有很多類型爬蟲的基
    發表于 05-10 15:21

    Python爬蟲初學者需要準備什么?

    ,想從事這方面的工作,需掌握以下知識:1. 學習Python基礎知識并實現基本的爬蟲過程般獲取數據的過程都是按照發送請求-獲得頁面反饋-解析并且存儲數據 這三流程來實現的。這個過程
    發表于 06-20 17:14

    Python 爬蟲:8 常用的爬蟲技巧總結!

    的話,就需要多線程了,這里給簡單的線程池模板 這個程序只是簡單地打印了1-10,但是可以看出是并發的。雖然說python的多線程很雞肋,但是對于爬蟲這種網絡頻繁型,還是能定程度提高
    發表于 01-02 14:37

    0基礎入門Python爬蟲實戰課

    學習資料良莠不齊爬蟲門實踐性的技能,沒有實戰的課程都是騙人的!所以這節Python爬蟲實戰課,將幫到你!課程從0基礎入門開始,受眾人群廣泛:如畢業大學生、轉行人群、對
    發表于 07-25 09:28

    Python爬蟲簡介與軟件配置

    Python爬蟲練習、爬蟲簡介1. 介紹2. 軟件配置二、爬取南陽理工OJ題目三、爬取學校信息通知四、總結五、參考、
    發表于 01-11 06:32

    python網絡爬蟲概述

    、MySQL、MongoDB、Redis …關于爬蟲的合法性幾乎每個網站都有名為robots.txt的文檔,當然也有有些網站沒有設定。對于沒有設定robots.txt的網站可以通過網絡爬蟲
    發表于 03-21 16:51

    Python 公共情報搜集爬蟲——Photon

    Photon是由s0md3v開源的情報搜集爬蟲,其主要功能有:1.爬取鏈接(內鏈、外鏈)。2.爬取帶參數的鏈接,如(pythondict.com/test?id=2)。3.文件(p
    發表于 06-23 16:35

    詳細用Python寫網絡爬蟲

    詳細用Python寫網絡爬蟲
    發表于 09-07 08:40 ?32次下載
    詳細用<b class='flag-5'>Python</b>寫網絡<b class='flag-5'>爬蟲</b>

    完全自學指南Python爬蟲BeautifulSoup詳解

    完全自學指南Python爬蟲BeautifulSoup詳解
    發表于 09-07 08:55 ?36次下載
    完全自學指南<b class='flag-5'>Python</b><b class='flag-5'>爬蟲</b>BeautifulSoup詳解

    WebSpider——多個python爬蟲項目下載

    此文檔包含多個python爬蟲項目
    發表于 03-26 09:29 ?3次下載

    python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎

    本文檔的主要內容詳細介紹的是python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎
    發表于 08-28 15:32 ?29次下載

    Python寫網絡爬蟲

    Python寫網絡爬蟲的方法說明。
    發表于 06-01 11:55 ?21次下載

    利用Python編寫簡單網絡爬蟲實例

    利用 Python編寫簡單網絡爬蟲實例2 實驗環境python版本:3.3.5(2.7下報錯
    發表于 02-24 11:05 ?13次下載

    Photon:一個超快的公共情報搜集爬蟲

    Photon是一個由s0md3v開源的情報搜集爬蟲,其主要功能有: 1.爬取鏈接(內鏈、外鏈)。 2.爬取帶參數的鏈接,如(pythondict.com/test?id=2)。 3.文件(pdf
    的頭像 發表于 10-31 15:17 ?249次閱讀
    Photon:一個超快的<b class='flag-5'>公共</b><b class='flag-5'>情報搜集</b><b class='flag-5'>爬蟲</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>