ETH官方钱包

創作內容

0 GP

公主連結 動態網頁crawler

作者:艾倫D索妮雅│2020-07-26 13:43:13│巴幣:0│人氣:121
github: resource

from bs4 import BeautifulSoup
from selenium import webdriver
import time
import os
import requests

#因urllib.request只能用在靜態網頁
#故使用driver來進入動態網頁
driver = webdriver.Chrome('D:\PythonLab\chromedriver_win32/chromedriver.exe')
driver.get("https://pcredivewiki.tw/Gacha")
url = "https://pcredivewiki.tw"

time.sleep(5) #等待動態網頁載入完整的網頁原始碼
    
html = driver.page_source #擷取網頁原始碼

page = BeautifulSoup(html,'html.parser')

All_img = page.find_all('img')

index = 0
for img in All_img:
    src = url+img['src']
    if src.find('unit') != -1:
        index += 1
        fname = '爬蟲img/'+str(index)+'.png'
        data = requests.get(src,stream = True)
        with open(fname,'wb') as f:
            f.write(data.content)
            f.close()
            print('抓取公主連結 : '+src.split('/')[-1])
    

print('公主連結-爬蟲結束...')
引用網址:http://www.jamesdambrosio.com/TrackBack.php?sn=4861876
All rights reserved. 版權所有,保留一切權利

相關創作

留言共 0 篇留言

我要留言提醒:您尚未登入,請先登入再留言

喜歡★arthur850512 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:nhentai craw... 後一篇:Pixiv自動登入...


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情? 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】