ETH官方钱包

<style id="zdjj5"></style>

<big id="zdjj5"></big>

<acronym id="zdjj5"></acronym>

<acronym id="zdjj5"><var id="zdjj5"></var></acronym>

前往
大廳

主題

巴哈場外休憩區10頁簡易標題爬蟲

我也太廢了吧 | 2022-06-30 07:46:31 | 巴幣 2 | 人氣 563

因為用reqest.get無法獲取想爬的東西，所以使用Scrapy來實作在這裡記錄一下自己寫過的東西這樣

import scrapy
import bs4

class BhSpider(scrapy.Spider):
    name = 'BH' #專案名稱
    allowed_domains = ['forum.gamer.com.tw'] #網域名稱

    def start_requests(self): #開始進行請求

        urls =[]
        maxPages =10 #決定要爬多少頁的標題

        for page in range(1,maxPages+1): #先分別建立maxPages頁的網址再一一丟出請求
            urls.append('https://forum.gamer.com.tw/B.php?page='+ str(page)+'&bsn=60076')

        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)


    def parse(self, response): #利用BS4套件解析頁面
        soup = bs4.BeautifulSoup(response.text, 'lxml')
        titles = soup.find_all('p','b-list__main__title')
        for title in titles:
            print(title.get_text())

標題的位置，直接利用最前面的P跟b-list__main__title當參數就行了

其他的依此類推，還蠻方便的

這是輸出後的成果

如果我的程式碼有問題請在下方留言指教

或是看不懂的地方也可以詢問，感恩

#爬蟲 #場外 #程式 #python

1

創作回應

我也太廢了吧 iamjone

追蹤創作集

作者相關創作

作品資料夾

可用於分析場外是否有網軍與其熱門趨勢?場外爬蟲程式碼

巴哈場外休憩區10頁簡易標題爬蟲

利用100頁的場外標題及預覽內文製作星爆文字雲

關於探討人生意義的動畫-靈魂急轉彎與隻手探險簡易感想

5/28 自身抱怨廢文，總要為過去行為付出代價

寫歌day2 試唱方面的困難

寫歌day 1

5/13 近況與未來或許會做的事

一袋米要扛幾樓

住家外傍晚的彩虹

OCA習題（一）

6/29(廢文）不經意又陷入痛苦的的迴圈

動畫瘋算還行的推理類動畫，重啟咲良田與艾梅洛閣下二世簡易無雷感想

5/24尋找或轉移替代的情感與事物

5/17生命的意義

還是一樣爛啦

5/10略感煩躁

5/2回診與不敢面對的未來

混亂的心情

4/26廢文

相關創作

達人 [ 知識圖譜 ] 自動網路爬蟲，生成知識圖譜系統附程式

%%鼠拒收病婿

15

605

達人【爬蟲 + React + SQLite】實現無後端SQL查詢，養生寫前端

%%鼠拒收病婿

22

2232

車圖爬蟲 : BahaDrift (Ver 0.1.0) - 讓你再也不缺席！

8

634

Python 基本網頁爬蟲 - 下載圖片

緩慢爬行（人類）

1

393

[Python] 爬蟲程式練習3

0

145

[Python] 爬蟲程式練習2

0

336

[EN] AI VTuber 來教你 Python

4

766

達人 [星爆AI #1] 了解繪圖AI原理，圖像生成對抗網路 GAN 基礎篇

%%鼠拒收病婿

24

2580

G-Banner - Ver 0.1.0 使用說明

11

532

達人 [Python+ CV ] 修圖軟體製作：GUI框架, JS事件, 縮放拖拉, based64轉numpy

%%鼠拒收病婿

29

1340

雜談(4) - Echo Server

6

624

[Docker] 在Mac M1使用Docker安裝MySQL,並存取本地端資料

帥氣跳蚤蛋

1

3219

【手把手帶你學會爬蟲】#4 認識 Http

4

1178

【程式作品】嘉義大學選課輔助器

15

2159

[Design Pattern C#] Observer Pattern 觀察者模式 Event &Delegate

帥氣跳蚤蛋

5

751

【手把手帶你學會爬蟲】#3 別著急！先來找 API！

6

6240

[LeetCode Python] 5. Longest Palindromic Substring— Dynamic Programming

帥氣跳蚤蛋

3

974

【手把手帶你學會爬蟲】#2 認識 HTML

1

729

【手把手帶你學會爬蟲】#1 介紹爬蟲(或叫序章？)

5

741

紀錄些最近學到的程式小知識 - 讚美Golang

2

500

更多創作

我也太廢了吧 iamjone

追蹤創作集

其他創作

作品資料夾

<cite id="t1cxe"></cite>

<big id="t1cxe"><form id="t1cxe"></form></big>

<center id="t1cxe"><i id="t1cxe"></i></center>