TQC+ 網頁資料擷取與分析_Python_203_台灣彩券

文、意如

1. 題目說明:

請開啟PYD02.py檔案,依下列題意進行作答,使輸出值符合題意要求。作答完成請另存新檔為PYA02.py再進行評分。

2. 設計說明:

請撰寫一程式,爬取https://www.codejudger.com/target/5203.html,程式須回傳下列資訊:

  • 大樂透的開出順序
  • 大樂透的大小順序
  • 大樂透的特別號

3. 輸入輸出:

輸入說明

爬取網頁

輸出說明

  • 大樂透的開出順序
  • 大樂透的大小順序
  • 大樂透的特別號

範例輸入

範例輸出

題目題示:

# -*- coding: utf-8 -*-

import ___
import requests

url = '___'
# GET 請求
html = requests.___(___)

# 使用 lxml 解析器
objSoup = bs4.BeautifulSoup(html.text, '___')

dataTag = objSoup.select('.contents_box02')

balls = dataTag[2].find_all('___', {'class': '___'})
print("大樂透開獎 : ")
print('-------------')

# 開出順序
print("開出順序 : ", end='')
for i in range(6):
    print(____.____, end='   ')

# 大小順序
print("\n大小順序 : ", end='')
for i in range(6, len(balls)):
    print(____.____, end='   ')

# 特別號:資料位於 <div class="ball_red"></div>
redball = dataTag[2].find_all('___', {'class': '___'})
print("\n特別號   :", ____)

參考解答:

# 匯入所需模組
import bs4
import requests

# 指定目標網頁的 URL
url = 'http://tqc.codejudger.com:3000/target/5203.html'

# 使用 requests 套件發送 GET 請求,取得網頁內容
html = requests.get(url)

# 使用 BeautifulSoup 解析網頁內容,選擇 lxml 解析器
objSoup = bs4.BeautifulSoup(html.text, 'lxml')

# 從網頁中選取具有 class 為 'contents_box02' 的元素
dataTag = objSoup.select('.contents_box02')

# 從 'dataTag' 中取得大樂透的開獎號碼球
balls = dataTag[2].find_all('div', {'class': 'ball_tx ball_yellow'})

# 印出大樂透開獎訊息
print("大樂透開獎 : ")
print('-------------')

# 印出開出順序的號碼
print("開出順序 : ", end='')
for i in range(6):
    print(balls[i].text, end='   ')

# 印出大小順序的號碼
print("\n大小順序 : ", end='')
for i in range(6, len(balls)):
    print(balls[i].text, end='   ')

# 取得特別號:資料位於 <div class="ball_red"></div>
redball = dataTag[2].find_all('div', {'class': 'ball_red'})
print("\n特別號   :", redball[0].text)

執行結果:

 

參考

Yiru@Studio - 關於我 - 意如