当前位置 - 養生大全網 - 養生知識 - Python爬蟲(1)請求抓取豆瓣電影TOP250

Python爬蟲(1)請求抓取豆瓣電影TOP250

抓取時間:2020/11/25

系統環境:Windows 10

使用的工具:Jupyter筆記本\Python 3.0

涉及的庫:requests \ lxml \ panda \ matplotlib \ numpy。

蛋胖的想法:首先從網站上爬下來電影名稱,原名,評分,評價人數,分類信息。

蛋胖想法:打印數據列表後,發現電影的原名稱和分類信息中有不必要的字符,需要提前處理;同時因為以後要做豆瓣電影TOP250的維度分布圖,而且同壹部電影有多個分布國家和類型(比如《法美/劇情動作犯罪》),為了簡單(偷懶),這裏取第壹個作為記錄數據;最後,將數據保存為xlsx。

蛋胖想法:蛋胖想知道豆瓣電影TOP250中年份、國家、類型的維度數據。為了練習,我們用剛剛保存為xlsx的數據,分別繪制成雷達圖、柱形圖和扇形圖。