爬取B站视频弹幕信息,知名网站的

时间:2019-11-08 11:54来源:关于计算机
著名网址的 404 页面长啥样? 2017/09/21 · HTML5 · 1评论 ·404 初藳出处:Muzli   译文出处:众成翻译    google.com . youtube.com . facebook.com . reddit.com . muz.li . . amazon.com . vk.com . linkedin.com . i

著名网址的 404 页面长啥样?

2017/09/21 · HTML5 · 1 评论 · 404

初藳出处: Muzli   译文出处:众成翻译   

图片 1

图片 2图片 3google.com

.

图片 4

youtube.com

.

图片 5

facebook.com

.

图片 6

reddit.com

.

图片 7

muz.li

.

图片 8

.

图片 9

amazon.com

.

图片 10

vk.com

.

图片 11

linkedin.com

.

图片 12

imgur.com

.

图片 13

aliexpress.com

.

图片 14

bing.com

.

图片 15

图片 16图片 17tumblr.com

.

图片 18

.

图片 19

stackoverflow.com

.

图片 20

github.com

.

图片 21

dropbox.com

.

图片 22

craigslist.org

.

图片 23

dribbble.com

.

图片 24

awwwards.com

.

图片 25

csswinner.com

.

图片 26

producthunt.com

.

图片 27

coolhunting.com

.

图片 28

codyhouse.co

.

图片 29

mailchimp.com

.

图片 30

slack.com

.

图片 31

mashable.com

.

图片 32

bloomberg.com

.

图片 33

airbnb.com

.

图片 34

bitly.com

.

图片 35

virgin.com

1 赞 2 收藏 1 评论

图片 36

获取B站录像弹幕,相对来讲不会细小略,须要选取的知识点有requests、re七个库。requests用来获取网页音信,re正则极度得到你需求的消息,当然还会有别的的方法,比方Xpath。
进去你所见到的录制的页面,F12进去开采者工具,选用网络。查找大家须要的新闻,开掘域名那列有comment.bilibili.com 格式为xml ,文件名即为cid号。点击它后,在左边的音讯头中复制央浼网址,在浏览器中开垦,就能够获取录像全方位弹幕新闻。

图片 37   图片 38

代码如下:

图片 39图片 40

 1 import requests
 2 import re
 3 def getHTML(av):
 4     url='https://comment.bilibili.com/'+av+'.xml'
 5     html=requests.get(url)
 6     comments=html.text
 7     res=r'>(.+?)</d>'
 8     rescom=re.compile(res)
 9     comment=re.findall(rescom,comments)
10     for row in comment:
11         print(row)
12 av=input("input your av:")
13 getHTML(av)

弹幕代码

运转代码,弹幕就总体打字与印刷到窗口中,此外关于收获探究以至用商议内容制作词云可查阅博客。

 

原创不易,尊重版权。转发请评释出处:http://www.cnblogs.com/xsmile/

编辑:关于计算机 本文来源:爬取B站视频弹幕信息,知名网站的

关键词: