1 网络信息内容获取基本概念
网络信息内容分为2类:
- 网络媒体信息:互连网网络公开发布的信息,网络用户通常基于通用的网络浏览器获得互连网公开发布的信息
- 网络通信信息:实现与特定点的通信或进行点对点通信时所交互的信息
信息交互协议——应用层
- 网页浏览:HTTP,HTTPS
- 文件传输:FTP
- 多媒体交互:
- RTSP(Real Time Streaming Protocol,实时流传输协议)
- HLS(HTTP Live Streaming,基于HTTP的自适应码率流媒体传输协议,HTTP+M3U8+TS)
- SIP(Session Initiation Protocol,会话初始协议)
补充一下各个协议相关知识
2 网络信息内容的来源与特点
互联网信息分布:表网、深网、暗网
暗网例子:Tor(提供客户端匿名访问、服务器端匿名Hidden Service)
**网络信息内容获取的评价:**全面性、一致性、完整性、实时性
3 网络信息内容获取的基本方法
网络媒体信息获取的一般流程
网络信息内容获取方法:
- 主动获取(主动发起连接,如爬虫、开发者模式)
- 被动获取(在某个节点上监听,如wireshark/tcpdump抓包)