博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
DC学院数据分析学习笔记(二):爬虫需要的HTML
阅读量:6304 次
发布时间:2019-06-22

本文共 1486 字,大约阅读时间需要 4 分钟。

关于html,之前也稍微了解过一些,又碰到了,那么就系统的学习一下

HTML

超文本标记语言(HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。

什么是 HTML?

HTML 是用来描述网页的一种语言。

  • HTML 指的是超文本标记语言 (Hyper Text Markup Language)
  • HTML 不是一种编程语言,而是一种标记语言 (markup language)
  • 标记语言是一套标记标签 (markup tag)
  • HTML 使用标记标签来描述网页
  • HTML 文档包含了HTML 标签及文本内容
  • HTML文档也叫做 web 页面

HTML代码的一般形式

一个基本的网页代码框架:

文档标题文档内容......

标签基本格式:<标签名 属性名1=“属性值” 属性名2=“属性值” ……>文件内容标签名>

:用于代码开头指定html版本等信息:告知浏览器这是一个 HTML 文档,是 HTML 文档中最外层的元素:所有头部元素的容器,必须包含文档的标题(title),可以包含脚本、样式、meta 信息以及其他:定义文档的标题,定义浏览器工具栏中的标题,显示在搜索引擎结果中的页面标题:定义文档的主体,包含文档的所有内容(比如文本、超链接、图像、表格和列表等)

:定义 HTML 标题,从

标题的重要程度逐渐降低

:定义段落,浏览器会自动在其前后创建一些空白
:一个简单的换行符,是一个空标签,意味着它没有结束标签。
:定义 HTML 文档中的一个分隔区块或者一个区域部分。经常与 CSS 一起使用,用来布局网页。

用菜鸟教程的HTML网页结构举个例子:

image

HTML链接语法

Link text:href 属性规定链接的目标。Fill Our Form:指向同一服务器同一目录下的form.htmlParent:指向同一服务器父目录下的parent.htmlCatalog :指向同一服务器子目录stuff下的cat.htmlbaidu:指向外部网站 。其中,使用了 Target 属性,可以定义被链接的文档在何处显示,这里的会在新窗口打开网页

特别的,在HTML链接中有个id属性

id属性可用于创建在一个HTML文档书签标记

提示: 书签是不以任何特殊的方式显示,在HTML文档中是不显示的,所以对于读者来说是隐藏的

引用中的例子:

HTML图像

some_text:src 指 "source",即图像的 URL 地址。alt属性是在图片无法显示时,替换上去的文本。和超链接结合起来,可以为插入的图片添加超链接:

还可以设置图像的高度于宽度:

Pulpit rock:最好设置一下,因为没有指定图片的大小,加载页面时有可能破坏HTML的整体布局

列表

无序列表(unordered list,ul)

例如:

  • Coffee
  • Milk

显示:

  • Coffee
  • Milk

有序列表(ordered list,ol)

例如:

  1. Coffee
  2. Milk

显示:

  1. Coffee
  2. Milk

表格

 :表格的开始和结束 :创建表格的一行 :创建表格中普通单元格:创建表格中标题栏单元格

表单

表单元素是允许用户在表单中输入内容,比如:文本域(textarea)、下拉列表、单选框(radio-buttons)、复选框(checkboxes)等等。

引用一个DC学院课堂中的例子:

image

OK !HTML内容还是很多的,说是系统学习一下,其实只学了一下爬虫会可能用到的。

转载地址:http://znbxa.baihongyu.com/

你可能感兴趣的文章
有赞透明多级缓存解决方案(TMC)设计思路
查看>>
如何设计高扩展的在线网页制作平台
查看>>
Git 2.5增加了工作树、改进了三角工作流、性能等诸多方面
查看>>
Swift 5将强制执行内存独占访问
查看>>
中台之上(二):为什么业务架构存在20多年,技术人员还觉得它有点虚?
查看>>
深度揭秘腾讯云低功耗广域物联网LPWAN 技术及应用
查看>>
与Jeff Sutherland谈敏捷领导力
查看>>
More than React(四)HTML也可以静态编译?
查看>>
React Native最佳学习模版- F8 App开源了
查看>>
云服务正在吞噬世界!
查看>>
阅读Android源码的一些姿势
查看>>
Web语义化标准解读
查看>>
一份代码构建移动、桌面、Web全平台应用
查看>>
高性能 Lua 技巧(译)
查看>>
区分指针、变量名、指针所指向的内存
查看>>
异步编程的世界
查看>>
最近话题火爆的四件事你知道不?
查看>>
SpringBoot整合MyBatis
查看>>
云计算产业如何率先推行信用管理?
查看>>
Android 类库书签更新(一)
查看>>