更新
This commit is contained in:
34
Python-100-Days/Day66-75/06.表单交互和验证码处理.md
Normal file
34
Python-100-Days/Day66-75/06.表单交互和验证码处理.md
Normal file
@@ -0,0 +1,34 @@
|
||||
## 表单交互和验证码处理
|
||||
|
||||
### 提交表单
|
||||
|
||||
#### 手动提交
|
||||
|
||||
|
||||
|
||||
#### 自动提交
|
||||
|
||||
|
||||
|
||||
### 验证码处理
|
||||
|
||||
#### 加载验证码
|
||||
|
||||
|
||||
|
||||
#### 光学字符识别
|
||||
|
||||
光学字符识别(OCR)是从图像中抽取文本的工具,可以应用于公安、电信、物流、金融等诸多行业,例如识别车牌,身份证扫描识别、名片信息提取等。在爬虫开发中,如果遭遇了有文字验证码的表单,就可以利用OCR来进行验证码处理。Tesseract-OCR引擎最初是由惠普公司开发的光学字符识别系统,目前发布在Github上,由Google赞助开发。
|
||||
|
||||

|
||||
|
||||
#### 改善OCR
|
||||
|
||||
|
||||
|
||||
#### 处理更复杂的验证码
|
||||
|
||||
|
||||
|
||||
#### 验证码处理服务
|
||||
|
||||
Reference in New Issue
Block a user