Python 정리/module,Package -> pip
Urllib - urllib.parse 편(Python 내장)
아직미정임
2022. 3. 12. 23:48
urllib는 URL 작업을 위한 여러 모듈을 모은 패키지입니다.:
- URL을 열고 읽기 위한 urllib.request
- urllib.request에 의해 발생하는 예외를 포함하는 urllib.error
- URL 구문 분석을 위한 urllib.parse
- robots.txt 파일을 구문 분석하기 위한 urllib.robotparser
urllib.parse
HTTP 요청, 파싱과 관련된 하위 패키지들이 존재하며, URL 파싱과 관련된 것들은 거의 다 urllib.parse에 들어 있다. Python 2의 urlparse가 옮겨진 것이다.
urllib.parse.unquote()
선택적 encoding과 errors 매개 변수는 bytes.decode() 메서드에서 받아들이는 것처럼 퍼센트 인코딩된 시퀀스를 유니코드 문자로 디코딩하는 방법을 지정합니다.
encoding의 기본값은 'utf-8'입니다. errors의 기본값은 'replace'로, 유효하지 않은 시퀀스는 자리 표시자 문자(placeholder character)로 대체됩니다.
예: unquote('/El%20Ni%C3%B1o/')는 '/El Niño/'를 산출합니다.
버전 3.9에서 변경: string 매개 변수는 바이트열과 문자열 객체를 지원합니다 (이전에는 문자열만 지원했습니다).
def relaxed_decode_base64(data):
data2 = urllib.parse.unquote(urllib.parse.unquote(data))
for i in range(0,1000):
if len(data2) % 4 == 0:
if i == 0:
print(" no padding needed ")
print(i)
break
else:
data2 += "="
return base64.urlsafe_b64decode(data2)