Search

string.punctuation

import string punctuation = string.punctuation
Python
복사
string.punctuation은 ASCII코드에서 구두점(쉼표, 온점 등)의 꾸러미 이다.
이를 이용해 문자열의 punctuation들을 제거할 수 있다.
import string txt_file = './metamorphosis_clean.txt' file = open(txt_file, 'rt') # read, text mode text = file.read() # file의 내용들을 하나의 문자열로 text에 저장 file.close() # str.maketrans(원래문자, 대입할 문자, optinal-제거할 문자) words = text.split() table = str.maketrans("","", string.punctuation) # str.translate에 사용 가능한 변환 테이블을 반환한다. stripped = [w.translate(table) for w in words] print(stripped[:100])
Python
복사
https://datagy.io/python-remove-punctuation-from-string/ 이 블로그 글에 따르면 가장 fastest한 방법이라고 함
보면 wasn’t → wasnt가 되었다.