아래와 같은 형식의 성경구절 텍스트를
01 1:1 태초에 하나님이 천지를 창조하시니라
01 1:2 땅이 혼돈하고 공허하며 흑암이 깊음 위에 있고 하나님의 신은 수면에 운행하시니라
01 1:3 하나님이 가라사대 빛이 있으라 하시매 빛이 있었고
.
.
파싱하여 권, 장, 절, 성경text 로 나누려고 하는데
파이선과 정규식을 썼더니 한줄 코딩으로 해결이 되네요
line = '01 1:1 태초에 하나님이 천지를 창조하시니라'
dummy1, vol, chap, verse, content, dummy2 = re.split('(\d{2}) (\d+):(\d+) (.*)', line)
참 군더더기 없고 간결합니다
파이선, 정규식 텍스트처리에 강추합니다
'컴퓨터 > Python(파이선, 파이썬)' 카테고리의 다른 글
문자열 전,후 값 변경된 위치 알아내기 (0) | 2020.04.03 |
---|---|
숫자 천단위 컴마로 구분하기(Commify numbers) (0) | 2013.07.12 |
정규식 디버거(Regular Expression/Regex Debugger) Kodos (0) | 2010.08.02 |
스크랩(클리핑)된 기사(웹페이지)들 윈도우도움말파일(파일확장자 .chm)로 만들어 편리하게 보기 (0) | 2010.07.23 |
신문칼럼/게시글 스크랩 (0) | 2010.07.23 |