컴퓨터/Python(파이선, 파이썬)

참 간결하고 편리한 파이썬과 정규식(Python & Regular Expression)

이비그치면 2013. 6. 21. 17:32

아래와 같은 형식의 성경구절 텍스트를

01 1:1 태초에 하나님이 천지를 창조하시니라

01 1:2 땅이 혼돈하고 공허하며 흑암이 깊음 위에 있고 하나님의 신은 수면에 운행하시니라

01 1:3 하나님이 가라사대 빛이 있으라 하시매 빛이 있었고

.

.

파싱하여 권, 장, 절, 성경text 로 나누려고 하는데

파이선과 정규식을 썼더니 한줄 코딩으로 해결이 되네요


line = '01 1:1 태초에 하나님이 천지를 창조하시니라'

dummy1, vol, chap, verse, content, dummy2 = re.split('(\d{2}) (\d+):(\d+) (.*)', line)


참 군더더기 없고 간결합니다

파이선, 정규식 텍스트처리에 강추합니다