블로그 이미지
이비그치면

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

calendar

1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

아래와 같은 형식의 성경구절 텍스트를

01 1:1 태초에 하나님이 천지를 창조하시니라

01 1:2 땅이 혼돈하고 공허하며 흑암이 깊음 위에 있고 하나님의 신은 수면에 운행하시니라

01 1:3 하나님이 가라사대 빛이 있으라 하시매 빛이 있었고

.

.

파싱하여 권, 장, 절, 성경text 로 나누려고 하는데

파이선과 정규식을 썼더니 한줄 코딩으로 해결이 되네요


line = '01 1:1 태초에 하나님이 천지를 창조하시니라'

dummy1, vol, chap, verse, content, dummy2 = re.split('(\d{2}) (\d+):(\d+) (.*)', line)


참 군더더기 없고 간결합니다

파이선, 정규식 텍스트처리에 강추합니다