블로그 이미지
이비그치면

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

calendar

1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
오직 하루, 한 순간만 나의 아버지의 손 안에서 쉬는 모든 것들이 그 속에서 위안을 얻게 하소서.

내가 아이로서 무엇을 갈망할 수 있을까? 그는 내게 어머니의 마음을 갖게 하시고, 그는 매일 매일 자비로움과 부드러움을 주시네.

고통을 기쁨으로 만들어 주시네. 그는 항상 내게 가까이 계시네. 특별한 순간에는 특별한 사랑을 베푸시네. 일상의 근심을 대신 지시는, 힘과 도움이라는 두 이름의 그. 그의 모든 값진 재산을 지키시고, 모두를 보살피시네. 당신의 날처럼 힘과 물질들을 그가 약속하셨네.

편하고 고요하게 쉬게 하소서. 사랑하는 아버지의 약속 안에서, 값진 맘의 위안을 헛되게 하지 마시고, 내게 하셨던 약속대로,

도와주소서, 내게 일어나는 일들을. 당신의 믿음직한 아버지의 손으로. 단지 하루, 한 순간만이라도, 하늘 나라에 갈 때까지.

위와 같은 html 문에서

글의 내용(text)만을 추출하고 싶을때

BeautifulSoup을 사용하여 다음과같이 간단히 추출할수있다.

 

import re
from bs4 import BeautifulSoup

data =''' 
오직 하루, 한 순간만 나의 아버지의 손 안에서 쉬는 모든 것들이 그 속에서 위안을 얻게 하소서.

내가 아이로서 무엇을 갈망할 수 있을까? 그는 내게 어머니의 마음을 갖게 하시고, 그는 매일 매일 자비로움과 부드러움을 주시네.

고통을 기쁨으로 만들어 주시네. 그는 항상 내게 가까이 계시네. 특별한 순간에는 특별한 사랑을 베푸시네. 일상의 근심을 대신 지시는, 힘과 도움이라는 두 이름의 그. 그의 모든 값진 재산을 지키시고, 모두를 보살피시네. 당신의 날처럼 힘과 물질들을 그가 약속하셨네.

편하고 고요하게 쉬게 하소서. 사랑하는 아버지의 약속 안에서, 값진 맘의 위안을 헛되게 하지 마시고, 내게 하셨던 약속대로,

도와주소서, 내게 일어나는 일들을. 당신의 믿음직한 아버지의 손으로. 단지 하루, 한 순간만이라도, 하늘 나라에 갈 때까지.

''' soup = BeautifulSoup(data, 'html.parser') l = [(div.contents[0].strip(), span.text.strip()) for div in soup.select('div.test') for span in div.select('span')] for match, verse in l: print(match, verse)

실행결과는 아래와 같다

 오직 하루, 한 순간만
 나의 아버지의 손 안에서 쉬는 모든 것들이
 그 속에서 위안을 얻게 하소서.
 
 내가 아이로서 무엇을 갈망할 수 있을까?
 그는 내게 어머니의 마음을 갖게 하시고,
 그는 매일 매일 자비로움과 부드러움을 주시네.
 
 고통을 기쁨으로 만들어 주시네.
 그는 항상 내게 가까이 계시네.
 특별한 순간에는 특별한 사랑을 베푸시네.
 일상의 근심을 대신 지시는, 힘과 도움이라는 두 이름의 그.
 그의 모든 값진 재산을 지키시고, 모두를 보살피시네.
 당신의 날처럼 힘과 물질들을 그가 약속하셨네.
 
 편하고 고요하게 쉬게 하소서.
 사랑하는 아버지의 약속 안에서,
 값진 맘의 위안을 헛되게 하지 마시고,
 내게 하셨던 약속대로,
 
 도와주소서, 내게 일어나는 일들을.
 당신의 믿음직한 아버지의 손으로.
 단지 하루, 한 순간만이라도, 하늘 나라에 갈 때까지.