블로그 이미지
이비그치면

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

calendar

1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

MS Office Documents(MS WORD, MS Excel etc.)에서 VBA를 이용하여

한자, 일본어, 한글 추출

unicode 와 정규식(Regular Expression) 사용


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Sub test()
Dim RegEx As Object
Set RegEx = CreateObject("vbscript.regexp")
     
'-- 한자 추출
RegEx.Pattern = "[\u2E80-\u2EFF\u3400-\u4DBF\u4E00-\u9FBF\uF900-\uFAFF\u20000-\u2A6DF\u2F800-\u2FA1F]+"
RegEx.IgnoreCase = True
RegEx.Global = True
 
sStr = "태초(太初)에 하나님이 천지(天地)를 창조(創造)하시니라"
 
Set matches = RegEx.Execute(sStr)
 
For Each mch In matches
    Debug.Print mch.Value
Next
 
'-- 한글 추출
RegEx.Pattern = "[\uAC00-\uD7AF]+"
Set matches = RegEx.Execute(sStr)
 
For Each mch In matches
    Debug.Print mch.Value
Next
 
'-- 일어 추출
RegEx.Pattern = "[\u3040-\u309F\u30A0-\u30FF\u31F0-\u31FF\u8EA1-\u8EFE\uFF61-\uFF9F]+"
sStr = "はじめに神は天と地とを創造された"
 
Set matches = RegEx.Execute(sStr)
 
For Each mch In matches
    Debug.Print mch.Value
Next
 
End Sub
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
太初
天地
創造
태초
하나님이
천지
창조
하시니라
はじめに
とを
された