JAVA HTML 태그 또는 모든 태그 형식 제거
JAVA - 정규표현식을 이용한 HTML 태그 또는 모든 태그 형식 제거# HTML 제거2006/12/04 15:10 HTML 태그는 로 끝나고, 종료 태그의 경우는 로 끝난다. 따라서, 다음과 같은 정규 표현식은 HTML 태그를 모두 포함하게 된다. ]*)?(\\s)*(/)?> 자바 1.4부터 String.repalceAll(String regex, String replacemenet) 메소드를 제공하는데, 이 메소드는 문자열에서 regex의 정규 표현식에 일치하는 부분을 replacement로 취환해주는 기능을 제공한다. 특정 문자열에 HTML 태그를 제거하려면 위의 정규 표현식을 다음과 같이 적용하면 된다. 12String text = "......";String textWith..